Dépôt institutionnel de l'UQO
RECHERCHER

Développement et implantation d'une ontologie pour l'analyse sémantique automatisée des risques de projets en technologies de l'information

Téléchargements

Téléchargements par mois depuis la dernière année

Plus de statistiques...

Kwan, Franck-Olivier (2021). Développement et implantation d'une ontologie pour l'analyse sémantique automatisée des risques de projets en technologies de l'information. Thèse. Gatineau, Université du Québec en Outaouais, Département des sciences administratives, 302 p.

[thumbnail of Kwan_Franck-Olivier_2021_these.pdf]
Prévisualisation
PDF
Télécharger (3MB) | Prévisualisation

Résumé

Cette thèse démontre la faisabilité de l’utilisation de l’analyse sémantique comme outil de détection et de suivi des risques dans les projets informatiques. Elle part du principe que si nous pouvons annoter l’ensemble des artefacts d’un projet, pour y indiquer les événements liés à différents risques, nous devrions être en mesure d’utiliser un outil d’analyse sémantique pour établir les liens potentiels entre différents événements et risques, et ainsi identifier les traces selon leur occurrence. Ce type d’outil pourrait donc servir de plateforme propice à la détection et le suivi des risques dans les projets informatiques.

Notre principale contribution est d’ordre pratique et vise le développement et l’implantation d’un processus de détection et de suivi des risques permettant d’exploiter les artefacts des projets informatiques, traités par des outils d’analyse de texte et de détection des structures sémantiques, où les extrants sont intégrés à une ontologie ou à une base de connaissances liée aux risques de ce type de projets. On utilise ensuite des outils d’interrogation et d’inférence sur la base de connaissances, pour ainsi reconnaître et classifier les événements selon qu’ils sont associés ou non à l’occurrence de risques potentiels. On interprète enfin ces résultats en comparaison aux risques réels documentés du projet, permettant de déterminer la qualité de la classification.

Notre méthodologie expérimentale se base sur un projet informatique concret réalisé sur une période de trois ans au sein d’un grand ministère. Nous analysons les artefacts liés à la documentation du projet, les rapports d’analyse du risque, les documents d’affaires, les comptes rendus de réunions ainsi que les rapports d’audits du projet servant de base à l’étude afin d’illustrer et d’interpréter a posteriori une dynamique de gestion des risques.

Nous utilisons trois groupes d’outils d’analyse de texte et de structures sémantiques : (1) une ontologie du risque construite à l’aide de Protégé, permettant de décrire les risques et les principales composantes du projet visé ; (2) le logiciel ARDAKE, ou Adaptive Rules-Driven Architecture for Knowledge Extraction, basé sur la plateforme Unstructured Information Management Architecture (UIMA), permettant de formuler des ensembles de règles d’annotation des artefacts, et d’insérer des balises liées à différents concepts de notre ontologie ; (3) le logiciel Protégé et les plugiciels ELK et SPARQL permettant de créer des commandes de requête et d’interroger l’ensemble de nos artefacts annotés pour détecter les liens potentiels entre les événements dans nos artefacts et les risques définis dans un audit du risque.

Notre démarche de validation commence par l’identification d’une dizaine d’événements à haut risque tels que définis formellement dans un registre des risques du projet visé. Pour chaque risque, on développe des ensembles de règles d’annotation dans ARDAKE, permettant de lier les risques à des événements associés directement ou indirectement, surtout dans une période rapprochée et précurseur à l’occurrence du risque. Ces règles sont exécutées pour annoter l’ensemble des artefacts permettant de relier chaque phrase, section, et élément pertinent aux événements liés au risque. Les artefacts étant datés et dotés de métadonnées, nous reconstituons des chaînes d’événements tirées des artefacts. Une fois les annotations et les reconstitutions complétées, nous utilisons des logiciels informatiques pour formuler des commandes de requête et interroger nos données annotées. Les commandes représentent un ensemble de conditions pertinentes à l’occurrence des risques. Une fois exécutés, les extrants doivent rapporter les risques pertinents identifiés initialement, de manière à maximiser la précision des résultats, ainsi que le rappel de l’ensemble des concepts liés au risque.

Les résultats de nos commandes et de nos requêtes (SQL, ELK, SPARQL) sont évalués par le biais d’une approche interprétative. On tente ainsi de classifier les événements présents dans les artefacts comme étant liés ou non aux risques définis dans le registre des risques du projet. Les événements précurseurs à l’occurrence de risques sont identifiés en évaluant si les n-grams, tels qu’annotés par ARDAKE, sont les mêmes ou proches des mêmes branches sémantiques dans notre ontologie. Cette démonstration est utile pour un retour d’expérience et détecter les faiblesses ou les forces dans la gestion des risques passés, et donc enrichir le répertoire d’actions possibles en apportant une approche structurée et évolutive pour les retours d’expérience pour les gestionnaires et les acteurs clés de projets en TI.

Cette thèse a apporté plusieurs contributions pour une meilleure gestion des risques fondée sur des preuves. Premièrement, nous avons créé une ontologie du risque à partir d'une revue de littérature, une des rares publiées à ce jour focalisé sur la gestion des risques des projets TI. Deuxièmement, elle a été utilisée pour annoter les artefacts des projets informatiques, en utilisant une plateforme d'analyse sémantique automatique nommée ARDAKE, pour la détection de structures sémantiques. Les résultats ont montré que l'outil informatique était capable d'annoter des événements ou des signes avant-coureurs avant qu'ils deviennent des risques. Les phrases ont été annotées selon des concepts définis dans l'ontologie, mais le chercheur doit interpréter les résultats et juger de leur pertinence. Troisièmement, nous avons ensuite utilisé les outils de requête et d'inférence basés sur des connaissances spécifiques au domaine, pour reconnaître et classer les événements tels qu'ils sont avec ou sans la survenance de risques potentiels. Enfin, une interprétation des résultats a été réalisée selon un registre des risques réels afin de déterminer la qualité de la classification. Nos résultats montrent le potentiel des outils pour effectuer l’analyse sémantique automatisée et ainsi aider à l'analyse des risques des projets informatiques.

Type de document: Thèse (Thèse)
Directeur de mémoire/thèse: Nabelsi, Véronique
Co-directeurs de mémoire/thèse: Gagnon, Stéphane
Départements et école, unités de recherche et services: Sciences administratives
Date de dépôt: 05 nov. 2021 19:50
Dernière modification: 05 nov. 2021 19:50
URI: http://di.uqo.ca/id/eprint/1331

Actions (Identification requise)

Dernière vérification avant le dépôt Dernière vérification avant le dépôt