Construire une onthologie de la pneumologie : aspects théoriques, modèles et expérimentations - Page 1 - test Tous nos livres sont imprimés dans les règles environnementales les plus strictes Il est interdit de reproduire intégralement ou partiellement la présente publication sans autorisation du Centre Français d’exploitation du droit de Copie (CFC) – 20 rue des GrandsAugustins – 75006 PARIS – Tél. : 01 44 07 47 70 / Fax : 01 46 34 67 19. © Éditions Edilivre – Collection Universitaire – 2008 ISBN : 978-2-35607-850-6 Dépôt légal : Août 2008 Tous droits de reproduction, d’adaptation et de traduction, intégrale ou partielle réservés pour tous pays. UNIVERSITÉ PIERRE ET MARIE CURIE - PARIS 6 THÈSE DE DOCTORAT DE L’UNIVERSITÉ PARIS 6 SPÉCIALITÉ : INFORMATIQUE MÉDICALE Pour l’obtention du grade de DOCTEUR DE L’UNIVERSITÉ PARIS 6 Thèse de doctorat présentée et soutenue publiquement le 06 février 2007 par Audrey Baneyx UNE CONSTRUIRE ONTOLOGIE DE LA PNEUMOLOGIE THÉORIQUES, MODÈLES ET EXPÉRIMENTATIONS ASPECTS Composition du jury : Madame Monsieur Madame Madame Monsieur Monsieur Nathalie Stefan J. Anne Marie-Christine Bruno Jean AUSSENAC-GILLES DARMONI DOUCET JAULENT BACHIMONT CHARLET Rapporteur Rapporteur Examinateur Examinateur Examinateur Directeur de thèse LABORATOIRE INSERM UMR_S 872 – SANTÉ PUBLIQUE ET INFORMATIQUE MÉDICALE iii INTITULÉ ET ADRESSE DE L’UNITÉ OÙ LA THÈSE A ÉTÉ PRÉPARÉE : INSERM UMR_S 872 Équipe 20 Santé Publique et Informatique Médicale Centre de recherche des Cordeliers 15, rue de l’École de Médecine 75006 Paris – France v À Julien vii Remerciements Au-delà de la formalité d’usage, c’est avec un grand plaisir que je remercie les membres de mon jury : Monsieur Jean Charlet, mon directeur de thèse, pour m’avoir proposé cette thèse et m’avoir permis de la faire dans les meilleurs conditions qui soient, pour nos nombreuses discussions et pour m’avoir présentée à ses amis de la communauté IC. Je lui adresse également un grand A merci pour m’avoir fait profiter de ses talents de typographe et ses coups de main en LTEX. Il est évident que sans lui cette thèse serait moins bien présentée. Il m’a beaucoup appris. J’espère avoir toujours autant de volonté et d’enthousiasme que lui pour mener mes recherches futures, qu’il trouve dans ces quelques mots l’expression de ma gratitude. Madame Marie-Christine Jaulent pour son bouillonnement perpétuel d’idées et son enthousiasme communicatif, pour avoir toujours pris le temps de relire mes articles, les bons comme les moins bons, et pour savoir créer une ambiance de travail conviviale et motivante. Ce n’est pas donné à tout le monde. Madame Nathalie Aussenac-Gilles, a accepté d’être le premier rapporteur de mon travail de thèse. Elle a relu avec attention ce mémoire et ses remarques, pertinentes et constructives, m’ont permis de regarder mes contributions aux domaines de l’Ingénierie des connaissances et de l’Informatique médicale d’un œil neuf. Le docteur Stefan Darmoni, a bien voulu être le second rapporteur de ce travail. Je le remercie de m’avoir donné son point de vue de médecin sur certains des aspects de ce travail. Ses encouragements quant aux résultats de MedCKARe et ses suggestions de collaborations pour mes futurs travaux de recherche sont une grande motivation. En 2002-2003, Madame Anne Doucet m’a accueillie dans le DESS d’Intelligence artificielle qu’elle dirigeait à l’université Paris 6. Cette année d’études a sans aucun doute été la plus intéressante et la plus enrichissante pour moi. Je suis particulièrement heureuse qu’elle ait accepté d’examiner mon travail. Les travaux de monsieur Bruno Bachimont ont servi de point de départ à la partie méthodologique de mes recherches. Ses recherches en Ingénierie ontologique et les liens qu’il fait avec la philosophie sont, pour moi, une source d’inspiration. Je le remercie d’avoir bien voulu juger mon travail. viii Je tiens également à remercier chaleureusement : Monsieur Didier Bourigault qui m’a permis d’utiliser son outil SYNTEX-UPERY et d’obtenir les résultats de qualité sur lesquels j’ai fondé mes travaux de recherche. Le Dr F-X Blanc, le Pr B. Housset et le Pr T. Similowski pour leur participation au projet PERTOMed et le Pr B. Maitre, le Dr N. Roche, le Pr C. Chouaid, le Pr J. Cadranel, le Pr M. Humbert, et le Dr A. Duguet, pour avoir rassemblé les ressources nécessaires à mon travail. Ce travail doit également beaucoup aux nombreux échanges avec mes collègues (ex-) doctorants rencontrés deci delà. J’ai une pensée particulière pour Véronique Malaisé, Natalia Grabar, Nadia Nadah et Sandra Bringuay que je remercie de leurs encouragements et de leur bonne humeur. Un clin d’œil à tous mes copains thésards et post-doctorants de Paris, de Marseille et d’ailleurs . . . et aux autres aussi, parce qu’il parait qu’il n’y a pas que les thèses dans la vie ! Un grand merci à ma famille, et en particulier à mes parents, pour leur soutien tout au long de ma scolarité, leurs enseignements et leur confiance. J’adresse une mention toute particulière à Simon qui m’a tenu compagnie tout l’été et motivé chaque jour pour écrire ce manuscrit dans les temps. Je souhaite que ce qu’il fera plus tard l’intéresse autant que moi. Les mots de la fin sont pour exprimer toute ma reconnaissance à Julien pour m’avoir toujours soutenue dans mes choix, pour nos discussions sans fin, parce qu’il regarde dans la même direction que moi et bien plus encore . . . Table des matières 1 Introduction générale 1 Contexte . . . . . . . . . . . . . . . 1.1 Contexte administratif . . . 1.2 Contexte scientifique . . . . 2 Domaines concernés . . . . . . . . 2.1 Informatique médicale . . . 2.2 Ingénierie des connaissances 2.3 Ingénierie ontologique . . . 3 Organisation du mémoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 1 2 3 3 5 6 7 11 11 13 13 15 19 20 2 Problématique scientifique et enjeux 1 Projet PertoMed . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Problématique . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Limites du codage médico-économique des pathologies . 2.2 Construction d’ontologies en médecine à partir de textes 3 Hypothèses de travail . . . . . . . . . . . . . . . . . . . . . . . 4 Synthèse et originalité des travaux . . . . . . . . . . . . . . . . Représenter des connaissances : terminologies et ontologies 1 De la notion de terminologie à celle d’ontologie : épistémologies et définitions . . . . . . . . . . . 1.1 Terminologie . . . . . . . . . . . . . . . 1.2 Classification . . . . . . . . . . . . . . . 1.3 Nomenclature . . . . . . . . . . . . . . . 1.4 Thésaurus . . . . . . . . . . . . . . . . . 1.5 Taxinomie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 23 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 24 26 27 27 29 x Table des matières 2 3 4 5 6 7 1.6 Ontologie . . . . . . . . . . . . . . . . . . . . . Ressources terminologiques et ontologiques en médecine 2.1 CIM . . . . . . . . . . . . . . . . . . . . . . . . 2.2 CCAM . . . . . . . . . . . . . . . . . . . . . . 2.3 MeSH . . . . . . . . . . . . . . . . . . . . . . . 2.4 CISMeF . . . . . . . . . . . . . . . . . . . . . . 2.5 SNOMED . . . . . . . . . . . . . . . . . . . . . 2.6 UMLS . . . . . . . . . . . . . . . . . . . . . . 2.7 FMA . . . . . . . . . . . . . . . . . . . . . . . 2.8 DOLCE . . . . . . . . . . . . . . . . . . . . . . 2.9 GALEN . . . . . . . . . . . . . . . . . . . . . . 2.10 MENELAS . . . . . . . . . . . . . . . . . . . . 2.11 Synthèse sur les RTO en médecine . . . . . . . . Formalismes pour la représentation des connaissances . . 3.1 Graphes conceptuels . . . . . . . . . . . . . . . 3.2 Logiques de description . . . . . . . . . . . . . 3.3 Synthèse sur les formalismes . . . . . . . . . . . Méthodes et méthodologies de construction d’ontologies 4.1 Stratégies descendantes et ascendantes . . . . . . 4.2 Les travaux de M. Uschold et M. Grüninger . . . 4.3 METHONTOLOGY . . . . . . . . . . . . . . . . 4.4 Les travaux de N. Guarino et C. Welty . . . . . . 4.5 OntoSpec . . . . . . . . . . . . . . . . . . . . . 4.6 ARCHONTE . . . . . . . . . . . . . . . . . . . . 4.7 Conclusion . . . . . . . . . . . . . . . . . . . . Langages pour exploiter des ontologies . . . . . . . . . 5.1 XML . . . . . . . . . . . . . . . . . . . . . . . 5.2 RDF . . . . . . . . . . . . . . . . . . . . . . . . 5.3 OIL . . . . . . . . . . . . . . . . . . . . . . . . 5.4 DAML et DAML+OIL . . . . . . . . . . . . . . 5.5 OWL . . . . . . . . . . . . . . . . . . . . . . . Éditeurs d’ontologies . . . . . . . . . . . . . . . . . . . 6.1 PROTÉGÉ . . . . . . . . . . . . . . . . . . . . . 6.2 OILEd . . . . . . . . . . . . . . . . . . . . . . 6.3 ONTOEDIT . . . . . . . . . . . . . . . . . . . . 6.4 WebODE . . . . . . . . . . . . . . . . . . . . . 6.5 DOE . . . . . . . . . . . . . . . . . . . . . . . . Outils d’ingénierie ontologique à partir de textes . . . . . 7.1 TERMINAE . . . . . . . . . . . . . . . . . . . . 7.2 Text-To-Onto et KAON . . . . . . . . . . . . . 7.3 SYNTEX- UPERY . . . . . . . . . . . . . . . . . 7.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 38 39 40 41 42 44 45 46 46 46 47 48 48 49 53 56 57 57 58 59 60 61 61 62 62 62 64 64 65 66 67 68 69 71 71 72 75 75 76 77 77 Table des matières 4 Construction d’une ontologie dans le domaine de la pneumologie 1 Méthode ARCHONTE : principes et originalité . . . . . . . . . . . . . . 1.1 Normalisation sémantique et engagement sémantique . . . . . . 1.2 Formalisation des connaissances et engagement ontologique . . 1.3 Opérationalisation . . . . . . . . . . . . . . . . . . . . . . . . 2 Élaboration des corpus de référence . . . . . . . . . . . . . . . . . . . 3 Traitement des corpus . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Approche syntaxique et distributionnelle : SYNTEX-UPERY . . 3.2 Repérage d’énoncés définitoires par patrons lexico-syntaxiques 4 Sélection des candidats termes du domaine . . . . . . . . . . . . . . . . 4.1 Définir les termes du domaine . . . . . . . . . . . . . . . . . . 4.2 Extraction, filtrage et sélection . . . . . . . . . . . . . . . . . . 5 Mise en œuvre des principes différentiels . . . . . . . . . . . . . . . . 5.1 Procédure de comparaison des hiérarchies obtenues . . . . . . . 5.2 Comparaison des termes issus du corpus [LIVRE] . . . . . . . . 5.3 Comparaison des termes issus du corpus [CRH] . . . . . . . . 6 Ontologie de haut niveau . . . . . . . . . . . . . . . . . . . . . . . . . 7 Formalisation et opérationalisation : PROTÉGÉ 3.2 . . . . . . . . . . . 8 Synthèse sur la construction de la hiérarchie . . . . . . . . . . . . . . . 9 Discussion et conclusion . . . . . . . . . . . . . . . . . . . . . . . . . MedCKARe, un outil pour le codage des CRH 1 Objectifs et hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Outils existants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Ressources . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Ontologie de la pneumologie . . . . . . . . . . . . . . . . . . . 3.2 Thésaurus de spécialité . . . . . . . . . . . . . . . . . . . . . . 3.3 Corpus de référence . . . . . . . . . . . . . . . . . . . . . . . 3.4 Ressources lexicales . . . . . . . . . . . . . . . . . . . . . . . 4 Unitex, un outil pour l’extraction d’informations . . . . . . . . . . . . . 5 Développement et fonctionnement de l’outil . . . . . . . . . . . . . . . 5.1 Récupération des données de l’ontologie . . . . . . . . . . . . 5.2 Construction du dictionnaire . . . . . . . . . . . . . . . . . . . 5.3 Traitement et utilisation des ressources lexicales . . . . . . . . 5.4 Mise au point des patrons lexico-syntaxiques . . . . . . . . . . 5.5 Modélisation du thésaurus pour le codage médico-économique . 5.6 Identification des informations pertinentes pour le codage . . . 6 Résultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.1 Résultats de la modélisation du thésaurus de spécialité . . . . . 6.2 Résultats qualitatifs et quantitatifs pour les deux types de codage 6.3 Interface utilisateur . . . . . . . . . . . . . . . . . . . . . . . . 6.4 Problèmes à résoudre et pistes d’amélioration . . . . . . . . . . 7 Perspectives et conclusion . . . . . . . . . . . . . . . . . . . . . . . . 79 80 81 83 83 84 87 88 92 94 94 95 97 99 100 101 103 103 104 106 111 111 112 118 118 118 118 119 121 122 122 123 125 125 128 130 131 132 132 133 134 137 xi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 xii 6 Table des matières Évaluation, évolution et maintenance d’une ontologie en médecine 1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Critères pour évaluer une RTO . . . . . . . . . . . . . . . . . . . . . . 2.1 Élaboration et évaluation des corpus textuels . . . . . . . . . . 2.2 Évaluation du contenu de l’ontologie . . . . . . . . . . . . . . 2.3 Évaluation de la qualité taxinomique . . . . . . . . . . . . . . . 2.4 Évaluation de l’ontologie en situation . . . . . . . . . . . . . . 2.5 La question de la réutilisabilité . . . . . . . . . . . . . . . . . . 3 Expérimentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 De l’évaluation à l’évolution . . . . . . . . . . . . . . . . . . . 3.2 Représentation conceptuelle d’un thésaurus médical et évolution 3.3 Évolution de l’ontologie due à l’usage . . . . . . . . . . . . . . 4 Perspectives et conclusion . . . . . . . . . . . . . . . . . . . . . . . . Perspectives et conclusion 1 Réutilisabilité de la top-ontologie de MENELAS 2 Serveurs de terminologies et services associés . 3 Projet DaFOE4App . . . . . . . . . . . . . . . 3.1 Contexte et enjeux . . . . . . . . . . . 3.2 Intérêts scientifiques . . . . . . . . . . 4 Projet MedOC . . . . . . . . . . . . . . . . . 4.1 Objectifs . . . . . . . . . . . . . . . . 4.2 Intérêt scientifique . . . . . . . . . . . 5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 139 140 141 142 144 145 146 146 146 147 148 149 151 152 152 154 154 154 156 157 158 159 163 179 181 189 195 199 . 199 . 199 . 200 . 200 . 201 . 201 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Références Liste des figures A Guide de bonnes pratiques méthodologiques B Extraits d’OntoPneumo C Patrons lexico-syntaxiques D Liste des publications 1 Publications dans des revues internationales à comités de lecture et de sélection 2 Publications dans des revues nationales à comités de lecture et de sélection . . . 3 Publications dans des actes de conférences internationales à comités de lecture et de sélection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Publications dans des actes de conférences nationales à comités de lecture et de sélection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 Présentations nationales et internationales de posters . . . . . . . . . . . . . . 6 Rapports . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Construire une onthologie de la pneumologie : aspects théoriques, modèles et expérimentations - Page 1
Construire une onthologie de la pneumologie : aspects théoriques, modèles et expérimentations - Page 2
wobook
edilivre.com