Acquisition et représentation de connaissances en musique - Page 1 - test Tous nos livres sont imprimés dans les règles environnementales les plus strictes Il est interdit de reproduire intégralement ou partiellement la présente publication sans autorisation du Centre Français d’exploitation du droit de Copie (CFC) – 20 rue des GrandsAugustins – 75006 PARIS – Tél. : 01 44 07 47 70 / Fax : 01 46 34 67 19. © Éditions Edilivre – Collection Universitaire – 2008 ISBN : 978-2-35607-647-2 Dépôt légal : Juillet 2008 Tous droits de reproduction et d’adaptation, intégrale ou partielle réservés pour tous pays. UNIVERSITE DE DROIT, D'ECONOMIE ET DES SCIENCES D'AIX-MARSEILLE FACULTE DES SCIENCES ET TECHNIQUES DE SAINT-JEROME Thèse présentée par M. Bernard BEL pour obtenir le grade de Docteur en Sciences (nouveau régime) de l'Université de Droit, d'Economie et des Sciences d'AIX-MARSEILLE (AIX-MARSEILLE III) Spécialité: INFORMATIQUE Acquisition et représentation de connaissances en musique soutenue le 28 novembre 1990 devant la Commission d'Examen: M. Jean-Paul ALLOUCHE, rapporteur M. Jean-Claude BERTRAND M. Eugène CHOURAQUI M. Alain GUENOCHE, directeur M. Otto LASKE M. Jean-Claude RISSET, rapporteur M. Bernard VECCHIONE, rapporteur _________________________________________________________ 1 Remerciements Je remercie les chercheurs qui m'ont guidé par leurs conseils dans les divers domaines scientifiques liés à cette étude: MM. Jean-Paul Allouche pour la théorie des automates, Alain Guénoche, directeur de thèse, pour l'algorithmique combinatoire, Jim Kippen pour l'anthropologie et l'ethnomusicologie, Otto Laske pour la musicologie cognitive, et Bernard Vecchione pour la musicologie et l'épistémologie. Je remercie M. Eugène Chouraqui, directeur du Groupe Représentation et Traitement des Connaissances, grâce à qui j'ai pu mener à bien ces travaux dans les meilleures conditions de travail, en bénéficiant de la documentation du laboratoire et du soutien des chercheurs, ingénieurs, étudiants, et du personnel administratif du GRTC. Je remercie enfin tous les membres du jury qui était composé, outre les personnes déjà citées, de MM. Jean-Claude Bertrand et Jean-Claude Risset. Cette thèse est dédiée à la mémoire de deux personnes qui ont à la fois suscité et encouragé mon engagement dans ce projet: John Blacking, musicien et anthropologue de l'Université de Belfast, décédé le 24 janvier 1990, et Afaq Husain Khan, musicien de Lucknow, décédé le 18 février 1990. Leur générosité et leur ouverture d'esprit exceptionnelles ont été une source d'inspiration dans les moments les plus difficiles. Les travaux menés dans la phase initiale de cette étude ont reçu le soutien de la Ford Foundation (USA), du National Centre for the Performing Arts (NCPA, Bombay), de l'International Society for Traditional Arts Research (ISTAR) et du Leverhulme Trust (Royaume Uni). 3 Acquisition et représentation de connaissances en musique Définitions et conventions............................................... 9 I. Introduction........................................................... 13 1. La notion de “connaissance” en musique (the concept of “knowledge” in music) .......................................................13 2. Les domaines d'application de cette étude (domains of application of this study)...................................................................17 3. Grammaires musicales et grammaires formelles (musical grammars vs. formal grammars).........................................................18 4. La composition musicale assistée par ordinateur (computer-aided musical composition) .........................................................19 5. Le traitement du temps (the processing of time)...........................20 II. Acquisition de connaissances en ethnographie et méthodologie “BP” (knowledge acquisition in ethnography and the “BP” methodology)....................................... 23 1. Collection ethnographique (ethnographic collection) .....................23 2. L'anthropologie dialectique (dialectical anthropology) ...................24 3. Acquisition de connaissances — la “méthodologie BP” (knowledge acquisition — the “BP methodology”).......................26 4. La validation des modèles (model assessment)............................27 III. Transcription musicale et schémas d'improvisation (musical transcription and improvisation schemata) ...................... 29 1. Transcription des pièces rythmiques (transcribing rhythmic items).....29 2. Homomorphismes (homomorphisms)......................................30 3. Schéma d'improvisation et grammaticalité (improvisation schemata and grammaticality) ...........................................................31 IV. Grammaires BP (BP grammars) ................................... 33 1. Aperçu historique (historical survey) .......................................33 2. Grammaires de motifs (pattern grammars).................................35 3. Grammaires BP (BP grammars) ............................................41 4. Grammaires BP transformationnelles (BP transformational grammars)......................................................................44 5. Contrôle des dérivations dans les grammaires BP (derivation control in a BP grammar) ....................................................45 6. Test d'appartenance des grammaires BP (membership test for a BP grammar).......................................................................46 V. Formalisme BP1 (BP1 formalism) ................................. 53 1. Règles de type 0 (type-0 rules) ..............................................53 2. Négation de contexte (negative context)....................................53 3. Valeurs nulles (wildcards) ...................................................58 4. Tempo (tempo) ................................................................58 5. Gabarits (templates)...........................................................59 5 6. Modèle stochastique (stochastic model).................................... 61 VI. Apprentissage inductif (inductive learning) ......................65 1. Problème de l'inférence de langage (the problem of language inference) ...................................................................... 67 2. Paradigmes d'apprenabilité (learning paradigms)......................... 68 3. Définitions et notations (definitions and notations)....................... 70 4. Généralisation d'une fonction caractéristique de langage régulier (generalizing the characteristic function of a regular language) ......... 74 5. Accepteur “presque minimal” d'un langage fini (“almost minimal” acceptor of a finite language)................................................ 75 6. Exemple musical (musical example)........................................ 81 7. Connaissances lexicales (lexical knowledge).............................. 81 8. Construction sous contraintes de Ai (constructing Ai under constraints).................................................................... 85 9. Généralisation de l'accepteur presque minimal (generalizing the almost-minimal acceptor) .................................................... 89 10. Heuristiques de généralisation (generalisation heuristics) ............... 90 11. Extensions envisagées (directions for future work) ...................... 90 VII. Temps symbolique, objets temporels/atemporels, synchronisation (symbolic time, time/out-time objects, synchronization) ...................................................93 1. Sonèmes, objets musicaux, objets sonores (sonemes, musical objects, sound-objects) ...................................................... 93 2. Le temps musical (musical time)............................................ 96 3. Bol Processor BP2 — l'environnement (BP2 environment)............ 98 4. Temps symbolique et objets temporels (symbolic time and timeobjects)......................................................................... 99 5. Durée symbolique d'un objet temporel (symbolic duration of a time-object)...................................................................101 6. Objets atemporels (out-time objects) ......................................101 7. Temps lisse et temps strié (smooth and streaked time)..................102 8. Problème de la synchronisation (the synchronization problem)........103 9. Synchronisation de séquences (synchronizing sequences) .............105 Synchronisation de séquences d'objets temporels/atemporels (time-object/out-time object sequence synchronization) ................................................. 113 1. Représentation de séquences (representing sequences) .................114 2. Interprétation de formules polymétriques (interpreting a polymetric structure)......................................................................116 3. Silences indéterminés (undetermined rests) ..............................118 4. Représentations minimale et dilatée d'une formule polymétrique (minimal and stretched representations of a polymetric expression)...119 5. Algorithme d'interprétation (interpretation algorithm)...................120 6. Exemple de traitement (example of processing)..........................123 7. Traitement des objets atemporels (processing out-time objects) .......126 VIII. 6 8. Conclusion................................................................... 127 IX. Mise en temps d'objets sonores (time-setting of soundobjects)............................................................129 1. Prototypes d'objets sonores (sound-object prototypes) ................ 130 2. Codage des structures polymétriques (encoding polymetric structures).................................................................... 132 3. Paramètres d'exécution (performance parameters)...................... 135 4. Propriétés métriques des objets non vides (metrical properties of non-empty objects).......................................................... 136 5. Propriétés topologiques des objets non vides (topological properties of non-empty objects).......................................... 139 6. Déformations d'objets non vides (stretching non-empty objects) ..... 141 7. Calcul du coefficient de dilatation/contraction (calculating the timescale ratio).................................................................... 143 8. Procédure de mise en temps (time-setting procedure) .................. 145 9. Espace de recherche et solutions canoniques (search space and canonic solutions)........................................................... 165 10. Complexité de l'algorithme de mise en temps (complexity of the time-setting algorithm)...................................................... 166 11. Résumé et discussion de cette méthode (summary and discussion of the method) ............................................................... 168 X. Conclusion..........................................................169 Bibliographie ...........................................................171 Annexes.................................................................183 1. Grammaire d'un qa‘ida (grammar of a qa‘ida) — Afaq Husain Khan.......................................................................... 183 2. Exemple d'analyse par le Bol Processor BP1 (example of an analysis by Bol Processor BP1)........................................... 187 3. Algorithme d'interprétation de formules polymétriques (algorithm for polymetric structure interpretation) ................................... 189 4. Exemple de traitement de formule polymétrique en notation tonale (example of polymetric structure processing in staff notation) ........ 194 5. Exemples de mise en temps de structures (examples of time-setting of structures)................................................................. 197 6. Algorithme d'instanciation d'objets sonores (sound-object instantiation algorithm) ..................................................... 204 7. Structures polymétriques — approche algébrique (polymetric structures — an algebraic approach)...................................... 209 7 Définitions et conventions La terminologie utilisée dans ce volume est, pour l'essentiel, une traduction de la terminologie anglo-saxonne en théorie des langages formels, plus particulièrement Salomaa1 , Kain 2 et Révész3 . Certaines désignations ou définitions ne sont pas rigoureusement identiques dans diverses publications. Nous précisons ici les conventions adoptées. Les titres de chapitre et de paragraphes ont été traduits en anglais afin de restituer les termes d'origine et de faciliter la lecture de l'ouvrage. 1. Conventions diverses Avec les quantificateurs “∀” (“quel que soit”) et “∃” (“il existe”), nous utilisons la notation x1, …, xn ∈ E au lieu de (x1, …, xn) ∈ En sauf bien sûr pour désigner un n-uplet. Lorsqu'un objet mathématique est désigné par une lettre minuscule de l'alphabet latin, toute mention isolée de cet objet dans une phrase est indiquée en italique. Ainsi, a est en italique pour être discerné du présent du verbe “avoir”, par contre l'expression a ∈ E n'introduit aucune ambiguïté. Les caractères ou chaînes de caractères sont délimités entre guillemets: “”. Nous désignons par N l'ensemble des entiers naturels {0, 1, …}, Z celui des entiers relatifs, Q celui des nombres rationnels et R celui des nombres réels. Appliquée à ces ensembles, la notation X* désigne X \ {0} , alors que dans tout autre contexte elle désigne l'opération monoïde. 2. Applications Soient deux ensembles E et F. On appelle graphe d'une correspondance entre E et F un sous-ensemble Γ du produit cartésien E x F. La correspondance (mapping) est l'opérateur f qui, à tout élément x de l'ensemble de départ E pour lequel il existe au moins un couple (x,y) ∈ Γ, associe son image f(x) dans F: 1 1973 2 1981 3 1985 9 f(x) = {y | (x,y) ∈ Γ} Une correspondance telle que pour tout x ∈ E il existe au moins un couple (x,y) ∈ Γ est appelée une application multivoque. On peut sans perte de généralité ramener toute correspondance f à une application multivoque4 en adoptant la convention: (x,y) ∉ Γ <=> f(x) = ∅ où “∅” désigne l'ensemble vide. L'application est univoque lorsque card(f(x)) = 1 pour tout x ∈ E. 5 Nous convenons que toute application est univoque à moins que l'épithète “multivoque” ne soit explicité. L'application f est injective si ∀ x,y ∈ E , x ≠ y => f(x) ∩ f(y) = ∅ et surjective si ∀ y ∈ F, ∃ x ∈ E | y ∈ f(x) . A l'inverse de certains auteurs6 , nous convenons qu'une application ne peut être bijective que si elle est univoque. Une application univoque est bijective si elle est à la fois injective et surjective. On retrouve ainsi une propriété classique des bijections: S'il existe une bijection entre E et F, alors card(E) = card(F). Nous appelons fonction multivaluée la donnée d'un ensemble de départ E, d'un ensemble d'arrivée F, et d'une application multivoque f de E dans F. Le domaine de définition de définition de la fonction est: Df = { x ∈ E | f(x) ≠ ∅ } Si l'application f est telle que, pour tout x ∈ E, card(f(x)) ≤ 1, alors la fonction est monovaluée. Nous convenons qu'une fonction est monovaluée à moins que la propriété “multivaluée” ne soit mentionnée explicitement. 3. Langages formels On appelle suite toute application f d'une partie contiguë E = {1,…,n} de N dans un ensemble quelconque F. L'image f(x) d'un entier i est appelée le terme de rang i de la suite. Si E = N la suite est infinie. Nous appelons liste la réduction d'une suite à une partie de N. Le nombre card(E) est la longueur de la liste. 4 D'où le terme anglais mapping utilisé indifféremment pour les deux. 5 “card(X)” désigne le cardinal de l'ensemble X. 6 Kaufmann & Pichat 1977, I, p.84. 10 Une chaîne (string) est une liste dans un ensemble F fini appelé alphabet. Nous utilisons le mot “symbole”, et non “caractère”, pour désigner tout élément d'une chaîne. Un symbole peut être un graphème quelconque ou même une chaîne de symboles dans un autre alphabet. Nous avons évité les désignations “mot” et “phrase” qui peuvent renvoyer à la linguistique ou à la musique. Au chapitre VI, “mot” désigne un élément d'un ensemble fini de chaînes (un vocabulaire) qui sert à coder un langage formel. Nous représentons “.” l'opération de concaténation de listes ou de chaînes. Cette représentation est omise lorsqu'aucune ambiguïté n'est possible. La chaîne vide est représentée par le symbole λ. 11 I. Introduction Un objectif de cette étude est de traiter certains problèmes de représentation des connaissances: traitement du temps, parallélisme et synchronisation, multiplicité des fonctions sonologiques, etc., qui sont spécifiques à la musique par rapport à d'autres formes de communication.7 Bien que dérivés, pour la plupart, de la théorie des langages formels, les formalismes décrits n'ont qu'un lien de parenté lointain avec ceux de la linguistique computationnelle. La plupart des projets “intelligence artificielle et musique” partent d'outils existants (réseaux sémantiques, automates et grammaires formelles, systèmes experts, etc.) à l'aide lesquels il est possible de représenter certains concepts musicaux, par exemple les rudiments du solfège tonal. Peu de chercheurs s'intéressent à l'acquisition de connaissances, prenant pour argent comptant que l'univers du discours musical est entièrement décrit par les traités de “théorie de la musique”. Les problèmes des formes musicales autres que la musique occidentale sont rarement abordés. Enfin, on peut s'interroger sur l'utilisation pratique des connaissances ainsi modélisées, et, partant, sur la finalité des réalisations informatiques. Nous pensons donc qu'il est utile de situer cette étude dans le contexte des problématiques musicologiques et technologiques qui l'ont suscitée. 1. La notion de “connaissance” en musique (the concept of “knowledge” in music) 1.1 Sonétique vs. sonologie Une partie de l'informatique musicale s'intéresse aux modèles d'analyse et de synthèse du son (l'indispensable lutherie électronique/numérique), à l'étude des fonctions perceptives mises en jeu dans l'écoute musicale, et à celle des caractéristiques des gestes producteurs de sons. Ce domaine est désigné par Vecchione8 sous le terme de “sonétique”: 7 Pour les sémioticiens, postuler une spécificité du musical revient à rompre avec le structuralisme, pour qui le langage verbal est ce qui fonde toute communication. Pour Jakobson, par exemple, “le langage, c'est réellement les fondations même de la culture. Par rapport au langage, tous les autres systèmes de symboles sont accessoires et dérivés.” (Cité par Vecchione 1990a, p.93) 8 1990a, pp.73-4. 13
Acquisition et représentation de connaissances en musique - Page 1
Acquisition et représentation de connaissances en musique - Page 2
wobook
edilivre.com