Résumé
Nous présentons, dans cet article, un système de lecture automatique de documents techniques. Les dessins techniques, au sens où nous l'entendons par la suite, sont des documents essentiellement graphiques (constitués de traits, de formes pleines, de texle produits par un dessinateur, à la main ou avec l'aide d'un système d'édition. L'architecture que nous avons choisie et développée permet d'extraire l'information graphique et alphanumérique du document pour reconstituer la sémantique associée aux différents objets du dessin et à leurs relations. En nous inspirant des connaissances acquises sur les mécanismes de la vision humaine, nous avons élaboré une méthode comportant deux phases : Durant une première phase de perception globale, une représentation initiale du document est obtenue à l'aide d'un nombre limité de primitives : le Pixel, le Vecteur, le Quadrilatère. Le choix de ces primitives permet à cette représentation de s'adapter à la description de documents techniques de types variés (plans, cadastres, partitions musicales,...). Cette représentation, bien que fondée sur des primitives élémentaires, fournit une description précise de toutes les formes,du document initial (image binaire). Outre leur adéquation aux formes à décrire, ces primitives constituent la base de la structure de données qui nous permettra de définir une représentation efficace des connaissances acquises sur le document durant l'analyse. Ensuite, l'utilisation duale d'un système multi-spécialistes et de la représentation préalablement construite permet, au cours d'une phase de lecture et d'interprétation, d'utiliser les données fournies par la vision globale pour réaliser les analyses locales. Un mécanisme de "cycles perceptifs" permet aux différents spécialistes de coopérer pour réduire au maximum les erreurs d'analyse et aboutir à une interprétation plus robuste. Chaque spécialiste réalise une tâche précise telle que, par exemple, la détection du texte, des courbes, des éléments mécaniques ou la reconstruction 3D du mécanisme. Tous utilisent la représentation construite pour focaliser leur attention sur des zones précises de l'image qu'ils étudient en détail. En fin de chaque cycle, la complétude de la compréhension du document est vérifiée et un nouveau cycle d'activation des spécialistes approfondit, si nécessaire, l'interprétation. Cette phase de lecture progressive a été mise en place pour le cas particulier des plans cinématiques mécaniques. Le système obtenu comporte alors six spécialistes et s'accorde parfaitement au traitement de ce type de document. Les exécutions continues et entrelacées des différents spécialistes permettent de réaliser des analyses contextuelles par segmentations successives augmentant ainsi l'interaction et l'efficacité du système. Grâce à cette démarche, nos travaux se distinguent de ceux employant la chaîne habituelle de traitements : pré-traitements -segmentation - analyse - reconnaissance. Notre système s'efforce, dans la vision globale, d'extraire des connaissances puis, à partir des informations possédées sur le document, d'extraire des formes de manière hiérarchique et réfléchie, et il les transcrit dans une représentation évolutive décrivant à chaque instant l'état du contexte d'interprétation.