|
|
Comment créer un Dictionnaire pour OpenOffice.org Diffusé ParLe Projet Documentation OpenOffice.org
AvertissementLe chapitre 2 du présent tutoriel a été établi à partir du chapitre 7 du Manuel de Référence Français-GUTenberg v1.0 publié par Christophe Pythoud le 7 juin 1999. Toutefois le plan du chapitre ayant été remanié et certains paragraphes récrits, il n'est pas possible de citer par le détail tous les passages recopiés de l'original. Avant toute réutilisation de fragment de texte issu du chapitre 2 du présent tutoriel, il convient donc de vérifier s'il a été recopié sans modification du document de Christophe Pythoud. La réutilisation de paragraphes issus du chapitre 2 du présent tutoriel qui auraient été recopiés du document de Christophe Pythoud est soumise au droit de licence du document original. Le Manuel de Référence Français-GUTenberg v1.0 est disponible sous le nom reference.pdf à l'adresse suivante : http://www.unil.ch/ling/cp/frgut.html#documentation
Table des matières 1 - Description des outils 4 1.1 - Le dictionnaire de mots (fichier fr_FR.dic) 4 1.2 - Le fichier des AFFIX 4 1.2.1 - Présentation d'une ligne d'en-tête 4 1.2.2 - Présentation d'une ligne descriptive 5 1.2.3 - Codification des conditions en champ 5 5 1.2.4 - Exemples de codification des conditions, tirés du fichier des affix FR 6 1.3 - Le programme MySpell 7 2 - Modification du dictionnaire général 8 2.1 - Ajouter des adverbes ou autres mots invariables 8 2.2 - Ajouter des noms et des adjectifs 8 2.2.1 - Le cas simple 8 2.2.2 - Féminin et masculin 8 2.2.3 - Accord de l'adjectif verbal formé sur le participe présent 9 2.2.4 - Le problème de l'élision devant les noms et adjectifs 10 2.2.5 - L'élision devant les noms et adjectifs verbaux formés sur le participe passé 11 2.2.6 - L'élision devant les adjectifs verbaux formés sur le participe présent 12 2.3 - Ajouter des verbes 12 2.3.1 - Conjugaison des temps de l'indicatif, du conditionnel, du subjonctif 12 2.3.2 - Infinitif, participe passé 14 2.3.3 - L'élision devant les verbes 14 2.3.4 - Première personne du singulier du conditionnel et des subjonctifs présent et imparfait avec élision de je 16 2.3.5 - Élision et emplois réflexifs 16 2.3.6 - Élision et verbes essentiellement pronominaux 17 2.3.7 - Les verbes du troisième groupe 18 2.4 - Entrer des abréviations 18 2.5 - Utilisation des préfixes 18 3 - Création d'un dictionnaire spécialisé 19 4 - Tableaux récapitulatifs 20 4.1 - Accord des noms et adjectifs 20 4.2 - Elision devant les noms et adjectifs 21 4.3 - Conjugaison des verbes du 1er et du 2ème groupe 22 4.4 - Elision devant les verbes du 1er et du 2ème groupe 23 4.5 - Elision devant les verbes du 1er et du 2ème groupe (page 2) 24 4.6 - Listes des Affix 25 5 - Crédits 27 6 - Licence 27
1 - Description des outilsLe dictionnaire français fonctionne à partir des 3 outils suivants :
1.1 - Le dictionnaire de mots (fichier fr_FR.dic)Cette liste de mots a été reprise dans le dictionnaire Français Gutenberg et enrichie par le groupe francophone Open Office.org. Définition :Un lemme est un mot racine en lexicographie La liste de mots comporte deux types d'entrée lemme1 lemme2/drapeau(x) Dans le premier cas, il s'agit tout simplement d'un mot qui fait partie du dictionnaire. (lemme=mot) Dans le second cas, le lemme est affecté de 1 ou plusieurs drapeaux qui font référence aux règles de composition des mots par application des affix contenus dans le fichier des affix. Ainsi, pour un seul lemme en entrée du dictionnaire de mots correspondra en réalité plusieurs mots. 1.2 - Le fichier des AFFIXUn affix est, soit un préfixe, soit un suffixe, attaché à des mots racines (lemme) pour composer d'autres mots. La raison d'être du fichier des affix est donc de restreindre le nombre de mots à faire figurer dans le dictionnaire de mots. Par exemple : dernière (lemme= dernière, suffixe= ère) qui permet d'obtenir dernier, derniers, dernières joindre (lemme = joindre, préfixe = ad, re) qui donnent adjoindre, rejoindre Les affix (suffixe) servent donc à gérer en particulier les règles d'accord en genre et en nombre (masculin/féminin, singulier/pluriel), les conjugaisons des verbes, ... Les affix (préfixe) sont utilisés pour les règles de composition des mots avec préfixe, les règles d'élision, ... Pour être complet, le fichier des affix doit comprendre une première ligne indiquant le type de jeux de caractère utilisé à la fois pour le dictionnaire de mots et le fichier des affix. La seconde ligne du fichier des affix indique la liste des caractères à utiliser pour construire les mots qui seront suggérés pour les mots mal orthographiés. Le fichier des affix comprend la description des différents drapeaux qui gèrent les règles d'affixation. Il est délimité par des espaces et est sensible à la casse. Pour chaque drapeau, le fichier des affix est constitué de 2 types de lignes, une ligne d'en tête, plusieurs lignes descriptives des règles 1.2.1 - Présentation d'une ligne d'en-têteLa ligne d'en-tête comporte quatre champs Champ 1 : valeur SFX ou PFX selon qu'il s'agit d'une règle s'appliquant au suffixe ou au préfixe Champ 2 : Lettre minuscule ou majuscule indiquant le nom du drapeau (attention à la casse) Champ 3 : valeur 'Y'
si le lemme peut être combiné avec un préfixe et
un suffixe. Champ 4 : nombre de lignes descriptives à suivre. 1.2.2 - Présentation d'une ligne descriptiveLa ligne descriptive comporte 5 champs Champ 1 : valeur SFX ou PFX selon qu'il s'agit d'une règle s'appliquant au suffixe ou au préfixe Champ 2 : lettre minuscule ou majuscule indiquant le nom du drapeau Champ 3 : la chaîne
de caractères à enlever avant d'ajouter le suffixe
(restriction du lemme). Champ 4 : la chaîne
de caractères affix à ajouter Champ 5 : les conditions que l'on doit respecter pour que l'affix soit appliqué. 1.2.3 - Codification des conditions en champ 5Pour un même drapeau, les conditions d'application de la règle peuvent varier en fonction de la chaîne de caractères initiale ou terminale. Il y a donc autant de lignes descriptives pour un même drapeau que de conditions propres à chaque chaîne de caractères initiale ou terminale. La condition peut donc se lire : pour les mots se terminant par la chaîne en champ 5, restreindre le lemme comme en champ 3 puis ajouter le champ 4 Lorsque la condition est spécifique à une lettre ou à une chaîne de caractères, celle-ci est simplement portée en champ 5 Lorsque la condition s'applique de la même manière plusieurs lettres, les lettres concernées sont placée entre crochets; Un '^' après le crochet ouvrant indique toutes les autres lettres sauf celles de la liste qui suit. On peut combiner deux crochets successifs. On peut combiner suite de lettre entre crochets et chaîne de caractères Cas des préfixesPour les préfixes, la condition est toujours sur la première lettre du mot. Il est fréquent que le même préfixe s'applique pour tout un groupe de lettres. L'apposition d'un préfixe se traduira souvent donc par une ligne descriptive qui aura en champ 5 une liste de lettre entre crochets (présence ou non de'^'). Cas des suffixesPour les suffixes, il est fréquent que les conditions dépendent de plusieurs des lettres de fin du mots. C'est le cas en particulier pour les conjugaisons de verbes. L'apposition d'un suffixe se traduira donc souvent par des combinaisons de chaîne de caractères et de suite de lettres entre crochets. 1.2.4 - Exemples de codification des conditions, tirés du fichier des affix FRVoici deux exemples d'application de préfixe : Règle d'application du préfixe 'dé' PFX D Y 2 PFX D 0 dé [^aàâeèéiîoôuh] PFX D 0 des [aàâeèéiîoôuh] Commentaires : Règle d'application sur les préfixes latins 'a(d)-'devant les verbes et non verbes PFX A Y 10 PFX A 0 ad [^bcdfglmnpqrst] PFX A 0 a [bdgm] PFX A 0 ac [cq] PFX A 0 af [f] PFX A 0 al [l] PFX A 0 an [n] PFX A 0 ap [p] PFX A 0 ar [r] PFX A 0 as [s] PFX A 0 at [t] Commentaires : Voici plusieurs exemples d'application de suffixe Accord en genre et en nombre des noms et adjectifs La gestion du masculin singulier et pluriel se fait à partir du féminin singulier Drapeau F : toutes terminaisons sauf mots en -eur SFX F Y 57 Règle générale du féminin pluriel SFX F 0 s [^sxz] Cas des voyelles + e/ë Masculin singulier des mots en ée lemme : employée SFX F ée é ée masculin singulier et pluriel des mots en ue lemme : bienvenue sauf si avant dernière lettre g ou q SFX F ue u [^gq]ue SFX F e s [^gq]ue masculin singulier et pluriel des mots en lle lemme : éventuelle, nulle, pareille, gentille avec e, i, u précédant lle SFX F lle l [eiu]lle SFX F le s [eiu]lle Commentaires : Conjugaison des verbes lemme = 1ère pers. sing. de l'indicatif présent Combinaison possible avec préfixe (Y en 3ème colonne) SFX u Y 52 verbes en 'e' lemme : arrive SFX u 0 s e SFX u 0 nt e Commentaires verbes en 'ens' sauf 'iens' lemme : sens SFX u s tent [^i]ens SFX u s te [^i]ens SFX u s tes [^i]ens Commentaires verbes en 'faux', 'feux', 'vaux', 'veux', 'peux' lemme : vaux, faux, veux, peux, SFX u x t [fvp][ae]ux Commentaires 1.3 - Le programme MySpellIl s'agit de l'outil d'analyse orthographique inclus dans la suite Open Office. Cet outil fonctionne de la manière suivante :
2 - Modification du dictionnaire généralCe chapitre expose les conditions dans lesquelles il est possible de modifier le dictionnaire général d'OpenOffice.org. L'analyseur orthographique Myspell ne peut être modifié que par le développeur qui en a la charge. Toute anomalie, dysfonctionnement ou souhait d'améliorations doit donc lui être soumis. En ce qui concerne le fichier des affix, il est issu de la transformation du fichier des affix pour Ispell créé par Christophe Pythoud. Il est fortement déconseillé de tenter d'apporter des modifications à ce fichier. Il ne faut surtout pas essayer de modifier la structure de affix fixée par Christophe Pythoud. Celle-ci est issue des travaux menés dans le cadre de son travail de diplôme et a été validée par la communauté des utilisateurs du dictionnaire Français Gutenberg. Les seules modifications envisageables sont celles portant sur la création de nouveaux affix dans la mesure où ils n'interfèrent pas avec ceux qui existent déjà. 1 La principale amélioration à apporter consiste donc à inclure de nouveaux lemmes dans le dictionnaire de mots et éventuellement à corriger les lemmes existants en leur adjoignant le drapeau idoine. Les cas de corrections sont traités comme des adjonctions de mots nouveaux et il suffit de se reporter à l'un paragraphes ci dessous pour en connaître les règles d'application. 2.1 - Ajouter des adverbes ou autres mots invariablesPour les adverbes et autres mots invariables, aucune précaution particulière n'est requise, il suffit de les faire figurer dans le dictionnaire tels quels. 2.2 - Ajouter des noms et des adjectifsLa règle retenue par Christophe Pythoud est de considérer que le lemme d'un nom ou d'un adjectif est sa forme féminine. Il est, en effet, dans la grande majorité des cas plus simple de faire les restrictions de lemme à partir de la forme féminine. 2.2.1 - Le cas simpleLe cas le plus simple est celui d'un nom ou d'un adjectif épicène2. Il suffit de l'entrer dans le dictionnaire et de lui adjoindre le drapeau S3, s'il prend un simple « s » au pluriel, ou le drapeau X dans tous les autres cas. Par exemple : célébration/S pour célébration et célébrations enfant/S pour enfant et enfants éclaircissement/S pour éclaircissement et éclaircissements bateau/X pour bateau et bateaux drapeau/X pour drapeau et drapeaux Si le pluriel est identique au singulier, il ne faut pas mettre de drapeau (cf. 2.1) 2.2.2 - Féminin et masculinCertains noms et adjectifs possèdent des formes féminines et masculines. Dans ce cas, la règle est de faire figurer le mot dans sa forme du féminin singulier Les règles d'accord en genre et en nombre de ces noms et adjectifs sont traitées par les drapeaux F et G. Les drapeaux F et G couvrent la quasi-totalité des correspondances entre masculin et féminin du français : Dans le doute, vérifier ce qui est produit par le drapeau. Seuls les cas les plus irréguliers ne sont pas traités : andalou/andalouse, beau/belle, favori/favorite, fou/folle, tiers/tierce. En présence de ces noms très irréguliers et non codifiés dans le fichier des affix, il faut faire figurer toutes les formes dans le dictionnaire. Cas général. Drapeau FOn utilisera le drapeau F pour tous les mots, sauf si s'agit d'un mot qui finit en -eur au masculin singulier ou d'un mot en al qui fait son pluriel en aux Quelques exemples : nominative/F pour nominative, nominatives, nominatif, nominatifs malheureuse/F pour malheureuse, malheureuses, malheureux dentale/F pour dentale, dentales, dental, dentaux Cas particuliers Drapeau GIl faut utiliser le drapeau G pour les mots qui finissent en -eur au masculin singulier et pour les mots en -al qui font le pluriel en -als. Rappel : on utilisera le drapeau F pour ceux qui font leur pluriel en aux. Exemples fatale/G pour fatale, fatales, fatal, fatals boudeuse/G pour boudeuse, boudeuses, boudeur et boudeurs 2.2.3 - Accord de l'adjectif verbal formé sur le participe présentLe participe présent est engendré par le drapeau v. Pour notre exemple charmant est créé à partir de du dernier affix du 2ème lemme repris au paragraphe 2.2.1. En effet, bien souvent, au participe présent correspond un adjectif verbal (et parfois un substantif) susceptible de s'accorder en genre et en nombre (charmants, charmante, charmantes). Quand c'est le cas, on peut ajouter le drapeau c au lemme à l'imparfait. Dans notre exemple, on obtient : charmais/vc Les règles du drapeau c sont : SFX c Y 3 SFX c is nts ais charmant SFX c is nte ais charmante SFX c is ntes ais charmantes Ce dernier mécanisme est très pratique, mais il faut savoir que l'orthographe française recèle quelques pièges dans ce domaine. Il faut dans certains cas s'abstenir d'utiliser le drapeau c. En effet, les graphies du participe présent et de l'adjectif verbal peuvent parfois être différentes. Quelques exemples : Exemple 1 Pierre, négligeant toute prudence, appuya sur le champignon. Pierre se montre toujours très négligent au volant. Exemple 2 Paul asséna son dernier argument à Jean, le convainquant ainsi du bien-fondé de son point de vue. Paul a été très convaincant face à Jean. Exemple 3 Le journaliste continua de poser ses questions, fatiguant les coureurs. Les questions du journaliste étaient fatigantes. Au vu de ce qui précède, il faut tenir compte des points suivants :
Grevisse (1988) donne au §1882 une liste d'adjectifs « verbaux » qui ne se forment pas sur le participe présent. 2.2.4 - Le problème de l'élision devant les noms et adjectifsComment gérer l'élision de l'article le ou de dans le cas d'un nom ou d'un adjectif commençant par une voyelle ou un « h » muet ? Les cas d'élision de le devant les noms et adjectifs sont réglés par le drapeau L Les cas d'élision de de devant les noms et adjectifs sont réglés par le drapeau M Attention : les cas d'élision devant les verbes sont réglés par d'autres drapeaux Il faut distinguer deux cas :
Dans le premier cas, on entre le nom ou l'adjectif au singulier dans le dictionnaire, accompagné des drapeaux L et M en plus de S ou de X selon le pluriel du mot (cf. 2.2.1). Exemples : éclaircissement/LMS pour éclaircissement, éclaircissements, l'éclaircissement, d'éclaircissement et d'éclaircissements. agneau/LMX pour agneau, agneaux, l'agneau, d'agneau, d'agneaux.
Dans le second cas, l'opération est une peu plus délicate : il faut entrer la forme du féminin singulier du mot, accompagnée des drapeaux LMF ou LMG (cf. 2.2.2), et le masculin singulier précédé de « l' ». Exemple : ancienne/LMF pour ancienne, anciennes, ancien, anciens, l'ancienne, d'ancienne, d'anciennes, d'ancien et d'anciens l'ancien Pourquoi est-il nécessaire de spécifier l'ancien. Examinons le « code » des drapeaux L et M : Élision de l'article 'le' PFX L N 1 PFX L 0 l' [aàâeèéêiîoôuh] Élision de l'article 'de' PFX M Y 1 PFX M 0 d' [aàâeèéêiîoôuh] Ces deux règles indiquent que tout mot commençant par une voyelle (accentuée ou non) ou par un « h » muet peut être précédé de l' ou de d'. La différence entre elles se situe au niveau du champ 3 de la ligne d'en tête : N pour l'affix L, Y pour l'affix M. Ceci signifie que le préfixe M est libre de se combiner avec n'importe quel suffixe également doté de Y (et réciproquement). En revanche, le préfixe L ne le peut pas. Ceci a pour conséquence que d' + ancienne + s est autorisé mais pas l' + ancienne + s: Cette restriction interdit au système d'accepter ou de produire les formes erronées tel l'anciens et l'anciennes, mais nécessite alors que la forme correcte l'ancien soit spécifiée séparément. Le problème ne se pose pas pour le drapeau M. Quelques remarques sur les adjectifsJusqu'à présent aucune distinction n'a été faite entre noms et adjectifs pour l'attribution des drapeaux. On pourrait cependant se demander si les drapeaux L et M, représentant respectivement l'élision des déterminants le et de, doivent vraiment être attribués aux adjectifs. En règle normale l'adjectif qualificatif se place après le nom et en conséquence les adjectifs ne peuvent être précédés de le ou de. Exemple : l'individu ignoble Mais, il ne faut pas oublier qu'en français, la plupart des adjectifs peuvent se trouver antéposés au nom qu'ils qualifient. Exemple : l'ignoble individu. Certains adjectifs, appartenant à des catégories bien précises, ne sont toutefois jamais antéposés. Pour ceux-ci, et seulement pour eux, on peut se passer des drapeaux L et M. Les catégories d'adjectifs concernées sont les suivantes :
Cette règle est largement tempérée par le fait que beaucoup de ces adjectifs sont aussi des noms et comme tels s'accordent et qu'en conséquence le dictionnaire comporte un affix pour le nom correspondant. Exemple ovale/LMS pour ovale, ovales, l'ovale, d'ovale, d'ovales anglaise/LMF pour anglais, d'anglais l'anglais 2.2.5 - L'élision devant les noms et adjectifs verbaux formés sur le participe passéSi ce participe passé est à l'origine d'un substantif, on utilise la forme féminine accompagné des drapeaux LMF, suivie de la forme masculine précédée de « l' » (cf. 2.2.4, élision de le et de devant les noms). Mais on ne fera pas de même pour un adjectif : contrairement aux adjectifs formés sur le participe présent, les adjectifs formés sur le participe passé ne peuvent jamais être antéposés en français, i.e., utilisés comme épithètes4. Ils ne seront donc jamais précédés d'un déterminant. On peut s'en rendre compte empiriquement, en comparant les quatre exemples ci-dessous : L'homme assailli. *L'assailli homme. La question assaillante. L'assaillante question. 2.2.6 - L'élision devant les adjectifs verbaux formés sur le participe présentQue faire si le participe présent peut être mis en rapport avec un adjectif verbal ? Au vu de ce qui précède, il convient d'utiliser la forme féminine accompagnée des drapeaux LMF. Il n'est pas nécessaire d'ajouter la forme masculine précédée de « l' », sauf si le verbe est intransitif (le drapeau l n'accompagne pas le lemme de l'imparfait) ou si l'adjectif verbal ne se forme pas sur le participe présent (voir les explications concernant le drapeau c en fin de section 2.2.3). 2.3 - Ajouter des verbesDans les paragraphes qui suivent, sont examinées les modalités d'ajout de verbes au dictionnaire de mots. Pour simplifier les explications, les développements qui suivent partent du principe que les verbes à ajouter appartiennent aux premier et deuxième groupes de conjugaison5. Comme le dictionnaire Francais-GUTenberg dont est issu le dictionnaire OpenOffice contenait en principe tous les verbes du troisième groupe, il est peu probable qu'il soit nécessaire d'ajouter au dictionnaire de tels verbes (sinon, se reporter à la section 2.2.7). La conjugaison des verbes reposent sur un système à 5 lemmes, c'est à dire 5 formes de conjugaison du verbe permettent d'obtenir par restriction et ajout toutes les autres formes du verbe. Les quatre premiers lemmes sont étudiés au § 2.3.1 et le cinquième au § 2.3.2 Il existe une version du fichier des affix suffisamment documentée pour être comprise à partir des explications qui suivent. 2.3.1 - Conjugaison des temps de l'indicatif, du conditionnel, du subjonctifPour les verbes des 1er et 2ème groupe, la conjugaison des temps simples de l'indicatif, du conditionnel et de subjonctif (présent, imparfait, passé simple, futur) est formé au moyen de 4 lemmes qui sont les premières personnes des temps de l'indicatif présent, imparfait, passé simple et futur. Pour les temps composés, la conjugaison est formée avec le verbe être ou avoir et le participe passé du verbe. A ces quatre lemmes sont joints 4 drapeaux : u, v, w et x. (faire attention à la casse) Prenons l'exemple du verbe charmer : charme/u charmais/v charmai/w charmerai/x Ces quatre lemmes permettent d'engendrer toutes les formes du verbe charmer à l'exception de l'infinitif et du participe passé. Voici les règles, extraites du fichier des affix, qui leur sont appliquées (ne figurent que les lignes pertinentes pour le verbe charmer) : lemme = 1ère pers. sing. de l'indicatif présent qui permet d'obtenir les 1ère, 2ème, 3ème personne singulier de l'indicatif présent, 3ème personne pluriel de l'indicatif présent 1ère, 2ème, 3ème personne singulier du subjonctif présent, 3ème personne pluriel du subjonctif présent SFX u Y 52
SFX u 0 s e je charme,
tu charmes, il charme, SFX u 0 nt e ils charment, qu'ils charment
lemme = 1ère pers. sing. de l'indicatif imparfait qui permet d'obtenir toutes les personnes de l'indicatif imparfait les 1ère, 2ème personne pluriel de l'indicatif présent, les 1ère, 2ème personne pluriel du subjonctif présent, le participe présent la plupart des adjectifs verbaux en 'ant' SFX v Y 13 SFX v s t ais il charmait SFX v ais ions [^çe]ais nous charmions SFX v ais iez [^çe]ais vous charmiez SFX v s ent ais ils charmaient SFX v ais ons ais nous charmons SFX v ais ez [^çe]ais vous charmez SFX v is nt ais charmant
lemme = 1ère pers. sing. du passé simple qui permet d'obtenir toutes les personnes du passé simple les personnes du subjonctif imparfait SFX w Y 38 SFX w i s ai tu charmas SFX w ai a ai il charma SFX w ai âmes ai nous charmâmes SFX w ai âtes ai vous charmâtes SFX w ai èrent [^çe]ai ils charmèrent SFX w i sse ai que je charmasse SFX w i sses ai que tu charmasses SFX w ai ât ai qu'il charmât SFX w i ssions ai que nous charmassions SFX w i ssiez ai que vous charmassiez SFX w i ssent ai qu'ils charmassent
lemme = 1ère pers. sing. du futur indicatif permet d'obtenir toutes les personnes du futur indicatif les personnes du conditionnel présent SFX x Y 10 SFX x i s ai tu charmeras SFX x ai a ai il charmera SFX x ai ons ai nous charmerons SFX x ai ez ai vous charmerez SFX x ai ont ai ils charmeront SFX x 0 s ai je charmerais, tu charmerais SFX x 0 t ai il charmerait SFX x ai ions ai nous charmerions SFX x ai iez ai vous charmeriez SFX x 0 ent ai ils charmeraient 2.3.2 - Infinitif, participe passéEn ce qui concerne le participe passé, il faut distinguer deux cas :
Dans le premier cas, on entre simplement l'infinitif et le participe passé dans le dictionnaire. Par exemple : bifurquer bifurqué Dans le second cas, on entre l'infinitif suivi du drapeau y. Par exemple : charmer/y Le drapeau y se compose, entre autres, des règles suivantes : lemme = infinitif qui permet d'obtenir toutes les formes du participe passé SFX y Y 67 SFX y er é er charmé SFX y er és er charmés SFX y er ée er charmée SFX y er ées er charmées 2.3.3 - L'élision devant les verbesLorsqu'on est confronté à un verbe commençant par une voyelle ou un « h » muet, la situation est un peu compliquée et il faut être extrêmement prudent par rapport à deux choses :
Les pronoms susceptibles de s'élider relèvent de différentes catégories :
La table ci-après récapitule les conditions d'élisions des pronoms devant les verbes;
On observe un grand syncrétisme entre les différentes formes, ce qui n'est pas de nature à faciliter la tâche. Aux différentes formes d'élision correspondent les drapeaux j, n, m, t, l s : PFX j N 1 élision de de JE (j'aime) PFX j 0 j' [aàâeèéêiîoôuh] PFX n Y 2 élision de la négation (tu n'aimes pas) PFX n 0 n' [aàâeèéêiîoôuh] PFX n 0 qu' [aàâeèéêiîoôuh] PFX m Y 1 élision du pronom ME (tu m'aides) PFX m 0 m' [aàâeèéêiîoôuh] PFX t Y 1 élision du pronom TE (je t'énerve) PFX t 0 t' [aàâeèéêiîoôuh] PFX l Y 1 élision de LE (je l'attends) PFX l 0 l' [aàâeèéêiîoôuh] PFX s N 1 élision de SE uniquement pour l'infinitif (s'attendre) PFX s 0 s' [aàâeèéêiîoôuh]
Il ne faut jamais combiner ces drapeaux avec c et y (voir plus bas pour les détails). L'élision de se n'est pas prise en charge par le système (sauf pour l'infinitif, par le biais du drapeau s) : voir les sections 2.2.5 et 2.2.6 pour ce qui concerne les emplois réflexifs et les verbes essentiellement pronominaux. Quels drapeaux employer et dans quels cas ? Drapeau j Le drapeau j doit, dans tous les cas, précéder les quatre premiers lemmes du verbe, mais pas l'infinitif. Tout comme le drapeau L (cf. 2.2.4, accord des noms et adjectifs), il comporte N en champ 3, ce qui l'empêche de se combiner avec un suffixe pour donner des résultats aberrants (cependant, comme pour le drapeau L, cela présente quelques inconvénients – cf. 2.2.4). Drapeau n La négation est possible avec toutes les formes du verbe donc, le drapeau n concerne tous les lemmes du verbe. Drapeaux m, t, l Si le verbe accepte un objet direct, chaque lemme devrait être en principe accompagné des drapeaux m, t et l. En fait il faut bien réfléchir au sens du verbe : Si l'objet direct ne peut pas être une personne les drapeaux m et t ne devraient en principe pas être spécifiés. On peut prendre comme exemples les verbes accélérer ou ébruiter. Si le verbe n'accepte pas d'objet direct, mais seulement un objet indirect, seuls les drapeaux m et t entrent en ligne de compte (cf. table 2.1). Le critère sémantique invoqué pour les compléments d'objets directs s'applique également aux compléments indirects. Mais il ne faut cependant pas surestimer son importance : le français dispose d'une construction appelée datif éthique, dont les grammaires parlent peu mais qui est très usitée. Rentrent dans cette catégorie toutes les constructions du type : Je peux t' aménager de la place dans mon laboratoire. Il faudra m'améliorer la conclusion de cet article. qui indiquent, la plupart du temps, le bénéficiaire de l'action accomplie. On ne peux pas sérieusement considérer toutes ces formes comme incorrectes et il faut donc en tenir compte dans l'attribution des drapeaux. Si le verbe est intransitif, les choses deviennent fort simple, on ignore les trois drapeaux m, t et l. Avant d'aller plus loin, une remarque complémentaire sur les drapeaux m et t s'impose : ils autorisent des formes erronées comme *m'absolvons et *t'énerviez. Malheureusement, la seule solution pour éviter cela consisterait à supprimer ces drapeaux et à entrer « à la main » toutes les élisions des pronoms me et te dans le dictionnaire : vu leur nombre, ce n'est pas envisageable. Concernant le cinquième lemme, l'infinitif, on le fera figurer accompagné des drapeaux nM6, dans tous les cas, et des drapeaux m, t et l, quand il y a lieu (cf. ci-dessus), ainsi que le drapeau s dans certains cas (cf. 2.3.5). 2.3.4 - Première personne du singulier du conditionnel et des subjonctifs présent et imparfait avec élision de jeLorsqu'un verbe commence par une voyelle, il faut généralement ajouter « à la main » les premières personnes des subjonctifs présent et imparfait et du conditionnel précédées du pronom je élidé (« j' »). Pour les verbes du premier groupe, la première personne du subjonctif présent est identique à celle du présent de l'indicatif, il n'est donc pas nécessaire de l'ajouter. Pour les verbes du second groupe, la première personne du présent du subjonctif est identique à celle de l'imparfait du subjonctif ; il n'est donc pas nécessaire de l'ajouter. 2.3.5 - Élision et emplois réflexifsLes drapeaux présentés jusqu'ici ne permettent pas de régler le problème de l'élision du pronom se (dans il s'aime ou ils s'aiment). En effet le drapeau s ne doit être utilisé » que pour le forme infinitive (cf. 2.3.3). Ce problème présente deux caractéristiques :
On procédera de la manière suivante :
2.3.6 - Élision et verbes essentiellement pronominauxUn problème de même nature, mais de plus grande ampleur, se pose avec les verbes dits « essentiellement pronominaux » comme s'absenter. La meilleure solution avec de tels verbes est d'en entrer manuellement toutes les formes dans le dictionnaire, à l'exception de celles qui peuvent être engendrées par les drapeaux p ou q (cf. 2.3.5). Ils sont heureusement peu nombreux (et seuls les verbes commençant par une voyelle ou un « h » muet posent problème). Le dictionnaire Open Office français en contient un certain nombre. L'infinitif et le participe présent de ces verbes doivent être entrés tels quels, accompagnés des drapeaux s, m et t. Voici un exemple (le verbe s'absenter) : m'absente t'absentes s'absente/p absentons absentez m'absentais t'absentais s'absentait/p absentions absentiez m'absentai t'absentas absentâmes absentâtes m'absenterai t'absenteras absenterions absenterez m'absentasse t'absentasses absentassions absentassiez m'absenterais t'absenterais absenterions absenteriez absentant/smt absentée/F absenter/smt 2.3.7 - Les verbes du troisième groupeLes verbes du troisième groupe doivent être traités comme les autres, selon les points qui précèdent. La seule difficulté supplémentaire est que les drapeaux gérant la conjugaison proprement dite ne sont pas toujours les mêmes que pour les deux autres groupes. D'autre part, il n'existe rien d'équivalent aux drapeaux p et q (cf. 2.3.5) pour les verbes à emplois réflexifs. En principe, le dictionnaire d'Open Office contient tous les verbes du troisième groupe, vous ne devriez donc pas avoir à vous en soucier. 2.4 - Entrer des abréviationsLe dictionnaire peut également contenir des abréviations. Si une abréviation contient un point final, celui-ci ne doit pas être tapé. En revanche on peut utiliser des points dans le corps de l'abréviation, de même que des tirets et des apostrophes. Par exemple, pour l'abréviation « c.-à-d.» de « c'est-à-dire », vous entrerez c. -à-d (sans point final). 2.5 - Utilisation des préfixesLe fichier des affixf de OpenOffice permet de gérer les préfixes latin suivants : a(d)-, con-, dé-, dis-, ex-, in-, pré-, re- et sub-. Leur utilisation peut faciliter et accélérer la composition d'un dictionnaire. Il peut être envisagé de rajouter d'autres préfixes pour composer automatiquement des mots. (anti, anté, multi, ...). Il permet aussi de gérer les élisions de préposition telles que jusque, que, quoique, puisque. Il est tout à fait possible d'ajouter d'autres préfixes que ceux figurant au fichier des affix. Il conviendra seulement de respecter les règles suivantes :
3 - Création d'un dictionnaire spécialiséLe correcteur orthographique est un ensemble complet et homogène des trois composantes décrites ci dessus. En particulier, il y a une articulation très étroite entre le fonctionnement de MySpell, les règles de codification du fichier des affix et la déclinaison de ces règles sur les lemmes du dictionnaire de mots. Le fichier des affix est constitué d'un ensemble de règles codifiées selon un formalisme à respecter pour être correctement interprétées par le programme Myspell. De plus, il est très important de respecter les règles syntaxiques suivies pour la définition des lemmes. Une déviation dans ces règles entraîne immédiatement une mauvaise application des règles dans le dictionnaire de mots. Avant toute constitution d'un nouveau dictionnaire plus spécialisé que le dictionnaire général, il convient donc de lire attentivement les principes retenus dans la formation du fichier des affix et dans les choix retenus pour la constitution du dictionnaire de mots.(chapitre 1 de ce document) En particulier, il convient de retenir que les règles pour le choix des lemmes sont les suivantes :
L'utilisateur intéressé pourra se reporter utilement au mémoire de Christophe Pythoud (chapitres 5, 6, 7) détaillant les règles de construction du dictionnaire GUTenberg, dont s'inspire le dictionnaire d'OpenOffice.org. Ce mémoire est disponible sous le nom reference.pdf à l'adresse suivante : http://www.unil.ch/ling/cp/frgut.html#documentation
4 - Tableaux récapitulatifs4.1 - Accord des noms et adjectifs
4.2 - Elision devant les noms et adjectifs
4.3 - Conjugaison des verbes du 1er et du 2ème groupe
Les verbes du 3ème groupe sont en principe tous repris dans le dictionnaire 4.4 - Elision devant les verbes du 1er et du 2ème groupe
4.5 - Elision devant les verbes du 1er et du 2ème groupe (page 2)
4.6 - Listes des Affix
Cette liste est établie pour récapituler les préfixes et suffixes utilisés avec un résumé de la règle applicable. Certaines règles ont des conditions complémentaires de mise en oeuvre qui ne sont pas indiquées ci-après. Pour plus de détails, consulter le corps du document ou le fichier des affix.
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
