OK
AJAX error!

Documentation

Les différents dictionnaires

Répartition des graphies

Lemmes et formes fléchies

Les drapeaux

Nature grammaticale

Champs lexicaux

Documentation de Hunspell

Politique du dictionnaire

Les dictionnaires français

En 1990, le Conseil supérieur à la langue française et l’Académie française ont proposé une réforme de l’orthographe qui concerne plusieurs milliers de mots. L’emploi des nouvelles graphies n’est pas obligatoire. Les anciennes comme les nouvelles sont considérées comme correctes. À noter que certains mots concernés ne sont pas modifiés : la réforme ne fait que sélectionner une graphie parmi plusieurs possibles.

La nouvelle orthographe suscite beaucoup de polémiques. Afin de satisfaire autant que possible toutes les sensibilités vis-à-vis de la réforme, nous créons quatre dictionnaires à partir de la base de données :

La genèse de ces dictionnaires nécessite de classer chaque entrée dans un sous-dictionnaire. Il existe 5 sous-dictionnaires : Commun, Moderne, Classique, Réforme, Annexe.

La genèse des dictionnaires se fait selon ce schéma :

  • dictionnaire «Moderne» : Commun + Moderne.
  • dictionnaire «Classique» : Commun + Moderne + Classique.
  • dictionnaire «Réforme 1990» : Commun + Réforme.
  • dictionnaire «Toutes variantes» : Commun + Moderne + Classique + Réforme + Annexe.

Répartition des graphies

Lorsqu’un mot n’a qu’une seule graphie, elle est placée dans le sous-dictionnaire Commun.

Lorsqu’un mot possède deux graphies, plusieurs répartitions sont possibles :

Lorsqu’un mot possède plus de deux graphies, nous pouvons ne conserver que deux d’entre elles, et les répartir comme ci-dessus, ou bien nous pouvons en conserver plusieurs et leur attribuer une répartition en fonction des usages (par exemple, maharadja). En général, nous ne conservons que les graphies les plus fréquentes et éliminons les autres.

Le sous-dictionnaire Annexe sert à stocker des graphies très rares ou des mots susceptibles de créer des confusions avec d’autres plus courants. Ce sous-dictionnaire sert plutôt de zone de stockage pour exceptions gênantes.

Autant que possible, nous préférons ne proposer qu’une seule graphie par mot dans les dictionnaires «Moderne» et «Réforme 1990». Le dictionnaire «Classique» est une extension du «Moderne». Le dictionnaire «Toutes variantes» est un vaste bordel.

La répartition des graphies est un sujet souvent polémique.

Tous les mots du dictionnaire n’ont pas été examinés, pas plus que leurs éventuelles graphies alternatives, certains mots possèdent donc plusieurs graphies, tandis que d’autres n’en ont qu’une seule alors qu’ils pourraient en avoir plusieurs. La question des variantes graphiques est un chantier permanent.

Lemmes et formes fléchies

Tous les mots du français ne sont pas présents directement dans le dictionnaire. Celui-ci ne contient que des lemmes à partir desquels les formes fléchies seront générées : les pluriels, les formes masculines et féminines, les conjugaisons, et parfois des formes dérivées. Ces déclinaisons sont générées par des drapeaux qui décrivent les modifications à apporter sur le lemme.

Dans notre dictionnaire, c’est la forme féminine, lorsque celle-ci existe, qui sert de lemme à partir duquel le masculin sera engendré. Par exemple, dans notre dictionnaire, française est le lemme de français. Ce choix est pratique : il est presque toujours possible de trouver la forme masculine à partir de la terminaison du féminin, tandis que l’inverse n’est pas possible. Par exemple, un mot finissant par -eur ne détermine aucunement si la forme féminine sera en -euse, en -eure ou en -rice.

Drapeaux générant les formes fléchies

Chaque drapeau permet d’apposer un ou plusieurs affixes sur le lemme (un affixe est un préfixe ou un suffixe). Chaque affixe s’applique sur le lemme selon des règles définies dans le fichier des affixes. Un lemme peut être tronqué avant l’ajout d’un affixe ; un affixe ne s’applique que dans des conditions déterminées.

Un drapeau est codé sur deux caractères.

Drapeaux pour les non-verbes

La première lettre de ces drapeaux est une majuscule.

Pluriels
S.pluriel en -s.
S*pluriel en -s avec formes élidées.
X.pluriel en -x.
X*pluriel en -x avec formes élidées.
I.pluriel des mots latins.
I*pluriel des mots latins avec formes élidées.
A.pluriel des mots anglais (gentleman, -men ; miss, -es ; penalty, -ties ; smash, -es).
A*pluriel des mots anglais avec formes élidées.
Pluriels & formes féminines
F.lemme féminin dont la forme masculine adopte un pluriel en -s.
F*idem avec formes élidées.
W.lemme féminin dont la forme masculine adopte un pluriel en -x.
W*idem avec formes élidées.
Élisions (préfixes)
L'élision de “le” ou “la”.
D'élision de “de”.
Q'élision de “que”.
Q*élision de “quoique”, de “puisque”, de “lorsque”.
Qjélision de “jusque”.
Siélision de “si”.
Unités de mesure (préfixes)
Umajout des préfixes: milli, nano, hecto, pico, etc.
U.idem sous leur forme abrégée.

Note : Il n’existe pas de drapeaux pour les préfixes anti-, contre-, dé-, in-, pré-, re-, ré-, super-, etc. Les seuls préfixes que les règles d’affixation génèrent sont des formes élidées ou les préfixes pour les unités de mesure. C’est pourquoi le dictionnaire doit contenir des entrées séparées pour accessible et inaccessible. Ce choix délibéré permet d’éviter les confusions.

Conjugaison des verbes

Le premier caractère de ces drapeaux est une minuscule. Le second un chiffre pour les cas généraux, une lettre majuscule pour les cas particuliers. Le troisième groupe ne contient guère que des cas particuliers.

Premier groupe
verbes en -er, -ger, -cer, -yer.
verbes en -ecer, -emer, -ener, -eper, -erer, -eser, -ever, -evrer, ainsi que les verbes en -eter et -eler, dont la consonne ne se double pas. Changement du e en è avant la syllabe muette.
verbes en -ébrer, -écer, -écher, -écrer, -éder, -éger, -égler, -égner, -égrer, -éguer, -éler, -émer, -éner, -éper, -équer, -érer, -éser, -éter, -étrer, -évrer, -éyer. Changement du é en è.
verbes en -eler, -eter. Doublement des consonnes l ou t.
 0pas d’élisions.
 1élisions pour formes intransitives.
 2élisions pour formes transitives.
 3élisions pour formes pronominales.
 4élisions pour formes transitives et pronominales.
 5élisions pour formes transitives indirectes.
a6verbes pronominaux réciproques.
a8verbes impersonnels (infinitif + singulier).
a9verbes impersonnels (pluriel).
Deuxième groupe
f0pas d’élisions.
f1élisions pour formes intransitives.
f2élisions pour formes transitives.
f3élisions pour formes pronominales.
f4élisions pour formes transitives et pronominales.
f5élisions pour formes transitives indirectes.
Troisième groupe
Tous les drapeaux pour le 3e groupe sont des cas particuliers et sont dédiés à un seul verbe ou une liste définie.
iverbes en -ir.
p,qverbes en -oir.
tverbes en -dre, -tre, -pre.
uverbes en -battre.
vverbes en -mettre.
wverbes en -eindre, -oindre, -aire, -aindre, -aincre, -aître, -croître.
xverbes en -oire, -clore, -clure, -ou(r)dre, -vre.
yverbes en -ire.
Participes passés
p+participes passés pour les verbes du premier et du deuxième groupe.
p.participe passé invariable pour les verbes du premier et du deuxième groupe.
q+participes passés pour certains verbes du troisième groupe.
q.participe passé invariable pour certains verbes du troisième groupe.

Méta-drapeaux

Ces drapeaux n’engendrent aucune déclinaison. Ils indiquent des règles spécifiques.

()Indique un lemme virtuel. Un lemme virtuel n’est pas inclus dans la liste des déclinaisons. Mais en vérité, pour le dictionnaire français, les lemmes virtuels s’engendrent eux-mêmes avec d’autres drapeaux. Par exemple, accroupir/f3() va recréer sa forme à l’infinitif avec les drapeaux m’, t’, s’ pour générer m’accroupir, t’accroupir, s’accroupir.
||Casse imposée.
--Entrée reconnue, mais exclue des suggestions du correcteur.
**Flexion sur le préfixe et le suffixe imposée (circumfix dans Hunspell).

Nature grammaticale

Noms et adjectifs

nomNom commun (ou un nom propre s’utilisant avec déterminant&: la France, l’Everest, les États-Unis, etc.).
adjAdjectif.

Noms propres

prnPrénom.
patrPatronyme.
nprIndique un nom propre qui ne nécessite pas de déterminant : Berlin, Hawaï, Linux, etc.

Inflexions 

sgsingulier.
plpluriel.
invinvariable en nombre, c’est-à-dire singulier ou pluriel.
masmasculin.
femféminin.
epiépicène, c’est-à-dire masculin ou féminin.

Verbes

Les étiquettes des verbes sont nombreuses et suivent un code qui contient de nombreuses informations. Le code contient 10 caractères, v pour verbe, un chiffre pour le groupe, puis huit lettres ou tirets bas (_) pour les propriétés des verbes. Le x signale un cas particulier, le tiret bas est neutre.

0vle premier caractère est toujours un v.
10, 1, 2, 3le groupe du verbe : 1 pour le 1er groupe, 2 pour le 2e groupe, 3 pour le 3e groupe, 0 pour avoir et être.
2a, e, _verbe avoir, verbe être.
3i, x, _verbe intransitif.
4t, x, _verbe transitif direct.
5n, x, _verbe transitif indirect.
6p, q, r, e, x, _verbe pronominal, usage pronominal possible, verbe pronominal réciproque, usage pronominal avec “en”.
7m, x, _verbe impersonnel.
8e, x, _avec verbe auxiliaire être.
9a, x, _avec verbe auxiliaire avoir.

Inflexions 

infiinfinitif,
ppreparticipe présent,
ppasparticipe passé,
ipreindicatif présent,
ipsipassé simple,
iimpimparfait,
ifutfutur,
condprésent conditionnel,
spresubjonctif présent,
simpimparfait du subjonctif,
impeimpératif.
 
1sg1re personne du singulier.
2sg2e personne du singulier.
3sg3e personne du singulier.
1pl1re personne du pluriel.
2pl2e personne du pluriel.
3pl3e personne du pluriel.
1isg1re personne du singulier, forme interrogative en -è (ou en -é si pas de confusion possible avec un participe passé : puissé, dussé, fussé, eussé).
1jsg1re personne du singulier, forme interrogative en -é (confusion possible avec un participe passé).

Divers

advAdverbe.
loc.advLocution adverbiale.
loc.adjLocution adjectivale.
loc.verbLocution verbale.
interjInterjection.
mgMot grammatical.
detDéterminant.
prepPréposition.
nbNombre.
cjConjonction.
proPronom.

Champs lexicaux

Si une entrée appartient à plusieurs champs lexicaux, les séparer par un espace.

Variantes orthographiques

varvariante orthographique (graphies proches). Exemple : anévrysme, au lieu d’anévrisme. Ces mots sont souvent placés dans le sous-dictionnaire “Annexe”.
altgraphie alternative d’un mot (graphies dissemblables). Exemple : éthologiste, au lieu d’éthologue.
dicindique une variante graphique répertoriée par un dictionnaire de référence.

Usage

rarerarement employé.
vxobsolète, désuet.
néonéologisme, pour les mots dont la pérennité est douteuse.
famfamilier, grossier, vulgaire.
fxafaux-ami, mot très semblable à un autre d’emploi courant.

Catégorie

symbsymbole.
abrabréviation.
abtyabréviation typographique.
citéville, village, quartier.
dépnom déposé, devenu nom commun depuis lors (par exemple, mobylette).
TMproduit ou nom de compagnie (réservé à quelques exceptions à la politique du dictionnaire).
sigsigle.
ordnombre ordinal.
onomonomatopée.

Variétés nationales/régionales

afrafricanisme.
belgbelgicisme.
frafrancisme.
helvhelvétisme.
québquébécisme.
régrégionalisme.

Mots dérivés des langues régionales

occoccitan, provençal, auvergnat, gascon, etc.
oillangue d’oïl, normand, champenois, lorrain, wallon, etc.
celtcelte, gaulois.

Emprunts à d’autres langues

latlatin.
grecgrec.
anglanglais.
allallemand.
néernéerlandais.
flaflamand.
itaitalien.
espespagnol.
portportugais.
dandanois.
norvnorvégien.
suésuédois.
finnfinnois.
islislandais.
rusrusse.
polpolonais.
turcturc.
perspersan.
araarabe.
hébhébreu.
hindhindi.
sskrsanskrit.
chinchinois.
japjaponais.
étrautres origines étrangères.

Documentation de Hunspell (en anglais)

Politique du dictionnaire : quels mots sont acceptés ?

Nous n’acceptons pas tous les mots dans notre dictionnaire. Ce point est délicat et souvent sujet à controverses.

Voir le fil dans notre forum.

La langue française
Réforme de 1990
OpenOffice.org