OK
AJAX error!

Les forumsDictionnaireDictionnaire 6.0

Dictionnaire 6.0

Contrairement aux versions précédentes qui, depuis la version 3.0, ajoutaient des fonctionnalités ou des étiquettes, complexifiant grandement le dictionnaire pour Hunspell, la version 6.0 est un retour aux origines, vers plus de simplicité.

Les versions 3, 4, et 5, servant au correcteur grammatical, incluaient notamment des étiquettes grammaticales, ce qui nécessitait de créer des lemmes virtuels qui engendraient des formes fléchies correctement étiquetées.

Or, plus besoin de tout ça à présent, Grammalecte ne se sert plus de Hunspell pour la grammaire et il n’en a plus besoin que dans Firefox pour les suggestions orthographiques (et même ça, ça ne durera qu’un temps).

C’est pourquoi la version 6 est une simplification de la version 5 du dictionnaire. Il n’y aura plus d’étiquettes grammaticales, ni de lemmes virtuels.

À vrai dire, la version 5 de la structure du dictionnaire ne va pas pour autant disparaître, elle va continuer à exister, mais uniquement comme source. À partir de cette source, sera généré :
— le dictionnaire 6 pour Hunspell, simplifié,
— le lexique grammatical compilé en dictionnaire binaire indexable constituant le graphe de mots (DAWG) de Grammalecte.

Ça ne change cependant rien à ce qu’on fait ici.

Quel effet ça devrait avoir au final ? Normalement, ça devrait simplifier le travail de Hunspell pour faire des suggestions orthographiques.

Ce dictionnaire sortira avec la prochaine version de Grammalecte, d’abord pour tester s’il n’y aucun problème, puis ce sera le dictionnaire fourni comme standard.
le 20 novembre 2016 à 10:21
A partir de quand trouvera-t-on ce dictionnaire dans LO, Firefox et Thunderbird ?
Pierre
le 30 novembre 2016 à 17:10
Je vais attendre probablement quelques mois avant de publier ce dictionnaire… parfois il faut du temps pour détecter les problèmes.

Ensuite, pour l’intégration dans Firefox, Thunderbird et LO, ce n’est pas moi qui gère ça. Je ne sais pas.

Avez-vous constaté que ça fonctionnait mieux ? Pour ma part, je ne vois pas de différence.
le 30 novembre 2016 à 17:34
Humm. Quelque chose m'échappe là. Si vous me demandez si ça fonctionne mieux, c'est que le dictionnaire a été publié quelque part.
Et c'est contradictoire avec ce que vous venez de dire (écrire) :

Je vais attendre probablement quelques mois avant de publier ce dictionnaire… parfois il faut du temps pour détecter les problèmes.

le 30 novembre 2016 à 17:42
Le dictionnaire est déjà inclus dans la dernière version de Grammalecte pour LibreOffice, uniquement là.

Mea culpa, j’ai omis de le signaler et, de surcroît, j’ai oublié de modifier le numéro de version intégré dans l’extension. Vous ne pouviez donc pas le savoir.
le 30 novembre 2016 à 17:56
Quelles sont les conséquences pour LanguageTool qui utilise le lexique Dicollecte avec les étiquettes grammaticales ?
le 02 décembre 2016 à 00:24
Aucune. Ça ne change rien pour le lexique.
le 02 décembre 2016 à 01:44
Cela signifie-t-il que la prochaine version contiendra à la fois les formes masculines et féminines ?
Envisagez-vous d'héberger un jour le projet sur Github?
le 24 décembre 2016 à 15:37

Cela signifie-t-il que la prochaine version contiendra à la fois les formes masculines et féminines ?


Non, le principe du dictionnaire reste le même, générer les formes fléchies à partir d’un lemme. Le lemme féminin, s’il existe, demeure le standard pour notre dictionnaire.
La différence entre les deux dictionnaires (5 et 6) tient à une fonctionnalité subtile de Hunspell, la possibilité de créer des lemmes “virtuels”, c’est-à-dire vides en quelque sorte, à partir desquels on régénère toutes les formes fléchies, y compris le lemme lui-même.
À présent, les lemmes dans le dictionnaire 6 ne sont plus virtuels, c’est-à-dire qu’ils n’ont plus besoin de se régénérer eux-mêmes pour exister comme forme fléchie. Il faut lire la doc de Hunspell pour bien saisir la différence.

Envisagez-vous d'héberger un jour le projet sur Github?


Non, la gestion du dictionnaire se fera toujours ici.
le 24 décembre 2016 à 15:50
La version 6.0.2 est dorénavant publiée, aucun autre bug n’ayant été constaté.
le 31 janvier 2017 à 16:02
Bonjour,

Admin :
Je vais attendre probablement quelques mois avant de publier ce dictionnaire… parfois il faut du temps pour détecter les problèmes.

Ensuite, pour l’intégration dans Firefox, Thunderbird et LO, ce n’est pas moi qui gère ça. Je ne sais pas.



Le lien sur www.dicollecte.org… pointe vers www.dicollecte.org… (404). Une fois le lien réparé, je peux intégrer cette version dans Firefox 52 et Thunderbird 52, qui sont les prochaines versions majeures pour les deux logiciels, et la prochaine version ESR de Firefox. La dernière pour Windows XP et Vista, aussi.
le 31 janvier 2017 à 16:28
Corrigé. Merci pour le signalement.
le 31 janvier 2017 à 17:00
J'ai remarqué que les fichiers *.txt, *.dic et *.aff sont passés du format Unix (CR) au format Dos (CR + LF) dans la version 6.0.2.
Ce n'est pas forcément un problème mais je le signale quand même.
le 01 février 2017 à 21:33
Étonnant… parce que je ne crois pas avoir changé de méthode de génération entre temps… Les fichiers source sont toujours au depuis lors… Peut-être que ça vient du passage à Python 3.6 ?
le 01 février 2017 à 22:26
pour ce qui est de la performance du dictionnaire v6, j'ai l'impression que ce bug :
bugs.documentfoundation.org…
est venu perturber les performances attendues de ce nouveau dictionnaire.

Et effectivement, je trouvais les suggestions particulièrement lentes.
On verra avec la sortie de la 5.3.1, mais le ressenti ne sera plus comparable.
le 14 février 2017 à 17:47

Notification par e-mail    3