OK
AJAX error!

Les forumsDictionnaireCe week-end-là… (mot composé + là)

Ce week-end-là… (mot composé + là)

Bonjour,

Il y a quelque semaines j'ai posté un faux positif sur le forum de Grammalecte, puisque lorsqu'on écrit quelque chose du type "ce week-end là...", celui-ci demande le tiret entre "week-end" et "là", ce qui me semblait étrange vu la présence dans le mot précédent d'un autre tiret.
La réponse - au demeurant fort juste - d'Admin a été que la graphie "week-end-là" n'est pas proscrite, et je m'en étais tenu à ça, jusqu'à ce qu'aujourd'hui je corrige pour mettre le second tiret, et que le correcteur orthographique cette fois-ci me sous-ligne le tout, en proposant comme correction "week-end" tout simplement...
Je ne suis pas suffisamment au fait du fonctionnement du correcteur pour pouvoir apporter une recommandation précise en ce cas, mais clairement quelque chose ne va pas, soit la graphie "week-end-là" est proscrite et donc Grammalecte devrait accepter "week-end là" par exemple, soit week-end-là est correcte et il faut en "informer" le dictionnaire. Les deux ne peuvent avoir raison :)
Que pensez-vous de tout ça ?
Cordialement,
Mark.
le 22 novembre 2012 à 00:03
Bonjour,

La logique du correcteur grammatical et celle du correcteur orthographique sont très différentes. Et, en fait, je viens de découvrir que “week-end-là” n’était pas reconnu par le correcteur orthographique.
Il s’agit d’un effet de bord auquel je n’avais pas pensé. Normalement, quand un mot composé n’est pas reconnu par le correcteur, celui-ci le scinde et examine chaque partie séparément. C’est ainsi que des graphies comme “donne-le-moi”, “chose-là”, etc. sont reconnues sans qu’il soit nécessaire de les mettre dans le dictionnaire.
Or, ici, lorsque le correcteur scinde “week-end-là”, il analyse “week”, “end” et “là”. Les deux premiers mots étant absents du dico, le correcteur souligne le tout.
Il va falloir que je trouve une méthode pour corriger ce problème, qui doit advenir sur d’autres mots composés aussi.
le 22 novembre 2012 à 00:21
D'accord je comprends maintenant !
En fait il faudrait que le correcteur vérifie non seulement les éléments scindés, mais aussi des combinaisons des éléments contigus, pour voir si ceux-ci sont dans le dictionnaire. A-B-C doit donc être testé pour : A, B, C comme c'est le cas en ce moment, lorsque le tout n'est pas dans le dictionnaire, mais aussi A-B et B-C (pas certain que des cas existent pour le dernier)
Une fois l'analyse de chaque partie faite, la dichotomie centrale serrait sur l'existence de C pour moi :

Soit le tout est dans le dictionnaire :
si A et B et C existent alors JUSTE

sinon (soit A, soit B, soit C n'existe pas, disjonction de cas sur C) :
si C existe alors :
si A-B existe JUSTE (le cas de week-end-là)
ou si A-B n'existe pas FAUX (car soit A soit B n'existe pas puisque tous ne peuvent exister ici) (ouek-end-là, par exemple)
si C n'existe pas alors :
si B-C existe alors JUSTE (car A existe ici) (exemple à trouver...)
ou si B-C n'existe pas FAUX

Je ne sais pas si ça peut vous aider... c'est en expressions régulières que le dictionnaire fonctionne si j'ai bien compris non ? Je ne pense pas qu'il soit difficile de traduire cette disjonction de cas en regex... Vous m'en redonnerez des nouvelles !
Si je peux faire quoi que ce soit d'autre pour aider faites le moi savoir.
Cordialement,
Mark.
le 22 novembre 2012 à 03:37
Il suffit qu’un seul des éléments soit absent pour que tout le mot soit souligné.

Contrairement au correcteur grammatical, le correcteur orthographique n’utilise pas les expressions régulières. En fait, je ne sais pas vraiment comment il fonctionne, je ne suis qu’un utilisateur qui se sert de la doc existante. Contrairement à Lightproof que je modifie comme je l’entends, je ne sais pas modifier Hunspell pour l’améliorer ou le conformer à mes besoins. J’avais commencé à étudier le C++ il y a quelques années, mais j’ai renoncé, car ce langage est une vraie punition à mes yeux. Si je dois apprendre un langage de bas niveau, ce sera le Go (golang.org…) qui me paraît être une petite merveille, mais c’est une autre affaire.

Pour notre problème, je vois trois solutions :
— inclure week et end dans le dictionnaire,
— créer de nouveaux drapeaux pour générer des formes fléchies spécifiques,
— utiliser le système de composition de Hunspell.

La troisième solution a ma préférence, mais je connais mal ce point. Il faudra patienter un peu.
le 22 novembre 2012 à 09:34
Personnellement j'aime le C pour sa grande "humanité"... assez simple à enseigner et à apprendre, très bien implanté dans le monde informatique et donc capable de produire du contenu utile. Mais certains défauts sont à combler très certainement (je ne connaissais pas le Go par exemple...)
Patienter n'est pas le problème, je ne suis pas pressé du tout :) Peut-être pourrais-je me pencher plus particulièrement sur la chose puisque votre propre temps semble déjà fort occupé par le travail sur Grammalecte.
Je vais regarder d'un peu plus près comment fonctionne Hunspell et nous en reparlerons.
Par rapport à vos trois propositions je ne pense pas qu'inclure week et end serrait une bonne idée car cela favoriserait la non détection d'erreurs : je voulais t'end ire quelques mots par exemple ne serrait plus signalé ; la partie sur les formes fléchies consisterait simplement à ajouter week-end-là en drapeau à l'entrée week-end en le signalant comme forme fléchie c'est bien ça ? J'imagine que ça fonctionnerait mais c'est effectivement une solution qui manque de généralité, de plus j'imagine que la visée principale des formes fléchies est de recenser les conjugaisons et déclinaisons, pas de résoudre des problèmes de composition comme celui qui nous intéresse... mais peut-être est-ce là un à priori. La troisième solutions a donc ma préférence aussi.
le 22 novembre 2012 à 17:41
Je viens de trouver cette discutions qui est pertinente (bien qu'en anglais le problème est identique) :
bugzilla.mozilla.org…
le 22 novembre 2012 à 18:06
Il y a trop longtemps que je n’ai plus programmé en C (mon langage favori comme étudiant). Maintenant, j’ai presque tout oublié, mais surtout ce langage ne répond plus vraiment à mes besoins.

Ajouter «-là» comme suffixe créerait trop de lourdeur. Le système d’affixation du français est déjà l’un des plus compliqués parmi les dicos Hunspell, juste après le hongrois. Intégrer week et end séparément, c’est la solution facile et un peu sale.

Marcool :
Je viens de trouver cette discutions qui est pertinente (bien qu'en anglais le problème est identique) :
bugzilla.mozilla.org…


Je connais bien. Il y avait le même problème chez OOo et ce fut une longue lutte pour faire passer les mots au correcteur sans les scinder au niveau du trait d’union. Une autre époque. Celle des débuts de ce site. :)
le 22 novembre 2012 à 18:25

Notification par e-mail    0