Version 0.1 du dictionnaire phonétique français

Le projet est abandonné - lisez une explication (en anglais)

À la fin du mois de janvier, j'ai annoncé le projet du dictionnaire phonétique français. Pour vous rappeler de quoi il s'agit, le but est de créer un dictionnaire gratuit qui contiendrait la transcription phonétique des mots français en format suivant :

  • prononcer_pʀɔnɔ̃se
  • prononciation_pʀɔnɔ̃sjasjɔ̃

Plusieurs personnes ont proposé leur aide. Presque tout de suite on a réalisé que le dictionnaire contient beaucoup de transcriptions manquantes et trop de mots très rares. Puisque nous ne sommes pas très nombreux, il ne serait pas très raisonnable de perdre notre temps en recherche de la transcription phonétique, disons, du mot « alkékenge » (en passant, c'est une plante). Alors, on a décidé de limiter nos efforts d'abord sur les mots français les plus populaires (10 000).

Je voulais utiliser l'aide qu'on m'a proposée de façon judicieuse, alors, j'ai décidé de créer un outil automatique qui donnerait la transcription phonétique des mots français d'après les règles générales de la prononciation française. Actuellement je réside en Chine et suis un peu occupé, et cela m'a pris presque deux mois pour créer cet outil.

En plus des règles générales pour chaque lettre (par exemple « é » est prononcée comme [e] ou « ç » est prononcée comme [s]), j'ai décrit aussi plus de 160 exceptions à ces règles. Je continue toujours à en ajouter pour améliorer la qualité de la traduction phonétique. Actuellement, l'outil donne la bonne transcription des mots français dans 90-94% des cas. Le travail des volontaires consiste à comparer les différences entre la transcription phonétique des mots dans le dictionnaire et la transcription obtenue avec l'outil automatique. Si le dictionnaire ne contient pas de transcription pour un mot donné, le volontaire doit s'assurer que l'outil a donné la bonne transcription.

Aujourd'hui je suis très heureux de publier la première version du dictionnaire phonétique français. Il contient 3 432 mots dans les intervalles suivants : abaissement-attribution, cargaison-éventail, grisâtre-irrésistible. Comme je l'ai mentionné avant, le dictionnaire est publié sous licence Creative Commons « Paternité – partage des conditions initiales à l'identique » 4.0.

Merci à tous ceux qui participent !

Veuillez ne pas laisser de liens directs vers le dictionnaire (le fichier texte) – le hotlinking ne fonctionnera pas sur EasyPronunciation.com. Si vous voulez partager le dictionnaire avec vos amis, SVP, publiez le lien vers cette page.

Si vous voulez participer, SVP, contactez-moi. Même si vous ne voulez pas participer, il serait très apprécié, si vous pouviez partager le lien vers la page mentionnée ci-dessus avec vos amis, par exemple, à l'aide des réseaux sociaux. Cela aiderait à promouvoir le projet dans les moteurs de recherche et attirer plus de volontaires. On pourra finir le projet plus tôt et en même temps améliorer la qualité du traducteur phonétique français.

En parlant du traducteur, il y a une bonne nouvelle et une mauvaise nouvelle. La bonne, c'est que j'ai intégré l'outil automatique dans le traducteur et maintenant si le mot ne peut pas être traduit avec l'ancien algorithme, il sera traduit avec l'aide de cet outil. La transcription phonétique obtenue de cette façon sera entourée de signes « _ ». La mauvaise nouvelle, c'est qu'une partie du dictionnaire est maintenant changée ce qui a affecté la traduction des verbes du troisième groupe (et probablement d'autres mots). Alors, le traducteur est maintenant dans une période transitoire. Une fois le travail sur le dictionnaire terminé, je pourrai corriger ces erreurs.

Tags : français, dictionnaire phonétique, phonétique française, prononciation française, alphabet phonétique français