Créons un dictionnaire phonétique français ! Recherche des volontaires.

Selon les statistiques, la ressource la plus demandée sur le site EasyPronunciation.com est le traducteur phonétique français. Si vous l'avez utilisé, vous avez probablement remarqué que parfois il fait des erreurs. Pour l'améliorer, j'ai décidé de créer un dictionnaire phonétique français. Avant que je vous donne tous les détails de ce projet, je voudrais expliquer d'abord comment fonctionne ce traducteur.

D'abord, j'utilise un dictionnaire qui contient la transcription phonétique de la forme principale de chaque mot français dans le format suivant :

  • prononcer_pʀɔnɔ̃se
  • prononciation_pʀɔnɔ̃sjasjɔ̃

Je vais appeler ce dictionnaire le dictionnaire phonétique français. J'ai utilisé plusieurs sources pour le créer. Dans ce dictionnaire, la transcription phonétique de certains mots est soit erronée, soit absente (surtout pour les noms propres). Ce dictionnaire est la source principale des erreurs de traduction.

Deuxièmement, le traducteur utilise de nombreuses règles qui permettent d'obtenir la transcription phonétique de la forme conjuguée du mot à partir de la transcription de sa forme principale. Pour cela, j'utilise le dictionnaire français gratuit Dicollecte. Bien que ces règles soient très complexes, ils ne causent des erreurs qu'occasionnellement. Ces erreurs sont très faciles à corriger dans la plupart des cas.

Comme vous le voyez, si on élimine les erreurs du dictionnaire phonétique français, la qualité de la traduction peut être améliorée de façon significative. Pour éliminer ses erreurs, le dictionnaire doit être vérifié par les humains. Et pour le faire, j'ai besoin des volontaires. La question se pose – comment motiver les gens à ce travail ?

J'imagine que la personne qui pourrait être intéressée par ce projet aimerait voir les résultats de son travail disponibles au grand public pour le téléchargement gratuit. C'est pour cela que je propose de publier ce dictionnaire ici sur EasyPronunciation.com sous la licence Creative Commons « Paternité – partage des conditions initiales à l'identique » 4.0. Cela veut dire que les gens pourront utiliser ce dictionnaire même à des fins commerciales à condition qu'ils citent la source de ce dictionnaire et, s'ils veulent améliorer ce dictionnaire ou en ajouter des données, ils peuvent le faire pourvu qu'ils distribuent la version dérivée avec les mêmes libertés (sous les mêmes options Creative Commons).

Pour vous donner une idée de ce qui doit être fait, le dictionnaire contient 71 405 mots. Le pourcentage approximatif des erreurs est de 5 % pour les mots réguliers et 95 % pour les noms propres (les données sont le plus souvent absentes dans le dernier cas).

Si vous voulez participer, veuillez me contacter. Je vous enverrai une partie du dictionnaire. Il vous faudra trouver et corriger toutes les erreurs et ajouter les transcriptions phonétiques manquantes. Dès que vous m'aurez envoyé le fichier corrigé, je mettrai à jour le dictionnaire et publierai les parties corrigées du dictionnaire ici sous licence CC-BY-SA 4.0 mentionnée ci-dessus.

Si vous avez des questions et des suggestions concernant ce projet, n'hésitez pas à me contacter.

Mise à jour : le dictionnaire est disponible pour le téléchargement ici.

Tags : français, dictionnaire phonétique, phonétique française, prononciation française, alphabet phonétique français

 

SVP aidez le projet –
partagez ce site avec vos amis !

Partagez SVP!

Ne pas afficher ce message :

un jour une semaine un mois