La mise à jour du traducteur phonétique anglais

Ça fait longtemps je n'ai pas écrit ici. Et cela pour une raison. Pendant les trois derniers mois j'étais en train de travailler sans relâche sur mon traducteur phonétique anglais.

J'ai consacré à peu près deux tiers de ce temps à la révision manuelle de 30 000 mots anglais les plus fréquents. Le reste du temps, j'étais en train d'améliorer l'algorithme et tester le traducteur. Les mises à jour concernent surtout le traducteur de l'anglais américain, mais il y a aussi quelques améliorations au niveau du traducteur de l'anglais britannique.

Alors, quoi de neuf ?

  1. Il y a une augmentation significative de la vitesse et du nombre de mots, y compris les formes modifiées des mots.
  2. J'ai ajouté le support pour les homographes, ainsi que les variantes de prononciation pour le dictionnaire de l'anglais américain compilé de diverses sources.
  3. Maintenant il existe une option d'ajout du symbole d'aspiration [ʰ] après les consonnes [p], [t] et [k] dans les cas où elles sont aspirées. Exemples :
    • talk [ˈtʰɔk],
    • put [ˈpʰʊt],
    • cat [ˈkʰæt].
  4. Comme vous le savez peut-être, dans l'anglais américain il y a un phénomène appelé cot–caught merger lorsque les locuteurs natifs prononcent ces deux mots de façon identique. Alors, au lieu de [ˈkʰɔt] pour "caught", les deux mots sonnent comme [ˈkʰɑt]. Certains dictionnaires, par exemple Merriam-Webster's Advanced Learner's Dictionary, ont officiellement adopté cette approche et n'utilisent que le symbole [ɑ] pour les deux sons. Maintenant vous avez une option : soit garder le [ɔ] original pour le mot "caught" ou bien n'afficher que le son [ɑ].
  5. J'ai introduit l'algorithme pour les combinaisons des mots. Comparez :
    • I have an apple [ˈaɪ ˈhæv ən ˈæpəl].
    • I have to read [ˈaɪ ˈhæf tə ˈriːd].
  6. Les acronymes inconnus – avec les points (U.S.) et sans points (USA) – sont maintenant convertis à la lettre.
  7. Les terminaisons communes sont localisées pour l'anglais américain ou britannique. Comparez :
    • wanted [ˈwɔntəd US, ˈwɒntıd GB],
    • services [ˈsərvəsəz US, ˈsɜːvısız GB],
    • weakness [ˈwiːknəs US, ˈwiːknıs GB],
    • biggest [ˈbɪgəst US, ˈbıgıst GB].
  8. L'algorithme pour les mots avec les traits d'union est amélioré. Maintenant, même si une partie du mot se trouve dans sa forme modifiée, le mot sera converti correctement. Exemple :
    • two-thirds [ˈtuː-ˈθərdz].

Afin de vous fournir un produit de qualité, j'ai testé le traducteur sur dix tests TOEFL officiels – les sections d'expression et de compréhension orales (presque 60 000 mots). J'ai utilisé le logiciel Adobe Audition afin de diminuer la vitesse de lecture des pistes audio de 50%. Ledit logiciel permet de garder la qualité naturelle de la voix. Ensuite j'ai comparé ce que j'entendais avec la transcription phonétique obtenue à l'aide de mon traducteur. La vitesse de lecture diminuée m'a permis de percevoir les petites nuances de prononciation. À l'exception de certains termes scientifiques rares et certains noms propres, la transcription correspondait à l'audio pratiquement dans tous les cas.

J'ai commencé également à investir les revenus dans la révision de la base de données pour les mots anglais rares. Alors j'espère qu'un jour ce traducteur sera tout simplement le meilleur.

Si vous l'aimez, s'il vous plait, partagez le lien avec vos amis !

Tags : anglais, traduction phonétique, phonétique anglaise, prononciation anglaise, alphabet phonétique anglais, anglais britannique, anglais américain, dictionnaire phonétique