Версия 0.1 фонетического словаря французского языка

В начале января я анонсировал создание фонетического словаря французского языка. Напомню, что цель проекта – создать бесплатный словарь, который бы содержал транскрипцию французских слов в следующем формате:

  • prononcer_pʀɔnɔ̃se
  • prononciation_pʀɔnɔ̃sjasjɔ̃

Несколько человек предложило свою помощь. Практически сразу мы поняли, что словарь содержит очень много пропущенных транскрипций и редких слов. Т.к. нас не очень много, то было бы неразумно тратить наше время на поиск, скажем, фонетической транскрипции французского слова "alkékenge" (кстати это растение). Таким образом, мы решили сосредоточить наши усилия сначала на наиболее часто встречающихся французских словах (10 000).

Я хотел наиболее рационально использовать предложенную помощь и решил создать автоматический инструмент-переводчик, который бы показывал фонетическую транскрипцию французских слов на основе общих правил чтения во французском языке. В настоящее время я живу в Китае и довольно занят, поэтому мне потребовалось почти два месяца на создание этого инструмента.

В дополнение к обычным правилам чтения каждой буквы (например, "é" читается как [e], а "ç" как [s]) я дополнительно описал более 160 исключений к этим правилам. Чтобы улучшить работу этого инструмента, я продолжаю добавлять дополнительные исключения по мере работы со словарем. В настоящее время инструмент показывает правильную транскрипцию французских слов в 90-94% всех случаев. Таким образом, наша работа (волонтеров) сводится к тому, чтобы выявить случаи несовпадения между фонетической транскрипцией слов в словаре и транскрипцией, полученной с помощью вышеописанного инструмента. Если словарь не содержит фонетической транскрипции какого-либо слова, то волонтер должен удостовериться, что инструмент показал правильную транскрипцию.

Сегодня я публикую первую версию фонетического словаря французского языка. Она содержит 3 432 слова из следующих интервалов: abaissement-attribution, cargaison-éventail, grisâtre-irrésistible. Как я и обещал в предыдущем посте, словарь публикуется под лицензией Creative Commons "С указанием авторства — С сохранением условий" 4.0.

Спасибо всем, кто принимает участие в проекте!

Пожалуйста, не давайте прямой ссылки на словарь (текстовый файл) – она все равно не сработает из-за настроек сервера EasyPronunciation.com. Если вы хотите рассказать о словаре друзьям или знакомым, пожалуйста, давайте ссылку на эту страницу.

Если вы хотите помочь проекту, свяжитесь, пожалуйста, со мной. Даже если у вас нет времени, чтобы участвовать в создании словаря, вы очень поможете, если опубликуете ссылку на вышеуказанную страницу в интернете или поделитесь ей с друзьями с помощью социальных сетей. Это поможет поднять рейтинг страницы в поисковых системах (гугл, яндекс), привлечет внимание к проекту и дополнительных волонтеров. Так у нас получится пораньше создать качественный словарь и заодно улучшить работу переводчика французских слов в транскрипцию.

Кстати о переводчике, есть хорошая новость и есть плохая новость. Хорошая новость - это то, что автоматический инструмент, упомянутый выше, теперь встроен в переводчик. Это означает, что если какое-то слово не может быть переведено с использованием старого алгоритма, переводчик покажет его фонетическую транскрипцию на основе правил чтения. Транскрипция, полученная подобным образом, будет окружена двумя знаками "_". Плохая новость - это то, что словарь теперь изменен; из-за этого часть глаголов 3-ей группы (а возможно и другие слова) теперь переводится с ошибками. Так что в данный момент переводчик находится в "переходном" периоде. Как только будет выпущена окончательная версия фонетического словаря французского языка, я смогу исправить эти ошибки.

Теги: французский язык, словарь с транскрипцией, транскрипция французских слов, произношение французских слов