Создадим фонетический словарь французского языка! Нужны добровольцы.

По статистике самый посещаемый ресурс сайта EasyPronunciation.com – это переводчик французских слов в транскрипцию. Если Вы пользовались им, то наверняка заметили, что иногда он делает ошибки. Чтобы улучшить его работу, я решил открыть проект по созданию бесплатного фонетического словаря французского языка. Перед тем, как вдаваться в подробности проекта, я бы хотел объяснить, как работает фонетический переводчик для французского языка.

Во-первых, я использую словарь, который содержит фонетическую транскрипцию словарных форм слов французского языка в следующем формате:

  • prononcer_pʀɔnɔ̃se
  • prononciation_pʀɔnɔ̃sjasjɔ̃

Назовем этот словарь фонетическим словарем французского языка. Для его создания я использовал самые различные источники. В этом словаре для некоторых слов фонетическая транскрипция не указана (в основном это имена собственные), а для некоторых – указана с ошибками. Этот словарь – основной источник ошибок в работе фонетического переводчика.

Во-вторых, переводчик использует очень сложный набор правил, которые позволяет получить фонетическую транскрипцию измененной формы слова из словарной. Для этого я использую бесплатный словарь французского языка Dicollecte. Хотя этих правил очень много, они лишь изредка дают ошибки. Исправить подобные ошибки можно довольно легко и быстро.

Как Вы видите, если удастся избавиться от ошибок в фонетическом словаре, качество работы переводчика будет значительно улучшено. Чтобы избавиться от этих ошибок, нужно, чтобы словарь вычитали живые люди, добровольцы. Встает вопрос – как замотивировать людей на это?

Я предполагаю, что люди, которые могли бы заинтересованы в этом проекте, хотели бы, чтобы результаты их работы были доступны всем для бесплатного скачивания. В связи с этим я предлагаю, чтобы окончательная версия фонетического словаря была опубликована на сайте EasyPronunciation.com под лицензией Creative Commons "С указанием авторства — С сохранением условий" 4.0. Согласно этой лицензии люди смогут использовать данный словарь для любых целей, в том числе коммерческих, если они при этом указывают источник, откуда был взят словарь, и в случае, если они хотят улучшить словарь или добавить в него данные, то они должны будут распространять измененную версию словаря под тем же типом лицензии.

Опишу кратко поле работы: словарь содержит 71 405 слов. Навскидку, процент ошибок для обычных слов – около 5%, для имен собственных – 95% (фонетическая транскрипция отсутствует).

Если Вы хотите принять участие в проекте, свяжитесь, пожалуйста, со мной. Я пришлю Вам текстовый файл, содержащий фрагмент словаря. Вам нужно будет исправить в нем ошибки и добавить транскрипцию для тех слов, где ее нет. Как только Вы пришлете мне исправленный файл, я обновлю словарь на сайте и опубликую исправленные части словаря под лицензией CC-BY-SA 4.0, упомянутой выше.

Если у Вас есть какие-то вопросы или предложения по поводу проекта, просьба связаться со мной.

Обновление: словарь доступен для скачивания здесь.

Теги: французский язык, словарь с транскрипцией, транскрипция французских слов, произношение французских слов