Обновления в переводчике английских слов в транскрипцию

Давно я здесь не писал. И на то была причина. В течение последних трех месяцев я непрерывно работал над переводчиком английских слов в транскрипцию.

Две трети этого времени было потрачено на вычитку 30 000 наиболее популярных английских слов. В остальное время я улучшал алгоритм и тестировал переводчик. Обновления в основном касаются американского английского, но некоторые улучшения также были внесены в алгоритм и для британского английского.

Итак, что нового?

  1. Значительно возрасла скорость и увеличилось количество слов в словаре, в том числе их измененных форм.
  2. Я добавил поддержку омографов и вариантов произношения для американского английского словаря, составленного из разных источников.
  3. Теперь есть возможность добавить знак [ʰ] после согласных звуков [p], [t] и [k] в тех случаях, когда они произносятся с придыханием, например:
    • talk [ˈtʰɔk],
    • put [ˈpʰʊt],
    • cat [ˈkʰæt].
  4. Как вы, вероятно, знаете, в американском английском есть феномен под названием cot–caught merger, когда носители произносят эти два слова одинаково. Таким образом, вместо [ˈkʰɔt] в случае "caught", оба слова будут звучать [ˈkʰɑt]. Некоторые словари, в частности Merriam-Webster's Advanced Learner's Dictionary, официально поддерживают этот вариант произношения и используют только символ [ɑ] для обоих звуков. Теперь у вас есть выбор: использовать в транскрипции один из двух звуков, [ɔ] или [ɑ], или же отображать только звук [ɑ].
  5. Я ввел алгоритм для комбинаций слов. Сравните:
    • I have an apple [ˈaɪ ˈhæv ən ˈæpəl].
    • I have to read [ˈaɪ ˈhæf tə ˈriːd].
  6. Неизвестные акронимы – с точками (например, U.S.) и без точек (например, USA) – теперь конвертируются побуквенно.
  7. Распространенные окончания слов адаптированы для американского и британского вариантов произношения. Сравните:
    • wanted [ˈwɔntəd US, ˈwɒntıd GB],
    • services [ˈsərvəsəz US, ˈsɜːvısız GB],
    • weakness [ˈwiːknəs US, ˈwiːknıs GB],
    • biggest [ˈbɪgəst US, ˈbıgıst GB].
  8. Улучшен алгоритм для слов с дефисом. Теперь, даже если часть слова представляет собой измененную форму, слово будет сконвертировано правильно. Например:
    • two-thirds [ˈtuː-ˈθərdz].

Чтобы создать высококачественный переводчик в фонетическую транскрипцию, я протестировал его на текстах десяти официальных экзаменов TOEFL — разделы аудирования (listening) и устной речи (speaking). Это составило почти 60 000 слов. Я уменьшил скорость воспроизведения аудиозаписей на 50% с помощью программы Adobe Audition. Эта программа позволяет сохранить естественное звучание человеческого голоса. Затем я сравнил произношение на аудиозаписи с фонетической транскрипцией, полученной с помощью фонетического переводчика на сайте. Уменьшенная скорость воспроизведения позволила мне различить малейшие нюансы в произношении. За исключением некоторых редких научных терминов и личных имен, транскрипция практически всегда соответствовала произношению в аудиозаписи.

Я также начал вкладывать деньги в вычитку словаря для редких английских слов.. Таким образом, я надеюсь, что в будущем данный переводчик слов в транскрипцию станет лучшим в своем роде.

Если вам нравится этот переводчик, пожалуйста, поделитесь ссылкой на него со своими друзьями!

Теги: английский язык, переводчик слов в транскрипцию, транскрипция английских слов, произношение английских слов, британский английский, американский английский, словарь с транскрипцией