Обновления в переводчике английских слов в транскрипцию
Давно я здесь не писал. И на то была причина. В течение последних трех месяцев я непрерывно работал над переводчиком английских слов в транскрипцию.
Две трети этого времени было потрачено на вычитку 30 000 наиболее популярных английских слов. В остальное время я улучшал алгоритм и тестировал переводчик. Обновления в основном касаются американского английского, но некоторые улучшения также были внесены в алгоритм и для британского английского.
Итак, что нового?
- Значительно возрасла скорость и увеличилось количество слов в словаре, в том числе их измененных форм.
- Я добавил поддержку омографов и вариантов произношения для американского английского словаря, составленного из разных источников.
- Теперь есть возможность добавить знак [ʰ] после согласных звуков [p], [t] и [k] в тех случаях, когда они произносятся с придыханием, например:
- talk [ˈtʰɔk],
- put [ˈpʰʊt],
- cat [ˈkʰæt].
- Как вы, вероятно, знаете, в американском английском есть феномен под названием cot–caught merger, когда носители произносят эти два слова одинаково. Таким образом, вместо [ˈkʰɔt] в случае "caught", оба слова будут звучать [ˈkʰɑt]. Некоторые словари, в частности Merriam-Webster's Advanced Learner's Dictionary, официально поддерживают этот вариант произношения и используют только символ [ɑ] для обоих звуков. Теперь у вас есть выбор: использовать в транскрипции один из двух звуков, [ɔ] или [ɑ], или же отображать только звук [ɑ].
- Я ввел алгоритм для комбинаций слов. Сравните:
- I have an apple [ˈaɪ ˈhæv ən ˈæpəl].
- I have to read [ˈaɪ ˈhæf tə ˈriːd].
- Неизвестные акронимы – с точками (например, U.S.) и без точек (например, USA) – теперь конвертируются побуквенно.
- Распространенные окончания слов адаптированы для американского и британского вариантов произношения. Сравните:
- wanted [ˈwɔntəd US, ˈwɒntıd GB],
- services [ˈsərvəsəz US, ˈsɜːvısız GB],
- weakness [ˈwiːknəs US, ˈwiːknıs GB],
- biggest [ˈbɪgəst US, ˈbıgıst GB].
- Улучшен алгоритм для слов с дефисом. Теперь, даже если часть слова представляет собой измененную форму, слово будет сконвертировано правильно. Например:
- two-thirds [ˈtuː-ˈθərdz].
Чтобы создать высококачественный переводчик в фонетическую транскрипцию, я протестировал его на текстах десяти официальных экзаменов TOEFL — разделы аудирования (listening) и устной речи (speaking). Это составило почти 60 000 слов. Я уменьшил скорость воспроизведения аудиозаписей на 50% с помощью программы Adobe Audition. Эта программа позволяет сохранить естественное звучание человеческого голоса. Затем я сравнил произношение на аудиозаписи с фонетической транскрипцией, полученной с помощью фонетического переводчика на сайте. Уменьшенная скорость воспроизведения позволила мне различить малейшие нюансы в произношении. За исключением некоторых редких научных терминов и личных имен, транскрипция практически всегда соответствовала произношению в аудиозаписи.
Я также начал вкладывать деньги в вычитку словаря для редких английских слов.. Таким образом, я надеюсь, что в будущем данный переводчик слов в транскрипцию станет лучшим в своем роде.
Если вам нравится этот переводчик, пожалуйста, поделитесь ссылкой на него со своими друзьями!
Теги: английский язык, переводчик слов в транскрипцию, транскрипция английских слов, произношение английских слов, британский английский, американский английский, словарь с транскрипцией