Pinyin-Konverter mit "HSK-Standardkurs" getestet

Wenn Sie die Neuigkeiten verfolgen, dann wissen Sie, dass ich in den vergangenen Monaten in China war, um Chinesisch zu lernen. Während meines Aufenthalts in China habe ich meine freie Zeit genutzt, um den Chinesisch-Pinyin-Konverter ausgiebig zu testen. Dafür habe ich eine Reihe von Lehrbüchern des "HSK-Standardkurses" verwendet, veröffentlicht vom Verlag der Universität für Sprache und Kultur Peking (an genau der Universität habe ich Chinesisch gelernt).

Wenn Sie meinen Artikel "Eine vollständige Anleitung zum Sprachenlernen. Teil 1. Aussprache lernen" gelesen haben, wissen Sie, dass ich Videomaterial beim Erlernen einer neuen Sprache bevorzuge. HSK-Standardkurs ist ein Kurs im Hörformat und daher nicht die beste Lösung für Anfänger. Er ist trotzdem sehr ordentliches Material. Die Vorteile dieses Kurses sind:

  1. Die Autoren verwendeten nur die gängigsten chinesischen Wörter und die häufigsten Grammatikkonstruktionen für die HSK-Prüfung.
  2. Die Tonaufnahmen sind sehr gut. Die Kombination Audio aus Lehrbuch + Audio aus Übungsbuch versorgt Sie mit vielen Beispielen, wie diese gängigen chinesischen Wörter in verschiedenen Sätzen verwendet werden. Die Betonungen klingen sehr natürlich. Das Tempo ist ab HSK Stufe 3 etwas schnell, aber so sprechen Chinesen tatsächlich im Alltag.
  3. Alle Dialoge in den Büchern für HSK Stufe 1 und 2 haben eine englische Übersetzung.
  4. Die Autoren haben bei der Darstellung des Pinyin eine sehr gute Entscheidung getroffen. In den Büchern für HSK Stufe 1 und 2 steht das Pinyin über jeder Dialogzeile. In den Büchern für HSK Stufe 3 und 4 steht das Pinyin für jeden Dialog am Ende der Seite, sodass es nicht zu sehr ablenkt. Ab dem Buch für HSK Stufe 5 (nur das erste Buch wurde bisher veröffentlicht) wird das Pinyin nur bei neuen Wörtern dargestellt.

Um den Pinyin-Konverter zu testen, habe ich also im Grunde alle Dialoge aus den Büchern für HSK Stufe 1 bis 4 (32.800 Zeichen) genommen und das Ergebnis der Konvertierung mit der Pinyin-Lautschrift aus dem Buch verglichen.

Für meinen Konverter benutze ich das Wörterbuch CC-CEDICT. Es gibt aber drei Probleme mit diesem Wörterbuch:

  1. Manchmal sind mehrere Lautschriften für dasselbe Wort vorhanden und manche sind sehr selten. Zum Beispiel hat die Fragepartikel 吗 zwei Einträge: der eine ist "ma5" und der andere "ma3". Und im CC-CEDICT-Wörterbuch erscheint "ma3" als Erstes.
  2. Das zweite Problem ist das von mir sogenannte "Problem der langen Wörter". Es gibt z.B. das chinesische Wort "几分", was so viel bedeutet wie "etwas", "eher". Trifft man im chinesischen Text jedoch auf den Satz "几分钟", sollte es zu "jǐ fēnzhōng" ("mehrere Minuten") konvertiert werden.
  3. Und das letzte Problem ist das "Problem übermäßiger Einträge". Zum Beispiel hat das CC-CEDICT-Wörterbuch einen Eintrag für "等一下儿", was ein Satz ist und kein Wort. Für solche Einträge funktioniert der Algorithmus der Tonkorrektur für 一 und 不 manchmal nicht. Und da dieser Satz nicht in HSK-Vokabellisten auftaucht, wird der HSK Stufe auch nicht markiert.

Ich musste also all diese kleinen Fehler finden und manuell korrigieren. Wahrscheinlich werde ich eines Tages ein Online-Formular bereitstellen, mit dem Nutzer solche Fehler selbst eingeben können. Ich plane außerdem mehrere Lautschriften für die häufigsten chinesischen Wörter, wie 得, das als "de", "děi", oder "dé" ausgesprochen werden kann, darzustellen. Momentan wird nur die meist verbreitete Aussprache angezeigt.

Tags: Chinesisch, Lautschrift-Übersetzer, chinesische Aussprache, Pinyin, HSK