Projektankündigung französisches Aussprachewörterbuch – auf der Suche nach Volontären

Den Statistiken zufolge ist der französische Lautschriftkonverter die am meisten genutzte Ressource auf EasyPronunciation.com. Wenn Sie es genutzt haben, haben Sie sicher gemerkt, dass es manchmal fehlerhafte Ergebnisse ausgibt. Um dies zu nachzubessern, habe ich beschlossen, das Projekt Französisches Aussprachewörterbuch ins Leben zu rufen. Ehe ich ins Detail gehe, würde ich Ihnen gern ein wenig erklären, wie mein Französisch-Konverter funktioniert.

1. Ich benutze eine Datenbank, die Lautschriften der Hauptformen französischer Wörter im folgenden Format enthält:

  • prononcer_pʀɔnɔ̃se
  • prononciation_pʀɔnɔ̃sjasjɔ̃

Nennen wir es französisches Aussprachewörterbuch. Ich habe verschiedene Quellen genutzt, um dieses Wörterbuch zu erstellen. In diesem Wörterbuch fehlt die Lautschrift einiger Wörter (insbesondere für Eigennamen) und für einige andere ist es fehlerhaft. Dieses Wörterbuch ist die Hauptursache für Konvertierungsfehler.

2. Der Konverter wendet einen sehr komplexen Regelsatz dafür an, inwieweit die Lautschrift der Hauptform zu modifizieren ist, damit die richtige Lautschrift der modifizierten Form generiert wird. Dafür habe ich das kostenfreie französische Wörterbuch Dicollecte verwendet. Obwohl es eine sehr große Anzahl derartiger Regeln gibt, verursachen sie nur ab und an Fehler. Diese Fehler sind normalerweise sehr leicht zu beheben.

Wie Sie sehen, verbessert sich die Qualität der Konvertierung deutlich, wenn wir die Fehler des französischen Aussprachewörterbuchs beheben. Um die Fehler zu entfernen, sollte das Wörterbuch von echten Personen Korrektur gelesen werden. Und dafür brauche ich Freiwillige. Die Frage ist: wie motiviere ich Leute dazu, das zu tun?

Meine Annahme ist, dass evtl. an diesem Projekt interessierte Personen es gut finden würden, wenn die Ergebnisse ihrer Arbeit für jeden frei zum Download verfügbar stehen würden. Darum schlage ich vor, dass dieses Wörterbuch auf EasyPronunciation.com unter einer Creative Commons Attribution-Share Alike 4.0-Lizenz veröffentlicht wird. Das bedeutet, dass dieses Wörterbuch sowohl für nicht-kommerzielle als auch kommerzielle Zwecke verwendet werden kann, vorausgesetzt, dass erwähnt wird, woher die Daten stammen, und dass für den Fall, dass Daten verbessert oder dem Wörterbuch hinzugefügt werden, diese Veränderungen unter der gleichen Lizenz verfügbar sind.

Um Ihnen eine Vorstellung zu geben, was getan werden muss: das Wörterbuch enthält 71.405 Einträge. Meine grobe Einschätzung der Fehlerquote liegt bei 5% für regelmäßige Wörter und 95% für Eigennamen.

Wenn Sie mitmachen wollen, kontaktieren Sie mich gerne. Ich sende Ihnen dann eine Textdatei zu, die einen Teil des Wörterbuchs enthält. Sie müssten Fehler finden und korrigieren und fehlende Lautschriften hinzufügen. Sobald Sie mir die Korrektur gelesene Datei zurückgesendet haben, werde ich meine Datenbank aktualisieren und die Korrektur gelesenen Teile des Wörterbuchs hier unter der zuvor genannten CC-BY-SA 4.0-Lizenz veröffentlichen.

Sollten Sie irgendwelche Fragen oder Vorschläge für dieses Projekt haben, zögern Sie nicht, mich zu kontaktieren.

Update: das Wörterbuch steht hier zum Download bereit.

Tags: Französisch, Wörterbuch, Lautschrift, französische Aussprache