Version 0.1 des französischen Aussprachewörterbuchs veröffentlicht

Ende Januar habe ich das Projekt Französisches Aussprachewörterbuch angekündigt. Nur als kleine Erinnerung: Ziel ist es, ein kostenloses Open-Source-Wörterbuch zu erstellen, das die Lautschrift französischer Wörter in folgendem Format beinhaltet:

  • prononcer_pʀɔnɔ̃se
  • prononciation_pʀɔnɔ̃sjasjɔ̃

Einige Volontäre haben ihre Hilfe angeboten. Beinahe sofort haben wir erkannt, dass der Datenbank viele Lautschriften fehlen und sie viele sehr seltene Wörter enthält. Da wir nicht sehr zahlreich sind, wäre es unsinnig, unsere Zeit damit zu vergeuden, die Lautschrift für beispielsweise das französische Wort "alkékenge" zu finden (was übrigens eine Pflanze ist). Also entschieden wir, unsere Anstrengungen den (10.000) häufigsten französischen Wörtern zu widmen.

Ich wollte die angebotene Hilfe auch intelligenter nutzen. Also beschloss ich, ein automatisches Tool zu erstellen, das französische Wörter in ihre Lautschrift gemäß den allgemeinen französischen Ausspracheregeln konvertiert. Da ich zurzeit in China sehr beschäftigt bin, hat es mich fast zwei Monate gedauert, dieses Tool fertigzustellen.

Zusätzlich zu den allgemeinen Regeln für jeden Buchstaben (z.B. "é" wird als [e] und "ç" als [s] gesprochen), habe ich zudem mehr als 160 Ausnahmen beschrieben. Ich werde weiterhin Ausnahmen hinzufügen, um die Konvertierungsqualität zu verbessern. Derzeit erzeugt das Tool in 90-94% der Fälle die richtige Lautschrift von französischen Wörtern. Was wir (Volontäre) also momentan im Wesentlichen machen, ist die Diskrepanzen zwischen der Lautschrift in der Datenbank und der über das automatische Tool erhaltenen Lautschrift zu vergleichen. Wenn die Datenbank die Lautschrift eines bestimmten Wortes nicht enthält, muss der Volontär genau nachprüfen, ob das automatische Tool die richtige Lautschrift geliefert hat.

Heute veröffentliche ich die erste Version des französischen Aussprachewörterbuchs. Es beinhaltet 3.432 Wörter in den folgenden Intervallen: abaissement-attribution, cargaison-éventail, grisâtre-irrésistible. Wie im vorigen Post erwähnt, wird das Wörterbuch unter einer Creative Commons Attribution-Share Alike 4.0-Lizenz veröffentlicht.

Danke an alle, die am Wörterbuch mitarbeiten!

Bitte geben Sie nicht den direkten Link zum Wörterbuch (die Textdatei) an – der Hotlink wird nicht auf EasyPronunciation.com funktionieren. Wenn Sie es mit Ihren Freunden teilen wollen, geben Sie bitte den Link zu dieser Seite an.

Wenn Sie mitmachen wollen, kontaktieren Sie mich gerne. Selbst wenn Sie nicht mitmachen wollen, würden wir es sehr schätzen, wenn Sie die obige Seite mit Ihren Freunden, z.B. über soziale Netzwerke, teilen würden. Es wäre eine große Hilfe dabei, das Projekt in Suchmaschinen bekannter zu machen und mehr Volontäre anziehen. Wir könnten das Projekt somit früher abschließen und gleichzeitig die Arbeit des französischen Lautschriftkonverters verbessern.

Apropos Konverter, es gibt ein paar gute und ein paar schlechte Nachrichten. Die guten sind, dass das automatische Tool jetzt in den Konverter integriert ist. Das bedeutet, wenn ein Wort mit dem alten Algorithmus nicht konvertiert werden kann, wird es mit diesem Tool konvertiert. Wird die Lautschrift auf diese Weise generiert, wird sie mit den Zeichen "_" angezeigt. Die schlechten sind, dass ein Teil der Datenbank verändert wurde und dies Auswirkungen auf die Konvertierung der Verben aus der dritten Gruppe (und wahrscheinlich auch anderer Wörter) hatte. Der Konverter befindet sich momentan also in einer Übergangsphase. Sobald die endgültige Version des Aussprachewörterbuchs veröffentlicht wird, werde ich in der Lage sein, diese Fehler zu beheben.

Tags: Französisch, Wörterbuch, Lautschrift, französische Aussprache