Sproocherkennung op Lëtzebuergesch – Dir schwätzt, d’Maschinn schreift

Déi nei Web-Applikatioun schreifmaschinn.lu erméiglecht eng automatesch Text-Transkriptioun

Den 9. Dezember 2022 huet den Educatiounsminister Claude Meisch en neien Internetsite fir d’Lëtzebuerger Sprooch virgestallt. schreifmaschinn.lu mécht aus geschwatener Sprooch e geschriwwenen Text.

„Eng grouss Chance fir eng kleng Sprooch!“, seet de Minister fir Educatioun, Kanner a Jugend, Claude Meisch, iwwer déi nei Méiglechkeete vun der Sproocherkennung fir dʼLëtzebuergescht. „Ech ginn Toun eran an ech kréien Text eraus. E Programm verwandelt geschwate Sprooch a geschriwwe Sprooch“, esou bréngt de Minister deen neie Site schreifmaschinn.lu op de Punkt.

Wat fir aner Sprooche scho méi laang méiglech ass, dat gëtt et elo – an enger éischter Versioun – och fir dʼLëtzebuerger Sprooch: eng automatesch Text-Transkriptioun. Iwwer déi nei Web-App vum Zenter fir dʼLëtzebuerger Spooch (ZLS) an Zesummenaarbecht mam Le Minh Nguyen, Expert an der Voice Technology, ka jiddereen seng geschwate Sätz op eng einfach Aart a Weis verschrëftleche loossen. De Prototyp weist, datt dʼSproocherkennung och op Lëtzebuergesch funktionéiert. An den nächste Méint soll dʼPerformance vum Sproochmodell derhannert weider eropgesat ginn. Dofir huet den ZLS och scho konkreet Pläng an eng Partie interessant Kontakter mat potenzielle Partner zu Lëtzebuerg an am Ausland.

Mat der Sproocherkennung, also dem Verschrëftleche vu geschwatener Sprooch (Speech to Text), gëtt eng éischt wichteg Etapp fir zukünfteg Entwécklunge geluecht. Se kann dʼBasis si fir zum Beispill eng Sproochsteierung, eng Virliesfunktioun (Text to Speech), simultan Ënnertitelen, Live-Iwwersetzungen oder e lëtzebuergeschen Chatbot. „DʼLëtzebuerger Sprooch soll vun den neien technologesche Méiglechkeete profitéieren an hëllefen, de Leit dʼLiewe méi einfach ze maachen – am Alldag, am Beruff, beim Léieren an och an der Fräizäit“, esou de Wonsch vum Minister.

1. Wéi funktionéiert déi nei Web-App schreifmaschinn.lu?

De Gebrauch vun der neier Text-Transkiptioun ass intuitiv. Hei eng Erklärung a fënnef Schrëtt:

  1. Um Computer, Tablet oder Smartphone eng Browser-Fënster opmaachen an op dʼSäit schreifmaschinn.lu goen.
  2. Op der Introssäit den Disclaimer liesen. Déi kuerz Erklärung geet op eng Partie Froen an, déi een sech als Utilisateur ka stellen.
  3. Op der Haaptsäit huet een de Choix: Et kann ee selwer eppes aschwätzen, et kann een e Fichier (eng kuerz Audiodatei) eroplueden oder et kann een dʼSchreifmaschinn mat pre-enregistréierte Beispillssätz testen.
  4. Kuerz waarden op dʼResultat vun der Transkriptioun. Den Text daucht an enger Fënster ënner dem Audiofichier op.
  5. Bei Bedarf kann den Text aus der Schreifmaschinn kopéiert a weiderverschafft ginn.

2. Wéi gouf déi nei Web-App entwéckelt?

schreifmaschinn.lu baséiert um multilingualen Open-Source-Modell vu meta.ai XLS-R. Dee gouf mat 436.000 Stonnen Audiomaterial an 128 verschiddene Sprooche virtrainéiert.

Fir dëse Modell spezifesch op d’Lëtzebuerger Sprooch auszeriichten, ass déi kënschtlech Intelligenz hannendru mat lëtzebuergeschen Donnéeën, déi gréisstendeels vun ëffentleche Medien (RTL, 100,7) stamen, verfeinert ginn. Dobäi huet den ZLS säin Knowhow abruecht, fir déi transkribéiert Medientexter orthografesch unzepassen a mam Audiofichier ze synchroniséieren. Dräi Deeg Rechepower waren néideg, fir déi final Versioun vum Modell ze verbesseren.

Fir datt een deen Algorithmus och kann testen, gouf am ZLS eng Web-Applikatioun ronderëm de Modell gebaut. Duerch déi aktiv Kooperatioun vu CGIE, Restena an hire Cloud-Partner ass dës Web-App vun elo un ëffentlech zougänglech a kann ënner schreifmaschinn.lu ausprobéiert ginn.

3. Wat sinn dʼLimitte vun der neier Web-App?

schreifmaschinn.lu ass en éischte Prototyp a gëtt nach lafend verbessert. Natierlech gëtt et dowéinst nach vill Plaz fir Verbesserungen. Well de Modell, also déi kënschtlech Intelligenz derhannert, fir eng Transkriptioun muss bis zu zwou Milliarde Parameteren opruffen, ass d’Computational Power, déi derfir gebraucht gëtt, net ze ënnerschätzen. 
Fir d’Vitess an d’Capacitéit ze garantéiere gëtt et an enger éischter Phas eng Limitt am Tool vun 30 Sekonne pro Audiodatei/Opnam. Fir méi grouss Dateie sollt den ZLS direkt kontaktéiert ginn.

Den Disclaimer op der éischter Säit liwwert eng Partie wichteg Hiweiser iwwer schreifmaschinn.lu. En erkläert kuerz de Fonctionnement, informéiert iwwer d’Trainingsdaten, warnt viru falschen Erwaardungen a geet och op Froen zum Dateschutz an. D’Enregistrementer vun den Utilisateure ginn no der Auswäertung net gespäichert, trotzdeem gëtt dervun ofgeroden, sensibel Donnéeën ze kommunikéieren.

4. Wéi eng Perspektive bitt déi nei Web-App?

schreifmaschinn.lu wäert am Laf vun den nächste Méint nach perfektionéiert a verbessert ginn. Dofir gëtt et och schonn e konkreete Plang: Fir se op dʼLëtzebuerger Sprooch ze trainéieren, gouf déi aktuell Versioun vum Modell ënnert anerem mat 16 Stonnen hypersynchroniséierten Text-Audio-Donnéeë gefiddert. An den nächste Méint soll dës Zuel op honnert eropgesat ginn. Ausserdeem gëtt dʼMéiglechkeet gepréift, nach méi konsequent e Spellchecker (z. B. geziilt mat Eegennimm) an de Workflow ze integréieren.

Um Enn vun dëse mëttelfristege Verbesserunge sollen esouwuel deen optimiséierte Modell wéi och dʼTrainingsdaten allen Interesséierten op Nofro zur Verfügung gestallt ginn. Fir datt mam neien Transkribéier-Tool ka geschafft ginn a fir datt en op Wonsch no spezifesche Bedierfnesser ka weiderentwéckelt ginn. E soll och als Basis kënnen déngen, fir eegen Applikatiounen ze developpéieren. A mat den Date kënne méi spéit natierlech och aner AI-Modeller trainéiert ginn.

Den ZLS steet och ewell mat externe Firmaen als potenziell Partner a Kontakt. Dorënner sinn och grouss international Playeren. Eng wonnerbar Opportunitéit fir dʼLëtzebuerger Sprooch.

5. Wéi kann een hëllefen, schreifmaschinn.lu nach besser ze maachen?

E Modell ass ëmmer nëmmen esou gutt ewéi dʼDaten, mat deenen e gefiddert gëtt. Wien de Sproochmodell a ganz spezifesche Sproochesituatioune wëllt asetzen, deen ass gutt beroden, en och mat spezifeschen Daten ze trainéieren.

Fir den aktuelle Prototyp ze optimiséieren a fir vill Situationen asetzbar ze maachen, ass et dem ZLS en Uleies, Trainingsdaten aus méiglechst ville verschiddene Sourcen ze kréien. Wien also länger Audioopname mat entspriechendem Text huet a gewëllt ass, dës zur Verfügung ze stellen, deen ass häerzlech invitéiert, mam ZLS Kontakt opzehuelen.

6. Kontakt:

Zenter fir d’Lëtzebuerger Sprooch
163, rue du Kiem
L-8030 Stroossen

Tel. 247-88600
E-Mail: lod@lod.lu

 

(de g. à dr.) Dr. Sven Collette, linguiste informatique au Zenter fir d'Lëtzebuerger Sprooch; Claude Meisch, ministre de l'Éducation nationale, de l'Enfance et de la Jeunesse; Le Minh Nguyen, expert en 'Voice Technology'; Luc Marteling, directeur du Zenter fir d'Lëtzebuerger Sprooch

Dernière mise à jour