Künstliche Intelligenz in der Sprachverarbeitung: Entwicklungen und Herausforderungen in Europa

Kategorien:

No items found.

Freigegeben:

October 9, 2024

Artikel jetzt als Podcast anhören

Künstliche Intelligenz und europäische Sprachen: Fortschritte und Herausforderungen

Die rasante Entwicklung der Künstlichen Intelligenz (KI) hat in den letzten Jahren beeindruckende Fortschritte in der Sprachverarbeitung hervorgebracht. Insbesondere große Sprachmodelle (LLMs) haben die Art und Weise, wie wir mit Computern interagieren, revolutioniert und eröffnen neue Möglichkeiten in Bereichen wie Übersetzung, Textgenerierung und Sprachassistenz. Doch während die Technologie voranschreitet, rücken auch die Herausforderungen in den Fokus, insbesondere im Kontext europäischer Sprachen und Dialekte.

Große Sprachmodelle als Konsensmaschinen

Eine aktuelle Studie von Harvard-Forschern vergleicht große Sprachmodelle mit Crowdsourcing-Plattformen. Anstatt die Expertise einzelner Personen zu nutzen, generieren LLMs Antworten basierend auf einem riesigen Datensatz aus dem Internet. Ähnlich wie bei Crowdsourcing-Ergebnissen repräsentieren die Antworten der KI einen Konsens aus den verfügbaren Informationen.

Dieser Ansatz hat Stärken und Schwächen. Bei allgemeinen Fragen liefern LLMs meist korrekte und hilfreiche Antworten. Bei komplexen oder kontroversen Themen stoßen sie jedoch an ihre Grenzen. Ihre Tendenz zu „Halluzinationen“ – also der Generierung von falschen oder irreführenden Informationen – ist ein bekanntes Problem, insbesondere bei der Zitierung wissenschaftlicher Arbeiten.

KI im Gesundheitswesen: Corti unterstützt Ärzte in Deutschland

Das dänische Unternehmen Corti hat seine KI-Plattform für das Gesundheitswesen nun auch in Deutschland eingeführt. Der Clou: Ein spezielles Sprachmodell, trainiert mit Millionen von Patienteninteraktionen, unterstützt Ärzte bei der Dokumentation von Arzt-Patienten-Gesprächen.

Ähnlich wie Microsofts Copilot oder KI-Assistenten in anderen Bereichen fungiert Cortis „Co-Pilot“ als digitaler Helfer. Während der Konsultation erfasst und organisiert die KI Informationen, reduziert so den Verwaltungsaufwand und minimiert gleichzeitig die Fehlerquote in der klinischen Dokumentation. Erste Kliniken in Deutschland setzen die Plattform bereits erfolgreich ein.

Sprachdaten für Europa: MOSEL – Ein Schritt in Richtung Sprachgerechtigkeit

Ein internationales Forschungsteam hat mit MOSEL (Massive Open-source compliant Speech data for European Languages) eine umfangreiche Sammlung von Sprachdaten für alle 24 Amtssprachen der EU veröffentlicht.

Die Datenmenge ist beeindruckend: Über 500.000 Stunden transkribierte Sprachaufnahmen und 441.000 Stunden Rohdaten stehen frei zur Verfügung. Allerdings gibt es große Unterschiede zwischen den Sprachen. Während für Englisch riesige Datenmengen existieren, sind es für kleinere Sprachen wie Maltesisch oder Irisch deutlich weniger. Um diese Lücke zu schließen, wurden die Rohdaten mithilfe von KI-Modellen automatisch transkribiert. MOSEL ist ein wichtiger Schritt in Richtung Sprachgerechtigkeit und soll die Entwicklung von Sprachtechnologien für alle EU-Sprachen vorantreiben.

Die Herausforderungen der Sprachvielfalt: Dialekte und regionale Unterschiede

Sprachassistenten und andere KI-Systeme, die auf gesprochener Sprache basieren, stehen vor der Herausforderung, die enorme Vielfalt an Dialekten und regionalen Sprachvarianten zu bewältigen.

Faktoren wie Alter, Geschlecht und soziale Herkunft beeinflussen die Sprechweise und stellen KI-Systeme vor Probleme. Hinzu kommen Jugendsprache und die stetige Weiterentwicklung von Sprache. Um diese Herausforderungen zu meistern, sind große Mengen an Trainingsdaten notwendig, die die gesamte Bandbreite der sprachlichen Vielfalt abbilden.

Energieeffiziente KI: L-Mul – Ein neuer Algorithmus mit großem Potenzial

Ein Forscherteam hat mit „Linear-complexity multiplication“ (L-Mul) einen neuen Algorithmus vorgestellt, der den Energieverbrauch von KI-Modellen deutlich reduzieren könnte. Die Methode ersetzt komplexe Gleitkomma-Multiplikationen, die in Sprachmodellen eine zentrale Rolle spielen, durch einfachere Ganzzahl-Additionen.

Erste Tests zeigen vielversprechende Ergebnisse: L-Mul kann die Effizienz von KI-Modellen steigern, ohne die Genauigkeit wesentlich zu beeinträchtigen. Die Entwickler sehen in ihrer Methode das Potenzial, die Wettbewerbsfähigkeit und die technologische Souveränität Europas im Bereich der Künstlichen Intelligenz zu stärken.

Fazit: Fortschritte und Herausforderungen im Einklang

Die Entwicklung der Künstlichen Intelligenz im Bereich der Sprachverarbeitung schreitet rasant voran. Große Sprachmodelle eröffnen neue Möglichkeiten, bringen aber auch Herausforderungen mit sich. Die Berücksichtigung europäischer Sprachen und Dialekte ist entscheidend, um den Zugang zu KI-Technologien für alle zu gewährleisten. Projekte wie MOSEL und die Entwicklung von energieeffizienten Algorithmen wie L-Mul sind wichtige Schritte in die richtige Richtung. Es bleibt abzuwarten, wie sich die Technologie in Zukunft entwickelt und welche Innovationen uns erwarten.

Bibliographie

- Grünewald, Isabel. „KI-Update kompakt: Konsens-Maschinen, Corti, europäische Sprachen, Dialekte“. heise online, 15. März 2024. https://www.heise.de/news/KI-Update-kompakt-Konsens-Maschinen-Corti-europaeische-Sprachen-Dialekte-9971656.html. - Grünewald, Isabel. „KI-Update kompakt: Meta vs EU, DeepL, PEER, Proton“. heise online, 18. Juli 2024. https://www.heise.de/news/KI-Update-kompakt-Meta-vs-EU-DeepL-PEER-Proton-9805263.html. - „Occiglot – neue Open Source-Sprachmodelle für Europa veröffentlicht“. DFKI, 11. April 2024. https://www.dfki.de/web/news/occiglot-neue-open-source-sprachmodelle-fuer-europa-veroeffentlicht. - Kemper, Jonathan. „HeyGen lässt euch in Videos verschiedene Sprachen lippensynchron sprechen“. THE DECODER, 12. September 2023. https://the-decoder.de/heygen-laesst-euch-in-videos-verschiedene-sprachen-lippensynchron-sprechen/. - „Durchbruch für Generative KI-Forschung in Deutschland und Europa“. Fraunhofer IAIS, 16. Mai 2024. https://www.iais.fraunhofer.de/de/presse/presseinformationen/presseinformationen-2024/presseinformation-240516.html. - „KI-UPDATE: KEIN LLAMA IN DER EU UND CO.“. KI.Studio B12, 19. Juli 2024. https://ki.studio-b12.de/2024/ki-update-kein-llama-in-der-eu-und-co.

Was bedeutet das?