Für Teams, Einzelnutzer, Kanzleien und Transkription – derselbe Mindverse Look, klar aufgeteilt nach Anwendungsfall.
für Teams und Unternehmen
Die Plattform für Unternehmen, die eigene KI-Workflows, Wissensdatenbanken und Assistenten produktiv einsetzen möchten.
für Einzelnutzer und Creator
Der einfachste Einstieg in das Mindverse-Ökosystem für Content, Recherche, Bilder, Audio und produktives Arbeiten.
für Juristen und Kanzleien
Die spezialisierte KI-Lösung für juristische Recherche, Vertragsarbeit und kanzleispezifische Workflows.
für Audio, Meetings und Transkription
Schnelle KI-Transkription für Audiodateien und Meetings – ideal zum sofortigen Start oder für regelmäßige Nutzung.

Von der ersten Idee bis zur voll integrierten KI-Lösung – strukturiert, sicher und mit messbarem Erfolg
Wir analysieren Ihre Geschäftsprozesse und identifizieren konkrete Use Cases mit dem höchsten ROI-Potenzial.
✓ Messbare KPIs definiert
Vollständige Datenschutz-Analyse und Implementierung sicherer Datenverarbeitungsprozesse nach EU-Standards.
✓ 100% DSGVO-konform
Maßgeschneiderte Auswahl der optimalen KI-Lösung – von Azure OpenAI bis zu Open-Source-Alternativen.
✓ Beste Lösung für Ihren Fall
Schneller Proof of Concept mit nahtloser Integration in Ihre bestehende IT-Infrastruktur und Workflows.
✓ Ergebnisse in 4-6 Wochen
Unternehmensweiter Rollout mit umfassenden Schulungen für maximale Akzeptanz und Produktivität.
✓ Ihr Team wird KI-fit
Als Senior Specialist Journalist und Analyst für Mindverse ist es unsere Aufgabe, komplexe Entwicklungen im Bereich der Künstlichen Intelligenz präzise und verständlich für unsere B2B-Zielgruppe aufzubereiten. Eine aktuelle und relevante Entwicklung betrifft das Open Automatic Speech Recognition (ASR) Leaderboard, das kürzlich durch die Integration von privaten Datensätzen erweitert wurde. Diese Maßnahme zielt darauf ab, die Qualität und Vertrauenswürdigkeit der Benchmark-Ergebnisse zu erhöhen und dem sogenannten "Benchmaxxing" entgegenzuwirken.
Das Open ASR Leaderboard, das seit seiner Einführung im September 2023 über 710.000 Besuche verzeichnete, hat sich als zentrale Plattform für den Vergleich von ASR-Modellen etabliert. Die Ziele des Leaderboards sind die Standardisierung und Offenheit der Bewertungsprozesse. Dazu gehören die Vereinheitlichung von Modell-Outputs und Datensatz-Transkripten durch Normalisierung sowie die Offenlegung des Quellcodes für die Benutzeroberfläche und die Evaluierungsskripte.
Trotz dieser Bemühungen birgt die Offenheit von Benchmarks auch Herausforderungen. Eine davon ist das "Benchmaxxing", eine Praxis, bei der Modelle spezifisch daraufhin optimiert werden, auf veröffentlichten Testdatensätzen gut abzuschneiden. Dies kann zu einer künstlichen Verbesserung der Leaderboard-Platzierung führen, ohne dass sich die tatsächliche Leistung oder Robustheit der Modelle in realen Anwendungsszenarien entsprechend erhöht. Das Goodhart'sche Gesetz, "Wenn ein Maß zu einem Ziel wird, hört es auf, ein gutes Maß zu sein", beschreibt diese Problematik treffend.
Um dieser Entwicklung entgegenzuwirken und eine verlässlichere Bewertung zu gewährleisten, hat das Open ASR Leaderboard in Zusammenarbeit mit Appen Inc. und DataoceanAI neue, hochwertige Datensätze integriert. Diese Datensätze umfassen eine Vielfalt an englischen Sprachproben, sowohl skriptbasierte als auch konversationelle, und decken mehrere Akzente ab. Die Besonderheit dieser Datensätze liegt in ihrem privaten Charakter: Sie werden nicht öffentlich zugänglich gemacht, um die Möglichkeit des "Benchmaxxing" zu minimieren.
Die hinzugefügten Datensätze bieten eine breite Palette an Sprachstilen und Akzenten, was eine differenziertere Bewertung der ASR-Modelle ermöglicht. Hierzu gehören beispielsweise:
Diese Datensätze zeichnen sich durch unterschiedliche Dauern und Sprecheranteile aus und enthalten Transkriptionen, die spezifische Merkmale wie Interpunktion, Groß-/Kleinschreibung und Disfluenzen (z. B. Füllwörter) berücksichtigen.
Die Standardeinstellung des Leaderboards sieht vor, dass der durchschnittliche Wortfehlerrate (WER) weiterhin auf öffentlichen Datensätzen berechnet wird. Nutzer haben jedoch die Möglichkeit, eine Umschaltfunktion zu aktivieren, um die privaten Datensätze in die Bewertung einzubeziehen und deren Einfluss auf die Modellleistung zu analysieren.
Die Berechnungsweise der Metriken für die privaten Datensätze umfasst:
Es wird bewusst darauf verzichtet, Einzelergebnisse für jeden Split anzuzeigen, um zu verhindern, dass Modellentwickler ihre Scores gezielt für spezifische Datenanbieter oder Akzente optimieren.
Für Unternehmen, die ihre ASR-Modelle auf diesen neuen privaten Datensätzen evaluieren möchten, bleibt der Prozess, ein Modell zum Open ASR Leaderboard hinzuzufügen, transparent und community-basiert. Dies erfolgt über das GitHub-Repository des Leaderboards:
Diese Vorgehensweise stellt sicher, dass die Evaluierung fair und nachvollziehbar ist, während gleichzeitig die Integrität der privaten Datensätze gewahrt bleibt.
Die Einführung privater Datensätze ist ein strategischer Schritt zur Verbesserung der Vertrauenswürdigkeit des Open ASR Leaderboards. Sie minimiert das Risiko der Testset-Kontamination und des "Benchmaxxing", was zu einer realistischeren Einschätzung der Modellleistung führt. Zudem ermöglichen diese Datensätze die Identifizierung von Lücken und Bias in Modellen, insbesondere zwischen kontrollierten und gesättigten Einstellungen (z.B. skriptbasierte Sprache, amerikanischer Akzent) und nuancierteren Bedingungen (konversationelle Sprache, nicht-amerikanische Akzente).
Die Entwickler des Leaderboards betonen, dass sie offen für weitere Datenanbieter und Evaluierungssets sind, um die Vielfalt und Robustheit der Benchmark noch weiter zu erhöhen. Zukünftige Entwicklungen könnten Evaluierungen unter realen, rauschbehafteten Bedingungen umfassen, um die Anwendbarkeit der Modelle weiter zu testen.
Diese kontinuierlichen Anpassungen und Erweiterungen des Open ASR Leaderboards unterstreichen die Dynamik und die Notwendigkeit einer adaptiven Bewertung im schnelllebigen Feld der Künstlichen Intelligenz. Für B2B-Entscheidungsträger und Fachexperten bietet dies eine immer präzisere Grundlage für die Auswahl und Entwicklung von ASR-Lösungen, die den Anforderungen der realen Welt gerecht werden.
Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.
🚀 Demo jetzt buchen