Google DeepMind: Die neuesten KI-Modelle und ihre Fortschritte in der logischen Schlussfolgerung
Einführung
Google DeepMind hat kürzlich zwei neue KI-Systeme vorgestellt, die auf der diesjährigen International Mathematical Olympiad (IMO) Silbermedaillen gewonnen haben. Diese Systeme, AlphaProof und AlphaGeometry 2, konnten vier der sechs gestellten Aufgaben lösen und erzielten 28 von 42 möglichen Punkten. Dies stellt einen bedeutenden Schritt in Richtung Künstliche Allgemeine Intelligenz (AGI) dar, insbesondere im Bereich der mathematischen Fähigkeiten.
Die KI-Systeme: AlphaProof und AlphaGeometry 2
AlphaProof
AlphaProof kombiniert ein vortrainiertes Sprachmodell mit dem AlphaZero-Verstärkungslernalgorithmus, der bereits erfolgreich bei Spielen wie Schach, Shogi und Go eingesetzt wurde. Das Ziel ist es, mathematische Aussagen in der formalen Sprache Lean zu beweisen. Das System lernt, indem es Millionen von mathematischen Problemen unterschiedlicher Schwierigkeitsgrade löst und aus diesen Erfahrungen lernt. Jeder entdeckte und verifizierte Beweis erweitert das Sprachmodell von AlphaProof und verbessert seine Fähigkeit, nachfolgende, anspruchsvollere Probleme zu lösen.
AlphaGeometry 2
AlphaGeometry 2 ist eine deutlich verbesserte Version seines Vorgängers und basiert auf einem Gemini-Sprachmodell, das mit einer größeren Menge an synthetischen Daten trainiert wurde. Vor der IMO konnte AlphaGeometry 2 laut Google DeepMind 83 Prozent aller historischen IMO-Geometrieprobleme der letzten 25 Jahre lösen. Für den Einsatz bei der IMO wurden die Aufgaben zunächst manuell in eine formale mathematische Sprache übersetzt. Während menschliche Teilnehmer die Aufgaben in zwei 4,5-Stunden-Sitzungen bearbeiteten, benötigten die KI-Systeme für einige Aufgaben nur wenige Minuten und für andere bis zu drei Tage.
Bewertung durch führende Mathematiker
Die Lösungen der KI-Systeme wurden nach den offiziellen IMO-Regeln von führenden Mathematikern bewertet, darunter Professor Sir Timothy Gowers, selbst IMO-Goldmedaillengewinner und Fields-Medaillenträger. Gowers äußerte sich beeindruckt: "Die Tatsache, dass das Programm eine nicht offensichtliche Konstruktion wie diese finden kann, ist sehr beeindruckend und weit über das hinaus, was ich für den Stand der Technik hielt."
Logik und LLMs – eine komplexe Herausforderung
Google DeepMind sieht in der Entwicklung von KI-Systemen mit fortgeschrittenen mathematischen Fähigkeiten das Potenzial, neue Bereiche der Wissenschaft und Technologie zu erschließen. Dies ist mit den heutigen generativen KI-Modellen wie Large Language Models (LLMs), die oft an logischen Fähigkeiten mangeln und manchmal schwerwiegende Fehler machen, kaum möglich.
Zukunftspläne und Konkurrenz
DeepMind plant, in Zukunft mehr technische Details über AlphaProof zu veröffentlichen und erforscht auch Ansätze zur natürlichen Sprachverarbeitung basierend auf dem Gemini-Modell. Dies entspricht der Aussage von Google DeepMind CEO Demis Hassabis: "Man kann sich Gemini auf hoher Ebene als eine Kombination aus den Stärken von AlphaGo-ähnlichen Systemen und den erstaunlichen Sprachfähigkeiten der großen Modelle vorstellen. Wir haben auch einige neue Innovationen, die ziemlich interessant sein werden." Diese Ansätze haben jedoch noch nicht den Weg zu verbraucherorientierten Produkten gefunden.
Auch OpenAI zielt darauf ab, multimodalen KI-Modellen logisches Denken beizubringen. Unter dem Codenamen "Strawberry" entwickelt es ähnlich wie die von Stanford-Forschern entwickelte "Quiet-STaR"-Methode eine KI-Technologie mit verbesserten logischen Fähigkeiten. Das Ziel ist es, die Modelle des Unternehmens, insbesondere für autonome Internetsuchen und komplexe Planungsaufgaben, zu verbessern.
Weitere Fortschritte in der KI-Forschung
Ein Bericht von Reuters besagt, dass eine intern getestete OpenAI-KI über 90 Prozent im MATH-Benchmark für herausfordernde mathematische Aufgaben erzielte. Zum Vergleich: GPT-4 erzielte 53 Prozent und GPT-4o 76,6 Prozent. OpenAI hat intern angekündigt, dass es kurz davor steht, eine KI mit logischen Fähigkeiten zu entwickeln.
Die Bedeutung dieser Fortschritte
Die Fortschritte in der Entwicklung von KI-Modellen wie AlphaProof und AlphaGeometry 2 sind nicht nur beeindruckende technische Leistungen, sondern könnten auch tiefgreifende Auswirkungen auf verschiedene wissenschaftliche und technologische Bereiche haben. Die Fähigkeit, komplexe mathematische Probleme zu lösen und logische Schlussfolgerungen zu ziehen, könnte neue Wege in der Forschung und Innovation eröffnen.
Schlussgedanken
Die neuesten Entwicklungen von Google DeepMind und anderen führenden Unternehmen im Bereich der KI zeigen, dass wir möglicherweise an der Schwelle zu einer neuen Ära der Künstlichen Intelligenz stehen, in der Modelle nicht nur Informationen verarbeiten, sondern auch logisch denken und komplexe Probleme lösen können. Diese Fortschritte könnten nicht nur die Wissenschaft revolutionieren, sondern auch unsere tägliche Interaktion mit Technologie grundlegend verändern.
Bibliographie
- https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry/
- https://deepmind.google/discover/blog/funsearch-making-new-discoveries-in-mathematical-sciences-using-large-language-models/
- https://www.linkedin.com/posts/artificialintelligencenews_deepmind-framework-offers-breakthrough-in-activity-7161321397477097472-Ua_a
- https://www.artificialintelligence-news.com/2024/02/08/deepmind-framework-offers-breakthrough-llm-reasoning/
- https://www.wired.com/story/google-deepmind-demis-hassabis-chatgpt/
- https://www.technologyreview.com/2023/07/05/1075865/eric-schmidt-ai-will-transform-science/
- https://encord.com/blog/gemini-google-ai-model/
- https://medium.com/@agnieszkamikolajczyk/efficient-exploration-for-llms-6c5cfe987adb
- https://pyimagesearch.com/2024/03/04/google-gemini-1-5-review-million-token-ai-changes-everything/
- https://direct.mit.edu/neco/article/35/3/309/114731/Large-Language-Models-and-the-Reverse-Turing-Test