Das KI-Startup Prime Intellect hat nach eigenen Angaben das Training eines großen Sprachmodells mit 10 Milliarden Parametern abgeschlossen. Besonders bemerkenswert ist dabei der dezentrale Ansatz: Das Training erfolgte auf Computern, die über die USA, Europa und Asien verteilt sind. Laut Prime Intellect ist Intellect-1, so der Name des Modells, das erste Sprachmodell dieser Größe, das mit einem solchen verteilten Verfahren trainiert wurde. Sowohl das Modell selbst als auch die Trainingsdaten sollen in Kürze als Open Source veröffentlicht werden.
Das Projekt demonstriert, dass auch kleinere Unternehmen in der Lage sind, große KI-Modelle zu entwickeln. Langfristiges Ziel ist es, jedem die Möglichkeit zu geben, Rechenleistung für die Entwicklung transparenter und frei verfügbarer KI-Systeme beizusteuern. Die Vision ist eine gemeinschaftliche Entwicklung von Open-Source-KI, die für alle zugänglich ist.
Das Projekt basiert auf OpenDiLoCo, Prime Intellects Open-Source-Version von DeepMinds "Distributed Low-Communication method" (DiLoCo). DiLoCo ermöglicht das Training von KI-Modellen auf global verteilten Systemen und minimiert gleichzeitig den Bedarf an Datentransfer. Auf dieser Grundlage hat Prime Intellect ein System für zuverlässiges, verteiltes Training geschaffen, das flexibel mit dem Hinzufügen oder Entfernen von Rechenressourcen umgehen kann. Das System optimiert die Kommunikation über ein weltweites Netzwerk von Grafikkarten.
Das Modell selbst basiert auf der LLaMA-3-Architektur und wurde mit offenen Datensätzen trainiert. Die Trainingsdaten umfassen mehr als 6 Billionen Token und stammen hauptsächlich aus vier Quellen: Fineweb-edu, DLCM, Stack v2 und OpenWebMath.
Prime Intellect betrachtet Intellect-1 als ersten Schritt zu größeren Zielen. Das Unternehmen plant, das verteilte Training auf fortschrittlichere Open-Source-Modelle auszuweiten und ein System zu entwickeln, das jedem eine sichere Bereitstellung von Rechenleistung ermöglicht. Geplant sind Trainingseinheiten, die für die Öffentlichkeit zugänglich sind.
Die Open-Source-Entwicklung von KI reduziert laut Prime Intellect die Risiken einer zentralisierten Kontrolle. Gleichzeitig räumt das Unternehmen ein, dass die Konkurrenz zu großen KI-Laboren eine koordinierte Anstrengung erfordert. Daher sucht Prime Intellect nach Unterstützung durch Kooperationen und die Bereitstellung von Rechenressourcen.
Mit seinen 10 Milliarden Parametern ist Intellect-1 nach heutigen Maßstäben relativ klein. Auch ohne Benchmark-Ergebnisse ist es unwahrscheinlich, dass es mit größeren kommerziellen oder sogar kleineren Open-Source-KI-Modellen mithalten kann. Die entscheidende Frage ist, ob Prime Intellect diesen Ansatz über den Proof-of-Concept hinaus weiterentwickeln und damit einen bedeutenden Beitrag zur KI-Entwicklung leisten kann.
Die Veröffentlichung dieser Nachricht auf der Webseite von Mindverse unterstreicht die Bedeutung von Innovationen im Bereich der künstlichen Intelligenz. Mindverse, ein deutsches Unternehmen, bietet ein All-in-One-Content-Tool für KI-Texte, Bilder und Recherche. Als KI-Partner entwickelt Mindverse maßgeschneiderte Lösungen wie Chatbots, Voicebots, KI-Suchmaschinen und Wissenssysteme. Die Entwicklung von Intellect-1 durch Prime Intellect zeigt das wachsende Potenzial dezentraler Ansätze im KI-Training und die Möglichkeiten, die sich durch Open-Source-Initiativen für die Demokratisierung der KI-Entwicklung ergeben.
Die Kombination aus dezentralem Training, Open-Source-Modellen und der Expertise von Unternehmen wie Mindverse könnte die Zukunft der KI-Entwicklung maßgeblich beeinflussen und den Zugang zu leistungsstarken KI-Systemen für ein breiteres Publikum ermöglichen.
Bibliographie: https://the-decoder.com/ai-startup-prime-intellect-trains-first-distributed-llm-across-three-continents/ https://www.primeintellect.ai/blog/intellect-1 https://www.primeintellect.ai/ https://medium.com/@ignacio.de.gregorio.noblejas/intellect-1-an-ai-nightmare-for-big-tech-042b652bc195 https://x.com/PrimeIntellect/status/1859923050092994738 https://www.reddit.com/r/LocalLLaMA/comments/1g1uefz/training_of_the_first_open_distributed_llm/ https://www.primeintellect.ai/blog/opendiloco https://www.linkedin.com/posts/timdasey_open-source-llm-from-ai2-to-drive-critical-activity-7158915779839578112-gJ1o https://www.mckinsey.de/~/media/mckinsey/locations/europe%20and%20middle%20east/deutschland/news/presse/2023/2023-06-14%20mgi%20genai%20report%2023/the-economic-potential-of-generative-ai-the-next-productivity-frontier-vf.pdf https://ml-research.github.io/