Neueste Fortschritte in der Künstlichen Intelligenz bei Google, DisTrO und Meta

Kategorien:
No items found.
Freigegeben:
August 30, 2024

KI-Update: Neue Entwicklungen bei Google Gemini, DisTrO, Claude und Meta Sapiens

Google erweitert Gemini um themenbasierte Chatbots und Bildgenerator

Google hat kürzlich zwei bedeutende Erweiterungen für seinen KI-Assistenten Gemini vorgestellt: die „Gems“ und den KI-Bildgenerator „Imagen“. Die „Gems“ sind benutzerdefinierte Versionen von Gemini, die als Experten für spezifische Themen fungieren können. Sie speichern frühere Konversationen und Informationen, um wie Experten in einem bestimmten Bereich zu agieren. Google bietet verschiedene vorgefertigte Gems an, darunter Lernhilfe, kreative Partnerschaft und Karriereberatung. Der KI-Bildgenerator Imagen 3 ermöglicht es wieder, Bilder von Personen zu erstellen, jedoch mit gewissen Einschränkungen. So können beispielsweise keine fotorealistischen Bilder bekannter oder minderjähriger Personen sowie keine exzessiv gewalttätigen oder sexuellen Inhalte generiert werden. Alle generierten Bilder werden mit Wasserzeichen versehen, um sie als KI-generiert zu kennzeichnen. Während der Bildgenerator in allen Gemini-Apps verfügbar sein wird, sind die Gems und die Erstellung von Personenbildern auf die kostenpflichtigen Versionen von Gemini beschränkt.

Neue Methode könnte Training großer Sprachmodelle demokratisieren

Eine neue Optimierungsmethode namens DisTrO (Distributed Training Optimization) reduziert die Kommunikation zwischen GPUs während des KI-Trainings um das bis zu 10.000-fache. Beim Pre-Training eines Sprachmodells mit 1,2 Milliarden Parametern sank die erforderliche Bandbreite pro Trainingsschritt von 74 GB auf nur noch 86 MB. Beim Fine-Tuning sind sogar Reduktionen um das bis zu 10.000-fache möglich. Diese Methode könnte das Training großer KI-Modelle demokratisieren, indem es auch mit normalen Internetverbindungen möglich wäre, ohne auf spezialisierte Hochgeschwindigkeitsverbindungen angewiesen zu sein. Die Forscher sehen zudem Potenzial für ein dezentrales Netzwerk zur gemeinsamen Ressourcennutzung sowie für Anwendungen wie Federated Learning, bei denen Modelle kollaborativ trainiert werden, die Trainingsdaten aber privat und dezentral bleiben.

Nvidia knackt 30 Milliarden US-Dollar Umsatz

Zum ersten Mal in der Firmengeschichte hat Nvidia in einem einzelnen Quartal 30 Milliarden US-Dollar umgesetzt. Ebenso stellen der Betriebsgewinn von 18,6 Milliarden Dollar und der Nettogewinn von 16,6 Milliarden Dollar neue Rekorde dar. Besonders beeindruckend sind die Vergleiche zum Vorjahr, da damals der KI-Hype gerade erst begann. Dieser Hype ist für das rasante Wachstum verantwortlich, da Nvidia Hauptlieferant für Beschleuniger fürs KI-Training ist. Im Jahresvergleich stieg der Umsatz um 122 Prozent, der Betriebsgewinn um 174 Prozent und der Nettogewinn um 168 Prozent.

Nach ChatGPT soll auch Claude "dümmer" geworden sein

Nutzer:innen berichten erneut über eine anscheinend nachlassende Leistung von Anthropics Chatbot Claude. Auf Reddit wird heiß diskutiert, dass der Bot nach zwei Sätzen sein Ziel vergesse und selbst einfache Programmieraufgaben nicht mehr bewältigen könne. Anthropic widerspricht den Behauptungen und erklärt, dass keine Änderungen an den Modellen vorgenommen wurden. Das Unternehmen hat jedoch begonnen, die aktuellen Systemprompts, also die Anweisungen an das Modell, die das Unternehmen selbst vor den Prompts der Nutzer:innen an das Modell gibt, für mehr Transparenz zu dokumentieren. Möglicherweise haben auch technische Probleme bei Googles KI-Plattform Vertex AI eine Rolle gespielt, die Anfang August Ausfälle zu verzeichnen hatte. Es scheint ein wiederkehrendes Muster zu sein, dass Nutzer:innen einige Zeit nach der Veröffentlichung eines Modells über Leistungseinbußen klagen und die Hersteller dies dementieren. Ein Grund dafür könnte sein, dass die Erwartungen der Nutzenden mit der Zeit steigen, während die Modelle nicht in gleichem Maße mitwachsen.

Meta stellt KI-Modelle für menschenzentrierte Bildanalyse vor

Meta hat eine neue Familie von KI-Modellen namens „Sapiens“ vorgestellt, die sich auf die Analyse von Bildern mit Menschen spezialisieren. Die Modelle wurden mit 300 Millionen menschlichen Bildern vortrainiert und können Aufgaben wie 2D-Posenschätzung und Körpersegmentierung ausführen. Das größte Modell, Sapiens-2B, verfügt über 2 Milliarden Parameter und wurde mit einer HD-Bildauflösung trainiert. Bei der Körpersegmentierung erzielt es eine Verbesserung von mehr als 17 Prozentpunkten gegenüber früheren Methoden. Laut den Forschenden könnte Sapiens als Werkzeug dienen, um große Mengen realer Daten zu annotieren und so die nächste Generation menschenzentrierter Bildanalysesysteme zu entwickeln. Meta stellt die Modelle der Forschungsgemeinschaft auf GitHub zur Verfügung.

KI kündigt sich als Problem für Jugendschutz an

Jugendschutz.net, das gemeinsame Kompetenzzentrum von Bund und Ländern, hat in seinem Jahresbericht auf zunehmende Probleme im Bereich des Jugendschutzes im Internet hingewiesen. Die Organisation bearbeitete 45.963 Meldungen, wobei 7645 Verstöße gegen Rechtsvorschriften festgestellt wurden. Zwei Drittel der Fälle betrafen sexualisierte Gewalt, gefolgt von Pornografie, politischem Extremismus und selbstgefährdenden Inhalten. Ein wachsendes Problem stellen jugendliche Täter dar, die unter den Strafgesetzbuch-Paragrafen 184b fallende Inhalte austauschen. Zudem werden zunehmend Inhalte gefunden, die über Videochats mit Minderjährigen entstehen, was auf Cybergrooming hindeutet. Die Verbreitung von Extremismus und Hassinhalten, insbesondere nach dem Hamas-Überfall auf Israel, wurde ebenfalls als problematisch identifiziert. KI wird verstärkt für die Erstellung und Modifikation von Propaganda eingesetzt, was die Erkennung erschwert.

Bibliografie

- https://www.heise.de/news/KI-Update-kompakt-Google-Gemini-Trainingsmethode-DisTrO-Claude-Meta-Sapiens-9850917.html - https://cloud.google.com/products/gemini?hl=de - https://www.t-online.de/digital/aktuelles/id_100436672/google-gemini-neue-funktionen-imagen-3-und-gems-fuer-ki-assistenten.html - https://www.heise.de/news/KI-Update-kompakt-Google-Gemini-Llama-3-Qualcomm-AI-Hub-Musikgeneratoren-9642554.html - https://plus.rtl.de/podcast/ki-update-ein-heise-podcast-fitbmrwnyrukn - https://marketing-ki.de/ki-im-einsatz/vergleich-der-top-sprachmodelle-2024-chatgpt-vs-claude-3-vs-gemini-vs-copilot/ - https://www.afaik.de/wettrennen-um-ki/ - https://www.youtube.com/watch?v=uo_YSpEvhgQ - https://onlinemarketing.de/technologie/ai-update-chatgpt-claude-gemini
Was bedeutet das?