Die rasante Entwicklung im Bereich der Künstlichen Intelligenz (KI) bringt täglich neue Innovationen und Herausforderungen hervor. Dieser Artikel beleuchtet einige der jüngsten Entwicklungen, von der Veröffentlichung neuer Hardware wie den Snap Spectacles bis hin zu Fortschritten bei Sprachmodellen und Bildgeneratoren.
Snap Inc. hat die fünfte Generation seiner Augmented-Reality-Brille, die Snap Spectacles, in Deutschland veröffentlicht. Das auffällige Design der Brille mag polarisieren, doch die Funktionalität richtet sich vor allem an Entwickler. Mit einem Preis von 110 Euro pro Monat und einem Gewicht von 226 Gramm ist die Brille kein Massenprodukt. Sie bietet jedoch Funktionen wie Handtracking, Spielen, Luftmalerei, Videotelefonie und die Integration von Snapchat-Lenses.
Technisch setzt Snap auf Qualcomm-Prozessoren in beiden Bügeln, um die Wärmeentwicklung zu optimieren. Vier Kameras ermöglichen ein präzises Handtracking, und die Steuerung erfolgt über intuitive Zwick-Gesten. Das 46-Grad-Sichtfeld bietet eine umfassende Wahrnehmung der Umgebung. Trotz der innovativen Technologie stehen die Spectacles noch vor Herausforderungen, insbesondere hinsichtlich der Akkulaufzeit und des Gewichts, das bei längerem Tragen als störend empfunden werden kann.
Alphabet, die Muttergesellschaft von Google, verzeichnet starke Umsatzsteigerungen, insbesondere im Cloud-Geschäft und bei der Internetsuche. Google-Chef Sundar Pichai führt diesen Erfolg auf den verstärkten Einsatz von KI-Software zurück. KI-gestützte Funktionen erweitern die Suchmöglichkeiten und verändern die Art und Weise, wie Nutzer Informationen finden. Im Cloud-Bereich tragen KI-Lösungen dazu bei, die Kundenbindung zu stärken und neue Kunden zu gewinnen. Auch YouTube profitiert von der KI und konnte erstmals einen Jahresumsatz von über 50 Milliarden Dollar erzielen.
Google verfolgt zudem eine globale KI-Sprachinitiative. Mit Gemma 2 wurde ein kompaktes Sprachmodell mit zwei Milliarden Parametern vorgestellt, das speziell für die japanische Sprache optimiert ist und die Leistung von GPT-3.5 erreichen soll. Um die Entwicklung weiterer Sprachversionen zu fördern, hat Google den Wettbewerb "Unlocking Global Communication with Gemma" ins Leben gerufen. Entwickler weltweit sind eingeladen, Gemma 2 an verschiedene Sprachen anzupassen.
Eine Studie der University of British Columbia und Yale University hat gezeigt, dass die Tokenisierung, die Art und Weise, wie Text in einzelne Einheiten zerlegt wird, einen erheblichen Einfluss auf die Zählfähigkeiten von Sprachmodellen hat. Meta entwickelt mit MegaByte eine Alternative, die auf Byte-Ebene arbeitet und auf Tokenisierung verzichtet. Dieser Ansatz wird auch von OpenAI-Mitgründer Andrej Karpathy unterstützt.
Stability AI hat mit Stable Diffusion 3.5 Medium eine neue Version seines Bildgenerators veröffentlicht. Das Modell ist für gängige Hardware optimiert und soll auch auf leistungsschwächeren Geräten laufen. Die Nutzung ist für Forschungszwecke und nicht-kommerzielle Anwendungen kostenlos.
Apple integriert mit Image Playground, Genmoji und Image Wand neue KI-gestützte Bildgenerierungsfunktionen in seine Betriebssysteme. Image Playground konzentriert sich auf Illustrationen und Cartoon-artige Bilder, um die Erstellung von Deepfakes zu vermeiden.
GitHub bietet Entwicklern mit GitHub Copilot mehr Flexibilität bei der Wahl des Sprachmodells. Neben GPT-4o stehen nun auch Claude 3.5 Sonnet von Anthropic und Googles Gemini 1.5 Pro zur Verfügung. Mit Sparks wurde zudem ein Tool vorgestellt, das die Erstellung von Mikro-Apps über natürliche Sprache ermöglichen soll.
TeamViewer integriert KI-Funktionen in seine Fernwartungssoftware. "Session Insights" protokolliert Support-Sessions automatisch und fasst die Inhalte zusammen. TeamViewer nutzt dafür Sprachmodelle der GPT-4.0-Familie von OpenAI und betont, dass Kundendaten anonymisiert werden.
Bibliographie: https://www.heise.de/news/KI-Update-kompakt-Snap-Spectacles-Google-GPT-4o-Image-Playground-9999499.html https://www.heise.de/news/KI-Update-kompakt-ChatGPT-Advanced-Voice-Mode-Copilot-Ray-Ban-Glasses-Google-9989625.html https://www.techdogs.com/td-articles/miscellaneous/mistral-ai-is-making-generative-ai-fun https://www.gadgets360.com/ai/news/harvard-i-xray-meta-smart-glasses-app-reveal-sensitive-information-6708698 https://creol.ucf.edu/wp-content/uploads/sites/2/2024/08/2024_Spring_G4_Long_Report.pdf https://kiupdate.podigee.io/338-22-10-2024 https://blog.petra.com/blog/highlights-of-the-ces-2024-consumer-electronics-show https://github.com/tsirysndr/my-awesome-stars