Microsoft erweitert KI-Assistenten Copilot um fortschrittliche Sprach- und Bildverarbeitungsfunktionen

Kategorien:
No items found.
Freigegeben:
October 3, 2024

Microsoft rüstet KI-Assistenten Copilot mit neuen Sprach- und Bildverarbeitungsfunktionen auf

Microsoft integriert neue Funktionen in seinen KI-Assistenten Copilot, um dessen Fähigkeiten und Benutzerfreundlichkeit zu verbessern. Zu den wichtigsten Neuerungen gehören Sprachinteraktion, Bildanalyse und fortschrittlichere Denkprozesse. Diese Entwicklung bringt Copilot näher an die Funktionalität von ChatGPT heran, auf dem es basiert.

Sprachsteuerung und personalisierte Inhalte

Die neue Funktion "Copilot Voice" ermöglicht es Benutzern, mit dem Assistenten zu sprechen, wobei sie aus vier verschiedenen Sprachoptionen wählen können. Diese Funktion zielt darauf ab, die Interaktion mit Copilot intuitiver und natürlicher zu gestalten.

Für eine personalisierte Inhaltsfindung schlägt "Discover Cards" Themen und Funktionen vor, die auf den Interaktionen eines Benutzers mit verschiedenen Microsoft-Diensten basieren. Diese Funktion soll Nutzern dabei helfen, schneller und einfacher auf relevante Informationen und Funktionen zuzugreifen.

Zusätzlich bietet "Copilot Daily" eine morgendliche Zusammenfassung von Nachrichten und Wetter, die von der bevorzugten Copilot-Stimme des Benutzers vorgelesen wird. Für diese Funktion hat Microsoft Partnerschaften mit Nachrichtenagenturen wie Reuters, Axel Springer, Hearst Magazine und der Financial Times geschlossen.

Integration in Microsoft Edge und neue experimentelle Funktionen

Copilot ist nun direkt in den Microsoft Edge-Browser integriert. Benutzer können über die Adressleiste auf den Assistenten zugreifen, um Fragen zu beantworten, Webseiten zusammenzufassen, Texte zu übersetzen oder Sätze umzuformulieren. Microsoft betont, dass keine persönlichen Daten zur Schulung seiner KI-Systeme verwendet werden.

Darüber hinaus testet Microsoft experimentelle Funktionen in den Copilot Labs. Dazu gehören "Copilot Vision", das Webseiten in Echtzeit analysiert, um Fragen zu Text und Bildern zu beantworten, und "Think Deeper", das detailliertere Antworten auf komplexe Fragen liefert. Letzteres wird wahrscheinlich von OpenAI's neuem Sprachmodell "o1" unterstützt.

Verbesserungen bei der Bildverarbeitung und -suche

Auch die Bildbearbeitungsanwendung Paint wird mit KI-gestützten Funktionen erweitert. "Generative Fill" ermöglicht es Benutzern, KI-generierte Elemente basierend auf Textbeschreibungen in Bilder einzufügen, während "Generative Erase" Objekte aus Bildern entfernen kann, ähnlich wie Googles "Magic Eraser".

Die Windows-Suche auf Copilot Plus-PCs erhält ebenfalls ein KI-Upgrade. Eine neue Funktion namens "Click to Do", ähnlich wie Googles "Circle to Search", ermöglicht es Benutzern, mit Wörtern nach Bildern zu suchen, auch wenn diese nicht im Foto- oder Dateinamen erscheinen.

Verfügbarkeit und Ausblick

Die neuen Funktionen werden schrittweise für iOS, Android, Web und Windows-Plattformen eingeführt. Auch WhatsApp wird eine Copilot-Integration erhalten. Die Sprachfunktion wird zunächst in englischer Sprache in ausgewählten Ländern verfügbar sein, während "Copilot Daily" in den USA und Großbritannien eingeführt wird.

Mit diesen umfangreichen Updates unterstreicht Microsoft sein Engagement, KI-gestützte Funktionen in seine Produkte zu integrieren und das Benutzererlebnis auf verschiedenen Plattformen zu verbessern. Es bleibt abzuwarten, wie sich diese neuen Funktionen in der Praxis bewähren und wie sie die Arbeitsweise der Benutzer beeinflussen werden.

Bibliographie: https://www.wired.com/story/microsoft-copilot-vision-voice-emotional-support-windows-office/ https://www.bloomberg.com/news/articles/2024-10-01/microsoft-adds-voice-vision-features-to-consumer-ai-assistant https://www.hindustantimes.com/business/microsoft-adds-voice-vision-features-to-ai-assistant-all-you-need-to-know-101727794298154.html https://the-decoder.com/microsoft-adds-voice-vision-and-o1-to-copilot/ https://techcrunch.com/2024/10/01/microsoft-copilot-can-now-read-your-screen-think-deeper-and-speak-aloud-to-you/ https://www.reuters.com/technology/artificial-intelligence/microsoft-revamps-ai-copilot-with-new-voice-reasoning-capabilities-2024-10-01/ https://www.barrons.com/news/microsoft-beefs-up-its-ai-assistant-with-voice-vision-d94974c7 https://www.theinformation.com/briefings/microsoft-adds-openai-powered-voice-reasoning-features-to-ai-copilot https://www.itpro.com/technology/artificial-intelligence/microsoft-expands-copilot-across-the-windows-ecosystem-with-new-vision-and-copilot-pc-features
Was bedeutet das?