US-Medienhäuser verwehren Apple die Nutzung ihrer Inhalte für KI-Training

Kategorien:
No items found.
Freigegeben:
August 30, 2024
KI-Training: Große US-Seiten schließen Apple aus

KI-Training: Große US-Seiten schließen Apple aus

Einführung

Mehrere große Internetportale und Medienhäuser in den USA haben beschlossen, Apple den Zugang zu ihren Inhalten zu verwehren. Dies stellt eine Herausforderung für den Technologiekonzern dar, der auf qualitativ hochwertige Daten angewiesen ist, um seine KI-Modelle zu trainieren. Der Schritt führt zu einer Debatte über die Nutzung von Webinhalten für das Training von Künstlicher Intelligenz (KI) und darüber, wie Unternehmen wie Apple mit der Lizenzierung von Inhalten umgehen sollten.

Hintergrund

Berichten zufolge haben Websites wie Facebook, Instagram, Craigslist, Tumblr, die New York Times, Financial Times, Vox Media, USA Today und Condé Nast Maßnahmen ergriffen, um den Zugriff von Apples Web-Crawler, Applebot, auf ihre Inhalte zu verhindern. Apple hatte die Möglichkeit zur Selbstbestimmung, ob eine Website für Trainingsdaten herangezogen wird, bei der Vorstellung der Apple Intelligence auf der Entwicklerkonferenz WWDC explizit hervorgehoben. Dennoch hat das Unternehmen bereits Daten von frei zugänglichen Seiten gesammelt.

Applebot-Extended und die Reaktion der Websites

Um Daten zu erfassen, nutzt Apple eine Erweiterung seines Applebots namens "Applebot-Extended". Webseitenbetreiber können jedoch den Zugriff über die robots.txt-Datei ausschließen. Der ursprüngliche Applebot wurde entwickelt, um Daten für Siri und die Suchfunktion Spotlight zu sammeln. Diese Daten werden nun auch für das Training von Apples eigenen Large-Language-Modelle (LLM) verwendet.

Trotz der Möglichkeit zum Ausschluss haben bisher vergleichsweise wenige der hochfrequentierten Websites diese Option genutzt. Das KI-Start-up "Originality AI" simulierte den Applebot und stellte fest, dass nur sieben Prozent der getesteten Seiten den Zugang verweigerten. Der Datenjournalist Ben Walsh berichtete, dass ein Viertel von 1167 getesteten englischsprachigen US-Nachrichtenseiten Apple den Zugang verwehrt, was im Vergleich zu OpenAI (53 Prozent) und Google (43 Prozent) noch gering ist.

Strategische Partnerschaften als Lösung

Experten gehen davon aus, dass Medienhäuser und große Internetanbieter strategische Partnerschaften als Möglichkeit sehen, neue Einkünfte zu generieren. OpenAI hat bereits mehrere Kooperationen mit Medienhäusern geschlossen. Auch Apple könnte versucht sein, solche Partnerschaften einzugehen, um die Güte seiner Trainingsdaten zu verbessern. Apple hat Berichten zufolge bereits mehrere Verlage kontaktiert und mehrjährige Verträge im Wert von mindestens 50 Millionen Dollar angeboten.

Rechtliche und ethische Fragen

Die Nutzung von frei zugänglichem Web-Content für das Training von KI-Modellen wirft rechtliche und ethische Fragen auf. Einige Verlage befürchten, dass die Lizenzbedingungen von Apple eine zu weitgehende Nutzung ihrer Archive vorsehen und rechtliche Verpflichtungen nach sich ziehen könnten. Zudem ist unklar, wie Apple generative KI im Nachrichtenkontext einsetzen wird. Sollte Apple mit News trainierte generative KI über sein eigenes Ökosystem anbieten, könnten sich die Verlage selbst Konkurrenz machen.

Zukünftige Entwicklungen

Apples Bemühungen im Bereich Künstliche Intelligenz stehen noch am Anfang, doch das Unternehmen zeigt ein starkes Interesse an der Nutzung von Inhalten großer Verlage zur Schulung seines KI-Modells. Apple arbeitet an eigenen KI-Tools, einschließlich eines großen Sprachmodell-Frameworks namens "Ajax" und eines Chatbot-Dienstes namens "AppleGPT". Diese Entwicklungen könnten die KI-Landschaft erheblich verändern und den Wettbewerb weiter anheizen.

Für den europäischen Markt gibt es jedoch Einschränkungen: Apple plant, einige seiner neuen KI-Funktionen erst später in Europa einzuführen. Dies hängt möglicherweise mit den strengeren Datenschutzbestimmungen in der EU zusammen.

Fazit

Die Entscheidung großer US-Websites, Apple vom Zugang zu ihren Inhalten auszuschließen, wirft wichtige Fragen zur Nutzung von Webinhalten für das Training von KI-Modellen auf. Während strategische Partnerschaften eine Lösung bieten könnten, bleiben rechtliche und ethische Bedenken bestehen. Apples weitere Schritte und die Reaktionen der Medienhäuser werden entscheidend sein, um den zukünftigen Kurs in diesem komplexen Bereich zu bestimmen.

Bibliografie

https://the-decoder.de/apple-will-verlagen-inhalte-fuer-generatives-ki-training-abkaufen/ https://www.heise.de/news/KI-Auch-Apple-nutzt-unlizenziertes-Material-zum-Training-9762626.html https://www.tagesschau.de/wirtschaft/digitales/ki-apple-100.html https://www.wuv.de/Themen/KI-Tech/Apple-gewinnt-gerade-das-KI-Wettrennen https://www.it-boltwise.de/apple-strebt-partnerschaft-mit-grossen-verlagen-an-um-ki-modelle-zu-trainieren.html https://www.derstandard.de/story/3000000225498/apple-wird-seine-neuen-ki-features-wohl-nicht-in-europa-bringen https://www.investmentweek.com/apple-verschiebt-ki-funktionen-kunstliche-intelligenz-kommt-spater/ https://www.focus.de/digital/entwicklerkonferenz-wwdc-im-ticker-apple-chef-kuendigt-grosse-sache-an-kommt-die-ki-aufs-iphone_id_260023655.html https://www.watson.ch/digital/apple/457016757-offizielle-chatgpt-app-lanciert-und-apple-erlaesst-ein-internes-verbot
Was bedeutet das?