Fortschritte in der KI: Wie kanonische Beispiele die Sprachmodellentwicklung revolutionieren

Kategorien:

No items found.

Freigegeben:

June 14, 2024

In der Welt der künstlichen Intelligenz und des maschinellen Lernens vollzieht sich eine stetige Weiterentwicklung, die darauf abzielt, die Kommunikation und Interaktion zwischen Menschen und Maschinen zu verbessern. Ein bemerkenswerter Fortschritt in diesem Bereich wurde kürzlich von Forschern der Stanford University vorgestellt. Es handelt sich um eine neue Methode namens "Model Editing with Canonical Examples", die das Potenzial hat, die Art und Weise, wie wir mit Sprachmodellen arbeiten, grundlegend zu verändern.

Die Idee hinter dieser Methode ist relativ einfach, aber ihre Umsetzung und die damit verbundenen Herausforderungen sind komplex. Traditionell erforderte das Training von Sprachmodellen große Mengen an Daten und Beispielen, um ein gewünschtes Verhalten zu erlernen. Die Forscher der Stanford University haben jedoch einen Ansatz entwickelt, bei dem nur ein einzelnes Lernbeispiel pro gewünschtem Verhalten vorgegeben wird. Diese Beispiele werden als "kanonische Beispiele" bezeichnet und dienen als klare und einfache Instanzen von gutem oder schlechtem Verhalten, wie zum Beispiel "Die Hauptstadt von Mauritius ist Port Louis" oder "Ein Merkmal von Forschern ist Herzlosigkeit".

Die Evaluation dieser Methode erfolgt ausschließlich außerhalb der Verteilung (out-of-distribution), was bedeutet, dass das Modell anhand von komplexeren Beispielen geprüft wird, die nicht Teil des initialen Trainingsdatensatzes waren. Darüber hinaus wird darauf geachtet, dass die Abweichung vom ursprünglichen Modell streng begrenzt wird, um die Identität und die ursprünglichen Eigenschaften des Modells zu bewahren.

Die Stanford-Forscher haben drei Datensätze erstellt und drei weitere modifiziert, um das Model Editing mit kanonischen Beispielen in verschiedenen Bereichen zu testen: Verbesserungen, die intensives Wissen erfordern, Minderung von sozialen Vorurteilen und Behandlung von syntaktischen Sonderfällen. In Experimenten mit Pythia-Sprachmodellen stellten sie fest, dass LoRA (Layerwise Relevance Propagation) das vollständige Feintuning und MEMIT (Model-Editing via Model Interpretability Techniques) übertrifft.

Ein besonderes Augenmerk legten die Forscher auf die Backpack-Sprachmodellarchitektur, die gezielt für Verbesserungen entwickelt wurde. Backpack definiert eine umfangreiche Bank von Sinnesvektoren, die eine Zerlegung der verschiedenen Verwendungen jedes Wortes darstellen. Diese werden gewichtet und summiert, um die Ausgabe-Logits des Modells zu bilden. Die Stanford-Forscher schlagen ein Feintuning der Sinnesvektoren vor, bei dem einige (ungefähr 10) Sinnesvektoren für jedes kanonische Beispiel ausgewählt und feinabgestimmt werden. Dieser Ansatz übertraf andere Feintuning-Methoden deutlich, zum Beispiel wurde eine Verbesserung von 4,8 % gegenüber 0,3 % erzielt.

Abschließend konnten die Forscher das GPT-J-6B-Modell durch ein Inferenzzeit-Ensemble mit nur den Änderungen aus dem Sinnes-Feintuning eines 35-mal kleineren Backpack-Modells verbessern. In einem Szenario übertraf dies sogar das Editieren von GPT-J selbst (4,1 % gegenüber 1,0 %).

Die Ergebnisse der Stanford-Forscher könnten einen bedeutenden Einfluss auf die Entwicklung und Verbesserung von Sprachmodellen haben. Besonders hervorzuheben ist die Möglichkeit, spezifische Verhaltensweisen mit einer minimalen Anzahl von Beispielen zu trainieren und zu korrigieren, was Zeit und Ressourcen spart, während gleichzeitig die Effizienz und Präzision der Modelle gesteigert wird.

Diese Fortschritte in der KI-Forschung sind nicht nur für Entwickler und Wissenschaftler von Interesse, sondern auch für Unternehmen wie Mindverse, die sich auf die Entwicklung maßgeschneiderter KI-Lösungen konzentrieren. Die Integration solcher innovativer Methoden in die eigenen Produkte und Dienstleistungen könnte Mindverse dabei helfen, seine Position als KI-Partner weiter zu festigen und den Kunden fortschrittliche Tools für Texterstellung, Inhalte, Bilder, Forschung und vieles mehr anzubieten.

Quellen:
- Hewitt, J., Chen, S. L., Liang, P., & Manning, C. D. (2023). Teaching language models with canonical examples. OpenReview. https://openreview.net/forum?id=SJwXWwc47T
- arXiv. (2022). Model Editing with Canonical Examples. https://arxiv.org/pdf/2206.06520
- Hugging Face. (2024). Stanford presents Model Editing with Canonical Examples. https://huggingface.co/papers/2402.06155

Bitte beachten Sie, dass diese Informationen zum Zeitpunkt des Kenntnisstandes aktuell sind und sich in der schnelllebigen Welt der KI-Technologie ständig weiterentwickeln können.