Neue Einblicke in das anweisungsorientierte Lernen von Sprachmodellen ohne explizites Instruction Tuning

Kategorien:

No items found.

Freigegeben:

September 27, 2024

Große Sprachmodelle (LLMs) haben durch ihre Fähigkeit, Anweisungen zu verstehen und zu befolgen, in verschiedenen Aufgaben beeindruckende Leistungen erzielt. Diese Fähigkeit wird in der Regel durch "Instruction Tuning" erreicht, bei dem das Modell auf Paaren von Anweisungen und Antworten trainiert wird. Eine neue Forschungsarbeit stellt jedoch infrage, ob diese Form des Trainings immer notwendig ist, um LLMs zu einem anweisungsorientierten Verhalten zu bewegen.

Implizites Instruction Tuning

Die Studie mit dem Titel "Instruction Following without Instruction Tuning" zeigt, dass LLMs auch ohne explizites Training mit Anweisungs-Antwort-Paaren lernen können, Anweisungen zu folgen. Dieses Phänomen wird als "implizites Instruction Tuning" bezeichnet und tritt in zwei Formen auf:

1. Training nur mit Antworten

Überraschenderweise fanden die Forscher heraus, dass das Training eines LLMs ausschließlich mit den gewünschten Antworten, ohne die zugehörigen Anweisungen, zu einem anweisungsorientierten Verhalten führen kann. Dies deutet darauf hin, dass vortrainierte Modelle bereits eine latente Abbildung von Anweisungen zu Antworten besitzen, die durch das Lernen der gewünschten Antwortverteilung aufgedeckt werden kann.

2. Training mit fachspezifischen Daten

Darüber hinaus stellten die Forscher fest, dass das Training mit Anweisungs-Antwort-Paaren aus einem engen Themenbereich, wie z. B. Poesie, zu einem breiten Spektrum an anweisungsfolgendem Verhalten führen kann, wie z. B. der Generierung von Rezepten. Interessanterweise halten sich die Antworten des Modells jedoch nicht an den Stil des Trainingsbereichs, wenn die Anweisungen stark von denen im Trainingsdatensatz abweichen.

Erklärung für implizites Instruction Tuning

Die Forscher vermuten, dass bereits sehr einfache Änderungen an der Wahrscheinlichkeitsverteilung eines LLMs zu einem anweisungsorientierten Verhalten führen können. Sie untermauern diese Hypothese, indem sie ein regelbasiertes Sprachmodell erstellen, das in Kombination mit einem vortrainierten Modell zu einem anweisungsorientierten Verhalten führt. Die Regeln dieses Modells sind einfach: - Langsames Erhöhen der Wahrscheinlichkeit, die Sequenz zu beenden - Bestrafen von Wiederholungen - Gleichmäßiges Ändern der Wahrscheinlichkeiten von 15 Wörtern Diese Ergebnisse legen nahe, dass Anpassungen, die nicht explizit darauf ausgelegt sind, ein anweisungsorientiertes Verhalten zu erzeugen, dies implizit tun können.

Auswirkungen auf die Forschung und Entwicklung von LLMs

Die Entdeckung des impliziten Instruction Tunings hat weitreichende Auswirkungen auf die Forschung und Entwicklung von LLMs. Sie stellt die gängige Praxis des Instruction Tunings mit großen Datensätzen von Anweisungs-Antwort-Paaren infrage und eröffnet neue Möglichkeiten für effizientere und flexiblere Trainingsmethoden. Zukünftige Forschung sollte sich darauf konzentrieren, die Mechanismen hinter dem impliziten Instruction Tuning besser zu verstehen und zu untersuchen, wie dieses Phänomen genutzt werden kann, um die Fähigkeiten von LLMs in verschiedenen Anwendungen zu verbessern. ## Bibliographie - Hewitt, J., Liu, N. F., Liang, P., & Manning, C. D. (2024). Instruction Following without Instruction Tuning. *arXiv preprint arXiv:2409.14254*. - Xie, J., Syu, S., & Lee, H. (2024). Non-instructional Fine-tuning: Enabling Instruction-Following Capabilities in Pre-trained Language Models without Instruction-Following Data. *arXiv preprint arXiv:2409.00096*. - Li, H., Dong, Q., Tang, Z., Wang, C., Zhang, X., Huang, H., ... & Wang, B. (2023). Synthetic Data (Almost) from Scratch: Generalized Instruction Tuning for Language Models. *arXiv preprint arXiv:2402.13064*. - Jha, A., Havens, S., Dohmann, J., Trott, A., & Portes, J. (2023). LIMIT: Less Is More for Instruction Tuning Across Evaluation Paradigms. *arXiv preprint arXiv:2312.01311*. - Wu, X., Yao, W., Chen, J., Pan, X., Wang, X., Liu, N., & Yu, D. (2023). From Language Modeling to Instruction Following: Understanding the Behavior Shift in LLMs after Instruction Tuning. *OpenReview*.

Was bedeutet das?