KI für Ihr Unternehmen – Jetzt Demo buchen

Fortschritte im Zero-Shot Dense Retrieval durch Relevanz-Feedback

Kategorien:
No items found.
Freigegeben:
October 31, 2024

Artikel jetzt als Podcast anhören

Zero-Shot Dense Retrieval: Relevanz-Feedback für effizientere Suchsysteme

Die Entwicklung effektiver dichter Retrieval-Systeme gestaltet sich schwierig, wenn keine Relevanzbewertungen vorhanden sind. Herkömmliche Ansätze versuchen, diese Hürde durch den Einsatz großer Sprachmodelle (LLMs) zu überwinden, die hypothetische Dokumente generieren, um ähnliche reale Dokumente zu finden. Diese Methode ist jedoch stark abhängig vom domänenspezifischen Wissen des LLMs, was in der Praxis oft problematisch ist. Darüber hinaus ist die Generierung hypothetischer Dokumente ineffizient, da das LLM für jede Anfrage eine große Anzahl von Tokens erzeugen muss.

Ein neuer Forschungsansatz namens "Real Document Embeddings from Relevance Feedback" (ReDE-RF) bietet eine vielversprechende Alternative. Inspiriert von Relevance-Feedback-Mechanismen, formuliert ReDE-RF die Generierung hypothetischer Dokumente als Relevanzschätzung um. Ein LLM wird verwendet, um auszuwählen, welche Dokumente für die Nearest-Neighbor-Suche verwendet werden sollen. Durch diese Umformulierung benötigt das LLM kein domänenspezifisches Wissen mehr, sondern muss lediglich die Relevanz beurteilen. Zusätzlich erfordert die Relevanzschätzung nur die Ausgabe eines einzelnen Tokens durch das LLM, was die Suchlatenz deutlich verbessert.

Funktionsweise von ReDE-RF

ReDE-RF beginnt mit einer initialen Dokumentenabfrage aus einem unüberwachten Hybridsystem, das sowohl Sparse- als auch Dense-Retrieval-Methoden kombiniert. Ein LLM bewertet die zurückgegebenen Dokumente als relevant oder nicht relevant. Basierend auf den als relevant markierten Dokumenten ruft ReDE-RF die entsprechenden Dokumenten-Embeddings – die offline vorberechnet wurden – aus dem Dense-Index ab und generiert einen aktualisierten Abfragevektor. Dieser neue Abfragevektor basiert ausschließlich auf realen Dokumenten aus dem Korpus; das LLM generiert keinen neuen Inhalt zur Verfeinerung der Abfrage.

Der Vorteil dieses Ansatzes liegt darin, dass die Abhängigkeit von der hypothetischen Dokumentengenerierung durch LLMs reduziert wird. Die Generierung solcher Dokumente ist nicht nur ineffizient, sondern erfordert auch, dass das LLM das domänenspezifische Wissen zur Anfrage bereits besitzt und die Struktur eines relevanten Dokuments replizieren kann. Die Relevanzbeurteilung hingegen ist eine deutlich einfachere Aufgabe. Durch die Verwendung realer Dokumente wird außerdem sichergestellt, dass der zur Verfeinerung der Abfrage verwendete Inhalt im Korpus verankert ist, was die Generalisierung des Verfahrens über verschiedene Domänen hinweg erleichtert.

Experimentelle Ergebnisse und Vorteile

Empirische Bewertungen von ReDE-RF in verschiedenen Retrieval-Szenarien zeigen vielversprechende Ergebnisse. Insbesondere bei Low-Resource-Aufgaben übertrifft ReDE-RF bestehende Zero-Shot-Methoden, die LLMs zur Generierung hypothetischer Dokumente verwenden, um bis zu 6%, wenn LLMs mit Top-Retrieved-Dokumenten als Kontext arbeiten, und um bis zu 14%, wenn kein Kontext bereitgestellt wird. Darüber hinaus reduziert ReDE-RF die Suchlatenz im Vergleich zur hypothetischen Dokumentengenerierung mit Kontext um das 7,5- bis 11,2-fache und ohne Kontext um das 4,4-fache.

Ein weiterer Vorteil von ReDE-RF ist die Möglichkeit der Destillation in ein kleineres, effizienteres unüberwachtes Dense-Retrieval-Modell. Dieses destillierte Modell kann die Leistung von bestehenden Modellen wie Contriever um bis zu 33% verbessern, ohne den Dokumentenindex aktualisieren oder LLMs zur Inferenzzeit verwenden zu müssen.

Relevanz für KI-gestützte Content-Tools

Die Fortschritte im Bereich Zero-Shot Dense Retrieval, wie sie durch ReDE-RF demonstriert werden, sind besonders relevant für KI-gestützte Content-Tools wie Mindverse. Durch die verbesserte Effizienz und Genauigkeit der Suche können Nutzer schneller und präziser auf relevante Informationen zugreifen. Die Reduzierung der Latenz ermöglicht eine flüssigere User-Experience, während die Fähigkeit zur Generalisierung über verschiedene Domänen hinweg die Anwendbarkeit der Technologie erweitert. Die Integration solcher fortschrittlichen Retrieval-Methoden in Content-Tools eröffnet neue Möglichkeiten für die automatisierte Content-Erstellung, -Recherche und -Analyse.

Für Unternehmen, die maßgeschneiderte KI-Lösungen wie Chatbots, Voicebots, KI-Suchmaschinen und Wissenssysteme entwickeln, bietet ReDE-RF eine Grundlage für effizientere und robustere Suchfunktionen. Die Möglichkeit, ohne große Mengen an Trainingsdaten auszukommen, reduziert den Entwicklungsaufwand und ermöglicht die schnelle Anpassung an neue Domänen und Anwendungsfälle.

Bibliography: https://arxiv.org/html/2410.21242v1 https://deeplearn.org/arxiv/541606/zero-shot-dense-retrieval-with-embeddings-from-relevance-feedback http://arxiv.org/pdf/2410.21242 https://synthical.com/article/Zero-Shot-Dense-Retrieval-with-Embeddings-from-Relevance-Feedback-af88b09c-fde0-4789-a45e-8e4e5cb1edf9? https://twitter.com/_reachsumit/status/1851123133304242346 https://github.com/RUCAIBox/DenseRetrieval https://aclanthology.org/2023.acl-long.99 https://www.researchgate.net/publication/372916021_Precise_Zero-Shot_Dense_Retrieval_without_Relevance_Labels https://boston.lti.cs.cmu.edu/luyug/HyDE/HyDE.pdf https://paperreading.club/page?id=262494
Was bedeutet das?
Mindverse vs ChatGPT Plus Widget

Warum Mindverse Studio?

Entdecken Sie die Vorteile gegenüber ChatGPT Plus

Sie nutzen bereits ChatGPT Plus? Das ist ein guter Anfang! Aber stellen Sie sich vor, Sie hätten Zugang zu allen führenden KI-Modellen weltweit, könnten mit Ihren eigenen Dokumenten arbeiten und nahtlos im Team kollaborieren.

🚀 Mindverse Studio

Die professionelle KI-Plattform für Unternehmen – leistungsstärker, flexibler und sicherer als ChatGPT Plus. Mit über 50 Modellen, DSGVO-konformer Infrastruktur und tiefgreifender Integration in Unternehmensprozesse.

ChatGPT Plus

❌ Kein strukturierter Dokumentenvergleich

❌ Keine Bearbeitung im Dokumentkontext

❌ Keine Integration von Unternehmenswissen

VS

Mindverse Studio

✅ Gezielter Dokumentenvergleich mit Custom-Prompts

✅ Kontextbewusste Textbearbeitung im Editor

✅ Wissensbasierte Analyse & Zusammenfassungen

📚 Nutzen Sie Ihr internes Wissen – intelligent und sicher

Erstellen Sie leistungsstarke Wissensdatenbanken aus Ihren Unternehmensdokumenten.Mindverse Studio verknüpft diese direkt mit der KI – für präzise, kontextbezogene Antworten auf Basis Ihres spezifischen Know-hows.DSGVO-konform, transparent und jederzeit nachvollziehbar.

ChatGPT Plus

❌ Nur ein Modellanbieter (OpenAI)

❌ Keine Modellauswahl pro Use Case

❌ Keine zentrale Modellsteuerung für Teams

VS

Mindverse Studio

✅ Zugriff auf über 50 verschiedene KI-Modelle

✅ Modellauswahl pro Prompt oder Assistent

✅ Zentrale Steuerung auf Organisationsebene

🧠 Zugang zu allen führenden KI-Modellen – flexibel & anpassbar

OpenAI GPT-4: für kreative Texte und allgemeine Anwendungen
Anthropic Claude: stark in Analyse, Struktur und komplexem Reasoning
Google Gemini: ideal für multimodale Aufgaben (Text, Bild, Code)
Eigene Engines: individuell trainiert auf Ihre Daten und Prozesse

ChatGPT Plus

❌ Keine echte Teamkollaboration

❌ Keine Rechte- oder Rollenverteilung

❌ Keine zentrale Steuerung oder Nachvollziehbarkeit

VS

Mindverse Studio

✅ Teamübergreifende Bearbeitung in Echtzeit

✅ Granulare Rechte- und Freigabeverwaltung

✅ Zentrale Steuerung & Transparenz auf Organisationsebene

👥 Kollaborative KI für Ihr gesamtes Unternehmen

Nutzen Sie Mindverse Studio als zentrale Plattform für abteilungsübergreifende Zusammenarbeit.Teilen Sie Wissen, erstellen Sie gemeinsame Workflows und integrieren Sie KI nahtlos in Ihre täglichen Prozesse – sicher, skalierbar und effizient.Mit granularen Rechten, transparenter Nachvollziehbarkeit und Echtzeit-Kollaboration.

Bereit für den nächsten Schritt?

Sehen Sie Mindverse Studio in Aktion. Buchen Sie eine persönliche 30-minütige Demo.

🎯 Kostenlose Demo buchen

Wie können wir Ihnen heute helfen?

Das Expertenteam von Mindverse freut sich darauf, Ihnen zu helfen.
Herzlichen Dank! Deine Nachricht ist eingegangen!
Oops! Du hast wohl was vergessen, versuche es nochmal.

🚀 Neugierig auf Mindverse Studio?

Lernen Sie in nur 30 Minuten kennen, wie Ihr Team mit KI mehr erreichen kann – live und persönlich.

🚀 Demo jetzt buchen