Die Verschleierung der Autorenschaft, das Umschreiben eines Textes, um die Identität des Autors absichtlich zu verbergen, ist eine wichtige, aber herausfordernde Aufgabe. Bisherige Methoden, die große Sprachmodelle (Large Language Models, LLMs) verwenden, mangeln an Interpretierbarkeit und Kontrollierbarkeit. Diese ignorieren oft die stilistischen Merkmale spezifischer Autoren, was zu einer insgesamt weniger robusten Leistung führt.
Um dieses Problem zu lösen, wurde StyleRemix entwickelt, eine adaptive und interpretierbare Methode zur Verschleierung der Autorenschaft, die spezifische, feinkörnige Stilelemente des ursprünglichen Eingangstextes verändert. StyleRemix verwendet vortrainierte Low Rank Adaptation (LoRA) Module, um einen Input gezielt entlang verschiedener stilistischer Achsen (z.B. Formalität und Länge) umzuschreiben und dabei die Rechenkosten niedrig zu halten.
StyleRemix übertrifft in verschiedenen Domänen die aktuellen Stand der Technik und viel größere LLMs, wie sowohl durch automatische als auch durch menschliche Bewertungen bewertet wurde. Zusätzlich wurden AuthorMix, ein großer Satz von 30.000 hochwertigen, langformatigen Texten von einer vielfältigen Gruppe von 14 Autoren aus 4 Domänen, und DiSC, ein paralleles Korpus von 1.500 Texten, die sieben Stilachsen in 16 einzigartigen Richtungen abdecken, veröffentlicht.
Die Methode von StyleRemix besteht aus zwei Phasen:
In dieser Phase wird ein vielfältiger Trainingssatz für jede Stilachse erstellt, die wir modifizieren möchten (z.B. Längenvariationen, Formalitätsstufen, Grade-Level-Anpassungen usw.). Diese stil-spezifischen Datensätze werden dann verwendet, um Low-Rank Adaptation (LoRA) Adapter zu trainieren, die kleine Module sind, die nahtlos mit einem größeren Basismodell integriert werden können, um die Textgenerierung entlang spezifischer Stilachsen zu steuern.
In dieser Phase können Benutzer die Stilachsen auswählen, die am effektivsten den ursprünglichen Stil des Autors verschleiern, entweder automatisch oder manuell. Die ausgewählten vortrainierten LoRA-Adapter werden dann verwendet, um die verschleierte Textgenerierung zu steuern.
Die weit verbreiteten Autoreninvarianten in der Stilanalyse (der Untersuchung von Autorenstilen) umfassen:
- Textlänge - Verwendung von Funktionswörtern - Lesbarkeitsindexe (z.B. Flesch-Kincaid, Linsear Write, Gunning Fog Index) - Verwendung von Sarkasmus - Formalität - Stimme (passiv oder aktiv) - Schreibstil (persuasiv, beschreibend, erzählend, erklärend)StyleRemix wurde in mehreren experimentellen Domänen bewertet, darunter präsidentielle Reden, Romane, wissenschaftliche Artikel und Tagebuchstil-Blogs. Die Ergebnisse zeigen, dass StyleRemix die derzeit besten Methoden zur Autorenverschleierung übertrifft, indem es sowohl automatische als auch menschliche Bewertungen in einer Vielzahl von Domänen übertrifft.
Zusätzlich zur Methode selbst wurden zwei bedeutende Datensätze veröffentlicht:
- AuthorMix: Umfasst über 30.000 hochwertige Absätze aus vier verschiedenen Domänen (Präsidentenreden, Romane, wissenschaftliche Artikel und Blogs) und 14 Autorenstilen. - DiSC (Distilled Style Components Dataset): Ein hochwertiges, validiertes, paralleles Dataset über 7 Stilachsen mit 1.500 Texten, die in 16 unterschiedliche Stilrichtungen umgeschrieben wurden.StyleRemix stellt einen bedeutenden Fortschritt in der Verschleierung der Autorenschaft dar, indem es die Fluency und Steuerbarkeit von LLMs mit autorenspezifischen Stilinformationen kombiniert. Diese Methode bietet nicht nur eine höhere Leistung als bestehende Methoden, sondern ist auch interpretierbar und anpassbar an jeden einzigartigen Autorenstil.