Inserenten

Angebote für Studenten auf dem F.A.Z.-Stellenmarkt Aktuelle Angebote

25 km

Informationen zur Anzeige:

Masterarbeit: LLM-gestützte Autorschaftsverifikation
Fraunhofer-Institut für Sichere Informationstechnologie SIT
Darmstadt
Aktualität: 01.11.2024

Anzeigeninhalt:

01.11.2024, Fraunhofer-Institut für Sichere Informationstechnologie SIT
Darmstadt
Masterarbeit: LLM-gestützte Autorschaftsverifikation
Aufgaben:
Autorschaftsverifikation (AV) ist ein zentraler Forschungszweig der digitalen Textforensik und befasst sich mit der Frage, ob zwei oder mehr Texte von derselben Person verfasst wurden. AV bietet zahlreiche Anwendungen sowohl innerhalb als auch außerhalb der Forensik. Ein prominentes Beispiel ist die Überprüfung (Verifikation), ob Beiträge von verschiedenen Accounts von derselben Person stammen, was besonders relevant ist, wenn strafbare Inhalte wie Hassrede oder Desinformationen verbreitet werden. Das Ziel dieser Masterarbeit ist es, eine neue AV-Methode zu erforschen und zu entwickeln, die speziell auf solche Anwendungsfälle ausgerichtet ist. Dabei soll die Methode auf modernen Large Language Models (LLMs) basieren und deren Fähigkeit nutzen, feingranulare Merkmale aus Texten zu extrahieren. Diese Merkmale könnten beispielsweise Stilfiguren, Syntaxfehler oder Satzkonstituenten umfassen - Merkmale, die mit bisherigen NLP-Tools nur eingeschränkt oder gar nicht extrahiert werden konnten. Die extrahierten Merkmale sollen im Vergleich zu traditionellen Merkmalen in der AV (z.B. Zeichen-n-Gramme, Funktionswörter etc.) bewertet und, falls sinnvoll, durch diese ergänzt werden. Zusätzlich sollen mithilfe eines oder mehrerer LLMs Stilbeschreibungen der analysierten Texte erstellt werden. Dabei gilt es zu erforschen, wie sich diese Stilbeschreibungen in die AV-Methode integrieren lassen, um die Klassifikation zu verbessern. Im Rahmen einer umfassenden Evaluierung soll die entwickelte AV-Methode abschließend mit bestehenden Verfahren verglichen und hinsichtlich verschiedener Parameter wie Genauigkeit, Robustheit und Anwendungsbreite beurteilt werden.
Qualifikationen:
Studienhintergrund in Informatik, Computational Linguistics, Data Science oder einem vergleichbaren Bereich Erfahrungen mit NLP und modernen LLMs, sowie Kenntnisse zu aktuellen Methoden und Verfahren im Bereich des maschinellen Lernens und Deep Learnings Programmierkenntnisse in Python und vertrauter Umgang mit gängigen ML/NLP-Frameworks 

Fachrichtung

Art des Angebots

Standorte

Masterarbeit: LLM-gestützte Autorschaftsverifikation

Drucken
Teilen
Fraunhofer-Institut für Sichere Informationstechnologie SIT
Darmstadt