Evaluation von Einbettungstechniken

- Bachelorarbeit -


Beschreibung:
Einbettungstechniken stellen eine gute Möglichkeit dar, mit natürlicher Sprache zu arbeiten. Während natürliche Sprache nicht direkt von Computer verstanden werden kann, muss für Dienste, wie der Anfragevervollständigung oder der automatischen Informationserweiterungen, eine Schnittstelle genutzt werden, die Information möglichst gut repräsentiert.

In dieser Arbeit sollen die vier Einbettungstechniken TransE, TransH, HolE und ComplEx unter der Aufgabe der Link-Vorhersage untersucht werden. Um die Einbettungstechniken losgelöst von anderen Standardreferenzdaten zu evaluieren, dienen eigene Dokumente als Grundlage für eine Informationsstruktur. Bei der Evaluation der Ergebnisse wird auffallen, dass die Techniken TransE und TransH wider Erwarten bessere Ergebnisse erzielen als HolE und ComplEx. Gravierende Unterschiede sind den vorangegangen Ergebnisse vorheriger Arbeiten nicht zu entnehmen gewesen und daher sind verschiedene Faktoren zu betrachten. Faktoren können Unterschiede in der Implementierung sein oder auch die Struktur der genutzten Daten kann für die Ergebnisse verantwortlich sein. Fest steht jedoch, dass für jeden spezifischen Anwendungsfall einzelne Einbettungstechniken ausprobiert werden müssen, um eine möglichst gute Leistung zu erzielen. Auch die Kombination von verschiedenen Einbettungstechniken stellt eine valide Betrachtung dar, um die Ergebnisse zu verbessern.

 

Anforderungen/Kenntnisse:
Python, Java, Grundlagen von Einbettungstechniken

Bearbeitung:
Jonah Heller

Ergebnis:
Die Ausarbeitung kann im Institut für Informationssysteme angefordert werden.

Betreuung:

Prof. Dr. rer. nat. Ralf Möller
Institut für Informationssysteme
Ratzeburger Allee 160 ( Gebäude 64 - 2. OG)
23562 Lübeck
Telefon: 0451 / 3101 6400