Titelaufnahme

Titel
ROBUS : personalisierte Suche in natürlichsprachlichen Unternehmensdaten / Matthias Reichhold
Weitere Titel
ROBUS: Personalized search in enterprise environments
VerfasserReichhold, Matthias
Begutachter / BegutachterinMayr, Heinrich C. ; Fliedl, Günther
Erschienen2014
Umfang200 S. : graph. Darst.
Anmerkung
Abweichender Titel laut Übersetzung der Verfasserin/des Verfassers
Zsfassung in engl. Sprache
SpracheDeutsch
DokumenttypDissertation
Schlagwörter (DE)Unternehmenssuche / Suche / kontextsensitiv / personalisiert / Computerlinguistik / Sprachverarbeitung
Schlagwörter (EN)Enterprise Search / Information Retrieval / context sensitive / folksonomy / comoputational linguistics / natural language processing
URNurn:nbn:at:at-ubk:1-24908 
Zugriffsbeschränkung
 Das Dokument ist frei verfügbar
Links
Nachweis
Dateien
Klassifikation
Zusammenfassung

In der Arbeit "ROBUS: Personalisierte Suche in natürlichsprachlichen Unternehmensdaten" wird ein neuartiges Verfahren zur Optimierung von Suchaufgaben in unstrukturierten Unternehmensdaten auf Basis von automatisch generierten Rollenprofilen vorgestellt. Es wird gezeigt, wie Rollenprofile mit Hilfe eines standardisierten Thesaurus aus internetbasierten Stellenausschreibungen extrahiert werden können. Hierfür kommen spezielle Methoden der Computerlinguistik zum Einsatz, die es ermöglichen, Rollenprofile in Form von gewichteten Termvektoren textuell zu beschreiben. In einem ersten Schritt wird ein Textkorpus mit mehreren Tausend englischsprachigen Stellenausschreibungen erstellt. Die dafür verwendeten Rohdaten werden von der Internetplattform LinkedIn bezogen. Nach einem initialen Bereinigungsschritt werden die Texte in einzelne Segmente ("Tokens") aufgeteilt. Für jedes Token wird anschließend mit Hilfe eines Part-Of-Speech-Taggers die entsprechende Wortart bestimmt und ein Abgleich mit dem bereits erwähnten Thesaurus durchgeführt. Auf Basis dieses Abgleichs und weiterer Kriterien (Position und Häufigkeit des Tokens innerhalb des Ausschreibungstextes) wird der Term entweder als nicht relevant verworfen oder dem Rollenvektor hinzugefügt.

Darüber hinaus wird ein Mechanismus zur dynamischen Zuordnung von generierten Rollenprofilen zu textuellen Daten vorgestellt. Dabei ist zu beachten, dass der gewählte Mechanismus (1) gänzlich ohne manuelles Zutun funktioniert und (2) sich über die dynamische Zuordnung bestimmen lässt, wie relevant ein textuelles Dokument für eine bestimmte Rolle ist. Dies erfolgt durch die Bestimmung von Ähnlichkeiten im Vektorraum-Modell. Dabei wird für jeden Rollenvektor die Kosinus-Ähnlichkeit zu den vorhandenen Textdokumenten berechnet. Die Optimierung der Suchergebnisse erfolgt auf Basis folgender These:

Umso höher die Ähnlichkeit eines Dokuments zu einem Rollenprofil i ist auch die Relevanz des jeweiligen Dokuments für alle Benutzer/innen, die diesem Rollenprofil zugeordnet sind. Dementsprechend werden die Suchergebnisse anhand der Ähnlichkeitswerte neu gereiht. Im Rahmen der Dissertation wurde das hier beschriebene Verfahren vollständig implementiert und ausführlich evaluiert. Auf Basis der daraus gewonnen Testergebnisse wurde bewiesen, dass ein rollensensitives Suchverfahren in Form des ROBUS Systems zu einer signifikanten Verbesserung im Bereich der Unternehmenssuche beiträgt. Zu beachten ist außerdem, dass dieses System nicht als vollständige Suchmaschine, sondern vielmehr als Erweiterung zu bestehenden Suchsystemen zu verstehen ist. Die Suchergebnisse der zugrunde liegenden Suchmaschine werden durch das System anhand der Rollenprofile neu gereiht. Zur Evaluierung des Systems wurde die frei verfügbare Apache Lucene Implementierung herangezogen. Diese Vorgehensweise ermöglicht die Generierung von objektiven und vergleichbaren Testergebnissen.

Abstract

No abstract available

Statistik
Das PDF-Dokument wurde 32 mal heruntergeladen.