Renker, L.: Exploration von Textkorpora : Topic Models als Grundlage der Interaktion (2015)
0.08
0.0761787 = product of:
0.1523574 = sum of:
0.038245305 = weight(_text_:und in 2380) [ClassicSimilarity], result of:
0.038245305 = score(doc=2380,freq=14.0), product of:
0.11806262 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.053268533 = queryNorm
0.32394084 = fieldWeight in 2380, product of:
3.7416575 = tf(freq=14.0), with freq of:
14.0 = termFreq=14.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.0390625 = fieldNorm(doc=2380)
0.068976596 = weight(_text_:anwendung in 2380) [ClassicSimilarity], result of:
0.068976596 = score(doc=2380,freq=2.0), product of:
0.25789845 = queryWeight, product of:
4.8414783 = idf(docFreq=948, maxDocs=44218)
0.053268533 = queryNorm
0.2674564 = fieldWeight in 2380, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
4.8414783 = idf(docFreq=948, maxDocs=44218)
0.0390625 = fieldNorm(doc=2380)
0.04513549 = weight(_text_:des in 2380) [ClassicSimilarity], result of:
0.04513549 = score(doc=2380,freq=8.0), product of:
0.14751695 = queryWeight, product of:
2.7693076 = idf(docFreq=7536, maxDocs=44218)
0.053268533 = queryNorm
0.30596817 = fieldWeight in 2380, product of:
2.828427 = tf(freq=8.0), with freq of:
8.0 = termFreq=8.0
2.7693076 = idf(docFreq=7536, maxDocs=44218)
0.0390625 = fieldNorm(doc=2380)
0.5 = coord(3/6)
- Abstract
- Das Internet birgt schier endlose Informationen. Ein zentrales Problem besteht heutzutage darin diese auch zugänglich zu machen. Es ist ein fundamentales Domänenwissen erforderlich, um in einer Volltextsuche die korrekten Suchanfragen zu formulieren. Das ist jedoch oftmals nicht vorhanden, so dass viel Zeit aufgewandt werden muss, um einen Überblick des behandelten Themas zu erhalten. In solchen Situationen findet sich ein Nutzer in einem explorativen Suchvorgang, in dem er sich schrittweise an ein Thema heranarbeiten muss. Für die Organisation von Daten werden mittlerweile ganz selbstverständlich Verfahren des Machine Learnings verwendet. In den meisten Fällen bleiben sie allerdings für den Anwender unsichtbar. Die interaktive Verwendung in explorativen Suchprozessen könnte die menschliche Urteilskraft enger mit der maschinellen Verarbeitung großer Datenmengen verbinden. Topic Models sind ebensolche Verfahren. Sie finden in einem Textkorpus verborgene Themen, die sich relativ gut von Menschen interpretieren lassen und sind daher vielversprechend für die Anwendung in explorativen Suchprozessen. Nutzer können damit beim Verstehen unbekannter Quellen unterstützt werden. Bei der Betrachtung entsprechender Forschungsarbeiten fiel auf, dass Topic Models vorwiegend zur Erzeugung statischer Visualisierungen verwendet werden. Das Sensemaking ist ein wesentlicher Bestandteil der explorativen Suche und wird dennoch nur in sehr geringem Umfang genutzt, um algorithmische Neuerungen zu begründen und in einen umfassenden Kontext zu setzen. Daraus leitet sich die Vermutung ab, dass die Verwendung von Modellen des Sensemakings und die nutzerzentrierte Konzeption von explorativen Suchen, neue Funktionen für die Interaktion mit Topic Models hervorbringen und einen Kontext für entsprechende Forschungsarbeiten bieten können.
- Footnote
- Masterthesis zur Erlangung des akademischen Grades Master of Science (M.Sc.) vorgelegt an der Fachhochschule Köln / Fakultät für Informatik und Ingenieurswissenschaften im Studiengang Medieninformatik.
- Imprint
- Gummersbach : Fakultät für Informatik und Ingenieurswissenschaften