Mittelbach, J.; Probst, M.: Möglichkeiten und Grenzen maschineller Indexierung in der Sacherschließung : Strategien für das Bibliothekssystem der Freien Universität Berlin (2006)
0.01
0.0145176435 = product of:
0.08347645 = sum of:
0.019186692 = weight(_text_:und in 1411) [ClassicSimilarity], result of:
0.019186692 = score(doc=1411,freq=18.0), product of:
0.052235067 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.023567878 = queryNorm
0.3673144 = fieldWeight in 1411, product of:
4.2426405 = tf(freq=18.0), with freq of:
18.0 = termFreq=18.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.0390625 = fieldNorm(doc=1411)
0.012935456 = product of:
0.025870912 = sum of:
0.025870912 = weight(_text_:bibliothekswesen in 1411) [ClassicSimilarity], result of:
0.025870912 = score(doc=1411,freq=2.0), product of:
0.10505787 = queryWeight, product of:
4.457672 = idf(docFreq=1392, maxDocs=44218)
0.023567878 = queryNorm
0.24625391 = fieldWeight in 1411, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
4.457672 = idf(docFreq=1392, maxDocs=44218)
0.0390625 = fieldNorm(doc=1411)
0.5 = coord(1/2)
0.025870912 = weight(_text_:bibliothekswesen in 1411) [ClassicSimilarity], result of:
0.025870912 = score(doc=1411,freq=2.0), product of:
0.10505787 = queryWeight, product of:
4.457672 = idf(docFreq=1392, maxDocs=44218)
0.023567878 = queryNorm
0.24625391 = fieldWeight in 1411, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
4.457672 = idf(docFreq=1392, maxDocs=44218)
0.0390625 = fieldNorm(doc=1411)
0.025483383 = weight(_text_:im in 1411) [ClassicSimilarity], result of:
0.025483383 = score(doc=1411,freq=12.0), product of:
0.066621356 = queryWeight, product of:
2.8267863 = idf(docFreq=7115, maxDocs=44218)
0.023567878 = queryNorm
0.38251072 = fieldWeight in 1411, product of:
3.4641016 = tf(freq=12.0), with freq of:
12.0 = termFreq=12.0
2.8267863 = idf(docFreq=7115, maxDocs=44218)
0.0390625 = fieldNorm(doc=1411)
0.17391305 = coord(4/23)
- Abstract
- Automatische Indexierung wird zunehmend als sinnvolle Möglichkeit erkannt, Daten für Informationsretrievalsysteme zu erzeugen und somit die Auffindbarkeit von Do-kumenten zu erhöhen. Die dafür geeigneten Methoden sind seit geraumer Zeit bekannt und umfassen statistische bzw. computerlinguistische Sprachanalysetechniken, die im Gegensatz zur gebräuchlichen Freitextinvertierung entscheidende Vor-teile hinsichtlich des Retrievals bieten. So bilden erst die Wortformenreduzierung und die semantische Zerlegung sowie die Gewichtung der ermittelten Indexterme die Grundlagen für die gezielte sachliche Suche im Online-Katalog. Entsprechende Ver-fahren, die sich für Bibliotheken eignen, stehen seit Mitte der neunziger Jahre auch für den praktischen Einsatz bereit und werden - nicht zuletzt aufgrund steigender Akzeptanz - ständig weiterentwickelt. Dabei geht es nicht nur um die Steigerung der allgemeinen Leistungsfähigkeit von maschinellen Indexierungssystemen, sondern auch um ihre Fähigkeit, die im Bibliothekswesen verfügbare, sehr heterogene Daten-grundlage optimal zu nutzen. Wichtige Kriterien sind zudem eine vertretbare Fehler-quote, die Integrierbarkeit in die Geschäftsgänge und die Darstellbarkeit der anfal-lenden Datenmengen in entsprechenden Datenrepräsentationsmodellen. Im Fokus der Untersuchung stehen die allgemeine Betrachtung der Vor- und Nachteile der beiden gängigen Indexierungssysteme MILOS und intelligentCAPTURE sowie die Möglichkeiten und Grenzen ihres Einsatzes im Bibliothekssystem der Freien Universität Berlin. Diese Veröffentlichung geht zurück auf eine Master-Arbeit im postgradualen Fernstudiengang Master of Arts (Library and Information Science) an der Humboldt-Universität zu Berlin. Online-Version: http://www.ib.hu-berlin.de/~kumlau/handreichungen/h183/