-
Kempf, A.O.: Neue Verfahrenswege der Wissensorganisation : eine Evaluation automatischer Indexierung in der sozialwissenschaftlichen Fachinformation (2017)
0.02
0.0155234765 = product of:
0.08279187 = sum of:
0.020681024 = weight(_text_:und in 3497) [ClassicSimilarity], result of:
0.020681024 = score(doc=3497,freq=8.0), product of:
0.060324993 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.027217962 = queryNorm
0.34282678 = fieldWeight in 3497, product of:
2.828427 = tf(freq=8.0), with freq of:
8.0 = termFreq=8.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.0546875 = fieldNorm(doc=3497)
0.020681024 = weight(_text_:und in 3497) [ClassicSimilarity], result of:
0.020681024 = score(doc=3497,freq=8.0), product of:
0.060324993 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.027217962 = queryNorm
0.34282678 = fieldWeight in 3497, product of:
2.828427 = tf(freq=8.0), with freq of:
8.0 = termFreq=8.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.0546875 = fieldNorm(doc=3497)
0.041429825 = product of:
0.08285965 = sum of:
0.08285965 = weight(_text_:gesellschaft in 3497) [ClassicSimilarity], result of:
0.08285965 = score(doc=3497,freq=8.0), product of:
0.1207488 = queryWeight, product of:
4.4363647 = idf(docFreq=1422, maxDocs=44218)
0.027217962 = queryNorm
0.6862151 = fieldWeight in 3497, product of:
2.828427 = tf(freq=8.0), with freq of:
8.0 = termFreq=8.0
4.4363647 = idf(docFreq=1422, maxDocs=44218)
0.0546875 = fieldNorm(doc=3497)
0.5 = coord(1/2)
0.1875 = coord(3/16)
- Source
- Theorie, Semantik und Organisation von Wissen: Proceedings der 13. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) und dem 13. Internationalen Symposium der Informationswissenschaft der Higher Education Association for Information Science (HI) Potsdam (19.-20.03.2013): 'Theory, Information and Organization of Knowledge' / Proceedings der 14. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) und Natural Language & Information Systems (NLDB) Passau (16.06.2015): 'Lexical Resources for Knowledge Organization' / Proceedings des Workshops der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) auf der SEMANTICS Leipzig (1.09.2014): 'Knowledge Organization and Semantic Web' / Proceedings des Workshops der Polnischen und Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) Cottbus (29.-30.09.2011): 'Economics of Knowledge Production and Organization'. Hrsg. von W. Babik, H.P. Ohly u. K. Weber
-
Kempf, A.O.: Automatische Indexierung in der sozialwissenschaftlichen Fachinformation : eine Evaluationsstudie zur maschinellen Erschließung für die Datenbank SOLIS (2012)
0.01
0.005862519 = product of:
0.046900153 = sum of:
0.023450077 = weight(_text_:und in 903) [ClassicSimilarity], result of:
0.023450077 = score(doc=903,freq=14.0), product of:
0.060324993 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.027217962 = queryNorm
0.38872904 = fieldWeight in 903, product of:
3.7416575 = tf(freq=14.0), with freq of:
14.0 = termFreq=14.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.046875 = fieldNorm(doc=903)
0.023450077 = weight(_text_:und in 903) [ClassicSimilarity], result of:
0.023450077 = score(doc=903,freq=14.0), product of:
0.060324993 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.027217962 = queryNorm
0.38872904 = fieldWeight in 903, product of:
3.7416575 = tf(freq=14.0), with freq of:
14.0 = termFreq=14.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.046875 = fieldNorm(doc=903)
0.125 = coord(2/16)
- Abstract
- Automatische Indexierungsverfahren werden mit Zunahme der digitalen Verfügbarkeit von Metadaten und Volltexten mehr und mehr als eine mögliche Antwort auf das Management unstrukturierter Daten diskutiert. In der sozialwissenschaftlichen Fachinformation existiert in diesem Zusammenhang seit einiger Zeit der Vorschlag eines sogenannten Schalenmodells (vgl. Krause, 1996) mit unterschiedlichen Qualitätsstufen bei der inhaltlichen Erschließung. Vor diesem Hintergrund beschreibt die Arbeit zunächst Methoden und Verfahren der inhaltlichen und automatischen Indexierung, bevor vier Testläufe eines automatischen Indexierungssystems (MindServer) zur automatischen Erschließung von Datensätzen der bibliographischen Literaturdatenbank SOLIS mit Deskriptoren des Thesaurus Sozialwissenschaften sowie der Klassifikation Sozialwissenschaften beschrieben und analysiert werden. Es erfolgt eine ausführliche Fehleranalyse mit Beispielen sowie eine abschließende Diskussion, inwieweit die automatische Erschließung in dieser Form für die Randbereiche der Datenbank SOLIS für die Zukunft einen gangbaren Weg darstellt.
- Imprint
- Berlin : Humboldt-Universität zu Berlin, Philosophische Fakultät I, Institut für Bibliotheks- und Informationswissenschaft
- Series
- Berliner Handreichungen zur Bibliotheks- und Informationswissenschaft; 329
-
Toepfer, M.; Kempf, A.O.: Automatische Indexierung auf Basis von Titeln und Autoren-Keywords : ein Werkstattbericht (2016)
0.01
0.005222747 = product of:
0.041781977 = sum of:
0.020890988 = weight(_text_:und in 3209) [ClassicSimilarity], result of:
0.020890988 = score(doc=3209,freq=16.0), product of:
0.060324993 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.027217962 = queryNorm
0.34630734 = fieldWeight in 3209, product of:
4.0 = tf(freq=16.0), with freq of:
16.0 = termFreq=16.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.0390625 = fieldNorm(doc=3209)
0.020890988 = weight(_text_:und in 3209) [ClassicSimilarity], result of:
0.020890988 = score(doc=3209,freq=16.0), product of:
0.060324993 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.027217962 = queryNorm
0.34630734 = fieldWeight in 3209, product of:
4.0 = tf(freq=16.0), with freq of:
16.0 = termFreq=16.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.0390625 = fieldNorm(doc=3209)
0.125 = coord(2/16)
- Abstract
- Automatische Verfahren sind für Bibliotheken essentiell, um die Erschliessung stetig wachsender Datenmengen zu stemmen. Die Deutsche Zentralbibliothek für Wirtschaftswissenschaften - Leibniz-Informationszentrum Wirtschaft sammelt seit Längerem Erfahrungen im Bereich automatischer Indexierung und baut hier eigene Kompetenzen auf. Aufgrund rechtlicher Restriktionen werden unter anderem Ansätze untersucht, die ohne Volltextnutzung arbeiten. Dieser Beitrag gibt einen Einblick in ein laufendes Teilprojekt, das unter Verwendung von Titeln und Autoren-Keywords auf eine Nachnormierung der inhaltsbeschreibenden Metadaten auf den Standard-Thesaurus Wirtschaft (STW) abzielt. Wir erläutern den Hintergrund der Arbeit, betrachten die Systemarchitektur und stellen erste vielversprechende Ergebnisse eines dokumentenorientierten Verfahrens vor.
Im Folgenden erläutern wir zunächst den Hintergrund der aktuellen Arbeit. Wir beziehen uns auf Erfahrungen mit maschinellen Verfahren allgemein und an der Deutschen Zentralbibliothek für Wirtschaftswissenschaften (ZBW) - Leibniz-Informationszentrum Wirtschaft im Speziellen. Im Anschluss geben wir einen konkreten Einblick in ein laufendes Teilprojekt, bei dem die Systemarchitektur der Automatik gegenüber früheren Arbeiten Titel und Autoren-Keywords gemeinsam verwendet, um eine Nachnormierung auf den Standard-Thesaurus Wirtschaft (STW) zu erzielen. Im Gegenssatz zu einer statischen Verknüpfung im Sinne einer Crosskonkordanz bzw. Vokabularabbildung ist das jetzt verfolgte Vorgehen dokumentenorientiert und damit in der Lage, kontextbezogene Zuordnungen vorzunehmen. Der Artikel stellt neben der Systemarchitektur auch erste experimentelle Ergebnisse vor, die im Vergleich zu titelbasierten Vorhersagen bereits deutliche Verbesserungen aufzeigen.
- Content
- Beitrag in einem Themenschwerpunkt 'Computerlinguistik und Bibliotheken'. Vgl.: http://0277.ch/ojs/index.php/cdrs_0277/article/view/156/354.
-
Kempf, A.O.: Automatische Inhaltserschließung in der Fachinformation (2013)
0.00
0.00369304 = product of:
0.02954432 = sum of:
0.01477216 = weight(_text_:und in 905) [ClassicSimilarity], result of:
0.01477216 = score(doc=905,freq=8.0), product of:
0.060324993 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.027217962 = queryNorm
0.24487628 = fieldWeight in 905, product of:
2.828427 = tf(freq=8.0), with freq of:
8.0 = termFreq=8.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.0390625 = fieldNorm(doc=905)
0.01477216 = weight(_text_:und in 905) [ClassicSimilarity], result of:
0.01477216 = score(doc=905,freq=8.0), product of:
0.060324993 = queryWeight, product of:
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.027217962 = queryNorm
0.24487628 = fieldWeight in 905, product of:
2.828427 = tf(freq=8.0), with freq of:
8.0 = termFreq=8.0
2.216367 = idf(docFreq=13101, maxDocs=44218)
0.0390625 = fieldNorm(doc=905)
0.125 = coord(2/16)
- Abstract
- Der Artikel basiert auf einer Masterarbeit mit dem Titel "Automatische Indexierung in der sozialwissenschaftlichen Fachinformation. Eine Evaluationsstudie zur maschinellen Erschließung für die Datenbank SOLIS" (Kempf 2012), die im Rahmen des Aufbaustudiengangs Bibliotheks- und Informationswissenschaft an der Humboldt- Universität zu Berlin am Lehrstuhl Information Retrieval verfasst wurde. Auf der Grundlage des Schalenmodells zur Inhaltserschließung in der Fachinformation stellt der Artikel Evaluationsergebnisse eines automatischen Erschließungsverfahrens für den Einsatz in der sozialwissenschaftlichen Fachinformation vor. Ausgehend von dem von Krause beschriebenen Anwendungsszenario, wonach SOLIS-Datenbestände (Sozialwissenschaftliches Literaturinformationssystem) von geringerer Relevanz automatisch erschlossen werden sollten, wurden auf dieser Dokumentgrundlage zwei Testreihen mit der Indexierungssoftware MindServer der Firma Recommind durchgeführt. Neben den Auswirkungen allgemeiner Systemeinstellungen in der ersten Testreihe wurde in der zweiten Testreihe die Indexierungsleistung der Software für die Rand- und die Kernbereiche der Literaturdatenbank miteinander verglichen. Für letztere Testreihe wurden für beide Bereiche der Datenbank spezifische Versionen der Indexierungssoftware aufgebaut, die anhand von Dokumentkorpora aus den entsprechenden Bereichen trainiert wurden. Die Ergebnisse der Evaluation, die auf der Grundlage intellektuell generierter Vergleichsdaten erfolgt, weisen auf Unterschiede in der Indexierungsleistung zwischen Rand- und Kernbereichen hin, die einerseits gegen den Einsatz automatischer Indexierungsverfahren in den Randbereichen sprechen. Andererseits deutet sich an, dass sich die Indexierungsresultate durch den Aufbau fachteilgebietsspezifischer Trainingsmengen verbessern lassen.
- Source
- Information - Wissenschaft und Praxis. 64(2013) H.2/3, S.96-106