Search (52 results, page 1 of 3)

Junger, U.; Schwens, U.: ¬Die inhaltliche Erschließung des schriftlichen kulturellen Erbes auf dem Weg in die Zukunft : Automatische Vergabe von Schlagwörtern in der Deutschen Nationalbibliothek (2017) 0.02

0.022409644 = product of:
  0.10644581 = sum of:
    0.030162308 = weight(_text_:deutsche in 3780) [ClassicSimilarity], result of:
      0.030162308 = score(doc=3780,freq=2.0), product of:
        0.11561814 = queryWeight, product of:
          4.7224083 = idf(docFreq=1068, maxDocs=44218)
          0.024482876 = queryNorm
        0.26087868 = fieldWeight in 3780, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.7224083 = idf(docFreq=1068, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3780)
    0.024859069 = weight(_text_:und in 3780) [ClassicSimilarity], result of:
      0.024859069 = score(doc=3780,freq=28.0), product of:
        0.05426304 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024482876 = queryNorm
        0.45812157 = fieldWeight in 3780, product of:
          5.2915025 = tf(freq=28.0), with freq of:
            28.0 = termFreq=28.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3780)
    0.043131713 = weight(_text_:leben in 3780) [ClassicSimilarity], result of:
      0.043131713 = score(doc=3780,freq=2.0), product of:
        0.13825856 = queryWeight, product of:
          5.647154 = idf(docFreq=423, maxDocs=44218)
          0.024482876 = queryNorm
        0.31196412 = fieldWeight in 3780, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.647154 = idf(docFreq=423, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3780)
    0.008292729 = product of:
      0.016585458 = sum of:
        0.016585458 = weight(_text_:22 in 3780) [ClassicSimilarity], result of:
          0.016585458 = score(doc=3780,freq=2.0), product of:
            0.08573486 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.024482876 = queryNorm
            0.19345059 = fieldWeight in 3780, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0390625 = fieldNorm(doc=3780)
      0.5 = coord(1/2)
  0.21052632 = coord(4/19)

Abstract: Wir leben im 21. Jahrhundert, und vieles, was vor hundert und noch vor fünfzig Jahren als Science Fiction abgetan worden wäre, ist mittlerweile Realität. Raumsonden fliegen zum Mars, machen dort Experimente und liefern Daten zur Erde zurück. Roboter werden für Routineaufgaben eingesetzt, zum Beispiel in der Industrie oder in der Medizin. Digitalisierung, künstliche Intelligenz und automatisierte Verfahren sind kaum mehr aus unserem Alltag wegzudenken. Grundlage vieler Prozesse sind lernende Algorithmen. Die fortschreitende digitale Transformation ist global und umfasst alle Lebens- und Arbeitsbereiche: Wirtschaft, Gesellschaft und Politik. Sie eröffnet neue Möglichkeiten, von denen auch Bibliotheken profitieren. Der starke Anstieg digitaler Publikationen, die einen wichtigen und prozentual immer größer werdenden Teil des Kulturerbes darstellen, sollte für Bibliotheken Anlass sein, diese Möglichkeiten aktiv aufzugreifen und einzusetzen. Die Auswertbarkeit digitaler Inhalte, beispielsweise durch Text- and Data-Mining (TDM), und die Entwicklung technischer Verfahren, mittels derer Inhalte miteinander vernetzt und semantisch in Beziehung gesetzt werden können, bieten Raum, auch bibliothekarische Erschließungsverfahren neu zu denken. Daher beschäftigt sich die Deutsche Nationalbibliothek (DNB) seit einigen Jahren mit der Frage, wie sich die Prozesse bei der Erschließung von Medienwerken verbessern und maschinell unterstützen lassen. Sie steht dabei im regelmäßigen kollegialen Austausch mit anderen Bibliotheken, die sich ebenfalls aktiv mit dieser Fragestellung befassen, sowie mit europäischen Nationalbibliotheken, die ihrerseits Interesse an dem Thema und den Erfahrungen der DNB haben. Als Nationalbibliothek mit umfangreichen Beständen an digitalen Publikationen hat die DNB auch Expertise bei der digitalen Langzeitarchivierung aufgebaut und ist im Netzwerk ihrer Partner als kompetente Gesprächspartnerin geschätzt.
Date: 19. 8.2017 9:24:22

Toepfer, M.; Kempf, A.O.: Automatische Indexierung auf Basis von Titeln und Autoren-Keywords : ein Werkstattbericht (2016) 0.01
```
0.010677476 = product of:
  0.06762402 = sum of:
    0.030162308 = weight(_text_:deutsche in 3209) [ClassicSimilarity], result of:
      0.030162308 = score(doc=3209,freq=2.0), product of:
        0.11561814 = queryWeight, product of:
          4.7224083 = idf(docFreq=1068, maxDocs=44218)
          0.024482876 = queryNorm
        0.26087868 = fieldWeight in 3209, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.7224083 = idf(docFreq=1068, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3209)
    0.018791689 = weight(_text_:und in 3209) [ClassicSimilarity], result of:
      0.018791689 = score(doc=3209,freq=16.0), product of:
        0.05426304 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024482876 = queryNorm
        0.34630734 = fieldWeight in 3209, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3209)
    0.018670026 = product of:
      0.037340052 = sum of:
        0.037340052 = weight(_text_:allgemein in 3209) [ClassicSimilarity], result of:
          0.037340052 = score(doc=3209,freq=2.0), product of:
            0.12864152 = queryWeight, product of:
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.024482876 = queryNorm
            0.2902644 = fieldWeight in 3209, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.0390625 = fieldNorm(doc=3209)
      0.5 = coord(1/2)
  0.15789473 = coord(3/19)
```
Abstract

Automatische Verfahren sind für Bibliotheken essentiell, um die Erschliessung stetig wachsender Datenmengen zu stemmen. Die Deutsche Zentralbibliothek für Wirtschaftswissenschaften - Leibniz-Informationszentrum Wirtschaft sammelt seit Längerem Erfahrungen im Bereich automatischer Indexierung und baut hier eigene Kompetenzen auf. Aufgrund rechtlicher Restriktionen werden unter anderem Ansätze untersucht, die ohne Volltextnutzung arbeiten. Dieser Beitrag gibt einen Einblick in ein laufendes Teilprojekt, das unter Verwendung von Titeln und Autoren-Keywords auf eine Nachnormierung der inhaltsbeschreibenden Metadaten auf den Standard-Thesaurus Wirtschaft (STW) abzielt. Wir erläutern den Hintergrund der Arbeit, betrachten die Systemarchitektur und stellen erste vielversprechende Ergebnisse eines dokumentenorientierten Verfahrens vor.
Im Folgenden erläutern wir zunächst den Hintergrund der aktuellen Arbeit. Wir beziehen uns auf Erfahrungen mit maschinellen Verfahren allgemein und an der Deutschen Zentralbibliothek für Wirtschaftswissenschaften (ZBW) - Leibniz-Informationszentrum Wirtschaft im Speziellen. Im Anschluss geben wir einen konkreten Einblick in ein laufendes Teilprojekt, bei dem die Systemarchitektur der Automatik gegenüber früheren Arbeiten Titel und Autoren-Keywords gemeinsam verwendet, um eine Nachnormierung auf den Standard-Thesaurus Wirtschaft (STW) zu erzielen. Im Gegenssatz zu einer statischen Verknüpfung im Sinne einer Crosskonkordanz bzw. Vokabularabbildung ist das jetzt verfolgte Vorgehen dokumentenorientiert und damit in der Lage, kontextbezogene Zuordnungen vorzunehmen. Der Artikel stellt neben der Systemarchitektur auch erste experimentelle Ergebnisse vor, die im Vergleich zu titelbasierten Vorhersagen bereits deutliche Verbesserungen aufzeigen.

Content

Beitrag in einem Themenschwerpunkt 'Computerlinguistik und Bibliotheken'. Vgl.: http://0277.ch/ojs/index.php/cdrs_0277/article/view/156/354.
Pollmeier, M.: Verlagsschlagwörter als Grundlage für den Einsatz eines maschinellen Verfahrens zur verbalen Erschließung der Kinder- und Jugendliteratur durch die Deutsche Nationalbibliothek : eine Datenanalyse (2019) 0.01
```
0.0072875163 = product of:
  0.069231406 = sum of:
    0.04265594 = weight(_text_:deutsche in 1081) [ClassicSimilarity], result of:
      0.04265594 = score(doc=1081,freq=4.0), product of:
        0.11561814 = queryWeight, product of:
          4.7224083 = idf(docFreq=1068, maxDocs=44218)
          0.024482876 = queryNorm
        0.36893815 = fieldWeight in 1081, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.7224083 = idf(docFreq=1068, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1081)
    0.026575463 = weight(_text_:und in 1081) [ClassicSimilarity], result of:
      0.026575463 = score(doc=1081,freq=32.0), product of:
        0.05426304 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024482876 = queryNorm
        0.48975256 = fieldWeight in 1081, product of:
          5.656854 = tf(freq=32.0), with freq of:
            32.0 = termFreq=32.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1081)
  0.10526316 = coord(2/19)
```
Abstract

Die Inhaltserschließung durch Schlagwörter wird aktuell in vielen Öffentlichen Bibliotheken Deutschlands zurückgefahren. Aufgrund von Personalmangel und den vielfältigen anderen bibliothekarischen Dienstleistungen, die für die Benutzer zu leisten sind, kommt sie oft zu kurz. Die Deutsche Nationalbibliothek unterstützte diese Bibliotheken bisher als wichtigster Datenlieferant, jedoch stellte sie 2017 die intellektuelle Inhaltserschließung der Kinder- und Jugendliteratur und der Belletristik ein. Um diese problematische Situation zu verbessern, wird aktuell in der Deutschen Nationalbibliothek ein Verfahren erprobt, das aus Schlagwörtern von Verlagen maschinell bibliothekarische Schlagwörter aus der Gemeinsamen Normdatei generiert. Auf die Titel der Kinder- und Jugendliteratur aus den Jahren 2018 und 2019 wurde es bereits angewendet. In dieser Arbeit geht es um eine erste Analyse dieser Erschließungsergebnisse, um Aussagen über die Nützlichkeit der Verlagsschlagwörter und des automatischen Verfahrens zu treffen. Im theoretischen Teil werden einerseits die Inhaltserschließung im bibliothekarischen Bereich und deren aktuelle Entwicklungen hinsichtlich der Automatisierung beschrieben. Andererseits wird näher auf die Erschließungspraxis in der Deutschen Nationalbibliothek hinsichtlich der Automatisierung und der Kinder- und Jugendliteratur eingegangen. Im Analyseteil werden sowohl die Verlagsschlagwörter als auch die bibliothekarischen Schlagwörter nach festgelegten Kriterien untersucht und schließlich miteinander verglichen.

Footnote

Bachelorarbeit an der Hochschule für Technik, Wirtschaft und Kultur Leipzig Fakultät Informatik und Medien Studiengang Bibliotheks- und Informationswissenschaft.

Imprint

Leipzig : Hochschule für Technik, Wirtschaft und Kultur / Fakultät Informatik und Medien

Schöning-Walter, C.: Automatische Erschließungsverfahren für Netzpublikationen : zum Stand der Arbeiten im Projekt PETRUS (2011) 0.01

0.006662425 = product of:
  0.06329304 = sum of:
    0.04825969 = weight(_text_:deutsche in 1714) [ClassicSimilarity], result of:
      0.04825969 = score(doc=1714,freq=2.0), product of:
        0.11561814 = queryWeight, product of:
          4.7224083 = idf(docFreq=1068, maxDocs=44218)
          0.024482876 = queryNorm
        0.41740587 = fieldWeight in 1714, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.7224083 = idf(docFreq=1068, maxDocs=44218)
          0.0625 = fieldNorm(doc=1714)
    0.015033351 = weight(_text_:und in 1714) [ClassicSimilarity], result of:
      0.015033351 = score(doc=1714,freq=4.0), product of:
        0.05426304 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024482876 = queryNorm
        0.27704588 = fieldWeight in 1714, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1714)
  0.10526316 = coord(2/19)

Abstract: Die Deutsche Nationalbibliothek (DNB) hat damit begonnen, ihre Erschließungsprozesse zu automatisieren, um die Publikationen in ihrem Bestand und die bibliografischen Metadaten trotz der enorm anwachsenden Sammlung gedruckter und digitaler Medien so schnell wie möglich für die Nutzung zur Verfügung zu stellen.

Beyer, C.; Trunk, D.: Automatische Verfahren für die Formalerschließung im Projekt PETRUS (2011) 0.01

0.0061989343 = product of:
  0.058889873 = sum of:
    0.04825969 = weight(_text_:deutsche in 1712) [ClassicSimilarity], result of:
      0.04825969 = score(doc=1712,freq=2.0), product of:
        0.11561814 = queryWeight, product of:
          4.7224083 = idf(docFreq=1068, maxDocs=44218)
          0.024482876 = queryNorm
        0.41740587 = fieldWeight in 1712, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.7224083 = idf(docFreq=1068, maxDocs=44218)
          0.0625 = fieldNorm(doc=1712)
    0.010630185 = weight(_text_:und in 1712) [ClassicSimilarity], result of:
      0.010630185 = score(doc=1712,freq=2.0), product of:
        0.05426304 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024482876 = queryNorm
        0.19590102 = fieldWeight in 1712, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1712)
  0.10526316 = coord(2/19)

Abstract: Die Deutsche Nationalbibliothek (DNB) erstellt für Netzpublikationen seit Anfang 2010 keine intellektuell per Autopsie und nach gültigem Regelwerk (RAK-WB bzw. RAK-NBM) erschlossen Titeldaten mehr. Da das stetig wachsende Kontingent an Netzpublikationen durch intellektuelle Bearbeitung nicht mehr zu bewältigen ist, wurde mit dem Projekt PETRUS damit begonnen, die Erschließungsprozesse für Netzpublikationen zu automatisieren.

Wiesenmüller, H.: DNB-Sacherschließung : Neues für die Reihen A und B (2019) 0.01
```
0.0054884255 = product of:
  0.052140042 = sum of:
    0.036194768 = weight(_text_:deutsche in 5212) [ClassicSimilarity], result of:
      0.036194768 = score(doc=5212,freq=2.0), product of:
        0.11561814 = queryWeight, product of:
          4.7224083 = idf(docFreq=1068, maxDocs=44218)
          0.024482876 = queryNorm
        0.3130544 = fieldWeight in 5212, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.7224083 = idf(docFreq=1068, maxDocs=44218)
          0.046875 = fieldNorm(doc=5212)
    0.015945276 = weight(_text_:und in 5212) [ClassicSimilarity], result of:
      0.015945276 = score(doc=5212,freq=8.0), product of:
        0.05426304 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024482876 = queryNorm
        0.29385152 = fieldWeight in 5212, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5212)
  0.10526316 = coord(2/19)
```
Abstract

"Alle paar Jahre wird die Bibliothekscommunity mit Veränderungen in der inhaltlichen Erschließung durch die Deutsche Nationalbibliothek konfrontiert. Sicher werden sich viele noch an die Einschnitte des Jahres 2014 für die Reihe A erinnern: Seither werden u.a. Ratgeber, Sprachwörterbücher, Reiseführer und Kochbücher nicht mehr mit Schlagwörtern erschlossen (vgl. das DNB-Konzept von 2014). Das Jahr 2017 brachte die Einführung der maschinellen Indexierung für die Reihen B und H bei gleichzeitigem Verlust der DDC-Tiefenerschließung (vgl. DNB-Informationen von 2017). Virulent war seither die Frage, was mit der Reihe A passieren würde. Seit wenigen Tagen kann man dies nun auf der Website der DNB nachlesen. (Nebenbei: Es ist zu befürchten, dass viele Links in diesem Blog-Beitrag in absehbarer Zeit nicht mehr funktionieren werden, da ein Relaunch der DNB-Website angekündigt ist. Wie beim letzten Mal wird es vermutlich auch diesmal keine Weiterleitungen von den alten auf die neuen URLs geben.)"

Source

https://www.basiswissen-rda.de/dnb-sacherschliessung-reihen-a-und-b/
Groß, T.; Faden, M.: Automatische Indexierung elektronischer Dokumente an der Deutschen Zentralbibliothek für Wirtschaftswissenschaften : Bericht über die Jahrestagung der Internationalen Buchwissenschaftlichen Gesellschaft (2010) 0.00
```
0.00455723 = product of:
  0.043293685 = sum of:
    0.024129845 = weight(_text_:deutsche in 4051) [ClassicSimilarity], result of:
      0.024129845 = score(doc=4051,freq=2.0), product of:
        0.11561814 = queryWeight, product of:
          4.7224083 = idf(docFreq=1068, maxDocs=44218)
          0.024482876 = queryNorm
        0.20870294 = fieldWeight in 4051, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.7224083 = idf(docFreq=1068, maxDocs=44218)
          0.03125 = fieldNorm(doc=4051)
    0.01916384 = weight(_text_:und in 4051) [ClassicSimilarity], result of:
      0.01916384 = score(doc=4051,freq=26.0), product of:
        0.05426304 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024482876 = queryNorm
        0.3531656 = fieldWeight in 4051, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=4051)
  0.10526316 = coord(2/19)
```
Abstract

Die zunehmende Verfügbarmachung digitaler Informationen in den letzten Jahren sowie die Aussicht auf ein weiteres Ansteigen der sogenannten Datenflut kumulieren in einem grundlegenden, sich weiter verstärkenden Informationsstrukturierungsproblem. Die stetige Zunahme von digitalen Informationsressourcen im World Wide Web sichert zwar jederzeit und ortsungebunden den Zugriff auf verschiedene Informationen; offen bleibt der strukturierte Zugang, insbesondere zu wissenschaftlichen Ressourcen. Angesichts der steigenden Anzahl elektronischer Inhalte und vor dem Hintergrund stagnierender bzw. knapper werdender personeller Ressourcen in der Sacherschließun schafft keine Bibliothek bzw. kein Bibliotheksverbund es mehr, weder aktuell noch zukünftig, alle digitalen Daten zu erfassen, zu strukturieren und zueinander in Beziehung zu setzen. In der Informationsgesellschaft des 21. Jahrhunderts wird es aber zunehmend wichtiger, die in der Flut verschwundenen wissenschaftlichen Informationen zeitnah, angemessen und vollständig zu strukturieren und somit als Basis für eine Wissensgenerierung wieder nutzbar zu machen. Eine normierte Inhaltserschließung digitaler Informationsressourcen ist deshalb für die Deutsche Zentralbibliothek für Wirtschaftswissenschaften (ZBW) als wichtige Informationsinfrastruktureinrichtung in diesem Bereich ein entscheidender und auch erfolgskritischer Aspekt im Wettbewerb mit anderen Informationsdienstleistern. Weil die traditionelle intellektuelle Sacherschließung aber nicht beliebig skalierbar ist - mit dem Anstieg der Zahl an Online-Dokumenten steigt proportional auch der personelle Ressourcenbedarf an Fachreferenten, wenn ein gewisser Qualitätsstandard gehalten werden soll - bedarf es zukünftig anderer Sacherschließungsverfahren. Automatisierte Verschlagwortungsmethoden werden dabei als einzige Möglichkeit angesehen, die bibliothekarische Sacherschließung auch im digitalen Zeitalter zukunftsfest auszugestalten. Zudem können maschinelle Ansätze dazu beitragen, die Heterogenitäten (Indexierungsinkonsistenzen) zwischen den einzelnen Sacherschließer zu nivellieren, und somit zu einer homogeneren Erschließung des Bibliotheksbestandes beitragen.
Mit der Anfang 2010 begonnen Implementierung und Ergebnisevaluierung des automatischen Indexierungsverfahrens "Decisiv Categorization" der Firma Recommind soll das hier skizzierte Informationsstrukturierungsproblem in zwei Schritten gelöst werden. Kurz- bis mittelfristig soll die intellektuelle Indexierung durch ein semiautomatisches Verfahren6 unterstützt werden. Mittel- bis langfristig soll das maschinelle Verfahren, aufbauend auf einem entsprechenden Training, in die Lage versetzt werden, sowohl im Hause vorliegende Dokumente vollautomatisch zu indexieren als auch ZBW-fremde digitale Informationsressourcen zu verschlagworten bzw. zu klassifizieren, um sie in einem gemeinsamen Suchraum auffindbar machen zu können. Im Anschluss an diese Einleitung werden die ersten Ansätze maschineller Sacherschließung an der ZBW (2001-2004) und deren Ergebnisse und Problemlagen aufgezeigt. Danach werden die Rahmenbedingungen (Projektauftrag und -ziel) für eine Wiederaufnahme des Vorhabens im Jahre 2009 aufgezeigt, gefolgt von einer Darstellung der Funktionsweise der Recommind-Technologie und deren Einsatz im Rahmen der Sacherschließung von Online-Dokumenten mit einem Thesaurus. Schwerpunkt dieser Abhandlung bilden im Anschluss daran die Evaluierungsmöglichkeiten automatischer Indexierungsansätze sowie die aktuellen Ergebnisse und zentralen Erkenntnisse des Einsatzes im Kontext der ZBW. Das Fazit beschreibt die entsprechenden Schlussfolgerungen aus den erzielten Ergebnissen sowie den Ausblick auf das weitere Vorgehen.
Carevic, Z.: Semi-automatische Verschlagwortung zur Integration externer semantischer Inhalte innerhalb einer medizinischen Kooperationsplattform (2012) 0.00
```
0.003983807 = product of:
  0.037846163 = sum of:
    0.0248269 = weight(_text_:literatur in 897) [ClassicSimilarity], result of:
      0.0248269 = score(doc=897,freq=2.0), product of:
        0.11727622 = queryWeight, product of:
          4.7901325 = idf(docFreq=998, maxDocs=44218)
          0.024482876 = queryNorm
        0.21169594 = fieldWeight in 897, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.7901325 = idf(docFreq=998, maxDocs=44218)
          0.03125 = fieldNorm(doc=897)
    0.013019265 = weight(_text_:und in 897) [ClassicSimilarity], result of:
      0.013019265 = score(doc=897,freq=12.0), product of:
        0.05426304 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024482876 = queryNorm
        0.23992877 = fieldWeight in 897, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=897)
  0.10526316 = coord(2/19)
```
Abstract

Die vorliegende Arbeit beschäftigt sich mit der Integration von externen semantischen Inhalten auf Basis eines medizinischen Begriffssystems. Die zugrundeliegende Annahme ist, dass die Verwendung einer einheitlichen Terminologie auf Seiten des Anfragesystems und der Wissensbasis zu qualitativ hochwertigen Ergebnissen führt. Um dies zu erreichen muss auf Seiten des Anfragesystems eine Abbildung natürlicher Sprache auf die verwendete Terminologie gewährleistet werden. Dies geschieht auf Basis einer (semi-)automatischen Verschlagwortung textbasierter Inhalte. Im Wesentlichen lassen sich folgende Fragestellungen festhalten: Automatische Verschlagwortung textbasierter Inhalte Kann eine automatische Verschlagwortung textbasierter Inhalte auf Basis eines Begriffssystems optimiert werden? Der zentrale Aspekt der vorliegenden Arbeit ist die (semi-)automatische Verschlagwortung textbasierter Inhalte auf Basis eines medizinischen Begriffssystems. Zu diesem Zweck wird der aktuelle Stand der Forschung betrachtet. Es werden eine Reihe von Tokenizern verglichen um zu erfahren welche Algorithmen sich zur Ermittlung von Wortgrenzen eignen. Speziell wird betrachtet, wie die Ermittlung von Wortgrenzen in einer domänenspezifischen Umgebung eingesetzt werden kann. Auf Basis von identifizierten Token in einem Text werden die Auswirkungen des Stemming und POS-Tagging auf die Gesamtmenge der zu analysierenden Inhalte beobachtet. Abschließend wird evaluiert wie ein kontrolliertes Vokabular die Präzision bei der Verschlagwortung erhöhen kann. Dies geschieht unter der Annahme dass domänenspezifische Inhalte auch innerhalb eines domänenspezifischen Begriffssystems definiert sind. Zu diesem Zweck wird ein allgemeines Prozessmodell entwickelt anhand dessen eine Verschlagwortung vorgenommen wird.
Integration externer Inhalte Inwieweit kann die Nutzung einer einheitlichen Terminologie zwischen Anfragesystem und Wissensbasis den Prozess der Informationsbeschaffung unterstützen? Zu diesem Zweck wird in einer ersten Phase ermittelt welche Wissensbasen aus der medizinischen Domäne in der Linked Data Cloud zur Verfügung stehen. Aufbauend auf den Ergebnissen werden Informationen aus verschiedenen dezentralen Wissensbasen exemplarisch integriert. Der Fokus der Betrachtung liegt dabei auf der verwendeten Terminologie sowie der Nutzung von Semantic Web Technologien. Neben Informationen aus der Linked Data Cloud erfolgt eine Suche nach medizinischer Literatur in PubMed. Wie auch in der Linked Data Cloud erfolgt die Integration unter Verwendung einer einheitlichen Terminologie. Eine weitere Fragestellung ist, wie Informationen aus insgesamt 21. Mio Aufsatzzitaten in PubMed sinnvoll integriert werden können. Dabei wird ermittelt welche Mechanismen eingesetzt werden können um die Präzision der Ergebnisse zu optimieren. Eignung medizinischer Begriffssystem Welche medizinischen Begriffssysteme existieren und wie eignen sich diese als zugrungeliegendes Vokabular für die automatische Verschlagwortung und Integration semantischer Inhalte? Der Fokus liegt dabei speziell auf einer Bewertung der Reichhaltigkeit von Begriffssystemen, wobei insbesondere der Detaillierungsgrad von Interesse ist. Handelt es sich um ein spezifisches oder allgemeines Begriffssystem und eignet sich dieses auch dafür bestimmte Teilaspekte der Medizin, wie bspw. die Chirurige oder die Anästhesie, in einer ausreichenden Tiefe zu beschreiben?

Glaesener, L.: Automatisches Indexieren einer informationswissenschaftlichen Datenbank mit Mehrwortgruppen (2012) 0.00

0.0038987563 = product of:
  0.037038185 = sum of:
    0.023769816 = weight(_text_:und in 401) [ClassicSimilarity], result of:
      0.023769816 = score(doc=401,freq=10.0), product of:
        0.05426304 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024482876 = queryNorm
        0.438048 = fieldWeight in 401, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=401)
    0.013268366 = product of:
      0.026536733 = sum of:
        0.026536733 = weight(_text_:22 in 401) [ClassicSimilarity], result of:
          0.026536733 = score(doc=401,freq=2.0), product of:
            0.08573486 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.024482876 = queryNorm
            0.30952093 = fieldWeight in 401, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=401)
      0.5 = coord(1/2)
  0.10526316 = coord(2/19)

Abstract: Ein Bericht über die Ergebnisse und die Prozessanalyse einer automatischen Indexierung mit Mehrwortgruppen. Diese Bachelorarbeit beschreibt, inwieweit der Inhalt informationswissenschaftlicher Fachtexte durch informationswissenschaftliches Fachvokabular erschlossen werden kann und sollte und dass in diesen wissenschaftlichen Texten ein Großteil der fachlichen Inhalte in Mehrwortgruppen vorkommt. Die Ergebnisse wurden durch eine automatische Indexierung mit Mehrwortgruppen mithilfe des Programme Lingo an einer informationswissenschaftlichen Datenbank ermittelt.
Content: Bachelorarbeit im Studiengang Bibliothekswesen der Fakultät für Informations- und Kommunikationswissenschaften an der Fachhochschule Köln.
Date: 11. 9.2012 19:43:22
Imprint: Köln : Fachhochschule / Fakultät für Informations- und Kommunikationswissenschaften

Kasprzik, A.: Voraussetzungen und Anwendungspotentiale einer präzisen Sacherschließung aus Sicht der Wissenschaft (2018) 0.00

0.003620372 = product of:
  0.034393534 = sum of:
    0.022783713 = weight(_text_:und in 5195) [ClassicSimilarity], result of:
      0.022783713 = score(doc=5195,freq=12.0), product of:
        0.05426304 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024482876 = queryNorm
        0.41987535 = fieldWeight in 5195, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5195)
    0.011609821 = product of:
      0.023219641 = sum of:
        0.023219641 = weight(_text_:22 in 5195) [ClassicSimilarity], result of:
          0.023219641 = score(doc=5195,freq=2.0), product of:
            0.08573486 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.024482876 = queryNorm
            0.2708308 = fieldWeight in 5195, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5195)
      0.5 = coord(1/2)
  0.10526316 = coord(2/19)

Abstract: Große Aufmerksamkeit richtet sich im Moment auf das Potential von automatisierten Methoden in der Sacherschließung und deren Interaktionsmöglichkeiten mit intellektuellen Methoden. In diesem Kontext befasst sich der vorliegende Beitrag mit den folgenden Fragen: Was sind die Anforderungen an bibliothekarische Metadaten aus Sicht der Wissenschaft? Was wird gebraucht, um den Informationsbedarf der Fachcommunities zu bedienen? Und was bedeutet das entsprechend für die Automatisierung der Metadatenerstellung und -pflege? Dieser Beitrag fasst die von der Autorin eingenommene Position in einem Impulsvortrag und der Podiumsdiskussion beim Workshop der FAG "Erschließung und Informationsvermittlung" des GBV zusammen. Der Workshop fand im Rahmen der 22. Verbundkonferenz des GBV statt.

Donath, A.: Flickr sorgt mit Automatik-Tags für Aufregung (2015) 0.00
```
0.0035290695 = product of:
  0.03352616 = sum of:
    0.014856135 = weight(_text_:und in 1876) [ClassicSimilarity], result of:
      0.014856135 = score(doc=1876,freq=10.0), product of:
        0.05426304 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024482876 = queryNorm
        0.27378 = fieldWeight in 1876, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1876)
    0.018670026 = product of:
      0.037340052 = sum of:
        0.037340052 = weight(_text_:allgemein in 1876) [ClassicSimilarity], result of:
          0.037340052 = score(doc=1876,freq=2.0), product of:
            0.12864152 = queryWeight, product of:
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.024482876 = queryNorm
            0.2902644 = fieldWeight in 1876, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.0390625 = fieldNorm(doc=1876)
      0.5 = coord(1/2)
  0.10526316 = coord(2/19)
```
Content

"Flickr hat ein Tagging der heraufgeladenen Fotos eingeführt, das zusätzlich zu den Bildbeschreibungen der Nutzer versucht, die Fotos mit Schlagwörtern zu versehen, die den Bildinhalt beschreiben. Nach einem Bericht des britischen Guardian werden dabei Fehler gemacht, die unangebrachte Beschreibungen bis hin zu rassistischen oder politisch inkorrekten Bemerkungen beinhalten. So wurden dunkelhäutiger Menschen als "monochrom", "Tier" und "Affe" beschrieben. Auch das Gesicht einer hellhäutigen Frau wurde mit "Tier" klassifiziert. Bilder eines Konzentrationslagers wurden gar mit "Sport" und "Klettergerüst" verschlagwortet. Die automatischen Tags lassen sich nicht abschalten - und befinden sich nach Angaben von Yahoo noch in der Betaphase. Viel bringen sie nach Einschätzung von Golem.de nicht, da sie recht allgemein gehalten und wenig aussagekräftig sind. Oftmals kann der Algorithmus nur "Indoor" oder "Outdoor" hinzufügen, was zwar fast immer korrekt zugeordnet wird, dennoch wenig nutzt. Hinter den Kulissen scheint Flickr bereits an einer Verbesserung zu arbeiten - und hat dem Guardian auf Nachfrage versichert, dass die Probleme mit falschen Tags bekannt seien. Einige fehlerhafte Schlagwörter wurden mittlerweile auch wieder entfernt." Vgl. auch: https://news.ycombinator.com/item?id=8621658.
Junger, U.: Can indexing be automated? : the example of the Deutsche Nationalbibliothek (2012) 0.00
```
0.0031430693 = product of:
  0.05971832 = sum of:
    0.05971832 = weight(_text_:deutsche in 1717) [ClassicSimilarity], result of:
      0.05971832 = score(doc=1717,freq=4.0), product of:
        0.11561814 = queryWeight, product of:
          4.7224083 = idf(docFreq=1068, maxDocs=44218)
          0.024482876 = queryNorm
        0.5165134 = fieldWeight in 1717, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.7224083 = idf(docFreq=1068, maxDocs=44218)
          0.0546875 = fieldNorm(doc=1717)
  0.05263158 = coord(1/19)
```
Abstract

The German subject headings authority file (Schlagwortnormdatei/SWD) provides a broad controlled vocabulary for indexing documents of all subjects. Traditionally used for intellectual subject cataloguing primarily of books the Deutsche Nationalbibliothek (DNB, German National Library) has been working on developping and implementing procedures for automated assignment of subject headings for online publications. This project, its results and problems are sketched in the paper.
Junger, U.: Can indexing be automated? : the example of the Deutsche Nationalbibliothek (2014) 0.00
```
0.0031430693 = product of:
  0.05971832 = sum of:
    0.05971832 = weight(_text_:deutsche in 1969) [ClassicSimilarity], result of:
      0.05971832 = score(doc=1969,freq=4.0), product of:
        0.11561814 = queryWeight, product of:
          4.7224083 = idf(docFreq=1068, maxDocs=44218)
          0.024482876 = queryNorm
        0.5165134 = fieldWeight in 1969, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.7224083 = idf(docFreq=1068, maxDocs=44218)
          0.0546875 = fieldNorm(doc=1969)
  0.05263158 = coord(1/19)
```
Abstract

The German Integrated Authority File (Gemeinsame Normdatei, GND), provides a broad controlled vocabulary for indexing documents on all subjects. Traditionally used for intellectual subject cataloging primarily for books, the Deutsche Nationalbibliothek (DNB, German National Library) has been working on developing and implementing procedures for automated assignment of subject headings for online publications. This project, its results, and problems are outlined in this article.

Franke-Maier, M.: Anforderungen an die Qualität der Inhaltserschließung im Spannungsfeld von intellektuell und automatisch erzeugten Metadaten (2018) 0.00

0.0029179303 = product of:
  0.027720338 = sum of:
    0.016110517 = weight(_text_:und in 5344) [ClassicSimilarity], result of:
      0.016110517 = score(doc=5344,freq=6.0), product of:
        0.05426304 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024482876 = queryNorm
        0.2968967 = fieldWeight in 5344, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5344)
    0.011609821 = product of:
      0.023219641 = sum of:
        0.023219641 = weight(_text_:22 in 5344) [ClassicSimilarity], result of:
          0.023219641 = score(doc=5344,freq=2.0), product of:
            0.08573486 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.024482876 = queryNorm
            0.2708308 = fieldWeight in 5344, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5344)
      0.5 = coord(1/2)
  0.10526316 = coord(2/19)

Abstract: Spätestens seit dem Deutschen Bibliothekartag 2018 hat sich die Diskussion zu den automatischen Verfahren der Inhaltserschließung der Deutschen Nationalbibliothek von einer politisch geführten Diskussion in eine Qualitätsdiskussion verwandelt. Der folgende Beitrag beschäftigt sich mit Fragen der Qualität von Inhaltserschließung in digitalen Zeiten, wo heterogene Erzeugnisse unterschiedlicher Verfahren aufeinandertreffen und versucht, wichtige Anforderungen an Qualität zu definieren. Dieser Tagungsbeitrag fasst die vom Autor als Impulse vorgetragenen Ideen beim Workshop der FAG "Erschließung und Informationsvermittlung" des GBV am 29. August 2018 in Kiel zusammen. Der Workshop fand im Rahmen der 22. Verbundkonferenz des GBV statt.

Busch, D.: Domänenspezifische hybride automatische Indexierung von bibliographischen Metadaten (2019) 0.00
```
0.0027259528 = product of:
  0.025896551 = sum of:
    0.015945276 = weight(_text_:und in 5628) [ClassicSimilarity], result of:
      0.015945276 = score(doc=5628,freq=8.0), product of:
        0.05426304 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024482876 = queryNorm
        0.29385152 = fieldWeight in 5628, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5628)
    0.009951275 = product of:
      0.01990255 = sum of:
        0.01990255 = weight(_text_:22 in 5628) [ClassicSimilarity], result of:
          0.01990255 = score(doc=5628,freq=2.0), product of:
            0.08573486 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.024482876 = queryNorm
            0.23214069 = fieldWeight in 5628, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=5628)
      0.5 = coord(1/2)
  0.10526316 = coord(2/19)
```
Abstract

Im Fraunhofer-Informationszentrum Raum und Bau (IRB) wird Fachliteratur im Bereich Planen und Bauen bibliographisch erschlossen. Die daraus resultierenden Dokumente (Metadaten-Einträge) werden u.a. bei der Produktion der bibliographischen Datenbanken des IRB verwendet. In Abb. 1 ist ein Dokument dargestellt, das einen Zeitschriftenartikel beschreibt. Die Dokumente werden mit Deskriptoren von einer Nomenklatur (Schlagwortliste IRB) indexiert. Ein Deskriptor ist "eine Benennung., die für sich allein verwendbar, eindeutig zur Inhaltskennzeichnung geeignet und im betreffenden Dokumentationssystem zugelassen ist". Momentan wird die Indexierung intellektuell von menschlichen Experten durchgeführt. Die intellektuelle Indexierung ist zeitaufwendig und teuer. Eine Lösung des Problems besteht in der automatischen Indexierung, bei der die Zuordnung von Deskriptoren durch ein Computerprogramm erfolgt. Solche Computerprogramme werden im Folgenden auch als Klassifikatoren bezeichnet. In diesem Beitrag geht es um ein System zur automatischen Indexierung von deutschsprachigen Dokumenten im Bereich Bauwesen mit Deskriptoren aus der Schlagwortliste IRB.

Source

B.I.T.online. 22(2019) H.6, S.465-469

Short, M.: Text mining and subject analysis for fiction; or, using machine learning and information extraction to assign subject headings to dime novels (2019) 0.00

0.0022866882 = product of:
  0.043447077 = sum of:
    0.043447077 = weight(_text_:literatur in 5481) [ClassicSimilarity], result of:
      0.043447077 = score(doc=5481,freq=2.0), product of:
        0.11727622 = queryWeight, product of:
          4.7901325 = idf(docFreq=998, maxDocs=44218)
          0.024482876 = queryNorm
        0.3704679 = fieldWeight in 5481, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.7901325 = idf(docFreq=998, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5481)
  0.05263158 = coord(1/19)

Theme: Schöne Literatur

Groß, T.: Automatische Indexierung von wirtschaftswissenschaftlichen Dokumenten : Implementierung und Evaluierung am Beispiel der Deutschen Zentralbibliothek für Wirtschaftswissenschaften (2010) 0.00
```
0.001260779 = product of:
  0.0239548 = sum of:
    0.0239548 = weight(_text_:und in 2078) [ClassicSimilarity], result of:
      0.0239548 = score(doc=2078,freq=26.0), product of:
        0.05426304 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024482876 = queryNorm
        0.441457 = fieldWeight in 2078, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2078)
  0.05263158 = coord(1/19)
```
Abstract

Die Bewertung der Indexierungsqualität bzw. -güte ist ein grundlegendes Problem von manuellen und automatischen Indexierungsverfahren. Letztere werden aber gerade im digitalen Zeitalter als einzige Möglichkeit angesehen, den zunehmenden Schwierigkeiten bibliothekarischer Informationsstrukturierung gerecht zu werden. Diese Arbeit befasst sich mit der Funktionsweise, Implementierung und Evaluierung der Sacherschließungssoftware MindServer Categorizer, der Firma Recommind, an der Deutschen Zentralbibliothek für Wirtschaftswissenschaften (ZBW). Grundlage der maschinellen Sacherschließung und anschließenden quantitativen und qualitativen Auswertung bilden rund 39.000 wirtschaftswissenschaftliche Dokumente aus den Datenbanken Econis und EconStor. Unter Zuhilfenahme des rund 6.000 Deskriptoren umfassenden Standard-Thesaurus Wirtschaft (STW) wird der ursprünglich rein statistische Indexierungsansatz des MindServer Categorizer zu einem begriffsorientierten Verfahren weiterentwickelt und zur Inhaltserschließung digitaler Informationsressourcen eingesetzt. Der zentrale Fokus dieser Arbeit liegt vor allem auf der Evaluierung der maschinell beschlagworteten Titel, in Anlehnung und entsprechender Anpassung der von Stock (2008) und Lancaster (2003) hierzu vorgeschlagenen Kriterien: Indexierungskonsistenz, -tiefe, -breite, -spezifität, -effektivität. Zusätzlich wird die Belegungsbilanz des STW evaluiert und es erfolgt ferner eine stichprobenartige, qualitative Bewertung der Ergebnisse seitens der zuständigen Fachreferenten und -referentinnen.

Content

Vgl. unter: http://edoc.hu-berlin.de/series/berliner-handreichungen/2010-284/PDF/284.pdf. Auch als: Automatische Indexierung von Dokumenten in einer wissenschaftlichen Bibliothek: Implementierung und Evaluierung am Beispiel der Deutschen Zentralbibliothek für Wirtschaftswissenschaften. Diplomica Verlag, 2011.

Imprint

Berlin : Institut für Bibliotheks- und Informationswissenschaft der Humboldt-Universität zu Berlin
Keller, A.: Einstellung zur (automatischen) Sacherschließung in deutsch- und englischsprachigen Ländern (2015) 0.00
```
0.0012510429 = product of:
  0.023769816 = sum of:
    0.023769816 = weight(_text_:und in 2571) [ClassicSimilarity], result of:
      0.023769816 = score(doc=2571,freq=10.0), product of:
        0.05426304 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024482876 = queryNorm
        0.438048 = fieldWeight in 2571, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=2571)
  0.05263158 = coord(1/19)
```
Abstract

Angesichts der Tatsache, dass die Sacherschließung in deutsch- und englischsprachigen Bibliotheken von verschiedenen Personalgruppen (Fachreferenten bzw. Katalogisierern) geleistet wird, geht die Umfrage der Frage nach, ob unterschiedliche Einstellungen gegenüber der inhaltlichen Erschließung im Allgemeinen und der automatischen Sacherschließung im Besonderen zu erkennen sind. Die Umfrage zeigt eine große Ähnlichkeit zwischen den zwei Sprachregionen: Befragte sind überzeugt vom Nutzen der Sacherschließung und möchten das gegenwärtige Qualitätsniveau aufrechterhalten, gegenüber der automatischen Sacherschließung sind sie hingegen skeptisch eingestellt. Der Beitrag präsentiert und diskutiert die Resultate der Umfrage.
Munkelt, J.: Erstellung einer DNB-Retrieval-Testkollektion (2018) 0.00
```
0.0011991428 = product of:
  0.022783713 = sum of:
    0.022783713 = weight(_text_:und in 4310) [ClassicSimilarity], result of:
      0.022783713 = score(doc=4310,freq=12.0), product of:
        0.05426304 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024482876 = queryNorm
        0.41987535 = fieldWeight in 4310, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4310)
  0.05263158 = coord(1/19)
```
Abstract

Seit Herbst 2017 findet in der Deutschen Nationalbibliothek die Inhaltserschließung bestimmter Medienwerke rein maschinell statt. Die Qualität dieses Verfahrens, das die Prozessorganisation von Bibliotheken maßgeblich prägen kann, wird unter Fachleuten kontrovers diskutiert. Ihre Standpunkte werden zunächst hinreichend erläutert, ehe die Notwendigkeit einer Qualitätsprüfung des Verfahrens und dessen Grundlagen dargelegt werden. Zentraler Bestandteil einer künftigen Prüfung ist eine Testkollektion. Ihre Erstellung und deren Dokumentation steht im Fokus dieser Arbeit. In diesem Zusammenhang werden auch die Entstehungsgeschichte und Anforderungen an gelungene Testkollektionen behandelt. Abschließend wird ein Retrievaltest durchgeführt, der die Einsatzfähigkeit der erarbeiteten Testkollektion belegt. Seine Ergebnisse dienen ausschließlich der Funktionsüberprüfung. Eine Qualitätsbeurteilung maschineller Inhaltserschließung im Speziellen sowie im Allgemeinen findet nicht statt und ist nicht Ziel der Ausarbeitung.

Content

Bachelorarbeit, Bibliothekswissenschaften, Fakultät für Informations- und Kommunikationswissenschaften, Technische Hochschule Köln

Imprint

Köln : Technische Hochschule, Fakultät für Informations- und Kommunikationswissenschaften
Wiesenmüller, H.: Maschinelle Indexierung am Beispiel der DNB : Analyse und Entwicklungmöglichkeiten (2018) 0.00
```
0.0011991428 = product of:
  0.022783713 = sum of:
    0.022783713 = weight(_text_:und in 5209) [ClassicSimilarity], result of:
      0.022783713 = score(doc=5209,freq=12.0), product of:
        0.05426304 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024482876 = queryNorm
        0.41987535 = fieldWeight in 5209, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5209)
  0.05263158 = coord(1/19)
```
Abstract

Der Beitrag untersucht die Ergebnisse des bei der Deutschen Nationalbibliothek (DNB) eingesetzten Verfahrens zur automatischen Vergabe von Schlagwörtern. Seit 2017 kommt dieses auch bei Printausgaben der Reihen B und H der Deutschen Nationalbibliografie zum Einsatz. Die zentralen Problembereiche werden dargestellt und an Beispielen illustriert - beispielsweise dass nicht alle im Inhaltsverzeichnis vorkommenden Wörter tatsächlich thematische Aspekte ausdrücken und dass die Software sehr häufig Körperschaften und andere "Named entities" nicht erkennt. Die maschinell generierten Ergebnisse sind derzeit sehr unbefriedigend. Es werden Überlegungen für mögliche Verbesserungen und sinnvolle Strategien angestellt.

Search (52 results, page 1 of 3)

Authors

Languages

Types

Themes

Classifications