Search (209 results, page 1 of 11)

Junger, U.: Möglichkeiten und Probleme automatischer Erschließungsverfahren in Bibliotheken : Bericht vom KASCADE-Workshop in der Universitäts- und Landesbibliothek Düsseldorf (1999) 0.08

0.07857163 = product of:
  0.15714327 = sum of:
    0.08982204 = weight(_text_:bibliothek in 3645) [ClassicSimilarity], result of:
      0.08982204 = score(doc=3645,freq=2.0), product of:
        0.1650165 = queryWeight, product of:
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.04019371 = queryNorm
        0.54432154 = fieldWeight in 3645, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.09375 = fieldNorm(doc=3645)
    0.045340717 = weight(_text_:und in 3645) [ClassicSimilarity], result of:
      0.045340717 = score(doc=3645,freq=6.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.5089658 = fieldWeight in 3645, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=3645)
    0.021980502 = product of:
      0.065941505 = sum of:
        0.065941505 = weight(_text_:29 in 3645) [ClassicSimilarity], result of:
          0.065941505 = score(doc=3645,freq=2.0), product of:
            0.14138891 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.04019371 = queryNorm
            0.46638384 = fieldWeight in 3645, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.09375 = fieldNorm(doc=3645)
      0.33333334 = coord(1/3)
  0.5 = coord(3/6)

Date: 23.10.1996 17:26:29
Source: Bibliothek: Forschung und Praxis. 23(1999) H.1, S.88-90

Probst, M.; Mittelbach, J.: Maschinelle Indexierung in der Sacherschließung wissenschaftlicher Bibliotheken (2006) 0.06

0.056713138 = product of:
  0.113426276 = sum of:
    0.05988136 = weight(_text_:bibliothek in 1755) [ClassicSimilarity], result of:
      0.05988136 = score(doc=1755,freq=2.0), product of:
        0.1650165 = queryWeight, product of:
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.04019371 = queryNorm
        0.36288103 = fieldWeight in 1755, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.0625 = fieldNorm(doc=1755)
    0.039023075 = weight(_text_:und in 1755) [ClassicSimilarity], result of:
      0.039023075 = score(doc=1755,freq=10.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.438048 = fieldWeight in 1755, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1755)
    0.0145218475 = product of:
      0.04356554 = sum of:
        0.04356554 = weight(_text_:22 in 1755) [ClassicSimilarity], result of:
          0.04356554 = score(doc=1755,freq=2.0), product of:
            0.14075153 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.04019371 = queryNorm
            0.30952093 = fieldWeight in 1755, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=1755)
      0.33333334 = coord(1/3)
  0.5 = coord(3/6)

Abstract: Obwohl fast alle größeren Bibliotheken intellektuelle Sacherschließung betreiben, sind elektronische Kataloge für die zielgerichtete sachliche Suche nur eingeschränkt nutzbar. Durch maschinelle Indexierung können ohne nennenswerten personellen Mehraufwand ausreichend große Datenmengen für Informationsretrievalsysteme erzeugt und somit die Auffindbarkeit von Dokumenten erhöht werden. Geeignete Sprachanalysetechniken zur Indextermerzeugung sind bekannt und bieten im Gegensatz zur gebräuchlichen Freitextinvertierung entscheidende Vorteile beim Retrieval. Im Fokus steht die Betrachtung der Vor- und Nachteile der gängigen Indexierungssysteme MILOS und intelligentCAPTURE.
Date: 22. 3.2008 12:35:19
Source: Bibliothek: Forschung und Praxis. 30(2006) H.2, S.168-176

Groß, T.: Automatische Indexierung von Dokumenten in einer wissenschaftlichen Bibliothek : Implementierung und Evaluierung am Beispiel der Deutschen Zentralbibliothek für Wirtschaftswissenschaften (2011) 0.05
```
0.054236934 = product of:
  0.10847387 = sum of:
    0.06482347 = weight(_text_:bibliothek in 1083) [ClassicSimilarity], result of:
      0.06482347 = score(doc=1083,freq=6.0), product of:
        0.1650165 = queryWeight, product of:
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.04019371 = queryNorm
        0.39283025 = fieldWeight in 1083, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1083)
    0.034491852 = weight(_text_:und in 1083) [ClassicSimilarity], result of:
      0.034491852 = score(doc=1083,freq=20.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.3871834 = fieldWeight in 1083, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1083)
    0.009158542 = product of:
      0.027475627 = sum of:
        0.027475627 = weight(_text_:29 in 1083) [ClassicSimilarity], result of:
          0.027475627 = score(doc=1083,freq=2.0), product of:
            0.14138891 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.04019371 = queryNorm
            0.19432661 = fieldWeight in 1083, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.0390625 = fieldNorm(doc=1083)
      0.33333334 = coord(1/3)
  0.5 = coord(3/6)
```
Abstract

Die Bewertung der Indexierungsqualität bzw. -güte ist ein grundlegendes Problem von intellektuellen und automatischen Indexierungsverfahren. Letztere werden aber gerade im digitalen Zeitalter als einzige Möglichkeit angesehen, den zunehmenden Schwierigkeiten bibliothekarischer Informationsstrukturierung gerecht zu werden. Diese Studie befasst sich mit der Funktionsweise, Implementierung und Evaluierung der Sacherschließungssoftware MindServer Categorizer der Firma Recommind an der Deutschen Zentralbibliothek für Wirtschaftswissenschaften. Grundlage der maschinellen Sacherschließung und anschließenden quantitativen und qualitativen Auswertung bilden rund 39.000 wirtschaftswissenschaftliche Dokumente aus den Datenbanken Econis und EconStor. Unter Zuhilfenahme des rund 6.000 Schlagwörter umfassenden Standard-Thesaurus Wirtschaft wird der ursprünglich rein statistische Indexierungsansatz des MindServer Categorizer zu einem begriffsorientierten Verfahren weiterentwickelt und zur Inhaltserschließung digitaler Informationsressourcen eingesetzt. Der zentrale Fokus dieser Studie liegt vor allem auf der Evaluierung der maschinell beschlagworteten Titel, in Anlehnung an die hierzu von Stock und Lancaster vorgeschlagenen Kriterien: Indexierungskonsistenz, -tiefe, -breite, -spezifität, -effektivität. Weiterhin wird die Belegungsbilanz des STW evaluiert und es erfolgt zusätzlich eine qualitative, stichprobenartige Bewertung der Ergebnisse seitens der zuständigen Fachreferenten und -referentinnen.

Date

19. 6.2015 18:00:29

RSWK

Automatische Indexierung / Dokument / Wissenschaftliche Bibliothek

Subject

Automatische Indexierung / Dokument / Wissenschaftliche Bibliothek

Pielmeier, S.; Voß, V.; Carstensen, H.; Kahl, B.: Online-Workshop "Computerunterstützte Inhaltserschließung" 2020 (2021) 0.05

0.04947102 = product of:
  0.14841306 = sum of:
    0.037020538 = weight(_text_:und in 4409) [ClassicSimilarity], result of:
      0.037020538 = score(doc=4409,freq=16.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.41556883 = fieldWeight in 4409, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=4409)
    0.11139253 = weight(_text_:ub in 4409) [ClassicSimilarity], result of:
      0.11139253 = score(doc=4409,freq=2.0), product of:
        0.25988364 = queryWeight, product of:
          6.465779 = idf(docFreq=186, maxDocs=44218)
          0.04019371 = queryNorm
        0.42862463 = fieldWeight in 4409, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.465779 = idf(docFreq=186, maxDocs=44218)
          0.046875 = fieldNorm(doc=4409)
  0.33333334 = coord(2/6)

Abstract: Zum ersten Mal in digitaler Form und mit 230 Teilnehmer*innen fand am 11. und 12. November 2020 der 4. Workshop "Computerunterstützte Inhaltserschließung" statt, organisiert von der Deutschen Nationalbibliothek (DNB), der Firma Eurospider Information Technology, der Staatsbibliothek zu Berlin - Preußischer Kulturbesitz (SBB), der UB Stuttgart und dem Bibliotheksservice-Zentrum Baden-Württemberg (BSZ). Im Mittelpunkt stand der "Digitale Assistent DA-3": In elf Vorträgen wurden Anwendungsszenarien und Erfahrungen mit dem System vorgestellt, das Bibliotheken und andere Wissenschafts- und Kultureinrichtungen bei der Inhaltserschließung unterstützen soll. Die Begrüßung und Einführung in die beiden Workshop-Tage übernahm Frank Scholze (Generaldirektor der DNB). Er sieht den DA-3 als Baustein für die Verzahnung der intellektuellen und der maschinellen Erschließung.

Niggemann, E.: Wer suchet, der findet? : Verbesserung der inhaltlichen Suchmöglichkeiten im Informationssystem Der Deutschen Bibliothek (2006) 0.04
```
0.041632686 = product of:
  0.12489805 = sum of:
    0.09075286 = weight(_text_:bibliothek in 5812) [ClassicSimilarity], result of:
      0.09075286 = score(doc=5812,freq=6.0), product of:
        0.1650165 = queryWeight, product of:
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.04019371 = queryNorm
        0.54996234 = fieldWeight in 5812, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5812)
    0.03414519 = weight(_text_:und in 5812) [ClassicSimilarity], result of:
      0.03414519 = score(doc=5812,freq=10.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.38329202 = fieldWeight in 5812, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5812)
  0.33333334 = coord(2/6)
```
Abstract

Elektronische Bibliothekskataloge und Bibliografien haben ihr Monopol bei der Suche nach Büchern, Aufsätzen, musikalischen Werken u. a. verloren. Globale Suchmaschinen sind starke Konkurrenten, und Bibliotheken müssen heute so planen, dass ihre Dienstleistungen auch morgen noch interessant sind. Die Deutsche Bibliothek (DDB) wird ihre traditionelle Katalogrecherche zu einem globalen, netzbasierten Informationssystem erweitern, das die Vorteile der neutralen, qualitätsbasierten Katalogsuche mit den Vorteilen moderner Suchmaschinen zu verbinden sucht. Dieser Beitrag beschäftigt sich mit der Verbesserung der inhaltlichen Suchmöglichkeiten im Informationssystem Der Deutschen Bibliothek. Weitere Entwicklungsstränge sollen nur kurz im Ausblick angerissen werden.

Source

Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen

Lück, W.; Rittberger, W.; Schwantner, M.: ¬Der Einsatz des Automatischen Indexierungs- und Retrievalsystems (AIR) im Fachinformationszentrum Karlsruhe (1994) 0.04

0.03523405 = product of:
  0.10570215 = sum of:
    0.0748517 = weight(_text_:bibliothek in 8153) [ClassicSimilarity], result of:
      0.0748517 = score(doc=8153,freq=2.0), product of:
        0.1650165 = queryWeight, product of:
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.04019371 = queryNorm
        0.4536013 = fieldWeight in 8153, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.078125 = fieldNorm(doc=8153)
    0.030850448 = weight(_text_:und in 8153) [ClassicSimilarity], result of:
      0.030850448 = score(doc=8153,freq=4.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.34630734 = fieldWeight in 8153, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=8153)
  0.33333334 = coord(2/6)

Footnote: Wiederabdruck aus: Experimentelles und praktisches Information Retrieval. Hrsg.: R. Kuhlen. Konstanz: Universitätsverlag 1992
Series: Bibliothek aktuell; Sonderh.12

Kasprzik, A.: Automatisierte und semiautomatisierte Klassifizierung : eine Analyse aktueller Projekte (2014) 0.03
```
0.03351144 = product of:
  0.10053432 = sum of:
    0.06351378 = weight(_text_:bibliothek in 2470) [ClassicSimilarity], result of:
      0.06351378 = score(doc=2470,freq=4.0), product of:
        0.1650165 = queryWeight, product of:
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.04019371 = queryNorm
        0.38489348 = fieldWeight in 2470, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.046875 = fieldNorm(doc=2470)
    0.037020538 = weight(_text_:und in 2470) [ClassicSimilarity], result of:
      0.037020538 = score(doc=2470,freq=16.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.41556883 = fieldWeight in 2470, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=2470)
  0.33333334 = coord(2/6)
```
Abstract

Das sprunghafte Anwachsen der Menge digital verfügbarer Dokumente gepaart mit dem Zeit- und Personalmangel an wissenschaftlichen Bibliotheken legt den Einsatz von halb- oder vollautomatischen Verfahren für die verbale und klassifikatorische Inhaltserschließung nahe. Nach einer kurzen allgemeinen Einführung in die gängige Methodik beleuchtet dieser Artikel eine Reihe von Projekten zur automatisierten Klassifizierung aus dem Zeitraum 2007-2012 und aus dem deutschsprachigen Raum. Ein Großteil der vorgestellten Projekte verwendet Methoden des Maschinellen Lernens aus der Künstlichen Intelligenz, arbeitet meist mit angepassten Versionen einer kommerziellen Software und bezieht sich in der Regel auf die Dewey Decimal Classification (DDC). Als Datengrundlage dienen Metadatensätze, Abstracs, Inhaltsverzeichnisse und Volltexte in diversen Datenformaten. Die abschließende Analyse enthält eine Anordnung der Projekte nach einer Reihe von verschiedenen Kriterien und eine Zusammenfassung der aktuellen Lage und der größten Herausfordungen für automatisierte Klassifizierungsverfahren.

Content

Vgl.: https://journals.ub.uni-heidelberg.de/index.php/bibliothek/article/view/14022.

Source

Perspektive Bibliothek. 3(2014) H.1, S.85-110

Grummann, M.: Sind Verfahren zur maschinellen Indexierung für Literaturbestände Öffentlicher Bibliotheken geeignet? : Retrievaltests von indexierten ekz-Daten mit der Software IDX (2000) 0.03

0.030036166 = product of:
  0.0901085 = sum of:
    0.05988136 = weight(_text_:bibliothek in 1879) [ClassicSimilarity], result of:
      0.05988136 = score(doc=1879,freq=2.0), product of:
        0.1650165 = queryWeight, product of:
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.04019371 = queryNorm
        0.36288103 = fieldWeight in 1879, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.0625 = fieldNorm(doc=1879)
    0.030227143 = weight(_text_:und in 1879) [ClassicSimilarity], result of:
      0.030227143 = score(doc=1879,freq=6.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.33931053 = fieldWeight in 1879, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1879)
  0.33333334 = coord(2/6)

Abstract: Maschinelles Indexieren vereinheitlicht und vermehrt das Suchvokabular eines Bibliothekskatalogs durch verschiedene Methoden (u.a. Ermittlung der Grundform, Kompositazerlegung, Wortableitungen). Ein Retrievaltest mit einem für öffentliche Bibliotheken typischen Sachbuchbestand zeigt, dass dieses Verfahren die Ergebnisse von OPAC-Recherchen verbessert - trotz 'blumiger' Titelformulierungen. Im Vergleich zu herkömmlichen Erschließungsmethoden (Stich- und Schlagwörter) werden mehr relevante Titel gefunden, ohne gleichzeitig den 'Ballast' zu erhöhen. Das maschinelle Indexieren kann die Verschlagwortung jedoch nicht ersetzen, sondern nur ergänzen
Source: Bibliothek: Forschung und Praxis. 24(2000) H.3, S.297-318

Kugler, A.: Automatisierte Volltexterschließung von Retrodigitalisaten am Beispiel historischer Zeitungen (2018) 0.03
```
0.028728046 = product of:
  0.08618414 = sum of:
    0.06351378 = weight(_text_:bibliothek in 4595) [ClassicSimilarity], result of:
      0.06351378 = score(doc=4595,freq=4.0), product of:
        0.1650165 = queryWeight, product of:
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.04019371 = queryNorm
        0.38489348 = fieldWeight in 4595, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.046875 = fieldNorm(doc=4595)
    0.022670358 = weight(_text_:und in 4595) [ClassicSimilarity], result of:
      0.022670358 = score(doc=4595,freq=6.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.2544829 = fieldWeight in 4595, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=4595)
  0.33333334 = coord(2/6)
```
Abstract

Seit ein paar Jahren postuliert die DFG in ihren Praxisregeln "Digitalisierung", dass eine ausschließliche Bilddigitalisierung nicht mehr den wissenschaftlichen Ansprüchen Genüge leiste, sondern der digitale Volltext notwendig sei, da dieser die Basis für eine wissenschaftliche Nachnutzung darstellt. Um ein besseres Verständnis davon zu erlangen, was sich hinter dem Begriff "Volltext" verbirgt, wird im Folgenden ein kleiner Einblick in die technischen Verfahren zur automatisierten Volltexterschließung von Retrodigitalisaten geboten. Fortschritte und auch Grenzen der aktuellen Methoden werden vorgestellt und wie Qualität in diesem Zusammenhang überhaupt bemessen werden kann. Die automatisierten Verfahren zur Volltexterschließung werden am Beispiel historischer Zeitungen erläutert, da deren Zugänglichmachung gerade in den Geisteswissenschaften ein großes Desiderat ist und diese Quellengattung zugleich aufgrund der Spaltenstruktur besondere technische Herausforderungen mit sich bringt. 2016 wurde das DFG-Projekt zur Erstellung eines "Masterplan Zeitungsdigitalisierung" fertiggestellt, dessen Ergebnisse hier einfließen.

Content

Vgl.: http://journals.ub.uni-heidelberg.de/index.php/bibliothek/article/view/48394. Vgl. auch: URN (PDF): http://nbn-resolving.de/urn:nbn:de:bsz:16-pb-483949.

Source

Perspektive Bibliothek. 7(2018) H.1, S.33-54
Bachfeld, S.: Möglichkeiten und Grenzen linguistischer Verfahren der automatischen Indexierung : Entwurf einer Simulation für den Einsatz im Grundstudium (2003) 0.03
```
0.02855125 = product of:
  0.08565375 = sum of:
    0.05185878 = weight(_text_:bibliothek in 2827) [ClassicSimilarity], result of:
      0.05185878 = score(doc=2827,freq=6.0), product of:
        0.1650165 = queryWeight, product of:
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.04019371 = queryNorm
        0.3142642 = fieldWeight in 2827, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.03125 = fieldNorm(doc=2827)
    0.033794973 = weight(_text_:und in 2827) [ClassicSimilarity], result of:
      0.033794973 = score(doc=2827,freq=30.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.3793607 = fieldWeight in 2827, product of:
          5.477226 = tf(freq=30.0), with freq of:
            30.0 = termFreq=30.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=2827)
  0.33333334 = coord(2/6)
```
Abstract

Die Arbeit entwirft ein Konzept für eine Simulation, die als Teil eines ELearning-Moduls die Probleme der automatischen Freitextindexierung und linguistische Verfahren zur Verbesserung der Indexierungsergebnisse veranschaulichen soll. Zielgruppe der Simulation sind die im Studierenden des Fachbereichs Bibliothek und Information der HAW Hamburg, die sich im Grundstudium befinden. Es wird ein inhaltliches Konzept dafür entwickelt, wie die Simulation Vor- und Nachteile regelbasierter und wörterbuchbasierte Indexierungsverfahren für das Grundstudium darstellen kann. Ziel ist zu zeigen, dass regelbasierte Verfahren in einer stark flektierenden und kompositareichen Sprache wie dem Deutschen zu zahlreichen Indexierungsfehlern führen können und dass wörterbuchbasierte Verfahren bessere Indexate liefern. Im zweiten Teil der Arbeit wird eine Informationsarchitektur für die Simulation entworfen und ein Prototyp programmiert, der eine Freitextindexierung und darauf aufbauend ein regelbasiertes Reduktionsverfahren darstellt. Ziel dabei ist insbesondere zu zeigen, dass regelbasierte Indexierungsverfahren für das Deutsche keine befriedigenden Ergebnisse erzielen, und dass wörterbuchbasierte Verfahren im Deutschen zu bevorzugen sind. Vor diesem Hintergrund wird im zweiten Teil der Arbeit ein Prototyp für die Simulation konzipiert, die elektronische Volltexte zunächst nach der Freitextmethode und danach mit linguistischen Verfahren indexiert. Es wird eine Informationsarchitektur entwickelt, die nicht nur anstrebt, der Zielgruppe gerecht zu werden, sondern auch die Vor- und Nachteile der linguistischen Indexierungsverfahren möglichst deutlich zu zeigen. Für die Freitextindexierung als einfachste Form der automatischen Indexierung und für das regelbasierte Verfahren wird auch schon der Programmcode geschrieben. Für die regelbasierte Wortformenreduktion greift die Autorin auf ein schon bestehendes Programm zurück, das Cornelie Ahlfeld 1995 im Rahmen ihrer Diplomarbeit entwickelt hat. Die Autorin versucht, dieses Programm durch eine Präsentation der Indexierungsergebnisse zu ergänzen, die es für den Einsatz in der Lehre nützlich machen.

Footnote

Hausarbeit zur Diplomprüfung an der HAW Hamburg, Fachbereich Bibliothek und Information

Imprint

Hamburg : HAW Hamburg, Fachbereich Bibliothek und Information
Rädler, K.: In Bibliothekskatalogen "googlen" : Integration von Inhaltsverzeichnissen, Volltexten und WEB-Ressourcen in Bibliothekskataloge (2004) 0.03
```
0.026548471 = product of:
  0.07964541 = sum of:
    0.052928142 = weight(_text_:bibliothek in 2432) [ClassicSimilarity], result of:
      0.052928142 = score(doc=2432,freq=4.0), product of:
        0.1650165 = queryWeight, product of:
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.04019371 = queryNorm
        0.32074454 = fieldWeight in 2432, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2432)
    0.026717272 = weight(_text_:und in 2432) [ClassicSimilarity], result of:
      0.026717272 = score(doc=2432,freq=12.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.29991096 = fieldWeight in 2432, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2432)
  0.33333334 = coord(2/6)
```
Abstract

Ausgangslage Die Katalog-Recherchen über Internet, also von außerhalb der Bibliothek, nehmen erwartungsgemäß stark zu bzw. sind mittlerweile die Regel. Damit ist natürlich das Bedürfnis und die Notwendigkeit gewachsen, über den Titel hinaus zusätzliche inhaltliche Informationen zu erhalten, die es erlauben, die Zweckmäßigkeit wesentlich besser abschätzen zu können, eine Bestellung vorzunehmen oder vielleicht auch 50 km in die Bibliothek zu fahren, um ein Buch zu entleihen. Dieses Informationsdefizit wird zunehmend als gravierender Mangel erfahren. Inhaltsverzeichnisse referieren den Inhalt kurz und prägnant. Sie sind die erste Stelle, welche zur Relevanz-Beurteilung herangezogen wird. Fast alle relevanten Terme einer Fachbuchpublikation finden sich bereits dort. Andererseits wird immer deutlicher, dass die dem bibliothekarischen Paradigma entsprechende intellektuelle Indexierung der einzelnen dokumentarischen Einheiten mit den engsten umfassenden dokumentationssprachlichen Termen (Schlagwörter, Klassen) zwar eine notwendige, aber keinesfalls hinreichende Methode darstellt, das teuer erworbene Bibliotheksgut Information für den Benutzer in seiner spezifischen Problemstellung zu aktivieren und als Informationsdienstleistung anbieten zu können. Informationen zu sehr speziellen Fragestellungen, die oft nur in kürzeren Abschnitten (Kapitel) erörtert werden, sind derzeit nur indirekt, mit großem Zeitaufwand und oft überhaupt nicht auffindbar. Sie liegen sozusagen brach. Die Tiefe der intellektuellen Indexierung bis in einzelne inhaltliche Details zu erweitern, ist aus personellen und damit auch finanziellen Gesichtspunkten nicht vertretbar. Bibliotheken fallen deshalb in der Wahrnehmung von Informationssuchenden immer mehr zurück. Die enorme Informationsvielfalt liegt hinter dem Informations- bzw. Recherchehorizont der bibliographischen Aufnahmen im Katalog.

Franke-Maier, M.: Anforderungen an die Qualität der Inhaltserschließung im Spannungsfeld von intellektuell und automatisch erzeugten Metadaten (2018) 0.03

0.025835302 = product of:
  0.0775059 = sum of:
    0.026448749 = weight(_text_:und in 5344) [ClassicSimilarity], result of:
      0.026448749 = score(doc=5344,freq=6.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.2968967 = fieldWeight in 5344, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5344)
    0.051057152 = product of:
      0.076585725 = sum of:
        0.038465876 = weight(_text_:29 in 5344) [ClassicSimilarity], result of:
          0.038465876 = score(doc=5344,freq=2.0), product of:
            0.14138891 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.04019371 = queryNorm
            0.27205724 = fieldWeight in 5344, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5344)
        0.03811985 = weight(_text_:22 in 5344) [ClassicSimilarity], result of:
          0.03811985 = score(doc=5344,freq=2.0), product of:
            0.14075153 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.04019371 = queryNorm
            0.2708308 = fieldWeight in 5344, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5344)
      0.6666667 = coord(2/3)
  0.33333334 = coord(2/6)

Abstract: Spätestens seit dem Deutschen Bibliothekartag 2018 hat sich die Diskussion zu den automatischen Verfahren der Inhaltserschließung der Deutschen Nationalbibliothek von einer politisch geführten Diskussion in eine Qualitätsdiskussion verwandelt. Der folgende Beitrag beschäftigt sich mit Fragen der Qualität von Inhaltserschließung in digitalen Zeiten, wo heterogene Erzeugnisse unterschiedlicher Verfahren aufeinandertreffen und versucht, wichtige Anforderungen an Qualität zu definieren. Dieser Tagungsbeitrag fasst die vom Autor als Impulse vorgetragenen Ideen beim Workshop der FAG "Erschließung und Informationsvermittlung" des GBV am 29. August 2018 in Kiel zusammen. Der Workshop fand im Rahmen der 22. Verbundkonferenz des GBV statt.

Franke-Maier, M.; Beck, C.; Kasprzik, A.; Maas, J.F.; Pielmeier, S.; Wiesenmüller, H: ¬Ein Feuerwerk an Algorithmen und der Startschuss zur Bildung eines Kompetenznetzwerks für maschinelle Erschließung : Bericht zur Fachtagung Netzwerk maschinelle Erschließung an der Deutschen Nationalbibliothek am 10. und 11. Oktober 2019 (2020) 0.03
```
0.02565725 = product of:
  0.07697175 = sum of:
    0.04491102 = weight(_text_:bibliothek in 5851) [ClassicSimilarity], result of:
      0.04491102 = score(doc=5851,freq=2.0), product of:
        0.1650165 = queryWeight, product of:
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.04019371 = queryNorm
        0.27216077 = fieldWeight in 5851, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.046875 = fieldNorm(doc=5851)
    0.032060727 = weight(_text_:und in 5851) [ClassicSimilarity], result of:
      0.032060727 = score(doc=5851,freq=12.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.35989314 = fieldWeight in 5851, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5851)
  0.33333334 = coord(2/6)
```
Abstract

Am 10. und 11. Oktober 2019 trafen sich rund 100 Vertreterinnen und Vertreter aus Bibliothek, Wissenschaft und Wirtschaft an der Deutschen Nationalbibliothek (DNB) in Frankfurt am Main zu einer Fachtagung über das derzeitige Trend-Thema "maschinelle Erschließung". Ziel der Veranstaltung war die "Betrachtung unterschiedlicher Anwendungsbereiche maschineller Textanalyse" sowie die Initiation eines Dialogs zu Technologien für die maschinelle Textanalyse, Aufgabenstellungen, Erfahrungen und den Herausforderungen, die maschinelle Verfahren nach sich ziehen. Hintergrund ist der Auftrag des Standardisierungsausschusses an die DNB, regelmäßig einschlägige Tagungen durchzuführen, aus denen "perspektivisch ein Kompetenznetzwerk für die maschinelle Erschließung entsteh[t]".
Groß, T.: Automatische Indexierung von wirtschaftswissenschaftlichen Dokumenten : Implementierung und Evaluierung am Beispiel der Deutschen Zentralbibliothek für Wirtschaftswissenschaften (2010) 0.03
```
0.025584204 = product of:
  0.07675261 = sum of:
    0.03742585 = weight(_text_:bibliothek in 2078) [ClassicSimilarity], result of:
      0.03742585 = score(doc=2078,freq=2.0), product of:
        0.1650165 = queryWeight, product of:
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.04019371 = queryNorm
        0.22680065 = fieldWeight in 2078, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2078)
    0.03932676 = weight(_text_:und in 2078) [ClassicSimilarity], result of:
      0.03932676 = score(doc=2078,freq=26.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.441457 = fieldWeight in 2078, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2078)
  0.33333334 = coord(2/6)
```
Abstract

Die Bewertung der Indexierungsqualität bzw. -güte ist ein grundlegendes Problem von manuellen und automatischen Indexierungsverfahren. Letztere werden aber gerade im digitalen Zeitalter als einzige Möglichkeit angesehen, den zunehmenden Schwierigkeiten bibliothekarischer Informationsstrukturierung gerecht zu werden. Diese Arbeit befasst sich mit der Funktionsweise, Implementierung und Evaluierung der Sacherschließungssoftware MindServer Categorizer, der Firma Recommind, an der Deutschen Zentralbibliothek für Wirtschaftswissenschaften (ZBW). Grundlage der maschinellen Sacherschließung und anschließenden quantitativen und qualitativen Auswertung bilden rund 39.000 wirtschaftswissenschaftliche Dokumente aus den Datenbanken Econis und EconStor. Unter Zuhilfenahme des rund 6.000 Deskriptoren umfassenden Standard-Thesaurus Wirtschaft (STW) wird der ursprünglich rein statistische Indexierungsansatz des MindServer Categorizer zu einem begriffsorientierten Verfahren weiterentwickelt und zur Inhaltserschließung digitaler Informationsressourcen eingesetzt. Der zentrale Fokus dieser Arbeit liegt vor allem auf der Evaluierung der maschinell beschlagworteten Titel, in Anlehnung und entsprechender Anpassung der von Stock (2008) und Lancaster (2003) hierzu vorgeschlagenen Kriterien: Indexierungskonsistenz, -tiefe, -breite, -spezifität, -effektivität. Zusätzlich wird die Belegungsbilanz des STW evaluiert und es erfolgt ferner eine stichprobenartige, qualitative Bewertung der Ergebnisse seitens der zuständigen Fachreferenten und -referentinnen.

Content

Vgl. unter: http://edoc.hu-berlin.de/series/berliner-handreichungen/2010-284/PDF/284.pdf. Auch als: Automatische Indexierung von Dokumenten in einer wissenschaftlichen Bibliothek: Implementierung und Evaluierung am Beispiel der Deutschen Zentralbibliothek für Wirtschaftswissenschaften. Diplomica Verlag, 2011.

Imprint

Berlin : Institut für Bibliotheks- und Informationswissenschaft der Humboldt-Universität zu Berlin
Schneider, A.: Moderne Retrievalverfahren in klassischen bibliotheksbezogenen Anwendungen : Projekte und Perspektiven (2008) 0.02
```
0.021972727 = product of:
  0.06591818 = sum of:
    0.02994068 = weight(_text_:bibliothek in 4031) [ClassicSimilarity], result of:
      0.02994068 = score(doc=4031,freq=2.0), product of:
        0.1650165 = queryWeight, product of:
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.04019371 = queryNorm
        0.18144052 = fieldWeight in 4031, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.03125 = fieldNorm(doc=4031)
    0.035977494 = weight(_text_:und in 4031) [ClassicSimilarity], result of:
      0.035977494 = score(doc=4031,freq=34.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.40386027 = fieldWeight in 4031, product of:
          5.8309517 = tf(freq=34.0), with freq of:
            34.0 = termFreq=34.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=4031)
  0.33333334 = coord(2/6)
```
Abstract

Die vorliegende Arbeit beschäftigt sich mit modernen Retrievalverfahren in klassischen bibliotheksbezogenen Anwendungen. Wie die Verbindung der beiden gegensätzlich scheinenden Wortgruppen im Titel zeigt, werden in der Arbeit Aspekte aus der Informatik bzw. Informationswissenschaft mit Aspekten aus der Bibliothekstradition verknüpft. Nach einer kurzen Schilderung der Ausgangslage, der so genannten Informationsflut, im ersten Kapitel stellt das zweite Kapitel eine Einführung in die Theorie des Information Retrieval dar. Im Einzelnen geht es um die Grundlagen von Information Retrieval und Information-Retrieval-Systemen sowie um die verschiedenen Möglichkeiten der Informationserschließung. Hier werden Formal- und Sacherschließung, Indexierung und automatische Indexierung behandelt. Des Weiteren werden im Rahmen der Theorie des Information Retrieval unterschiedliche Information-Retrieval-Modelle und die Evaluation durch Retrievaltests vorgestellt. Nach der Theorie folgt im dritten Kapitel die Praxis des Information Retrieval. Es werden die organisationsinterne Anwendung, die Anwendung im Informations- und Dokumentationsbereich sowie die Anwendung im Bibliotheksbereich unterschieden. Die organisationsinterne Anwendung wird durch das Beispiel der Datenbank KURS zur Aus- und Weiterbildung veranschaulicht. Die Anwendung im Bibliotheksbereich bezieht sich in erster Linie auf den OPAC als Kompromiss zwischen bibliothekarischer Indexierung und Endnutzeranforderungen und auf seine Anreicherung (sog. Catalogue Enrichment), um das Retrieval zu verbessern. Der Bibliotheksbereich wird ausführlicher behandelt, indem ein Rückblick auf abgeschlossene Projekte zu Informations- und Indexierungssystemen aus den Neunziger Jahren (OSIRIS, MILOS I und II, KASCADE) sowie ein Einblick in aktuelle Projekte gegeben werden. In den beiden folgenden Kapiteln wird je ein aktuelles Projekt zur Verbesserung des Retrievals durch Kataloganreicherung, automatische Erschließung und fortschrittliche Retrievalverfahren präsentiert: das Suchportal dandelon.com und das 180T-Projekt des Hochschulbibliothekszentrums des Landes Nordrhein-Westfalen. Hierbei werden jeweils Projektziel, Projektpartner, Projektorganisation, Projektverlauf und die verwendete Technologie vorgestellt. Die Projekte unterscheiden sich insofern, dass in dem einen Fall eine große Verbundzentrale die Projektkoordination übernimmt, im anderen Fall jede einzelne teilnehmende Bibliothek selbst für die Durchführung verantwortlich ist. Im sechsten und letzten Kapitel geht es um das Fazit und die Perspektiven. Es werden sowohl die beiden beschriebenen Projekte bewertet als auch ein Ausblick auf Entwicklungen bezüglich des Bibliothekskatalogs gegeben. Diese Veröffentlichung geht zurück auf eine Master-Arbeit im postgradualen Fernstudiengang Master of Arts (Library and Information Science) an der Humboldt-Universität zu Berlin.

Imprint

Berlin : Institut für Bibliotheks- und Informationswissenschaft der Humboldt-Universität zu Berlin

Panyr, J.: STEINADLER: ein Verfahren zur automatischen Deskribierung und zur automatischen thematischen Klassifikation (1978) 0.02

0.021403547 = product of:
  0.06421064 = sum of:
    0.0349033 = weight(_text_:und in 5169) [ClassicSimilarity], result of:
      0.0349033 = score(doc=5169,freq=2.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.39180204 = fieldWeight in 5169, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.125 = fieldNorm(doc=5169)
    0.029307336 = product of:
      0.08792201 = sum of:
        0.08792201 = weight(_text_:29 in 5169) [ClassicSimilarity], result of:
          0.08792201 = score(doc=5169,freq=2.0), product of:
            0.14138891 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.04019371 = queryNorm
            0.6218451 = fieldWeight in 5169, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.125 = fieldNorm(doc=5169)
      0.33333334 = coord(1/3)
  0.33333334 = coord(2/6)

Source: Nachrichten für Dokumentation. 29(1978), S.92-96

Groß, T.; Faden, M.: Automatische Indexierung elektronischer Dokumente an der Deutschen Zentralbibliothek für Wirtschaftswissenschaften : Bericht über die Jahrestagung der Internationalen Buchwissenschaftlichen Gesellschaft (2010) 0.02
```
0.020467363 = product of:
  0.06140209 = sum of:
    0.02994068 = weight(_text_:bibliothek in 4051) [ClassicSimilarity], result of:
      0.02994068 = score(doc=4051,freq=2.0), product of:
        0.1650165 = queryWeight, product of:
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.04019371 = queryNorm
        0.18144052 = fieldWeight in 4051, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.1055303 = idf(docFreq=1980, maxDocs=44218)
          0.03125 = fieldNorm(doc=4051)
    0.03146141 = weight(_text_:und in 4051) [ClassicSimilarity], result of:
      0.03146141 = score(doc=4051,freq=26.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.3531656 = fieldWeight in 4051, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=4051)
  0.33333334 = coord(2/6)
```
Abstract

Die zunehmende Verfügbarmachung digitaler Informationen in den letzten Jahren sowie die Aussicht auf ein weiteres Ansteigen der sogenannten Datenflut kumulieren in einem grundlegenden, sich weiter verstärkenden Informationsstrukturierungsproblem. Die stetige Zunahme von digitalen Informationsressourcen im World Wide Web sichert zwar jederzeit und ortsungebunden den Zugriff auf verschiedene Informationen; offen bleibt der strukturierte Zugang, insbesondere zu wissenschaftlichen Ressourcen. Angesichts der steigenden Anzahl elektronischer Inhalte und vor dem Hintergrund stagnierender bzw. knapper werdender personeller Ressourcen in der Sacherschließun schafft keine Bibliothek bzw. kein Bibliotheksverbund es mehr, weder aktuell noch zukünftig, alle digitalen Daten zu erfassen, zu strukturieren und zueinander in Beziehung zu setzen. In der Informationsgesellschaft des 21. Jahrhunderts wird es aber zunehmend wichtiger, die in der Flut verschwundenen wissenschaftlichen Informationen zeitnah, angemessen und vollständig zu strukturieren und somit als Basis für eine Wissensgenerierung wieder nutzbar zu machen. Eine normierte Inhaltserschließung digitaler Informationsressourcen ist deshalb für die Deutsche Zentralbibliothek für Wirtschaftswissenschaften (ZBW) als wichtige Informationsinfrastruktureinrichtung in diesem Bereich ein entscheidender und auch erfolgskritischer Aspekt im Wettbewerb mit anderen Informationsdienstleistern. Weil die traditionelle intellektuelle Sacherschließung aber nicht beliebig skalierbar ist - mit dem Anstieg der Zahl an Online-Dokumenten steigt proportional auch der personelle Ressourcenbedarf an Fachreferenten, wenn ein gewisser Qualitätsstandard gehalten werden soll - bedarf es zukünftig anderer Sacherschließungsverfahren. Automatisierte Verschlagwortungsmethoden werden dabei als einzige Möglichkeit angesehen, die bibliothekarische Sacherschließung auch im digitalen Zeitalter zukunftsfest auszugestalten. Zudem können maschinelle Ansätze dazu beitragen, die Heterogenitäten (Indexierungsinkonsistenzen) zwischen den einzelnen Sacherschließer zu nivellieren, und somit zu einer homogeneren Erschließung des Bibliotheksbestandes beitragen.
Mit der Anfang 2010 begonnen Implementierung und Ergebnisevaluierung des automatischen Indexierungsverfahrens "Decisiv Categorization" der Firma Recommind soll das hier skizzierte Informationsstrukturierungsproblem in zwei Schritten gelöst werden. Kurz- bis mittelfristig soll die intellektuelle Indexierung durch ein semiautomatisches Verfahren6 unterstützt werden. Mittel- bis langfristig soll das maschinelle Verfahren, aufbauend auf einem entsprechenden Training, in die Lage versetzt werden, sowohl im Hause vorliegende Dokumente vollautomatisch zu indexieren als auch ZBW-fremde digitale Informationsressourcen zu verschlagworten bzw. zu klassifizieren, um sie in einem gemeinsamen Suchraum auffindbar machen zu können. Im Anschluss an diese Einleitung werden die ersten Ansätze maschineller Sacherschließung an der ZBW (2001-2004) und deren Ergebnisse und Problemlagen aufgezeigt. Danach werden die Rahmenbedingungen (Projektauftrag und -ziel) für eine Wiederaufnahme des Vorhabens im Jahre 2009 aufgezeigt, gefolgt von einer Darstellung der Funktionsweise der Recommind-Technologie und deren Einsatz im Rahmen der Sacherschließung von Online-Dokumenten mit einem Thesaurus. Schwerpunkt dieser Abhandlung bilden im Anschluss daran die Evaluierungsmöglichkeiten automatischer Indexierungsansätze sowie die aktuellen Ergebnisse und zentralen Erkenntnisse des Einsatzes im Kontext der ZBW. Das Fazit beschreibt die entsprechenden Schlussfolgerungen aus den erzielten Ergebnissen sowie den Ausblick auf das weitere Vorgehen.

Knorz, G.: Automatische Indexierung (1994) 0.02

0.019667014 = product of:
  0.05900104 = sum of:
    0.037020538 = weight(_text_:und in 4254) [ClassicSimilarity], result of:
      0.037020538 = score(doc=4254,freq=4.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.41556883 = fieldWeight in 4254, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=4254)
    0.021980502 = product of:
      0.065941505 = sum of:
        0.065941505 = weight(_text_:29 in 4254) [ClassicSimilarity], result of:
          0.065941505 = score(doc=4254,freq=2.0), product of:
            0.14138891 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.04019371 = queryNorm
            0.46638384 = fieldWeight in 4254, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.09375 = fieldNorm(doc=4254)
      0.33333334 = coord(1/3)
  0.33333334 = coord(2/6)

Date: 29. 1.2011 17:56:21
Series: Berufsbegleitendes Ergänzungsstudium im Tätigkeitsfeld wissenschaftliche Information und Dokumentation (BETID): Lehrmaterialien; Nr.3
Source: Wissensrepräsentation und Information Retrieval. R.-D. Hennings u.a

Renz, M.: Automatische Inhaltserschließung im Zeichen von Wissensmanagement (2001) 0.02

0.019505732 = product of:
  0.058517195 = sum of:
    0.045810577 = weight(_text_:und in 5671) [ClassicSimilarity], result of:
      0.045810577 = score(doc=5671,freq=18.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.51424015 = fieldWeight in 5671, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5671)
    0.012706617 = product of:
      0.03811985 = sum of:
        0.03811985 = weight(_text_:22 in 5671) [ClassicSimilarity], result of:
          0.03811985 = score(doc=5671,freq=2.0), product of:
            0.14075153 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.04019371 = queryNorm
            0.2708308 = fieldWeight in 5671, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5671)
      0.33333334 = coord(1/3)
  0.33333334 = coord(2/6)

Abstract: Methoden der automatischen Inhaltserschließung werden seit mehr als 30 Jahren entwickelt, ohne in luD-Kreisen auf merkliche Akzeptanz zu stoßen. Gegenwärtig führen jedoch die steigende Informationsflut und der Bedarf an effizienten Zugriffsverfahren im Informations- und Wissensmanagement in breiten Anwenderkreisen zu einem wachsenden Interesse an diesen Methoden, zu verstärkten Anstrengungen in Forschung und Entwicklung und zu neuen Produkten. In diesem Beitrag werden verschiedene Ansätze zu intelligentem und inhaltsbasiertem Retrieval und zur automatischen Inhaltserschließung diskutiert sowie kommerziell vertriebene Softwarewerkzeuge und Lösungen präsentiert. Abschließend wird festgestellt, dass in naher Zukunft mit einer zunehmenden Automatisierung von bestimmten Komponenten des Informations- und Wissensmanagements zu rechnen ist, indem Software-Werkzeuge zur automatischen Inhaltserschließung in den Workflow integriert werden
Date: 22. 3.2001 13:14:48
Source: nfd Information - Wissenschaft und Praxis. 52(2001) H.2, S.69-78

Fuhr, N.; Niewelt, B.: ¬Ein Retrievaltest mit automatisch indexierten Dokumenten (1984) 0.02

0.018651208 = product of:
  0.055953622 = sum of:
    0.030540386 = weight(_text_:und in 262) [ClassicSimilarity], result of:
      0.030540386 = score(doc=262,freq=2.0), product of:
        0.089084014 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04019371 = queryNorm
        0.34282678 = fieldWeight in 262, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.109375 = fieldNorm(doc=262)
    0.025413234 = product of:
      0.0762397 = sum of:
        0.0762397 = weight(_text_:22 in 262) [ClassicSimilarity], result of:
          0.0762397 = score(doc=262,freq=2.0), product of:
            0.14075153 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.04019371 = queryNorm
            0.5416616 = fieldWeight in 262, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.109375 = fieldNorm(doc=262)
      0.33333334 = coord(1/3)
  0.33333334 = coord(2/6)

Date: 20.10.2000 12:22:23
Source: Deutscher Dokumentartag 1983, Göttingen, 3.-7.10.1983: Fachinformation und Bildschirmtext. Bearb.: H. Strohl-Goebel

Search (209 results, page 1 of 11)

Authors

Years

Languages

Types

Themes

Subjects

Classifications