Search (172 results, page 1 of 9)

Gombocz, W.L.: Stichwort oder Schlagwort versus Textwort : Grazer und Düsseldorfer Philosophie-Dokumentation und -Information nach bzw. gemäß Norbert Henrichs (2000) 0.06

0.064141534 = product of:
  0.29932716 = sum of:
    0.14081435 = weight(_text_:philosophie in 3413) [ClassicSimilarity], result of:
      0.14081435 = score(doc=3413,freq=4.0), product of:
        0.17009477 = queryWeight, product of:
          5.298292 = idf(docFreq=600, maxDocs=44218)
          0.0321037 = queryNorm
        0.82785815 = fieldWeight in 3413, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.298292 = idf(docFreq=600, maxDocs=44218)
          0.078125 = fieldNorm(doc=3413)
    0.14081435 = weight(_text_:philosophie in 3413) [ClassicSimilarity], result of:
      0.14081435 = score(doc=3413,freq=4.0), product of:
        0.17009477 = queryWeight, product of:
          5.298292 = idf(docFreq=600, maxDocs=44218)
          0.0321037 = queryNorm
        0.82785815 = fieldWeight in 3413, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.298292 = idf(docFreq=600, maxDocs=44218)
          0.078125 = fieldNorm(doc=3413)
    0.01769847 = weight(_text_:der in 3413) [ClassicSimilarity], result of:
      0.01769847 = score(doc=3413,freq=2.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.2467987 = fieldWeight in 3413, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.078125 = fieldNorm(doc=3413)
  0.21428572 = coord(3/14)

Field: Philosophie
Series: Schriften der Universitäts- und Landesbibliothek Düsseldorf; 32

Stock, W.G.: Textwortmethode : Norbert Henrichs zum 65. (3) (2000) 0.06

0.056306478 = product of:
  0.26276356 = sum of:
    0.112651475 = weight(_text_:philosophie in 4891) [ClassicSimilarity], result of:
      0.112651475 = score(doc=4891,freq=4.0), product of:
        0.17009477 = queryWeight, product of:
          5.298292 = idf(docFreq=600, maxDocs=44218)
          0.0321037 = queryNorm
        0.6622865 = fieldWeight in 4891, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.298292 = idf(docFreq=600, maxDocs=44218)
          0.0625 = fieldNorm(doc=4891)
    0.112651475 = weight(_text_:philosophie in 4891) [ClassicSimilarity], result of:
      0.112651475 = score(doc=4891,freq=4.0), product of:
        0.17009477 = queryWeight, product of:
          5.298292 = idf(docFreq=600, maxDocs=44218)
          0.0321037 = queryNorm
        0.6622865 = fieldWeight in 4891, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.298292 = idf(docFreq=600, maxDocs=44218)
          0.0625 = fieldNorm(doc=4891)
    0.037460603 = weight(_text_:der in 4891) [ClassicSimilarity], result of:
      0.037460603 = score(doc=4891,freq=14.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.5223744 = fieldWeight in 4891, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=4891)
  0.21428572 = coord(3/14)

Abstract: Nur wenige Dokumentationsmethoden werden mit dem Namen ihrer Entwickler assoziiert. Ausnahmen sind Melvil Dewey (DDC), S.R. Ranganathan (Colon Classification) - und Norbert Henrichs. Seine Textwortmethode ermöglicht die Indexierung und das Retrieval von Literatur aus Fachgebieten, die keine allseits akzeptierte Fachterminologie vorweisen, also viele Sozial- und Geisteswissenschaften, vorneweg die Philosophie. Für den Einsatz in der elektronischen Philosophie-Dokumentation hat Henrichs in den späten sechziger Jahren die Textwortmethode entworfen. Er ist damit nicht nur einer der Pioniere der Anwendung der elektronischen Datenverarbeitung in der Informationspraxis, sondern auch der Pionier bei der Dokumentation terminologisch nicht starrer Fachsprachen

Stock, W.G.: Textwortmethode (2000) 0.05

0.04646572 = product of:
  0.21684003 = sum of:
    0.09957078 = weight(_text_:philosophie in 3408) [ClassicSimilarity], result of:
      0.09957078 = score(doc=3408,freq=2.0), product of:
        0.17009477 = queryWeight, product of:
          5.298292 = idf(docFreq=600, maxDocs=44218)
          0.0321037 = queryNorm
        0.58538413 = fieldWeight in 3408, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.298292 = idf(docFreq=600, maxDocs=44218)
          0.078125 = fieldNorm(doc=3408)
    0.09957078 = weight(_text_:philosophie in 3408) [ClassicSimilarity], result of:
      0.09957078 = score(doc=3408,freq=2.0), product of:
        0.17009477 = queryWeight, product of:
          5.298292 = idf(docFreq=600, maxDocs=44218)
          0.0321037 = queryNorm
        0.58538413 = fieldWeight in 3408, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.298292 = idf(docFreq=600, maxDocs=44218)
          0.078125 = fieldNorm(doc=3408)
    0.01769847 = weight(_text_:der in 3408) [ClassicSimilarity], result of:
      0.01769847 = score(doc=3408,freq=2.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.2467987 = fieldWeight in 3408, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.078125 = fieldNorm(doc=3408)
  0.21428572 = coord(3/14)

Field: Philosophie
Series: Schriften der Universitäts- und Landesbibliothek Düsseldorf; 32

Malits, A.; Schäuble, P.: ¬Der Digitale Assistent : halbautomatisches Verfahren der Sacherschließung in der Zentralbibliothek Zürich (2014) 0.02

0.022571037 = product of:
  0.15799725 = sum of:
    0.039177235 = weight(_text_:der in 2562) [ClassicSimilarity], result of:
      0.039177235 = score(doc=2562,freq=20.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.5463122 = fieldWeight in 2562, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=2562)
    0.11882001 = weight(_text_:speziellen in 2562) [ClassicSimilarity], result of:
      0.11882001 = score(doc=2562,freq=2.0), product of:
        0.2220858 = queryWeight, product of:
          6.9177637 = idf(docFreq=118, maxDocs=44218)
          0.0321037 = queryNorm
        0.5350185 = fieldWeight in 2562, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.9177637 = idf(docFreq=118, maxDocs=44218)
          0.0546875 = fieldNorm(doc=2562)
  0.14285715 = coord(2/14)

Abstract: Seit Juni 2013 ist der Digitale Assistent in den Workflow der Erschließungsprozesse der Zentralbibliothek Zürich integriert. Das System des Digitalen Assistenten kombiniert automatisch unterstützte Prozesse und intellektuelle Sacherschließung: Es werden Schlagwortvorschläge generiert, die danach intellektuell von den Fachreferenten überprüft werden. Im vorliegenden Beitrag wird die Entwicklung des Digitalen Assistenten im Kontext der Praxis der Sacherschließung im Allgemeinen und in der Zentralbibliothek Zürich im Speziellen skizziert. Im Anschluss werden die unterschiedlichen Prozesse der Datenverarbeitung des Systems näher erläutert, sodann wird auf Basis von Statistiken ein erstes Resümee gezogen. Ausführungen zu technischen Spezifikationen runden den Bericht ab.

Munkelt, J.: Erstellung einer DNB-Retrieval-Testkollektion (2018) 0.02
```
0.020931788 = product of:
  0.1465225 = sum of:
    0.02770249 = weight(_text_:der in 4310) [ClassicSimilarity], result of:
      0.02770249 = score(doc=4310,freq=10.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.38630107 = fieldWeight in 4310, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4310)
    0.11882001 = weight(_text_:speziellen in 4310) [ClassicSimilarity], result of:
      0.11882001 = score(doc=4310,freq=2.0), product of:
        0.2220858 = queryWeight, product of:
          6.9177637 = idf(docFreq=118, maxDocs=44218)
          0.0321037 = queryNorm
        0.5350185 = fieldWeight in 4310, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.9177637 = idf(docFreq=118, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4310)
  0.14285715 = coord(2/14)
```
Abstract

Seit Herbst 2017 findet in der Deutschen Nationalbibliothek die Inhaltserschließung bestimmter Medienwerke rein maschinell statt. Die Qualität dieses Verfahrens, das die Prozessorganisation von Bibliotheken maßgeblich prägen kann, wird unter Fachleuten kontrovers diskutiert. Ihre Standpunkte werden zunächst hinreichend erläutert, ehe die Notwendigkeit einer Qualitätsprüfung des Verfahrens und dessen Grundlagen dargelegt werden. Zentraler Bestandteil einer künftigen Prüfung ist eine Testkollektion. Ihre Erstellung und deren Dokumentation steht im Fokus dieser Arbeit. In diesem Zusammenhang werden auch die Entstehungsgeschichte und Anforderungen an gelungene Testkollektionen behandelt. Abschließend wird ein Retrievaltest durchgeführt, der die Einsatzfähigkeit der erarbeiteten Testkollektion belegt. Seine Ergebnisse dienen ausschließlich der Funktionsüberprüfung. Eine Qualitätsbeurteilung maschineller Inhaltserschließung im Speziellen sowie im Allgemeinen findet nicht statt und ist nicht Ziel der Ausarbeitung.
Rapke, K.: Automatische Indexierung von Volltexten für die Gruner+Jahr Pressedatenbank (2001) 0.02
```
0.018840147 = product of:
  0.13188103 = sum of:
    0.030035302 = weight(_text_:der in 6386) [ClassicSimilarity], result of:
      0.030035302 = score(doc=6386,freq=16.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.4188313 = fieldWeight in 6386, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=6386)
    0.10184573 = weight(_text_:speziellen in 6386) [ClassicSimilarity], result of:
      0.10184573 = score(doc=6386,freq=2.0), product of:
        0.2220858 = queryWeight, product of:
          6.9177637 = idf(docFreq=118, maxDocs=44218)
          0.0321037 = queryNorm
        0.4585873 = fieldWeight in 6386, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.9177637 = idf(docFreq=118, maxDocs=44218)
          0.046875 = fieldNorm(doc=6386)
  0.14285715 = coord(2/14)
```
Abstract

Retrieval Tests sind die anerkannteste Methode, um neue Verfahren der Inhaltserschließung gegenüber traditionellen Verfahren zu rechtfertigen. Im Rahmen einer Diplomarbeit wurden zwei grundsätzlich unterschiedliche Systeme der automatischen inhaltlichen Erschließung anhand der Pressedatenbank des Verlagshauses Gruner + Jahr (G+J) getestet und evaluiert. Untersucht wurde dabei natürlichsprachliches Retrieval im Vergleich zu Booleschem Retrieval. Bei den beiden Systemen handelt es sich zum einen um Autonomy von Autonomy Inc. und DocCat, das von IBM an die Datenbankstruktur der G+J Pressedatenbank angepasst wurde. Ersteres ist ein auf natürlichsprachlichem Retrieval basierendes, probabilistisches System. DocCat demgegenüber basiert auf Booleschem Retrieval und ist ein lernendes System, das auf Grund einer intellektuell erstellten Trainingsvorlage indexiert. Methodisch geht die Evaluation vom realen Anwendungskontext der Textdokumentation von G+J aus. Die Tests werden sowohl unter statistischen wie auch qualitativen Gesichtspunkten bewertet. Ein Ergebnis der Tests ist, dass DocCat einige Mängel gegenüber der intellektuellen Inhaltserschließung aufweist, die noch behoben werden müssen, während das natürlichsprachliche Retrieval von Autonomy in diesem Rahmen und für die speziellen Anforderungen der G+J Textdokumentation so nicht einsetzbar ist
Schöneberg, U.; Gödert, W.: Erschließung mathematischer Publikationen mittels linguistischer Verfahren (2012) 0.02
```
0.018265296 = product of:
  0.12785706 = sum of:
    0.026011333 = weight(_text_:der in 1055) [ClassicSimilarity], result of:
      0.026011333 = score(doc=1055,freq=12.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.36271852 = fieldWeight in 1055, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=1055)
    0.10184573 = weight(_text_:speziellen in 1055) [ClassicSimilarity], result of:
      0.10184573 = score(doc=1055,freq=2.0), product of:
        0.2220858 = queryWeight, product of:
          6.9177637 = idf(docFreq=118, maxDocs=44218)
          0.0321037 = queryNorm
        0.4585873 = fieldWeight in 1055, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.9177637 = idf(docFreq=118, maxDocs=44218)
          0.046875 = fieldNorm(doc=1055)
  0.14285715 = coord(2/14)
```
Abstract

Die Zahl der mathematik-relevanten Publikationn steigt von Jahr zu Jahr an. Referatedienste wie da Zentralblatt MATH und Mathematical Reviews erfassen die bibliographischen Daten, erschließen die Arbeiten inhaltlich und machen sie - heute über Datenbanken, früher in gedruckter Form - für den Nutzer suchbar. Keywords sind ein wesentlicher Bestandteil der inhaltlichen Erschließung der Publikationen. Keywords sind meist keine einzelnen Wörter, sondern Mehrwortphrasen. Das legt die Anwendung linguistischer Methoden und Verfahren nahe. Die an der FH Köln entwickelte Software 'Lingo' wurde für die speziellen Anforderungen mathematischer Texte angepasst und sowohl zum Aufbau eines kontrollierten Vokabulars als auch zur Extraction von Keywords aus mathematischen Publikationen genutzt. Es ist geplant, über eine Verknüpfung von kontrolliertem Vokabular und der Mathematical Subject Classification Methoden für die automatische Klassifikation für den Referatedienst Zentralblatt MATH zu entwickeln und zu erproben.

Footnote

Vortrag anlässlich der DMV-Tagung in Saarbrücken, 17.-20.09.2012.
Rapke, K.: Automatische Indexierung von Volltexten für die Gruner+Jahr Pressedatenbank (2001) 0.02
```
0.016317291 = product of:
  0.11422104 = sum of:
    0.029349593 = weight(_text_:der in 5863) [ClassicSimilarity], result of:
      0.029349593 = score(doc=5863,freq=22.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.40926933 = fieldWeight in 5863, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5863)
    0.08487144 = weight(_text_:speziellen in 5863) [ClassicSimilarity], result of:
      0.08487144 = score(doc=5863,freq=2.0), product of:
        0.2220858 = queryWeight, product of:
          6.9177637 = idf(docFreq=118, maxDocs=44218)
          0.0321037 = queryNorm
        0.38215607 = fieldWeight in 5863, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.9177637 = idf(docFreq=118, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5863)
  0.14285715 = coord(2/14)
```
Abstract

Retrievaltests sind die anerkannteste Methode, um neue Verfahren der Inhaltserschließung gegenüber traditionellen Verfahren zu rechtfertigen. Im Rahmen einer Diplomarbeit wurden zwei grundsätzlich unterschiedliche Systeme der automatischen inhaltlichen Erschließung anhand der Pressedatenbank des Verlagshauses Gruner + Jahr (G+J) getestet und evaluiert. Untersucht wurde dabei natürlichsprachliches Retrieval im Vergleich zu Booleschem Retrieval. Bei den beiden Systemen handelt es sich zum einen um Autonomy von Autonomy Inc. und DocCat, das von IBM an die Datenbankstruktur der G+J Pressedatenbank angepasst wurde. Ersteres ist ein auf natürlichsprachlichem Retrieval basierendes, probabilistisches System. DocCat demgegenüber basiert auf Booleschem Retrieval und ist ein lernendes System, das aufgrund einer intellektuell erstellten Trainingsvorlage indexiert. Methodisch geht die Evaluation vom realen Anwendungskontext der Textdokumentation von G+J aus. Die Tests werden sowohl unter statistischen wie auch qualitativen Gesichtspunkten bewertet. Ein Ergebnis der Tests ist, dass DocCat einige Mängel gegenüber der intellektuellen Inhaltserschließung aufweist, die noch behoben werden müssen, während das natürlichsprachliche Retrieval von Autonomy in diesem Rahmen und für die speziellen Anforderungen der G+J Textdokumentation so nicht einsetzbar ist

Series

Tagungen der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis; 4

Source

Information Research & Content Management: Orientierung, Ordnung und Organisation im Wissensmarkt; 23. DGI-Online-Tagung der DGI und 53. Jahrestagung der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis e.V. DGI, Frankfurt am Main, 8.-10.5.2001. Proceedings. Hrsg.: R. Schmidt
Bredack, J.: Automatische Extraktion fachterminologischer Mehrwortbegriffe : ein Verfahrensvergleich (2016) 0.02
```
0.015917022 = product of:
  0.11141915 = sum of:
    0.026547706 = weight(_text_:der in 3194) [ClassicSimilarity], result of:
      0.026547706 = score(doc=3194,freq=18.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.37019804 = fieldWeight in 3194, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3194)
    0.08487144 = weight(_text_:speziellen in 3194) [ClassicSimilarity], result of:
      0.08487144 = score(doc=3194,freq=2.0), product of:
        0.2220858 = queryWeight, product of:
          6.9177637 = idf(docFreq=118, maxDocs=44218)
          0.0321037 = queryNorm
        0.38215607 = fieldWeight in 3194, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.9177637 = idf(docFreq=118, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3194)
  0.14285715 = coord(2/14)
```
Abstract

In dieser Untersuchung wurden zwei Systeme eingesetzt, um MWT aus einer Dokumentkollektion mit fachsprachlichem Bezug (Volltexte des ACL Anthology Reference Corpus) automatisch zu extrahieren. Das thematische Spektrum umfasste alle Bereiche der natürlichen Sprachverarbeitung, im Speziellen die CL als interdisziplinäre Wissenschaft. Ziel war es MWT zu extrahieren, die als potentielle Indexterme im IR Verwendung finden können. Diese sollten auf Konzepte, Methoden, Verfahren und Algorithmen in der CL und angrenzenden Teilgebieten, wie Linguistik und Informatik hinweisen bzw. benennen.
Als Extraktionssysteme wurden der TreeTagger und die Indexierungssoftware Lingo verwendet. Der TreeTagger basiert auf einem statistischen Tagging- und Chunking- Algorithmus, mit dessen Hilfe NPs automatisch identifiziert und extrahiert werden. Er kann für verschiedene Anwendungsszenarien der natürlichen Sprachverarbeitung eingesetzt werden, in erster Linie als POS-Tagger für unterschiedliche Sprachen. Das Indexierungssystem Lingo arbeitet im Gegensatz zum TreeTagger mit elektronischen Wörterbüchern und einem musterbasierten Abgleich. Lingo ist ein auf automatische Indexierung ausgerichtetes System, was eine Vielzahl von Modulen mitliefert, die individuell auf eine bestimmte Aufgabenstellung angepasst und aufeinander abgestimmt werden können. Die unterschiedlichen Verarbeitungsweisen haben sich in den Ergebnismengen beider Systeme deutlich gezeigt. Die gering ausfallenden Übereinstimmungen der Ergebnismengen verdeutlichen die abweichende Funktionsweise und konnte mit einer qualitativen Analyse beispielhaft beschrieben werden. In der vorliegenden Arbeit kann abschließend nicht geklärt werden, welches der beiden Systeme bevorzugt für die Generierung von Indextermen eingesetzt werden sollte.

Content

Schriftliche Hausarbeit (Masterarbeit) zur Erlangung des Grades eines Master of Arts An der Universität Trier Fachbereich II Studiengang Computerlinguistik.
Toepfer, M.; Kempf, A.O.: Automatische Indexierung auf Basis von Titeln und Autoren-Keywords : ein Werkstattbericht (2016) 0.02
```
0.015700124 = product of:
  0.10990086 = sum of:
    0.025029417 = weight(_text_:der in 3209) [ClassicSimilarity], result of:
      0.025029417 = score(doc=3209,freq=16.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.34902605 = fieldWeight in 3209, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3209)
    0.08487144 = weight(_text_:speziellen in 3209) [ClassicSimilarity], result of:
      0.08487144 = score(doc=3209,freq=2.0), product of:
        0.2220858 = queryWeight, product of:
          6.9177637 = idf(docFreq=118, maxDocs=44218)
          0.0321037 = queryNorm
        0.38215607 = fieldWeight in 3209, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.9177637 = idf(docFreq=118, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3209)
  0.14285715 = coord(2/14)
```
Abstract

Automatische Verfahren sind für Bibliotheken essentiell, um die Erschliessung stetig wachsender Datenmengen zu stemmen. Die Deutsche Zentralbibliothek für Wirtschaftswissenschaften - Leibniz-Informationszentrum Wirtschaft sammelt seit Längerem Erfahrungen im Bereich automatischer Indexierung und baut hier eigene Kompetenzen auf. Aufgrund rechtlicher Restriktionen werden unter anderem Ansätze untersucht, die ohne Volltextnutzung arbeiten. Dieser Beitrag gibt einen Einblick in ein laufendes Teilprojekt, das unter Verwendung von Titeln und Autoren-Keywords auf eine Nachnormierung der inhaltsbeschreibenden Metadaten auf den Standard-Thesaurus Wirtschaft (STW) abzielt. Wir erläutern den Hintergrund der Arbeit, betrachten die Systemarchitektur und stellen erste vielversprechende Ergebnisse eines dokumentenorientierten Verfahrens vor.
Im Folgenden erläutern wir zunächst den Hintergrund der aktuellen Arbeit. Wir beziehen uns auf Erfahrungen mit maschinellen Verfahren allgemein und an der Deutschen Zentralbibliothek für Wirtschaftswissenschaften (ZBW) - Leibniz-Informationszentrum Wirtschaft im Speziellen. Im Anschluss geben wir einen konkreten Einblick in ein laufendes Teilprojekt, bei dem die Systemarchitektur der Automatik gegenüber früheren Arbeiten Titel und Autoren-Keywords gemeinsam verwendet, um eine Nachnormierung auf den Standard-Thesaurus Wirtschaft (STW) zu erzielen. Im Gegenssatz zu einer statischen Verknüpfung im Sinne einer Crosskonkordanz bzw. Vokabularabbildung ist das jetzt verfolgte Vorgehen dokumentenorientiert und damit in der Lage, kontextbezogene Zuordnungen vorzunehmen. Der Artikel stellt neben der Systemarchitektur auch erste experimentelle Ergebnisse vor, die im Vergleich zu titelbasierten Vorhersagen bereits deutliche Verbesserungen aufzeigen.
Kaufmann, E.: ¬Das Indexieren von natürlichsprachlichen Dokumenten und die inverse Seitenhäufigkeit (2001) 0.02
```
0.015008258 = product of:
  0.1050578 = sum of:
    0.07851009 = weight(_text_:spezielle in 318) [ClassicSimilarity], result of:
      0.07851009 = score(doc=318,freq=2.0), product of:
        0.21360074 = queryWeight, product of:
          6.653462 = idf(docFreq=154, maxDocs=44218)
          0.0321037 = queryNorm
        0.36755532 = fieldWeight in 318, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.653462 = idf(docFreq=154, maxDocs=44218)
          0.0390625 = fieldNorm(doc=318)
    0.026547706 = weight(_text_:der in 318) [ClassicSimilarity], result of:
      0.026547706 = score(doc=318,freq=18.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.37019804 = fieldWeight in 318, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=318)
  0.14285715 = coord(2/14)
```
Abstract

Die Lizentiatsarbeit gibt im ersten theoretischen Teil einen Überblick über das Indexieren von Dokumenten. Sie zeigt die verschiedenen Typen von Indexen sowie die wichtigsten Aspekte bezüglich einer Indexsprache auf. Diverse manuelle und automatische Indexierungsverfahren werden präsentiert. Spezielle Aufmerksamkeit innerhalb des ersten Teils gilt den Schlagwortregistern, deren charakteristische Merkmale und Eigenheiten erörtert werden. Zusätzlich werden die gängigen Kriterien zur Bewertung von Indexen sowie die Masse zur Evaluation von Indexierungsverfahren und Indexierungsergebnissen vorgestellt. Im zweiten Teil der Arbeit werden fünf reale Bücher einer statistischen Untersuchung unterzogen. Zum einen werden die lexikalischen und syntaktischen Bestandteile der fünf Buchregister ermittelt, um den Inhalt von Schlagwortregistern zu erschliessen. Andererseits werden aus den Textausschnitten der Bücher Indexterme maschinell extrahiert und mit den Schlagworteinträgen in den Buchregistern verglichen. Das Hauptziel der Untersuchungen besteht darin, eine Indexierungsmethode, die auf linguistikorientierter Extraktion der Indexterme und Termhäufigkeitsgewichtung basiert, im Hinblick auf ihren Gebrauchswert für eine automatische Indexierung zu testen. Die Gewichtungsmethode ist die inverse Seitenhäufigkeit, eine Methode, welche von der inversen Dokumentfrequenz abgeleitet wurde, zur automatischen Erstellung von Schlagwortregistern für deutschsprachige Texte. Die Prüfung der Methode im statistischen Teil führte nicht zu zufriedenstellenden Resultaten.

Content

Lizentiatsarbeit der Philosphischen Fakultät der Universität Zürich, - Vgl. auch: http://www.ifi.unizh.ch/cl/study/lizarbeiten/lizkaufmann.pdf.
Rädler, K.: In Bibliothekskatalogen "googlen" : Integration von Inhaltsverzeichnissen, Volltexten und WEB-Ressourcen in Bibliothekskataloge (2004) 0.01
```
0.014951277 = product of:
  0.10465893 = sum of:
    0.019787492 = weight(_text_:der in 2432) [ClassicSimilarity], result of:
      0.019787492 = score(doc=2432,freq=10.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.27592933 = fieldWeight in 2432, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2432)
    0.08487144 = weight(_text_:speziellen in 2432) [ClassicSimilarity], result of:
      0.08487144 = score(doc=2432,freq=2.0), product of:
        0.2220858 = queryWeight, product of:
          6.9177637 = idf(docFreq=118, maxDocs=44218)
          0.0321037 = queryNorm
        0.38215607 = fieldWeight in 2432, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.9177637 = idf(docFreq=118, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2432)
  0.14285715 = coord(2/14)
```
Abstract

Ausgangslage Die Katalog-Recherchen über Internet, also von außerhalb der Bibliothek, nehmen erwartungsgemäß stark zu bzw. sind mittlerweile die Regel. Damit ist natürlich das Bedürfnis und die Notwendigkeit gewachsen, über den Titel hinaus zusätzliche inhaltliche Informationen zu erhalten, die es erlauben, die Zweckmäßigkeit wesentlich besser abschätzen zu können, eine Bestellung vorzunehmen oder vielleicht auch 50 km in die Bibliothek zu fahren, um ein Buch zu entleihen. Dieses Informationsdefizit wird zunehmend als gravierender Mangel erfahren. Inhaltsverzeichnisse referieren den Inhalt kurz und prägnant. Sie sind die erste Stelle, welche zur Relevanz-Beurteilung herangezogen wird. Fast alle relevanten Terme einer Fachbuchpublikation finden sich bereits dort. Andererseits wird immer deutlicher, dass die dem bibliothekarischen Paradigma entsprechende intellektuelle Indexierung der einzelnen dokumentarischen Einheiten mit den engsten umfassenden dokumentationssprachlichen Termen (Schlagwörter, Klassen) zwar eine notwendige, aber keinesfalls hinreichende Methode darstellt, das teuer erworbene Bibliotheksgut Information für den Benutzer in seiner spezifischen Problemstellung zu aktivieren und als Informationsdienstleistung anbieten zu können. Informationen zu sehr speziellen Fragestellungen, die oft nur in kürzeren Abschnitten (Kapitel) erörtert werden, sind derzeit nur indirekt, mit großem Zeitaufwand und oft überhaupt nicht auffindbar. Sie liegen sozusagen brach. Die Tiefe der intellektuellen Indexierung bis in einzelne inhaltliche Details zu erweitern, ist aus personellen und damit auch finanziellen Gesichtspunkten nicht vertretbar. Bibliotheken fallen deshalb in der Wahrnehmung von Informationssuchenden immer mehr zurück. Die enorme Informationsvielfalt liegt hinter dem Informations- bzw. Recherchehorizont der bibliographischen Aufnahmen im Katalog.
Junger, U.; Scholze, F.: Neue Wege und Qualitäten : die Inhaltserschließungspolitik der Deutschen Nationalbibliothek (2021) 0.01
```
0.0118990755 = product of:
  0.08329353 = sum of:
    0.04807402 = weight(_text_:geschichte in 365) [ClassicSimilarity], result of:
      0.04807402 = score(doc=365,freq=2.0), product of:
        0.15258245 = queryWeight, product of:
          4.7528 = idf(docFreq=1036, maxDocs=44218)
          0.0321037 = queryNorm
        0.3150691 = fieldWeight in 365, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.7528 = idf(docFreq=1036, maxDocs=44218)
          0.046875 = fieldNorm(doc=365)
    0.035219513 = weight(_text_:der in 365) [ClassicSimilarity], result of:
      0.035219513 = score(doc=365,freq=22.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.4911232 = fieldWeight in 365, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=365)
  0.14285715 = coord(2/14)
```
Abstract

Es kommt nicht oft vor, dass ein bibliothekfachliches Thema Gegenstand eines ganzseitigen Artikels im Feuilleton einer der wichtigsten überregionalen Zeitungen in Deutschland wird. Am 31. Juli 2017 war dies der Fall: Die Frankfurter Allgemeine Zeitung veröffentlichte einen Artikel des Generaldirektors der Bayerischen Staatsbibliothek, Klaus Ceynowa, in dem dieser sich kritisch mit einem Konzept zur inhaltlichen Erschließung auseinandersetzte, das die Deutsche Nationalbibliothek (DNB) zuvor für die deutschsprachige bibliothekarische Community veröffentlicht hatte. Hatten bereits zuvor die Bemühungen der DNB, Verfahren zur maschinellen Dokumenterschließung zu entwickeln und einzusetzen, zu kontroversen Reaktionen im Bibliothekswesen geführt, so sorgte dieser Artikel noch einmal in besonderer Weise für Aufmerksamkeit und Diskussionen zu einem Thema, das vielen als eher verstaubt und unattraktiv galt: die Inhaltserschließung. Der folgende Beitrag zeichnet einige Grundlinien der Erschließungspolitik der DNB seit 2010 nach und beschreibt, welche Instrumente und Verfahren bei der Inhaltserschließung zum Einsatz kommen, welche konzeptionellen Entscheidungen ihr zugrunde liegen, wie versucht wird, Qualität zu erfassen und welche Entwicklungs- und Handlungsfelder für die Zukunft gesehen werden.

Source

Qualität in der Inhaltserschließung. Hrsg.: M. Franke-Maier, u.a

Theme

Geschichte der Sacherschließung

Williams, R.V.: Hans Peter Luhn and Herbert M. Ohlman : their roles in the origins of keyword-in-context/permutation automatic indexing (2010) 0.01

0.011179638 = product of:
  0.078257464 = sum of:
    0.064098686 = weight(_text_:geschichte in 3440) [ClassicSimilarity], result of:
      0.064098686 = score(doc=3440,freq=2.0), product of:
        0.15258245 = queryWeight, product of:
          4.7528 = idf(docFreq=1036, maxDocs=44218)
          0.0321037 = queryNorm
        0.42009214 = fieldWeight in 3440, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.7528 = idf(docFreq=1036, maxDocs=44218)
          0.0625 = fieldNorm(doc=3440)
    0.014158777 = weight(_text_:der in 3440) [ClassicSimilarity], result of:
      0.014158777 = score(doc=3440,freq=2.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.19743896 = fieldWeight in 3440, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=3440)
  0.14285715 = coord(2/14)

Theme: Geschichte der Sacherschließung

Lepsky, K.: Automatische Indexierung des Reallexikons zur Deutschen Kunstgeschichte (2006) 0.01
```
0.009816236 = product of:
  0.06871365 = sum of:
    0.03965904 = weight(_text_:geschichte in 6080) [ClassicSimilarity], result of:
      0.03965904 = score(doc=6080,freq=4.0), product of:
        0.15258245 = queryWeight, product of:
          4.7528 = idf(docFreq=1036, maxDocs=44218)
          0.0321037 = queryNorm
        0.25991875 = fieldWeight in 6080, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.7528 = idf(docFreq=1036, maxDocs=44218)
          0.02734375 = fieldNorm(doc=6080)
    0.029054616 = weight(_text_:der in 6080) [ClassicSimilarity], result of:
      0.029054616 = score(doc=6080,freq=44.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.405156 = fieldWeight in 6080, product of:
          6.6332498 = tf(freq=44.0), with freq of:
            44.0 = termFreq=44.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02734375 = fieldNorm(doc=6080)
  0.14285715 = coord(2/14)
```
Abstract

Digitalisierungsvorhaben sorgen für eine immer größere Verfügbarkeit von Inhalten bislang ausschließlich gedruckt vorliegender Werke, zunehmend auch von ganzen Büchern. Projekte wie "Google Print" versprechen die völlige elektronische Verfügbarkeit von Informationen nahezu unabhängig von Zeit und Ort und sorgen dafür, dass die Hüter der konventionellen Information, die Bibliotheken, in Angst und Schrecken versetzt werden angesichts des befürchteten Verlusts ihrer traditionellen Rolle. Die Debatte kreist dabei eher selten um die Frage, welcher Nutzen sich konkret aus dem elektronischen Volltext ergibt: Der Nutzen steht schlichtweg außer Frage, Volltexte gelten prinzipiell als nützlich. Das ist insofern zu optimistisch, als die reine Verfügbarkeit von Information noch lange nicht fir deren sinnvolle Verwertung sorgt - die bloße Verfügbarkeit des Volltexts von Kants "Kritik der reinen Vernunft" enthebt nicht der Notwendigkeit, das Werk zu lesen und verstehen zu wollen. Lesen wird man besser auch nicht am Bildschirm sondern in der (neu-deutsch) "PrintAusgabe". Elektronische Volltexte von Büchern dienen nicht der Lektüre. Falls ihr Sinn nicht ohnehin ein rein verkaufsfördernder ist (das "Publishers Program" von Google Print erweckt in der Tat diesen Eindruck), bleibt ihr potenzieller Nutzen als Nachschlageinstrument. Nur der Volltext bietet die Möglichkeit, Informationen in einem Werk zu finden, die nicht explizit erschlossen wurden, durch ein Inhaltsverzeichnis etwa oder, eine noch günstigere Ausgangslage, durch ein Sachregister. Allerdings sind die meisten Werke nicht für einen solchen Zweck verfasst worden, d.h. es ist nicht zu erwarten, dass ein Werk über die "Geschichte des Römischen Reiches" im Volltextzugriff zu einem Lexikon zur Geschichte des Römischen Reiches wird. Entspricht also die hinter Google Print und zahllosen anderen Digitalisierungsinitiativen stehende Auffassung einem doch sehr naiven Bild von der Nützlichkeit gedruckter Information?
Seriöse Information darf erwarten, wer renommierte Nachschlagewerke befragt. Zumindest für die über die Primärordnung (Stichwort/Lemma) erschlossenen Sachverhalte ist für Buchausgaben ein gezielter Zugriff möglich, Verweisungen zwischen Artikeln sorgen für weitere Einstiege. Anzunehmen ist, dass sich der Nutzen von Nachschlagewerken in elektronischer Form noch deutlich erhöhen lässt: Produkte wie z.B. "Brockhaus multimedial" oder "Encyclopedia Britannica" sorgen mit leistungsfähigen Techniken über den wahlfreien Volltextzugriff hinaus für zahlreiche Navigations- und Recherchemöglichkeiten. Es liegt daher nahe, über eine Digitalisierung konventionell vorliegender Nachschlagewerke auch deren Anwendung zu verbessern, die im Print möglichen Zugriffsmöglichkeiten deutlich zu erweitern. Beispiele für diesen Ansatz sind die Digitalisierung der "Oekonomischen Encyklopädie" von Johann Georg Krünitz, die mit hohem Aufwand nicht maschinell (Scanning und OCR) sondern manuell realisiert wurde oder auch die im "Projekt Runeberg' , vorgenommenen zahlreichen Digitalisierungen u.a. auch von Nachschlagewerken. Ob die einfache Volltextindexierung derartig umfangreicher und - weil bereits als Nachschlagewerk konzipiert - gleichzeitig extrem verdichteter Quellen für einen größtmöglichen Nutzen der elektronischen Version ausreicht, darf zu Recht bezweifelt werden. In kommerziellen Produkten sorgen daher zusätzliche Techniken für einerseits thematisch gezielte Zugriffe auch über Nicht-Stichwörter, andererseits für Querverbindungen zu möglicherweise weiteren Artikeln von Interesse ("Wissensnetz" des Brockhaus, "Knowledge Navigator" der Britannica). Es darf angenommen werden, dass derartige Techniken dabei auf Informationen aufsetzen können (Strukturierung der Artikel, gekennzeichnete (getaggte) Personennamen, Querverweise etc.), die in den zu verarbeitenden Artikeln in nutzbarer Form vorliegen. Für digitalisierte Druckausgaben kommen derartige Verfahren nicht in Frage, weil lediglich flache, noch dazu in der Regel mit OCR-Fehlern behaftete Texte vorliegen. Die Zugriffsmöglichkeiten bewegen sich daher zwischen der 1:1-Umsetzung der Druckausgabe, d.h. dem Primärzugriff über Stichwort, und der Volltextsuche auf den vollständigen Lexikontext. Beides ist angesichts der im elektronischen Volltext liegenden Möglichkeiten sicher nicht die Methode der Wahl. Für die Digitalisierung des "Reallexikons zur Deutschen Kunstgeschichte" im Rahmen des von der Deutschen Forschungsgemeinschaft geförderten Projekts "RDKWeb" wird daher versucht, mit den Mitteln der Automatischen Indexierung eine Lösung zu erzielen, die über eine reine Volltextsuchmöglichkeit hinaus Suchunterstützungen bietet, die sich an den Fähigkeiten kommerzieller Produkte orientieren (nicht messen!).

Kasprzik, A.: Voraussetzungen und Anwendungspotentiale einer präzisen Sacherschließung aus Sicht der Wissenschaft (2018) 0.01

0.008044723 = product of:
  0.05631306 = sum of:
    0.04108943 = weight(_text_:der in 5195) [ClassicSimilarity], result of:
      0.04108943 = score(doc=5195,freq=22.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.57297707 = fieldWeight in 5195, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5195)
    0.015223628 = product of:
      0.030447256 = sum of:
        0.030447256 = weight(_text_:22 in 5195) [ClassicSimilarity], result of:
          0.030447256 = score(doc=5195,freq=2.0), product of:
            0.112421684 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0321037 = queryNorm
            0.2708308 = fieldWeight in 5195, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5195)
      0.5 = coord(1/2)
  0.14285715 = coord(2/14)

Abstract: Große Aufmerksamkeit richtet sich im Moment auf das Potential von automatisierten Methoden in der Sacherschließung und deren Interaktionsmöglichkeiten mit intellektuellen Methoden. In diesem Kontext befasst sich der vorliegende Beitrag mit den folgenden Fragen: Was sind die Anforderungen an bibliothekarische Metadaten aus Sicht der Wissenschaft? Was wird gebraucht, um den Informationsbedarf der Fachcommunities zu bedienen? Und was bedeutet das entsprechend für die Automatisierung der Metadatenerstellung und -pflege? Dieser Beitrag fasst die von der Autorin eingenommene Position in einem Impulsvortrag und der Podiumsdiskussion beim Workshop der FAG "Erschließung und Informationsvermittlung" des GBV zusammen. Der Workshop fand im Rahmen der 22. Verbundkonferenz des GBV statt.

Hauer, M.: Automatische Indexierung (2000) 0.01

0.008018993 = product of:
  0.05613295 = sum of:
    0.030035302 = weight(_text_:der in 5887) [ClassicSimilarity], result of:
      0.030035302 = score(doc=5887,freq=4.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.4188313 = fieldWeight in 5887, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.09375 = fieldNorm(doc=5887)
    0.026097648 = product of:
      0.052195296 = sum of:
        0.052195296 = weight(_text_:22 in 5887) [ClassicSimilarity], result of:
          0.052195296 = score(doc=5887,freq=2.0), product of:
            0.112421684 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0321037 = queryNorm
            0.46428138 = fieldWeight in 5887, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=5887)
      0.5 = coord(1/2)
  0.14285715 = coord(2/14)

Series: Proceedings - Online-Tagung der DGI; 1
Source: Wissen in Aktion: Wege des Knowledge Managements. 22. Online-Tagung der DGI, Frankfurt am Main, 2.-4.5.2000. Proceedings. Hrsg.: R. Schmidt

Fuhr, N.: Rankingexperimente mit gewichteter Indexierung (1986) 0.01

0.008018993 = product of:
  0.05613295 = sum of:
    0.030035302 = weight(_text_:der in 2051) [ClassicSimilarity], result of:
      0.030035302 = score(doc=2051,freq=4.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.4188313 = fieldWeight in 2051, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.09375 = fieldNorm(doc=2051)
    0.026097648 = product of:
      0.052195296 = sum of:
        0.052195296 = weight(_text_:22 in 2051) [ClassicSimilarity], result of:
          0.052195296 = score(doc=2051,freq=2.0), product of:
            0.112421684 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0321037 = queryNorm
            0.46428138 = fieldWeight in 2051, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=2051)
      0.5 = coord(1/2)
  0.14285715 = coord(2/14)

Abstract: Der Beitrag enthält eine Darstellung zur Frage der Konzeption von Rankingalgorithmen auf Grundlage gewichteter Indexierung mittels statistischer Verfahren.
Date: 14. 6.2015 22:12:56

Franke-Maier, M.: Anforderungen an die Qualität der Inhaltserschließung im Spannungsfeld von intellektuell und automatisch erzeugten Metadaten (2018) 0.01

0.007180688 = product of:
  0.050264813 = sum of:
    0.035041183 = weight(_text_:der in 5344) [ClassicSimilarity], result of:
      0.035041183 = score(doc=5344,freq=16.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.4886365 = fieldWeight in 5344, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5344)
    0.015223628 = product of:
      0.030447256 = sum of:
        0.030447256 = weight(_text_:22 in 5344) [ClassicSimilarity], result of:
          0.030447256 = score(doc=5344,freq=2.0), product of:
            0.112421684 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0321037 = queryNorm
            0.2708308 = fieldWeight in 5344, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5344)
      0.5 = coord(1/2)
  0.14285715 = coord(2/14)

Abstract: Spätestens seit dem Deutschen Bibliothekartag 2018 hat sich die Diskussion zu den automatischen Verfahren der Inhaltserschließung der Deutschen Nationalbibliothek von einer politisch geführten Diskussion in eine Qualitätsdiskussion verwandelt. Der folgende Beitrag beschäftigt sich mit Fragen der Qualität von Inhaltserschließung in digitalen Zeiten, wo heterogene Erzeugnisse unterschiedlicher Verfahren aufeinandertreffen und versucht, wichtige Anforderungen an Qualität zu definieren. Dieser Tagungsbeitrag fasst die vom Autor als Impulse vorgetragenen Ideen beim Workshop der FAG "Erschließung und Informationsvermittlung" des GBV am 29. August 2018 in Kiel zusammen. Der Workshop fand im Rahmen der 22. Verbundkonferenz des GBV statt.

Lepsky, K.; Vorhauer, J.: Lingo - ein open source System für die Automatische Indexierung deutschsprachiger Dokumente (2006) 0.01

0.006530856 = product of:
  0.045715988 = sum of:
    0.028317554 = weight(_text_:der in 3581) [ClassicSimilarity], result of:
      0.028317554 = score(doc=3581,freq=8.0), product of:
        0.07171217 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0321037 = queryNorm
        0.3948779 = fieldWeight in 3581, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=3581)
    0.017398432 = product of:
      0.034796864 = sum of:
        0.034796864 = weight(_text_:22 in 3581) [ClassicSimilarity], result of:
          0.034796864 = score(doc=3581,freq=2.0), product of:
            0.112421684 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0321037 = queryNorm
            0.30952093 = fieldWeight in 3581, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=3581)
      0.5 = coord(1/2)
  0.14285715 = coord(2/14)

Abstract: Lingo ist ein frei verfügbares System (open source) zur automatischen Indexierung der deutschen Sprache. Bei der Entwicklung von lingo standen hohe Konfigurierbarkeit und Flexibilität des Systems für unterschiedliche Einsatzmöglichkeiten im Vordergrund. Der Beitrag zeigt den Nutzen einer linguistisch basierten automatischen Indexierung für das Information Retrieval auf. Die für eine Retrievalverbesserung zur Verfügung stehende linguistische Funktionalität von lingo wird vorgestellt und an Beispielen erläutert: Grundformerkennung, Kompositumerkennung bzw. Kompositumzerlegung, Wortrelationierung, lexikalische und algorithmische Mehrwortgruppenerkennung, OCR-Fehlerkorrektur. Der offene Systemaufbau von lingo wird beschrieben, mögliche Einsatzszenarien und Anwendungsgrenzen werden benannt.
Date: 24. 3.2006 12:22:02

Search (172 results, page 1 of 9)

Authors

Years

Languages

Types

Themes

Subjects

Classifications