Search (346 results, page 1 of 18)

Lustig, G.: Automatische Indexierung : Erfahrungen und Perspektiven (1989) 0.04

0.043693315 = product of:
  0.1529266 = sum of:
    0.088838845 = weight(_text_:indexierung in 2323) [ClassicSimilarity], result of:
      0.088838845 = score(doc=2323,freq=4.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.6722399 = fieldWeight in 2323, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0625 = fieldNorm(doc=2323)
    0.006693451 = weight(_text_:information in 2323) [ClassicSimilarity], result of:
      0.006693451 = score(doc=2323,freq=2.0), product of:
        0.04313797 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.024573348 = queryNorm
        0.1551638 = fieldWeight in 2323, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.0625 = fieldNorm(doc=2323)
    0.01987402 = weight(_text_:retrieval in 2323) [ClassicSimilarity], result of:
      0.01987402 = score(doc=2323,freq=2.0), product of:
        0.07433229 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.024573348 = queryNorm
        0.26736724 = fieldWeight in 2323, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0625 = fieldNorm(doc=2323)
    0.03752027 = weight(_text_:frankfurt in 2323) [ClassicSimilarity], result of:
      0.03752027 = score(doc=2323,freq=2.0), product of:
        0.10213336 = queryWeight, product of:
          4.1562657 = idf(docFreq=1882, maxDocs=44218)
          0.024573348 = queryNorm
        0.36736545 = fieldWeight in 2323, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.1562657 = idf(docFreq=1882, maxDocs=44218)
          0.0625 = fieldNorm(doc=2323)
  0.2857143 = coord(4/14)

Abstract: Es wird zunächst ein "ideales Information-Retrieval-System" beschrieben und diskutiert. Als Kernproblem für -selbst bescheidene - Entwicklungen in die dadurch aufgezeigte Richtung wird das "Verstehen" von Texten durch den Computer angesehen, wobei je nach der Aufgabenstellung einer Systemkomponente stets nur ein partielles Verstehen erforderlich ist. Ein relativ einfaches, aber keineswegs triviales Beispiel dieser Art ist die automatische Indexierung von Referatetexten bei vorgegebenen Deskriptorensystem. Von diesem Problem werden Ansätze, Ergebnisse und Erfahrungen mitgeteilt. Darauf aufbauend werden weitere Forschungsrichtungen und Entwicklungsmöglichkeiten mitgeteilt
Imprint: Frankfurt : Indeks

Lepsky, K.; Vorhauer, J.: Lingo - ein open source System für die Automatische Indexierung deutschsprachiger Dokumente (2006) 0.04

0.041214477 = product of:
  0.14425066 = sum of:
    0.10880493 = weight(_text_:indexierung in 3581) [ClassicSimilarity], result of:
      0.10880493 = score(doc=3581,freq=6.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.8233224 = fieldWeight in 3581, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0625 = fieldNorm(doc=3581)
    0.006693451 = weight(_text_:information in 3581) [ClassicSimilarity], result of:
      0.006693451 = score(doc=3581,freq=2.0), product of:
        0.04313797 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.024573348 = queryNorm
        0.1551638 = fieldWeight in 3581, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.0625 = fieldNorm(doc=3581)
    0.01987402 = weight(_text_:retrieval in 3581) [ClassicSimilarity], result of:
      0.01987402 = score(doc=3581,freq=2.0), product of:
        0.07433229 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.024573348 = queryNorm
        0.26736724 = fieldWeight in 3581, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0625 = fieldNorm(doc=3581)
    0.0088782655 = product of:
      0.026634796 = sum of:
        0.026634796 = weight(_text_:22 in 3581) [ClassicSimilarity], result of:
          0.026634796 = score(doc=3581,freq=2.0), product of:
            0.08605168 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.024573348 = queryNorm
            0.30952093 = fieldWeight in 3581, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=3581)
      0.33333334 = coord(1/3)
  0.2857143 = coord(4/14)

Abstract: Lingo ist ein frei verfügbares System (open source) zur automatischen Indexierung der deutschen Sprache. Bei der Entwicklung von lingo standen hohe Konfigurierbarkeit und Flexibilität des Systems für unterschiedliche Einsatzmöglichkeiten im Vordergrund. Der Beitrag zeigt den Nutzen einer linguistisch basierten automatischen Indexierung für das Information Retrieval auf. Die für eine Retrievalverbesserung zur Verfügung stehende linguistische Funktionalität von lingo wird vorgestellt und an Beispielen erläutert: Grundformerkennung, Kompositumerkennung bzw. Kompositumzerlegung, Wortrelationierung, lexikalische und algorithmische Mehrwortgruppenerkennung, OCR-Fehlerkorrektur. Der offene Systemaufbau von lingo wird beschrieben, mögliche Einsatzszenarien und Anwendungsgrenzen werden benannt.
Date: 24. 3.2006 12:22:02

Hauer, M.: Automatische Indexierung (2000) 0.04

0.040100943 = product of:
  0.18713774 = sum of:
    0.09422782 = weight(_text_:indexierung in 5887) [ClassicSimilarity], result of:
      0.09422782 = score(doc=5887,freq=2.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.71301806 = fieldWeight in 5887, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.09375 = fieldNorm(doc=5887)
    0.07959252 = weight(_text_:frankfurt in 5887) [ClassicSimilarity], result of:
      0.07959252 = score(doc=5887,freq=4.0), product of:
        0.10213336 = queryWeight, product of:
          4.1562657 = idf(docFreq=1882, maxDocs=44218)
          0.024573348 = queryNorm
        0.77929986 = fieldWeight in 5887, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.1562657 = idf(docFreq=1882, maxDocs=44218)
          0.09375 = fieldNorm(doc=5887)
    0.013317398 = product of:
      0.039952192 = sum of:
        0.039952192 = weight(_text_:22 in 5887) [ClassicSimilarity], result of:
          0.039952192 = score(doc=5887,freq=2.0), product of:
            0.08605168 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.024573348 = queryNorm
            0.46428138 = fieldWeight in 5887, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=5887)
      0.33333334 = coord(1/3)
  0.21428572 = coord(3/14)

Imprint: Frankfurt am Main : DGD
Source: Wissen in Aktion: Wege des Knowledge Managements. 22. Online-Tagung der DGI, Frankfurt am Main, 2.-4.5.2000. Proceedings. Hrsg.: R. Schmidt

Nohr, H.: Grundlagen der automatischen Indexierung : ein Lehrbuch (2003) 0.04
```
0.03812017 = product of:
  0.13342059 = sum of:
    0.11324775 = weight(_text_:indexierung in 1767) [ClassicSimilarity], result of:
      0.11324775 = score(doc=1767,freq=26.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.8569411 = fieldWeight in 1767, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.03125 = fieldNorm(doc=1767)
    0.0057966993 = weight(_text_:information in 1767) [ClassicSimilarity], result of:
      0.0057966993 = score(doc=1767,freq=6.0), product of:
        0.04313797 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.024573348 = queryNorm
        0.1343758 = fieldWeight in 1767, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.03125 = fieldNorm(doc=1767)
    0.00993701 = weight(_text_:retrieval in 1767) [ClassicSimilarity], result of:
      0.00993701 = score(doc=1767,freq=2.0), product of:
        0.07433229 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.024573348 = queryNorm
        0.13368362 = fieldWeight in 1767, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.03125 = fieldNorm(doc=1767)
    0.0044391328 = product of:
      0.013317398 = sum of:
        0.013317398 = weight(_text_:22 in 1767) [ClassicSimilarity], result of:
          0.013317398 = score(doc=1767,freq=2.0), product of:
            0.08605168 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.024573348 = queryNorm
            0.15476047 = fieldWeight in 1767, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.03125 = fieldNorm(doc=1767)
      0.33333334 = coord(1/3)
  0.2857143 = coord(4/14)
```
Date

22. 6.2009 12:46:51

Footnote

Rez. in: nfd 54(2003) H.5, S.314 (W. Ratzek): "Um entscheidungsrelevante Daten aus der ständig wachsenden Flut von mehr oder weniger relevanten Dokumenten zu extrahieren, müssen Unternehmen, öffentliche Verwaltung oder Einrichtungen der Fachinformation effektive und effiziente Filtersysteme entwickeln, einsetzen und pflegen. Das vorliegende Lehrbuch von Holger Nohr bietet erstmalig eine grundlegende Einführung in das Thema "automatische Indexierung". Denn: "Wie man Information sammelt, verwaltet und verwendet, wird darüber entscheiden, ob man zu den Gewinnern oder Verlierern gehört" (Bill Gates), heißt es einleitend. Im ersten Kapitel "Einleitung" stehen die Grundlagen im Mittelpunkt. Die Zusammenhänge zwischen Dokumenten-Management-Systeme, Information Retrieval und Indexierung für Planungs-, Entscheidungs- oder Innovationsprozesse, sowohl in Profit- als auch Non-Profit-Organisationen werden beschrieben. Am Ende des einleitenden Kapitels geht Nohr auf die Diskussion um die intellektuelle und automatische Indexierung ein und leitet damit über zum zweiten Kapitel "automatisches Indexieren. Hier geht der Autor überblickartig unter anderem ein auf - Probleme der automatischen Sprachverarbeitung und Indexierung - verschiedene Verfahren der automatischen Indexierung z.B. einfache Stichwortextraktion / Volltextinvertierung, - statistische Verfahren, Pattern-Matching-Verfahren. Die "Verfahren der automatischen Indexierung" behandelt Nohr dann vertiefend und mit vielen Beispielen versehen im umfangreichsten dritten Kapitel. Das vierte Kapitel "Keyphrase Extraction" nimmt eine Passpartout-Status ein: "Eine Zwischenstufe auf dem Weg von der automatischen Indexierung hin zur automatischen Generierung textueller Zusammenfassungen (Automatic Text Summarization) stellen Ansätze dar, die Schlüsselphrasen aus Dokumenten extrahieren (Keyphrase Extraction). Die Grenzen zwischen den automatischen Verfahren der Indexierung und denen des Text Summarization sind fließend." (S. 91). Am Beispiel NCR"s Extractor/Copernic Summarizer beschreibt Nohr die Funktionsweise.
Im fünften Kapitel "Information Extraction" geht Nohr auf eine Problemstellung ein, die in der Fachwelt eine noch stärkere Betonung verdiente: "Die stetig ansteigende Zahl elektronischer Dokumente macht neben einer automatischen Erschließung auch eine automatische Gewinnung der relevanten Informationen aus diesen Dokumenten wünschenswert, um diese z.B. für weitere Bearbeitungen oder Auswertungen in betriebliche Informationssysteme übernehmen zu können." (S. 103) "Indexierung und Retrievalverfahren" als voneinander abhängige Verfahren werden im sechsten Kapitel behandelt. Hier stehen Relevance Ranking und Relevance Feedback sowie die Anwendung informationslinguistischer Verfahren in der Recherche im Mittelpunkt. Die "Evaluation automatischer Indexierung" setzt den thematischen Schlusspunkt. Hier geht es vor allem um die Oualität einer Indexierung, um gängige Retrievalmaße in Retrievaltest und deren Einssatz. Weiterhin ist hervorzuheben, dass jedes Kapitel durch die Vorgabe von Lernzielen eingeleitet wird und zu den jeweiligen Kapiteln (im hinteren Teil des Buches) einige Kontrollfragen gestellt werden. Die sehr zahlreichen Beispiele aus der Praxis, ein Abkürzungsverzeichnis und ein Sachregister erhöhen den Nutzwert des Buches. Die Lektüre förderte beim Rezensenten das Verständnis für die Zusammenhänge von BID-Handwerkzeug, Wirtschaftsinformatik (insbesondere Data Warehousing) und Künstlicher Intelligenz. Die "Grundlagen der automatischen Indexierung" sollte auch in den bibliothekarischen Studiengängen zur Pflichtlektüre gehören. Holger Nohrs Lehrbuch ist auch für den BID-Profi geeignet, um die mehr oder weniger fundierten Kenntnisse auf dem Gebiet "automatisches Indexieren" schnell, leicht verständlich und informativ aufzufrischen."

Hauer, M.: Neue Qualitäten in Bibliotheken : Durch Content-Ergänzung, maschinelle Indexierung und modernes Information Retrieval können Recherchen in Bibliothekskatalogen deutlich verbessert werden (2004) 0.03

0.03450028 = product of:
  0.12075097 = sum of:
    0.023132863 = weight(_text_:web in 886) [ClassicSimilarity], result of:
      0.023132863 = score(doc=886,freq=2.0), product of:
        0.08019538 = queryWeight, product of:
          3.2635105 = idf(docFreq=4597, maxDocs=44218)
          0.024573348 = queryNorm
        0.2884563 = fieldWeight in 886, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.2635105 = idf(docFreq=4597, maxDocs=44218)
          0.0625 = fieldNorm(doc=886)
    0.06281855 = weight(_text_:indexierung in 886) [ClassicSimilarity], result of:
      0.06281855 = score(doc=886,freq=2.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.47534537 = fieldWeight in 886, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0625 = fieldNorm(doc=886)
    0.006693451 = weight(_text_:information in 886) [ClassicSimilarity], result of:
      0.006693451 = score(doc=886,freq=2.0), product of:
        0.04313797 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.024573348 = queryNorm
        0.1551638 = fieldWeight in 886, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.0625 = fieldNorm(doc=886)
    0.028106106 = weight(_text_:retrieval in 886) [ClassicSimilarity], result of:
      0.028106106 = score(doc=886,freq=4.0), product of:
        0.07433229 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.024573348 = queryNorm
        0.37811437 = fieldWeight in 886, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0625 = fieldNorm(doc=886)
  0.2857143 = coord(4/14)

Abstract: Seit Frühjahr 2004 ist Dandelon.com als neues, offenes, internationales Wissenschaftsportal in Betrieb. Erste Retrieval-Tests bescheinigen deutlich bessere Suchergebnisse als in herkömmlichen OPACs oder Verbundsystemen. Seine Daten stammen aus intelligentCAPTURE und Bibliothekskatalogen. intelligentCAPTURE erfasst Content über Scanning oder File-Import oder Web-Spidering und indexiert nach morphosyntaktischen und semantischen Verfahren. Aufbereiteter Content und Indexate gehen an Bibliothekssysteme und an dandelon.com. Dandelon.com ist kostenlos zugänglich für Endbenutzer und ist zugleich Austauschzentrale und Katalogerweiterung für angeschlossene Bibliotheken. Neue Inhalte können so kostengünstig und performant erschlossen werden.

Zimmermann, H.: Automatische Indexierung: Entwicklung und Perspektiven (1983) 0.03

0.031335674 = product of:
  0.14623314 = sum of:
    0.088838845 = weight(_text_:indexierung in 2318) [ClassicSimilarity], result of:
      0.088838845 = score(doc=2318,freq=4.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.6722399 = fieldWeight in 2318, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0625 = fieldNorm(doc=2318)
    0.01987402 = weight(_text_:retrieval in 2318) [ClassicSimilarity], result of:
      0.01987402 = score(doc=2318,freq=2.0), product of:
        0.07433229 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.024573348 = queryNorm
        0.26736724 = fieldWeight in 2318, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0625 = fieldNorm(doc=2318)
    0.03752027 = weight(_text_:frankfurt in 2318) [ClassicSimilarity], result of:
      0.03752027 = score(doc=2318,freq=2.0), product of:
        0.10213336 = queryWeight, product of:
          4.1562657 = idf(docFreq=1882, maxDocs=44218)
          0.024573348 = queryNorm
        0.36736545 = fieldWeight in 2318, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.1562657 = idf(docFreq=1882, maxDocs=44218)
          0.0625 = fieldNorm(doc=2318)
  0.21428572 = coord(3/14)

Abstract: Die Automatische Indexierung als ein Teilgebiet der Inhaltserschließung wird inzwischen in einer Reihe von Gebieten, vor allem in der Fachinformation und Kommunikation praktisch eingesetzt. Dabei dominieren äußerst einfache Systeme, die (noch) erhebliche Anpassungen des Benutzers an die jeweilige Systemstrategie voraussetzen. Unter Berücksichtigung des Konzepts der Einheit von Informationserschließung und -retrieval werden höherwertige ("intelligentere") Verfahren vorgestellt, die der Entlastung des Informationssuchenden wie auch der Verbesserung der Rechercheergebnisse dienen sollen
Imprint: Frankfurt : Indeks

Hauer, M: Silicon Valley Vorarlberg : Maschinelle Indexierung und semantisches Retrieval verbessert den Katalog der Vorarlberger Landesbibliothek (2004) 0.03

0.031312075 = product of:
  0.10959226 = sum of:
    0.025042059 = weight(_text_:web in 2489) [ClassicSimilarity], result of:
      0.025042059 = score(doc=2489,freq=6.0), product of:
        0.08019538 = queryWeight, product of:
          3.2635105 = idf(docFreq=4597, maxDocs=44218)
          0.024573348 = queryNorm
        0.3122631 = fieldWeight in 2489, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          3.2635105 = idf(docFreq=4597, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2489)
    0.055524275 = weight(_text_:indexierung in 2489) [ClassicSimilarity], result of:
      0.055524275 = score(doc=2489,freq=4.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.42014992 = fieldWeight in 2489, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2489)
    0.004183407 = weight(_text_:information in 2489) [ClassicSimilarity], result of:
      0.004183407 = score(doc=2489,freq=2.0), product of:
        0.04313797 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.024573348 = queryNorm
        0.09697737 = fieldWeight in 2489, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2489)
    0.024842525 = weight(_text_:retrieval in 2489) [ClassicSimilarity], result of:
      0.024842525 = score(doc=2489,freq=8.0), product of:
        0.07433229 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.024573348 = queryNorm
        0.33420905 = fieldWeight in 2489, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2489)
  0.2857143 = coord(4/14)

Abstract: 10 Jahre Internet haben die WeIt um die Bibliotheken herum stark geändert. Der Web-OPAC war eine Antwort der Bibliotheken. Doch reicht ein Web-OPAC im Zeitalter des Internets noch aus? Außer Web ist es doch der alte Katalog. Ca. 90% aller Bibliotheksrecherchen durch Benutzer sind Themenrecherchen. Ein Anteil dieser Recherchen bringt kein Ergebnis. Es kann leicht gemessen werden, dass null Medien gefunden wurden. Die Gründe hierfür wurden auch immer wieder untersucht: Plural- anstelle Singularformen, zu spezifische Suchbegriffe, Schreib- oder Bedienungsfehler. Zu wenig untersucht sind aber die Recherchen, die nicht mit einer Ausleihe enden, denn auch dann kann man in vielen Fällen von einem Retrieval-Mangel ausgehen. Schließlich: Von den ausgeliehenen Büchern werden nach Einschätzung vieler Bibliothekare 80% nicht weiter als bis zum Inhaltsverzeichnis gelesen (außer in Präsenzbibliotheken) - und erst nach Wochen zurückgegeben. Ein Politiker würde dies neudeutsch als "ein Vermittlungsproblem" bezeichnen. Ein Controller als nicht hinreichende Kapitalnutzung. Einfacher machen es sich immer mehr Studenten und Wissenschaftler, ihr Wissensaustausch vollzieht sich zunehmend an anderen Orten. Bibliotheken (als Funktion) sind unverzichtbar für die wissenschaftliche Kommunikation. Deshalb geht es darum, Wege zu finden und auch zu beschreiten, welche die Schätze von Bibliotheken (als Institution) effizienter an die Zielgruppe bringen. Der Einsatz von Information Retrieval-Technologie, neue Erschließungsmethoden und neuer Content sind Ansätze dazu. Doch die bisherigen Verbundstrukturen und Abhängigkeit haben das hier vorgestellte innovative Projekt keineswegs gefördert. Innovation entsteht wie die Innvoationsforschung zeigt eigentlich immer an der Peripherie: in Bregenz fing es an.
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Kumpe, D.: Methoden zur automatischen Indexierung von Dokumenten (2006) 0.03

0.03060172 = product of:
  0.14280802 = sum of:
    0.10993245 = weight(_text_:indexierung in 782) [ClassicSimilarity], result of:
      0.10993245 = score(doc=782,freq=8.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.8318544 = fieldWeight in 782, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0546875 = fieldNorm(doc=782)
    0.008282723 = weight(_text_:information in 782) [ClassicSimilarity], result of:
      0.008282723 = score(doc=782,freq=4.0), product of:
        0.04313797 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.024573348 = queryNorm
        0.1920054 = fieldWeight in 782, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.0546875 = fieldNorm(doc=782)
    0.024592843 = weight(_text_:retrieval in 782) [ClassicSimilarity], result of:
      0.024592843 = score(doc=782,freq=4.0), product of:
        0.07433229 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.024573348 = queryNorm
        0.33085006 = fieldWeight in 782, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0546875 = fieldNorm(doc=782)
  0.21428572 = coord(3/14)

Abstract: Diese Diplomarbeit handelt von der Indexierung von unstrukturierten und natürlichsprachigen Dokumenten. Die zunehmende Informationsflut und die Zahl an veröffentlichten wissenschaftlichen Berichten und Büchern machen eine maschinelle inhaltliche Erschließung notwendig. Um die Anforderungen hierfür besser zu verstehen, werden Probleme der natürlichsprachigen schriftlichen Kommunikation untersucht. Die manuellen Techniken der Indexierung und die Dokumentationssprachen werden vorgestellt. Die Indexierung wird thematisch in den Bereich der inhaltlichen Erschließung und des Information Retrieval eingeordnet. Weiterhin werden Vor- und Nachteile von ausgesuchten Algorithmen untersucht und Softwareprodukte im Bereich des Information Retrieval auf ihre Arbeitsweise hin evaluiert. Anhand von Beispiel-Dokumenten werden die Ergebnisse einzelner Verfahren vorgestellt. Mithilfe des Projekts European Migration Network werden Probleme und grundlegende Anforderungen an die Durchführung einer inhaltlichen Erschließung identifiziert und Lösungsmöglichkeiten vorgeschlagen.

Rapke, K.: Automatische Indexierung von Volltexten für die Gruner+Jahr Pressedatenbank (2001) 0.03

0.029823812 = product of:
  0.104383335 = sum of:
    0.03926159 = weight(_text_:indexierung in 5863) [ClassicSimilarity], result of:
      0.03926159 = score(doc=5863,freq=2.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.29709086 = fieldWeight in 5863, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5863)
    0.004183407 = weight(_text_:information in 5863) [ClassicSimilarity], result of:
      0.004183407 = score(doc=5863,freq=2.0), product of:
        0.04313797 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.024573348 = queryNorm
        0.09697737 = fieldWeight in 5863, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5863)
    0.027774787 = weight(_text_:retrieval in 5863) [ClassicSimilarity], result of:
      0.027774787 = score(doc=5863,freq=10.0), product of:
        0.07433229 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.024573348 = queryNorm
        0.37365708 = fieldWeight in 5863, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5863)
    0.033163548 = weight(_text_:frankfurt in 5863) [ClassicSimilarity], result of:
      0.033163548 = score(doc=5863,freq=4.0), product of:
        0.10213336 = queryWeight, product of:
          4.1562657 = idf(docFreq=1882, maxDocs=44218)
          0.024573348 = queryNorm
        0.32470825 = fieldWeight in 5863, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.1562657 = idf(docFreq=1882, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5863)
  0.2857143 = coord(4/14)

Abstract: Retrievaltests sind die anerkannteste Methode, um neue Verfahren der Inhaltserschließung gegenüber traditionellen Verfahren zu rechtfertigen. Im Rahmen einer Diplomarbeit wurden zwei grundsätzlich unterschiedliche Systeme der automatischen inhaltlichen Erschließung anhand der Pressedatenbank des Verlagshauses Gruner + Jahr (G+J) getestet und evaluiert. Untersucht wurde dabei natürlichsprachliches Retrieval im Vergleich zu Booleschem Retrieval. Bei den beiden Systemen handelt es sich zum einen um Autonomy von Autonomy Inc. und DocCat, das von IBM an die Datenbankstruktur der G+J Pressedatenbank angepasst wurde. Ersteres ist ein auf natürlichsprachlichem Retrieval basierendes, probabilistisches System. DocCat demgegenüber basiert auf Booleschem Retrieval und ist ein lernendes System, das aufgrund einer intellektuell erstellten Trainingsvorlage indexiert. Methodisch geht die Evaluation vom realen Anwendungskontext der Textdokumentation von G+J aus. Die Tests werden sowohl unter statistischen wie auch qualitativen Gesichtspunkten bewertet. Ein Ergebnis der Tests ist, dass DocCat einige Mängel gegenüber der intellektuellen Inhaltserschließung aufweist, die noch behoben werden müssen, während das natürlichsprachliche Retrieval von Autonomy in diesem Rahmen und für die speziellen Anforderungen der G+J Textdokumentation so nicht einsetzbar ist
Imprint: Frankfurt am Main : DGI
Source: Information Research & Content Management: Orientierung, Ordnung und Organisation im Wissensmarkt; 23. DGI-Online-Tagung der DGI und 53. Jahrestagung der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis e.V. DGI, Frankfurt am Main, 8.-10.5.2001. Proceedings. Hrsg.: R. Schmidt

Knorz, G.: Automatische Indexierung (1994) 0.03

0.029622387 = product of:
  0.1382378 = sum of:
    0.09422782 = weight(_text_:indexierung in 4254) [ClassicSimilarity], result of:
      0.09422782 = score(doc=4254,freq=2.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.71301806 = fieldWeight in 4254, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.09375 = fieldNorm(doc=4254)
    0.014198954 = weight(_text_:information in 4254) [ClassicSimilarity], result of:
      0.014198954 = score(doc=4254,freq=4.0), product of:
        0.04313797 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.024573348 = queryNorm
        0.3291521 = fieldWeight in 4254, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.09375 = fieldNorm(doc=4254)
    0.029811028 = weight(_text_:retrieval in 4254) [ClassicSimilarity], result of:
      0.029811028 = score(doc=4254,freq=2.0), product of:
        0.07433229 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.024573348 = queryNorm
        0.40105087 = fieldWeight in 4254, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.09375 = fieldNorm(doc=4254)
  0.21428572 = coord(3/14)

Series: Berufsbegleitendes Ergänzungsstudium im Tätigkeitsfeld wissenschaftliche Information und Dokumentation (BETID): Lehrmaterialien; Nr.3
Source: Wissensrepräsentation und Information Retrieval. R.-D. Hennings u.a

Reimer, U.: Verfahren der automatischen Indexierung : benötigtes Vorwissen und Ansätze zu seiner automatischen Akquisition, ein Überblick (1992) 0.03

0.02873122 = product of:
  0.13407902 = sum of:
    0.09422782 = weight(_text_:indexierung in 7858) [ClassicSimilarity], result of:
      0.09422782 = score(doc=7858,freq=2.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.71301806 = fieldWeight in 7858, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.09375 = fieldNorm(doc=7858)
    0.010040177 = weight(_text_:information in 7858) [ClassicSimilarity], result of:
      0.010040177 = score(doc=7858,freq=2.0), product of:
        0.04313797 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.024573348 = queryNorm
        0.23274569 = fieldWeight in 7858, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.09375 = fieldNorm(doc=7858)
    0.029811028 = weight(_text_:retrieval in 7858) [ClassicSimilarity], result of:
      0.029811028 = score(doc=7858,freq=2.0), product of:
        0.07433229 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.024573348 = queryNorm
        0.40105087 = fieldWeight in 7858, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.09375 = fieldNorm(doc=7858)
  0.21428572 = coord(3/14)

Source: Experimentelles und praktisches Information Retrieval: Festschrift für Gerhard Lustig. Hrsg. R. Kuhlen

Automatische Indexierung zwischen Forschung und Anwendung (1986) 0.03

0.028538354 = product of:
  0.13317898 = sum of:
    0.10993245 = weight(_text_:indexierung in 953) [ClassicSimilarity], result of:
      0.10993245 = score(doc=953,freq=8.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.8318544 = fieldWeight in 953, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0546875 = fieldNorm(doc=953)
    0.00585677 = weight(_text_:information in 953) [ClassicSimilarity], result of:
      0.00585677 = score(doc=953,freq=2.0), product of:
        0.04313797 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.024573348 = queryNorm
        0.13576832 = fieldWeight in 953, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.0546875 = fieldNorm(doc=953)
    0.017389767 = weight(_text_:retrieval in 953) [ClassicSimilarity], result of:
      0.017389767 = score(doc=953,freq=2.0), product of:
        0.07433229 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.024573348 = queryNorm
        0.23394634 = fieldWeight in 953, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0546875 = fieldNorm(doc=953)
  0.21428572 = coord(3/14)

Abstract: Die automatische Indexierung von Dokumenten für das Information Retrieval, d. h. die automatische Charakterisierung von Dokumentinhalten mittels Deskriptoren (Schlagwörtern) ist bereits seit über 25 Jahren ein Gebiet theoretischer und experimenteller Forschung. Dagegen wurde erst im Oktober 1985 mit der Anwendung der automatischen Indexierung in der Inputproduktion für ein großes Retrievalsystem begonnen. Es handelt sich um die Indexierung englischer Referatetexte für die Physik-Datenbasis des Informationszentrums Energie, Physik, Mathematik GmbH in Karlsruhe. In dem vorliegenden Buch beschreiben Mitarbeiter der Technischen Hochschule Darmstadt ihre Forschungs- und Entwicklungsarbeiten, die zu dieser Pilotanwendung geführt haben.

Rädler, K.: In Bibliothekskatalogen "googlen" : Integration von Inhaltsverzeichnissen, Volltexten und WEB-Ressourcen in Bibliothekskataloge (2004) 0.03
```
0.02830451 = product of:
  0.09906578 = sum of:
    0.01445804 = weight(_text_:web in 2432) [ClassicSimilarity], result of:
      0.01445804 = score(doc=2432,freq=2.0), product of:
        0.08019538 = queryWeight, product of:
          3.2635105 = idf(docFreq=4597, maxDocs=44218)
          0.024573348 = queryNorm
        0.18028519 = fieldWeight in 2432, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.2635105 = idf(docFreq=4597, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2432)
    0.06800307 = weight(_text_:indexierung in 2432) [ClassicSimilarity], result of:
      0.06800307 = score(doc=2432,freq=6.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.5145765 = fieldWeight in 2432, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2432)
    0.004183407 = weight(_text_:information in 2432) [ClassicSimilarity], result of:
      0.004183407 = score(doc=2432,freq=2.0), product of:
        0.04313797 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.024573348 = queryNorm
        0.09697737 = fieldWeight in 2432, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2432)
    0.012421262 = weight(_text_:retrieval in 2432) [ClassicSimilarity], result of:
      0.012421262 = score(doc=2432,freq=2.0), product of:
        0.07433229 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.024573348 = queryNorm
        0.16710453 = fieldWeight in 2432, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2432)
  0.2857143 = coord(4/14)
```
Abstract

Ausgangslage Die Katalog-Recherchen über Internet, also von außerhalb der Bibliothek, nehmen erwartungsgemäß stark zu bzw. sind mittlerweile die Regel. Damit ist natürlich das Bedürfnis und die Notwendigkeit gewachsen, über den Titel hinaus zusätzliche inhaltliche Informationen zu erhalten, die es erlauben, die Zweckmäßigkeit wesentlich besser abschätzen zu können, eine Bestellung vorzunehmen oder vielleicht auch 50 km in die Bibliothek zu fahren, um ein Buch zu entleihen. Dieses Informationsdefizit wird zunehmend als gravierender Mangel erfahren. Inhaltsverzeichnisse referieren den Inhalt kurz und prägnant. Sie sind die erste Stelle, welche zur Relevanz-Beurteilung herangezogen wird. Fast alle relevanten Terme einer Fachbuchpublikation finden sich bereits dort. Andererseits wird immer deutlicher, dass die dem bibliothekarischen Paradigma entsprechende intellektuelle Indexierung der einzelnen dokumentarischen Einheiten mit den engsten umfassenden dokumentationssprachlichen Termen (Schlagwörter, Klassen) zwar eine notwendige, aber keinesfalls hinreichende Methode darstellt, das teuer erworbene Bibliotheksgut Information für den Benutzer in seiner spezifischen Problemstellung zu aktivieren und als Informationsdienstleistung anbieten zu können. Informationen zu sehr speziellen Fragestellungen, die oft nur in kürzeren Abschnitten (Kapitel) erörtert werden, sind derzeit nur indirekt, mit großem Zeitaufwand und oft überhaupt nicht auffindbar. Sie liegen sozusagen brach. Die Tiefe der intellektuellen Indexierung bis in einzelne inhaltliche Details zu erweitern, ist aus personellen und damit auch finanziellen Gesichtspunkten nicht vertretbar. Bibliotheken fallen deshalb in der Wahrnehmung von Informationssuchenden immer mehr zurück. Die enorme Informationsvielfalt liegt hinter dem Informations- bzw. Recherchehorizont der bibliographischen Aufnahmen im Katalog.

Theme

Semantisches Umfeld in Indexierung u. Retrieval
Scherer, B.: Automatische Indexierung und ihre Anwendung im DFG-Projekt "Gemeinsames Portal für Bibliotheken, Archive und Museen (BAM)" (2003) 0.03
```
0.026188694 = product of:
  0.12221391 = sum of:
    0.10387641 = weight(_text_:indexierung in 4283) [ClassicSimilarity], result of:
      0.10387641 = score(doc=4283,freq=14.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.78602856 = fieldWeight in 4283, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4283)
    0.005916231 = weight(_text_:information in 4283) [ClassicSimilarity], result of:
      0.005916231 = score(doc=4283,freq=4.0), product of:
        0.04313797 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.024573348 = queryNorm
        0.13714671 = fieldWeight in 4283, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4283)
    0.012421262 = weight(_text_:retrieval in 4283) [ClassicSimilarity], result of:
      0.012421262 = score(doc=4283,freq=2.0), product of:
        0.07433229 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.024573348 = queryNorm
        0.16710453 = fieldWeight in 4283, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4283)
  0.21428572 = coord(3/14)
```
Abstract

Automatische Indexierung verzeichnet schon seit einigen Jahren aufgrund steigender Informationsflut ein wachsendes Interesse. Allerdings gibt es immer noch Vorbehalte gegenüber der intellektuellen Indexierung in Bezug auf Qualität und größerem Aufwand der Systemimplementierung bzw. -pflege. Neuere Entwicklungen aus dem Bereich des Wissensmanagements, wie beispielsweise Verfahren aus der Künstlichen Intelligenz, der Informationsextraktion, dem Text Mining bzw. der automatischen Klassifikation sollen die automatische Indexierung aufwerten und verbessern. Damit soll eine intelligentere und mehr inhaltsbasierte Erschließung geleistet werden. In dieser Masterarbeit wird außerhalb der Darstellung von Grundlagen und Verfahren der automatischen Indexierung sowie neueren Entwicklungen auch Möglichkeiten der Evaluation dargestellt. Die mögliche Anwendung der automatischen Indexierung im DFG-ProjektGemeinsames Portal für Bibliotheken, Archive und Museen (BAM)" bilden den Schwerpunkt der Arbeit. Im Portal steht die bibliothekarische Erschließung von Texten im Vordergrund. In einem umfangreichen Test werden drei deutsche, linguistische Systeme mit statistischen Verfahren kombiniert (die aber teilweise im System bereits integriert ist) und evaluiert, allerdings nur auf der Basis der ausgegebenen Indexate. Abschließend kann festgestellt werden, dass die Ergebnisse und damit die Qualität (bezogen auf die Indexate) von intellektueller und automatischer Indexierung noch signifikant unterschiedlich sind. Die Gründe liegen in noch zu lösenden semantischen Problemen bzw, in der Obereinstimmung mit Worten aus einem Thesaurus, die von einem automatischen Indexierungssystem nicht immer nachvollzogen werden kann. Eine Inhaltsanreicherung mit den Indexaten zum Vorteil beim Retrieval kann, je nach System oder auch über die Einbindung durch einen Thesaurus, erreicht werden.

Footnote

Masterarbeit im Studiengang Information Engineering zur Erlagung des Grades eines Master of Science in Information science,

Fuhr, N.: Rankingexperimente mit gewichteter Indexierung (1986) 0.03

0.025217827 = product of:
  0.17652479 = sum of:
    0.1632074 = weight(_text_:indexierung in 2051) [ClassicSimilarity], result of:
      0.1632074 = score(doc=2051,freq=6.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        1.2349837 = fieldWeight in 2051, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.09375 = fieldNorm(doc=2051)
    0.013317398 = product of:
      0.039952192 = sum of:
        0.039952192 = weight(_text_:22 in 2051) [ClassicSimilarity], result of:
          0.039952192 = score(doc=2051,freq=2.0), product of:
            0.08605168 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.024573348 = queryNorm
            0.46428138 = fieldWeight in 2051, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=2051)
      0.33333334 = coord(1/3)
  0.14285715 = coord(2/14)

Abstract: Der Beitrag enthält eine Darstellung zur Frage der Konzeption von Rankingalgorithmen auf Grundlage gewichteter Indexierung mittels statistischer Verfahren.
Date: 14. 6.2015 22:12:56
Source: Automatische Indexierung zwischen Forschung und Anwendung, Hrsg.: G. Lustig

Probst, M.; Mittelbach, J.: Maschinelle Indexierung in der Sacherschließung wissenschaftlicher Bibliotheken (2006) 0.03

0.0251981 = product of:
  0.117591135 = sum of:
    0.088838845 = weight(_text_:indexierung in 1755) [ClassicSimilarity], result of:
      0.088838845 = score(doc=1755,freq=4.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.6722399 = fieldWeight in 1755, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0625 = fieldNorm(doc=1755)
    0.01987402 = weight(_text_:retrieval in 1755) [ClassicSimilarity], result of:
      0.01987402 = score(doc=1755,freq=2.0), product of:
        0.07433229 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.024573348 = queryNorm
        0.26736724 = fieldWeight in 1755, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0625 = fieldNorm(doc=1755)
    0.0088782655 = product of:
      0.026634796 = sum of:
        0.026634796 = weight(_text_:22 in 1755) [ClassicSimilarity], result of:
          0.026634796 = score(doc=1755,freq=2.0), product of:
            0.08605168 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.024573348 = queryNorm
            0.30952093 = fieldWeight in 1755, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=1755)
      0.33333334 = coord(1/3)
  0.21428572 = coord(3/14)

Abstract: Obwohl fast alle größeren Bibliotheken intellektuelle Sacherschließung betreiben, sind elektronische Kataloge für die zielgerichtete sachliche Suche nur eingeschränkt nutzbar. Durch maschinelle Indexierung können ohne nennenswerten personellen Mehraufwand ausreichend große Datenmengen für Informationsretrievalsysteme erzeugt und somit die Auffindbarkeit von Dokumenten erhöht werden. Geeignete Sprachanalysetechniken zur Indextermerzeugung sind bekannt und bieten im Gegensatz zur gebräuchlichen Freitextinvertierung entscheidende Vorteile beim Retrieval. Im Fokus steht die Betrachtung der Vor- und Nachteile der gängigen Indexierungssysteme MILOS und intelligentCAPTURE.
Date: 22. 3.2008 12:35:19

Lustig, G.: Methoden der automatischen Indexierung (1970) 0.02

0.02483148 = product of:
  0.17382035 = sum of:
    0.09422782 = weight(_text_:indexierung in 4999) [ClassicSimilarity], result of:
      0.09422782 = score(doc=4999,freq=2.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.71301806 = fieldWeight in 4999, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.09375 = fieldNorm(doc=4999)
    0.07959252 = weight(_text_:frankfurt in 4999) [ClassicSimilarity], result of:
      0.07959252 = score(doc=4999,freq=4.0), product of:
        0.10213336 = queryWeight, product of:
          4.1562657 = idf(docFreq=1882, maxDocs=44218)
          0.024573348 = queryNorm
        0.77929986 = fieldWeight in 4999, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.1562657 = idf(docFreq=1882, maxDocs=44218)
          0.09375 = fieldNorm(doc=4999)
  0.14285715 = coord(2/14)

Imprint: Frankfurt : DGD
Source: Sprachliche Ansätze im Informations- und Dokumentationsbereich. Referate der Arbeitstagung des Komitees Automation der Dokumentation des DGD am 24.-25.2.1970 in Frankfurt

Panyr, J.: Vektorraum-Modell und Clusteranalyse in Information-Retrieval-Systemen (1987) 0.02

0.023321735 = product of:
  0.10883476 = sum of:
    0.06281855 = weight(_text_:indexierung in 2322) [ClassicSimilarity], result of:
      0.06281855 = score(doc=2322,freq=2.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.47534537 = fieldWeight in 2322, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0625 = fieldNorm(doc=2322)
    0.011593399 = weight(_text_:information in 2322) [ClassicSimilarity], result of:
      0.011593399 = score(doc=2322,freq=6.0), product of:
        0.04313797 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.024573348 = queryNorm
        0.2687516 = fieldWeight in 2322, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.0625 = fieldNorm(doc=2322)
    0.03442281 = weight(_text_:retrieval in 2322) [ClassicSimilarity], result of:
      0.03442281 = score(doc=2322,freq=6.0), product of:
        0.07433229 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.024573348 = queryNorm
        0.46309367 = fieldWeight in 2322, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0625 = fieldNorm(doc=2322)
  0.21428572 = coord(3/14)

Abstract: Ausgehend von theoretischen Indexierungsansätzen wird das klassische Vektorraum-Modell für automatische Indexierung (mit dem Trennschärfen-Modell) erläutert. Das Clustering in Information-Retrieval-Systemem wird als eine natürliche logische Folge aus diesem Modell aufgefaßt und in allen seinen Ausprägungen (d.h. als Dokumenten-, Term- oder Dokumenten- und Termklassifikation) behandelt. Anschließend werden die Suchstrategien in vorklassifizierten Dokumentenbeständen (Clustersuche) detailliert beschrieben. Zum Schluß wird noch die sinnvolle Anwendung der Clusteranalyse in Information-Retrieval-Systemen kurz diskutiert

Panyr, J.: Automatische Indexierung und Klassifikation (1983) 0.02

0.023308197 = product of:
  0.16315737 = sum of:
    0.1256371 = weight(_text_:indexierung in 7692) [ClassicSimilarity], result of:
      0.1256371 = score(doc=7692,freq=8.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.95069075 = fieldWeight in 7692, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0625 = fieldNorm(doc=7692)
    0.03752027 = weight(_text_:frankfurt in 7692) [ClassicSimilarity], result of:
      0.03752027 = score(doc=7692,freq=2.0), product of:
        0.10213336 = queryWeight, product of:
          4.1562657 = idf(docFreq=1882, maxDocs=44218)
          0.024573348 = queryNorm
        0.36736545 = fieldWeight in 7692, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.1562657 = idf(docFreq=1882, maxDocs=44218)
          0.0625 = fieldNorm(doc=7692)
  0.14285715 = coord(2/14)

Abstract: Im Beitrag wird zunächst eine terminologische Klärung und Gliederung für drei Indexierungsmethoden und weitere Begriffe, die Konsistenzprobleme bei intellektueller Indexierung betreffen, unternommen. Zur automatichen Indexierung werden Extraktionsmethoden erläutert und zur Automatischen Klassifikation (Clustering) und Indexierung zwei Anwendungen vorgestellt. Eine enge Kooperation zwischen den Befürwortern der intellektuellen und den Entwicklern von automatischen Indexierungsverfahren wird empfohlen
Imprint: Frankfurt : Indeks

Gödert, W.; Lepsky, K.: Semantische Umfeldsuche im Information Retrieval (1998) 0.02

0.023182198 = product of:
  0.10818359 = sum of:
    0.077733986 = weight(_text_:indexierung in 606) [ClassicSimilarity], result of:
      0.077733986 = score(doc=606,freq=4.0), product of:
        0.13215348 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.024573348 = queryNorm
        0.5882099 = fieldWeight in 606, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0546875 = fieldNorm(doc=606)
    0.00585677 = weight(_text_:information in 606) [ClassicSimilarity], result of:
      0.00585677 = score(doc=606,freq=2.0), product of:
        0.04313797 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.024573348 = queryNorm
        0.13576832 = fieldWeight in 606, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.0546875 = fieldNorm(doc=606)
    0.024592843 = weight(_text_:retrieval in 606) [ClassicSimilarity], result of:
      0.024592843 = score(doc=606,freq=4.0), product of:
        0.07433229 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.024573348 = queryNorm
        0.33085006 = fieldWeight in 606, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0546875 = fieldNorm(doc=606)
  0.21428572 = coord(3/14)

Abstract: Sachliche Suchen in bibliothekarischen Online-Katalogen enden häufig mit unbefriedigenden Ergebnissen. Als eine Ursache dafür kann angesehen werden, daß die Gestaltung des Suchprozesses das semantische Umfeld einer Suchanfrage nicht mit einbezieht, daß in Übertragung der Verhältnisse in konventionellen Katalogen am Paradigma des Wort-Matching zwischen Suchwort und Indexat festgehalten wird. Es wird statt dessen das Konzept einer semantischen Umfeldsuche entwickelt und gezeigt, welche Rolle die Verwendung strukturierten Vokabulars dafür spielen kann. Insbesondere wird dargestellt, welche Möglichkeiten Verfahren der wörterbuchgestützten maschinellen Indexierung in diesem Zusammenhang spielen können. Die Ausführungen werden durch Beispiele illustriert
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Search (346 results, page 1 of 18)

Authors

Years

Languages

Types

Themes

Subjects

Classifications