Search (174 results, page 1 of 9)

Rijsbergen, C.J. van: ¬A fast hierarchic clustering algorithm (1970) 0.06

0.060298506 = product of:
  0.24119402 = sum of:
    0.24119402 = weight(_text_:van in 3300) [ClassicSimilarity], result of:
      0.24119402 = score(doc=3300,freq=2.0), product of:
        0.24466558 = queryWeight, product of:
          5.5765896 = idf(docFreq=454, maxDocs=44218)
          0.043873694 = queryNorm
        0.98581105 = fieldWeight in 3300, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.5765896 = idf(docFreq=454, maxDocs=44218)
          0.125 = fieldNorm(doc=3300)
  0.25 = coord(1/4)

Jardine, N.; Rijsbergen, C.J. van: ¬The use of hierarchic clustering in information retrieval (1971) 0.06

0.060298506 = product of:
  0.24119402 = sum of:
    0.24119402 = weight(_text_:van in 5170) [ClassicSimilarity], result of:
      0.24119402 = score(doc=5170,freq=2.0), product of:
        0.24466558 = queryWeight, product of:
          5.5765896 = idf(docFreq=454, maxDocs=44218)
          0.043873694 = queryNorm
        0.98581105 = fieldWeight in 5170, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.5765896 = idf(docFreq=454, maxDocs=44218)
          0.125 = fieldNorm(doc=5170)
  0.25 = coord(1/4)

Konings, E.; Gramsbergen, E.: Automatische onderwerpsondexering van een bibliotheekscatalogus : Ervaringen van de Bibliotheek TU Delft (1999) 0.06

0.060298506 = product of:
  0.24119402 = sum of:
    0.24119402 = weight(_text_:van in 3263) [ClassicSimilarity], result of:
      0.24119402 = score(doc=3263,freq=8.0), product of:
        0.24466558 = queryWeight, product of:
          5.5765896 = idf(docFreq=454, maxDocs=44218)
          0.043873694 = queryNorm
        0.98581105 = fieldWeight in 3263, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          5.5765896 = idf(docFreq=454, maxDocs=44218)
          0.0625 = fieldNorm(doc=3263)
  0.25 = coord(1/4)

Abstract: Geautomatiseerde indexeringsmethoden blijken veelal moeilijk toepasbaar op tekstarme systemen als bibliotheekcatalogi, zo werd de Bibliotheek van de Technische Universiteit Delft na inventarisatie en onderzoek duidelijk. Kees Konings en Egbert Gramsbergen doen verslag van hun bevindingen.

Lepsky, K.; Vorhauer, J.: Lingo - ein open source System für die Automatische Indexierung deutschsprachiger Dokumente (2006) 0.06

0.059282556 = product of:
  0.11856511 = sum of:
    0.039153386 = weight(_text_:j in 3581) [ClassicSimilarity], result of:
      0.039153386 = score(doc=3581,freq=2.0), product of:
        0.1394085 = queryWeight, product of:
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.043873694 = queryNorm
        0.28085366 = fieldWeight in 3581, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.0625 = fieldNorm(doc=3581)
    0.07941173 = sum of:
      0.031857494 = weight(_text_:den in 3581) [ClassicSimilarity], result of:
        0.031857494 = score(doc=3581,freq=2.0), product of:
          0.12575069 = queryWeight, product of:
            2.866198 = idf(docFreq=6840, maxDocs=44218)
            0.043873694 = queryNorm
          0.25333852 = fieldWeight in 3581, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            2.866198 = idf(docFreq=6840, maxDocs=44218)
            0.0625 = fieldNorm(doc=3581)
      0.04755424 = weight(_text_:22 in 3581) [ClassicSimilarity], result of:
        0.04755424 = score(doc=3581,freq=2.0), product of:
          0.1536382 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.043873694 = queryNorm
          0.30952093 = fieldWeight in 3581, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.0625 = fieldNorm(doc=3581)
  0.5 = coord(2/4)

Abstract: Lingo ist ein frei verfügbares System (open source) zur automatischen Indexierung der deutschen Sprache. Bei der Entwicklung von lingo standen hohe Konfigurierbarkeit und Flexibilität des Systems für unterschiedliche Einsatzmöglichkeiten im Vordergrund. Der Beitrag zeigt den Nutzen einer linguistisch basierten automatischen Indexierung für das Information Retrieval auf. Die für eine Retrievalverbesserung zur Verfügung stehende linguistische Funktionalität von lingo wird vorgestellt und an Beispielen erläutert: Grundformerkennung, Kompositumerkennung bzw. Kompositumzerlegung, Wortrelationierung, lexikalische und algorithmische Mehrwortgruppenerkennung, OCR-Fehlerkorrektur. Der offene Systemaufbau von lingo wird beschrieben, mögliche Einsatzszenarien und Anwendungsgrenzen werden benannt.
Date: 24. 3.2006 12:22:02

Lepsky, K.: Vom OPAC zum Hyperkatalog : Daten und Indexierung (1996) 0.05

0.053475 = product of:
  0.10695 = sum of:
    0.08305688 = weight(_text_:j in 7726) [ClassicSimilarity], result of:
      0.08305688 = score(doc=7726,freq=4.0), product of:
        0.1394085 = queryWeight, product of:
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.043873694 = queryNorm
        0.5957806 = fieldWeight in 7726, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.09375 = fieldNorm(doc=7726)
    0.02389312 = product of:
      0.04778624 = sum of:
        0.04778624 = weight(_text_:den in 7726) [ClassicSimilarity], result of:
          0.04778624 = score(doc=7726,freq=2.0), product of:
            0.12575069 = queryWeight, product of:
              2.866198 = idf(docFreq=6840, maxDocs=44218)
              0.043873694 = queryNorm
            0.38000777 = fieldWeight in 7726, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.866198 = idf(docFreq=6840, maxDocs=44218)
              0.09375 = fieldNorm(doc=7726)
      0.5 = coord(1/2)
  0.5 = coord(2/4)

Source: Erschließen, Suchen, Finden: Vorträge aus den bibliothekarischen Arbeitsgruppen der 19. und 20. Jahrestagungen (Basel 1995 / Freiburg 1996) der Gesellschaft für Klassifikation. Hrsg.: H.-J. Hermes u. H.-J. Wätjen

Fuhr, N.; Knorz, G.: Retrieval test evaluation of a rule based automatic indexing (AIR/PHYS) (1984) 0.05

0.04522388 = product of:
  0.18089552 = sum of:
    0.18089552 = weight(_text_:van in 2321) [ClassicSimilarity], result of:
      0.18089552 = score(doc=2321,freq=2.0), product of:
        0.24466558 = queryWeight, product of:
          5.5765896 = idf(docFreq=454, maxDocs=44218)
          0.043873694 = queryNorm
        0.7393583 = fieldWeight in 2321, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.5765896 = idf(docFreq=454, maxDocs=44218)
          0.09375 = fieldNorm(doc=2321)
  0.25 = coord(1/4)

Source: Research and development in information retrieval. Proc. of the 3rd joint BCS and ACM symp., Cambridge, 2.-6.7.1984. Ed.: C.J. van Rijsbergen

Lepsky, K.: Automatische Indexierung in der Inhaltserschließung (1998) 0.05

0.04522388 = product of:
  0.18089552 = sum of:
    0.18089552 = weight(_text_:van in 1283) [ClassicSimilarity], result of:
      0.18089552 = score(doc=1283,freq=2.0), product of:
        0.24466558 = queryWeight, product of:
          5.5765896 = idf(docFreq=454, maxDocs=44218)
          0.043873694 = queryNorm
        0.7393583 = fieldWeight in 1283, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.5765896 = idf(docFreq=454, maxDocs=44218)
          0.09375 = fieldNorm(doc=1283)
  0.25 = coord(1/4)

Source: 7e dag van het document, 19 & 20 mei 1998. Congrescentrum De Reehorst, Ede. Red.: J.R. Creutzberg

Spitters, M.J.: Adjust : automatische thesauriele ontsluiting van grote hoeveelheden krantenartikelen (1999) 0.05

0.04522388 = product of:
  0.18089552 = sum of:
    0.18089552 = weight(_text_:van in 3938) [ClassicSimilarity], result of:
      0.18089552 = score(doc=3938,freq=2.0), product of:
        0.24466558 = queryWeight, product of:
          5.5765896 = idf(docFreq=454, maxDocs=44218)
          0.043873694 = queryNorm
        0.7393583 = fieldWeight in 3938, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.5765896 = idf(docFreq=454, maxDocs=44218)
          0.09375 = fieldNorm(doc=3938)
  0.25 = coord(1/4)

Maas, J.: Anforderungsanalyse für den Einsatz eines (semi)automatischen Indexierungsverfahrens in der Textdokumentation des ZDF (2002) 0.04

0.041311603 = product of:
  0.082623206 = sum of:
    0.058730084 = weight(_text_:j in 1785) [ClassicSimilarity], result of:
      0.058730084 = score(doc=1785,freq=2.0), product of:
        0.1394085 = queryWeight, product of:
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.043873694 = queryNorm
        0.4212805 = fieldWeight in 1785, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.09375 = fieldNorm(doc=1785)
    0.02389312 = product of:
      0.04778624 = sum of:
        0.04778624 = weight(_text_:den in 1785) [ClassicSimilarity], result of:
          0.04778624 = score(doc=1785,freq=2.0), product of:
            0.12575069 = queryWeight, product of:
              2.866198 = idf(docFreq=6840, maxDocs=44218)
              0.043873694 = queryNorm
            0.38000777 = fieldWeight in 1785, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.866198 = idf(docFreq=6840, maxDocs=44218)
              0.09375 = fieldNorm(doc=1785)
      0.5 = coord(1/2)
  0.5 = coord(2/4)

Kutschekmanesch, S.; Lutes, B.; Moelle, K.; Thiel, U.; Tzeras, K.: Automated multilingual indexing : a synthesis of rule-based and thesaurus-based methods (1998) 0.04

0.039331567 = product of:
  0.07866313 = sum of:
    0.04894173 = weight(_text_:j in 4157) [ClassicSimilarity], result of:
      0.04894173 = score(doc=4157,freq=2.0), product of:
        0.1394085 = queryWeight, product of:
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.043873694 = queryNorm
        0.35106707 = fieldWeight in 4157, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.078125 = fieldNorm(doc=4157)
    0.0297214 = product of:
      0.0594428 = sum of:
        0.0594428 = weight(_text_:22 in 4157) [ClassicSimilarity], result of:
          0.0594428 = score(doc=4157,freq=2.0), product of:
            0.1536382 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.043873694 = queryNorm
            0.38690117 = fieldWeight in 4157, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.078125 = fieldNorm(doc=4157)
      0.5 = coord(1/2)
  0.5 = coord(2/4)

Source: Information und Märkte: 50. Deutscher Dokumentartag 1998, Kongreß der Deutschen Gesellschaft für Dokumentation e.V. (DGD), Rheinische Friedrich-Wilhelms-Universität Bonn, 22.-24. September 1998. Hrsg. von Marlies Ockenfeld u. Gerhard J. Mantwill

Stankovic, R. et al.: Indexing of textual databases based on lexical resources : a case study for Serbian (2016) 0.04

0.039331567 = product of:
  0.07866313 = sum of:
    0.04894173 = weight(_text_:j in 2759) [ClassicSimilarity], result of:
      0.04894173 = score(doc=2759,freq=2.0), product of:
        0.1394085 = queryWeight, product of:
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.043873694 = queryNorm
        0.35106707 = fieldWeight in 2759, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.078125 = fieldNorm(doc=2759)
    0.0297214 = product of:
      0.0594428 = sum of:
        0.0594428 = weight(_text_:22 in 2759) [ClassicSimilarity], result of:
          0.0594428 = score(doc=2759,freq=2.0), product of:
            0.1536382 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.043873694 = queryNorm
            0.38690117 = fieldWeight in 2759, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.078125 = fieldNorm(doc=2759)
      0.5 = coord(1/2)
  0.5 = coord(2/4)

Date: 1. 2.2016 18:25:22
Source: Semantic keyword-based search on structured data sources: First COST Action IC1302 International KEYSTONE Conference, IKC 2015, Coimbra, Portugal, September 8-9, 2015. Revised Selected Papers. Eds.: J. Cardoso et al

7e Dag van het Document : 19 & 20 mei 1998, Congrescentrum De Reehorst, Ede ; proceedings (1998) 0.04

0.037686568 = product of:
  0.15074627 = sum of:
    0.15074627 = weight(_text_:van in 2427) [ClassicSimilarity], result of:
      0.15074627 = score(doc=2427,freq=2.0), product of:
        0.24466558 = queryWeight, product of:
          5.5765896 = idf(docFreq=454, maxDocs=44218)
          0.043873694 = queryNorm
        0.6161319 = fieldWeight in 2427, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.5765896 = idf(docFreq=454, maxDocs=44218)
          0.078125 = fieldNorm(doc=2427)
  0.25 = coord(1/4)

Rapke, K.: Automatische Indexierung von Volltexten für die Gruner+Jahr Pressedatenbank (2001) 0.04
```
0.035338324 = product of:
  0.07067665 = sum of:
    0.058730084 = weight(_text_:j in 6386) [ClassicSimilarity], result of:
      0.058730084 = score(doc=6386,freq=8.0), product of:
        0.1394085 = queryWeight, product of:
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.043873694 = queryNorm
        0.4212805 = fieldWeight in 6386, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.046875 = fieldNorm(doc=6386)
    0.01194656 = product of:
      0.02389312 = sum of:
        0.02389312 = weight(_text_:den in 6386) [ClassicSimilarity], result of:
          0.02389312 = score(doc=6386,freq=2.0), product of:
            0.12575069 = queryWeight, product of:
              2.866198 = idf(docFreq=6840, maxDocs=44218)
              0.043873694 = queryNorm
            0.19000389 = fieldWeight in 6386, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.866198 = idf(docFreq=6840, maxDocs=44218)
              0.046875 = fieldNorm(doc=6386)
      0.5 = coord(1/2)
  0.5 = coord(2/4)
```
Abstract

Retrieval Tests sind die anerkannteste Methode, um neue Verfahren der Inhaltserschließung gegenüber traditionellen Verfahren zu rechtfertigen. Im Rahmen einer Diplomarbeit wurden zwei grundsätzlich unterschiedliche Systeme der automatischen inhaltlichen Erschließung anhand der Pressedatenbank des Verlagshauses Gruner + Jahr (G+J) getestet und evaluiert. Untersucht wurde dabei natürlichsprachliches Retrieval im Vergleich zu Booleschem Retrieval. Bei den beiden Systemen handelt es sich zum einen um Autonomy von Autonomy Inc. und DocCat, das von IBM an die Datenbankstruktur der G+J Pressedatenbank angepasst wurde. Ersteres ist ein auf natürlichsprachlichem Retrieval basierendes, probabilistisches System. DocCat demgegenüber basiert auf Booleschem Retrieval und ist ein lernendes System, das auf Grund einer intellektuell erstellten Trainingsvorlage indexiert. Methodisch geht die Evaluation vom realen Anwendungskontext der Textdokumentation von G+J aus. Die Tests werden sowohl unter statistischen wie auch qualitativen Gesichtspunkten bewertet. Ein Ergebnis der Tests ist, dass DocCat einige Mängel gegenüber der intellektuellen Inhaltserschließung aufweist, die noch behoben werden müssen, während das natürlichsprachliche Retrieval von Autonomy in diesem Rahmen und für die speziellen Anforderungen der G+J Textdokumentation so nicht einsetzbar ist

Tsujii, J.-I.: Automatic acquisition of semantic collocation from corpora (1995) 0.03

0.031465255 = product of:
  0.06293051 = sum of:
    0.039153386 = weight(_text_:j in 4709) [ClassicSimilarity], result of:
      0.039153386 = score(doc=4709,freq=2.0), product of:
        0.1394085 = queryWeight, product of:
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.043873694 = queryNorm
        0.28085366 = fieldWeight in 4709, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.0625 = fieldNorm(doc=4709)
    0.02377712 = product of:
      0.04755424 = sum of:
        0.04755424 = weight(_text_:22 in 4709) [ClassicSimilarity], result of:
          0.04755424 = score(doc=4709,freq=2.0), product of:
            0.1536382 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.043873694 = queryNorm
            0.30952093 = fieldWeight in 4709, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=4709)
      0.5 = coord(1/2)
  0.5 = coord(2/4)

Date: 31. 7.1996 9:22:19

Probst, M.; Mittelbach, J.: Maschinelle Indexierung in der Sacherschließung wissenschaftlicher Bibliotheken (2006) 0.03

0.031465255 = product of:
  0.06293051 = sum of:
    0.039153386 = weight(_text_:j in 1755) [ClassicSimilarity], result of:
      0.039153386 = score(doc=1755,freq=2.0), product of:
        0.1394085 = queryWeight, product of:
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.043873694 = queryNorm
        0.28085366 = fieldWeight in 1755, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.0625 = fieldNorm(doc=1755)
    0.02377712 = product of:
      0.04755424 = sum of:
        0.04755424 = weight(_text_:22 in 1755) [ClassicSimilarity], result of:
          0.04755424 = score(doc=1755,freq=2.0), product of:
            0.1536382 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.043873694 = queryNorm
            0.30952093 = fieldWeight in 1755, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=1755)
      0.5 = coord(1/2)
  0.5 = coord(2/4)

Date: 22. 3.2008 12:35:19

Gaese, V.: "Automatische Klassifikation von Presseartikeln in der Gruner + Jahr Dokumentation" (2003) 0.03

0.031404153 = product of:
  0.062808305 = sum of:
    0.050861742 = weight(_text_:j in 1915) [ClassicSimilarity], result of:
      0.050861742 = score(doc=1915,freq=6.0), product of:
        0.1394085 = queryWeight, product of:
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.043873694 = queryNorm
        0.3648396 = fieldWeight in 1915, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.046875 = fieldNorm(doc=1915)
    0.01194656 = product of:
      0.02389312 = sum of:
        0.02389312 = weight(_text_:den in 1915) [ClassicSimilarity], result of:
          0.02389312 = score(doc=1915,freq=2.0), product of:
            0.12575069 = queryWeight, product of:
              2.866198 = idf(docFreq=6840, maxDocs=44218)
              0.043873694 = queryNorm
            0.19000389 = fieldWeight in 1915, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.866198 = idf(docFreq=6840, maxDocs=44218)
              0.046875 = fieldNorm(doc=1915)
      0.5 = coord(1/2)
  0.5 = coord(2/4)

Abstract: Das Klassifizieren von Texten, auch Indexieren, inhaltliches Erschließen oder verschlagworten genannt, gehört seit jeher zu den zwar notwendigen aber sehr aufwändigen Aufgaben von Archiven bzw. Dokumentationen. Ihre unterschiedlichen Zwecke bzw. Anforderungen sind sicher ein Grund dafür, dass es fast ebenso viele Erschließungsinventare, Thesauri oder Schlagwortverzeichnisse wie Dokumentationen gibt. Im folgenden werden Klassifizierung, Indexierung, Erschließung und Verschlagwortung synonym verwendet. In der G+J Dokumentation arbeiten heute ca. 20 Dokumentare an Auswahl und Erschließung von täglich etwa 1.100 Artikeln aus insgesamt ca. 210 Titeln. In der G+J Pressedatenbank sind aktuell ca. 7 Mio Artikel gespeichert, gut 2 Mio als digitaler Volltext (OCR/Satzdaten). Archiviert sind nur Artikel, für die die G+J Dokumentation die entsprechenden Rechte hat.

Panyr, J.: Automatische Indexierung und Klassifikation (1983) 0.03

0.030840017 = product of:
  0.061680034 = sum of:
    0.039153386 = weight(_text_:j in 7692) [ClassicSimilarity], result of:
      0.039153386 = score(doc=7692,freq=2.0), product of:
        0.1394085 = queryWeight, product of:
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.043873694 = queryNorm
        0.28085366 = fieldWeight in 7692, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.0625 = fieldNorm(doc=7692)
    0.02252665 = product of:
      0.0450533 = sum of:
        0.0450533 = weight(_text_:den in 7692) [ClassicSimilarity], result of:
          0.0450533 = score(doc=7692,freq=4.0), product of:
            0.12575069 = queryWeight, product of:
              2.866198 = idf(docFreq=6840, maxDocs=44218)
              0.043873694 = queryNorm
            0.35827476 = fieldWeight in 7692, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              2.866198 = idf(docFreq=6840, maxDocs=44218)
              0.0625 = fieldNorm(doc=7692)
      0.5 = coord(1/2)
  0.5 = coord(2/4)

Abstract: Im Beitrag wird zunächst eine terminologische Klärung und Gliederung für drei Indexierungsmethoden und weitere Begriffe, die Konsistenzprobleme bei intellektueller Indexierung betreffen, unternommen. Zur automatichen Indexierung werden Extraktionsmethoden erläutert und zur Automatischen Klassifikation (Clustering) und Indexierung zwei Anwendungen vorgestellt. Eine enge Kooperation zwischen den Befürwortern der intellektuellen und den Entwicklern von automatischen Indexierungsverfahren wird empfohlen

Rapke, K.: Automatische Indexierung von Volltexten für die Gruner+Jahr Pressedatenbank (2001) 0.03
```
0.029448599 = product of:
  0.058897197 = sum of:
    0.04894173 = weight(_text_:j in 5863) [ClassicSimilarity], result of:
      0.04894173 = score(doc=5863,freq=8.0), product of:
        0.1394085 = queryWeight, product of:
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.043873694 = queryNorm
        0.35106707 = fieldWeight in 5863, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5863)
    0.009955467 = product of:
      0.019910933 = sum of:
        0.019910933 = weight(_text_:den in 5863) [ClassicSimilarity], result of:
          0.019910933 = score(doc=5863,freq=2.0), product of:
            0.12575069 = queryWeight, product of:
              2.866198 = idf(docFreq=6840, maxDocs=44218)
              0.043873694 = queryNorm
            0.15833658 = fieldWeight in 5863, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.866198 = idf(docFreq=6840, maxDocs=44218)
              0.0390625 = fieldNorm(doc=5863)
      0.5 = coord(1/2)
  0.5 = coord(2/4)
```
Abstract

Retrievaltests sind die anerkannteste Methode, um neue Verfahren der Inhaltserschließung gegenüber traditionellen Verfahren zu rechtfertigen. Im Rahmen einer Diplomarbeit wurden zwei grundsätzlich unterschiedliche Systeme der automatischen inhaltlichen Erschließung anhand der Pressedatenbank des Verlagshauses Gruner + Jahr (G+J) getestet und evaluiert. Untersucht wurde dabei natürlichsprachliches Retrieval im Vergleich zu Booleschem Retrieval. Bei den beiden Systemen handelt es sich zum einen um Autonomy von Autonomy Inc. und DocCat, das von IBM an die Datenbankstruktur der G+J Pressedatenbank angepasst wurde. Ersteres ist ein auf natürlichsprachlichem Retrieval basierendes, probabilistisches System. DocCat demgegenüber basiert auf Booleschem Retrieval und ist ein lernendes System, das aufgrund einer intellektuell erstellten Trainingsvorlage indexiert. Methodisch geht die Evaluation vom realen Anwendungskontext der Textdokumentation von G+J aus. Die Tests werden sowohl unter statistischen wie auch qualitativen Gesichtspunkten bewertet. Ein Ergebnis der Tests ist, dass DocCat einige Mängel gegenüber der intellektuellen Inhaltserschließung aufweist, die noch behoben werden müssen, während das natürlichsprachliche Retrieval von Autonomy in diesem Rahmen und für die speziellen Anforderungen der G+J Textdokumentation so nicht einsetzbar ist
Oberhauser, O.; Labner, J.: OPAC-Erweiterung durch automatische Indexierung : Empirische Untersuchung mit Daten aus dem Österreichischen Verbundkatalog (2002) 0.03
```
0.025028545 = product of:
  0.05005709 = sum of:
    0.029365042 = weight(_text_:j in 883) [ClassicSimilarity], result of:
      0.029365042 = score(doc=883,freq=2.0), product of:
        0.1394085 = queryWeight, product of:
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.043873694 = queryNorm
        0.21064025 = fieldWeight in 883, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.046875 = fieldNorm(doc=883)
    0.020692049 = product of:
      0.041384097 = sum of:
        0.041384097 = weight(_text_:den in 883) [ClassicSimilarity], result of:
          0.041384097 = score(doc=883,freq=6.0), product of:
            0.12575069 = queryWeight, product of:
              2.866198 = idf(docFreq=6840, maxDocs=44218)
              0.043873694 = queryNorm
            0.32909638 = fieldWeight in 883, product of:
              2.4494898 = tf(freq=6.0), with freq of:
                6.0 = termFreq=6.0
              2.866198 = idf(docFreq=6840, maxDocs=44218)
              0.046875 = fieldNorm(doc=883)
      0.5 = coord(1/2)
  0.5 = coord(2/4)
```
Abstract

In Anlehnung an die in den neunziger Jahren durchgeführten Erschließungsprojekte MILOS I und MILOS II, die die Eignung eines Verfahrens zur automatischen Indexierung für Bibliothekskataloge zum Thema hatten, wurde eine empirische Untersuchung anhand einer repräsentativen Stichprobe von Titelsätzen aus dem Österreichischen Verbundkatalog durchgeführt. Ziel war die Prüfung und Bewertung der Einsatzmöglichkeit dieses Verfahrens in den Online-Katalogen des Verbundes. Der Realsituation der OPAC-Benutzung gemäß wurde ausschließlich die Auswirkung auf den automatisch generierten Begriffen angereicherten Basic Index ("Alle Felder") untersucht. Dazu wurden 100 Suchanfragen zunächst im ursprünglichen Basic Index und sodann im angereicherten Basic Index in einem OPAC unter Aleph 500 durchgeführt. Die Tests erbrachten einen Zuwachs an relevanten Treffern bei nur leichten Verlusten an Precision, eine Reduktion der Nulltreffer-Ergebnisse sowie Aufschlüsse über die Auswirkung einer vorhandenen verbalen Sacherschließung.
Kempf, A.O.: Automatische Inhaltserschließung in der Fachinformation (2013) 0.02
```
0.02442834 = product of:
  0.04885668 = sum of:
    0.024470866 = weight(_text_:j in 905) [ClassicSimilarity], result of:
      0.024470866 = score(doc=905,freq=2.0), product of:
        0.1394085 = queryWeight, product of:
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.043873694 = queryNorm
        0.17553353 = fieldWeight in 905, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.1774964 = idf(docFreq=5010, maxDocs=44218)
          0.0390625 = fieldNorm(doc=905)
    0.024385814 = product of:
      0.048771627 = sum of:
        0.048771627 = weight(_text_:den in 905) [ClassicSimilarity], result of:
          0.048771627 = score(doc=905,freq=12.0), product of:
            0.12575069 = queryWeight, product of:
              2.866198 = idf(docFreq=6840, maxDocs=44218)
              0.043873694 = queryNorm
            0.38784382 = fieldWeight in 905, product of:
              3.4641016 = tf(freq=12.0), with freq of:
                12.0 = termFreq=12.0
              2.866198 = idf(docFreq=6840, maxDocs=44218)
              0.0390625 = fieldNorm(doc=905)
      0.5 = coord(1/2)
  0.5 = coord(2/4)
```
Abstract

Der Artikel basiert auf einer Masterarbeit mit dem Titel "Automatische Indexierung in der sozialwissenschaftlichen Fachinformation. Eine Evaluationsstudie zur maschinellen Erschließung für die Datenbank SOLIS" (Kempf 2012), die im Rahmen des Aufbaustudiengangs Bibliotheks- und Informationswissenschaft an der Humboldt- Universität zu Berlin am Lehrstuhl Information Retrieval verfasst wurde. Auf der Grundlage des Schalenmodells zur Inhaltserschließung in der Fachinformation stellt der Artikel Evaluationsergebnisse eines automatischen Erschließungsverfahrens für den Einsatz in der sozialwissenschaftlichen Fachinformation vor. Ausgehend von dem von Krause beschriebenen Anwendungsszenario, wonach SOLIS-Datenbestände (Sozialwissenschaftliches Literaturinformationssystem) von geringerer Relevanz automatisch erschlossen werden sollten, wurden auf dieser Dokumentgrundlage zwei Testreihen mit der Indexierungssoftware MindServer der Firma Recommind durchgeführt. Neben den Auswirkungen allgemeiner Systemeinstellungen in der ersten Testreihe wurde in der zweiten Testreihe die Indexierungsleistung der Software für die Rand- und die Kernbereiche der Literaturdatenbank miteinander verglichen. Für letztere Testreihe wurden für beide Bereiche der Datenbank spezifische Versionen der Indexierungssoftware aufgebaut, die anhand von Dokumentkorpora aus den entsprechenden Bereichen trainiert wurden. Die Ergebnisse der Evaluation, die auf der Grundlage intellektuell generierter Vergleichsdaten erfolgt, weisen auf Unterschiede in der Indexierungsleistung zwischen Rand- und Kernbereichen hin, die einerseits gegen den Einsatz automatischer Indexierungsverfahren in den Randbereichen sprechen. Andererseits deutet sich an, dass sich die Indexierungsresultate durch den Aufbau fachteilgebietsspezifischer Trainingsmengen verbessern lassen.

Content

Vgl.: http://www.degruyter.com/view/j/iwp.2013.64.issue-2-3/iwp-2013-0011/iwp-2013-0011.xml?format=INT.

Search (174 results, page 1 of 9)

Authors

Years

Languages

Types

Themes

Subjects

Classifications