Search (6 results, page 1 of 1)

Scherer, B.: Automatische Indexierung und ihre Anwendung im DFG-Projekt "Gemeinsames Portal für Bibliotheken, Archive und Museen (BAM)" (2003) 0.01
```
0.008376329 = product of:
  0.033505317 = sum of:
    0.033505317 = product of:
      0.06701063 = sum of:
        0.06701063 = weight(_text_:intelligenz in 4283) [ClassicSimilarity], result of:
          0.06701063 = score(doc=4283,freq=2.0), product of:
            0.21362439 = queryWeight, product of:
              5.678294 = idf(docFreq=410, maxDocs=44218)
              0.037621226 = queryNorm
            0.31368437 = fieldWeight in 4283, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.678294 = idf(docFreq=410, maxDocs=44218)
              0.0390625 = fieldNorm(doc=4283)
      0.5 = coord(1/2)
  0.25 = coord(1/4)
```
Abstract

Automatische Indexierung verzeichnet schon seit einigen Jahren aufgrund steigender Informationsflut ein wachsendes Interesse. Allerdings gibt es immer noch Vorbehalte gegenüber der intellektuellen Indexierung in Bezug auf Qualität und größerem Aufwand der Systemimplementierung bzw. -pflege. Neuere Entwicklungen aus dem Bereich des Wissensmanagements, wie beispielsweise Verfahren aus der Künstlichen Intelligenz, der Informationsextraktion, dem Text Mining bzw. der automatischen Klassifikation sollen die automatische Indexierung aufwerten und verbessern. Damit soll eine intelligentere und mehr inhaltsbasierte Erschließung geleistet werden. In dieser Masterarbeit wird außerhalb der Darstellung von Grundlagen und Verfahren der automatischen Indexierung sowie neueren Entwicklungen auch Möglichkeiten der Evaluation dargestellt. Die mögliche Anwendung der automatischen Indexierung im DFG-ProjektGemeinsames Portal für Bibliotheken, Archive und Museen (BAM)" bilden den Schwerpunkt der Arbeit. Im Portal steht die bibliothekarische Erschließung von Texten im Vordergrund. In einem umfangreichen Test werden drei deutsche, linguistische Systeme mit statistischen Verfahren kombiniert (die aber teilweise im System bereits integriert ist) und evaluiert, allerdings nur auf der Basis der ausgegebenen Indexate. Abschließend kann festgestellt werden, dass die Ergebnisse und damit die Qualität (bezogen auf die Indexate) von intellektueller und automatischer Indexierung noch signifikant unterschiedlich sind. Die Gründe liegen in noch zu lösenden semantischen Problemen bzw, in der Obereinstimmung mit Worten aus einem Thesaurus, die von einem automatischen Indexierungssystem nicht immer nachvollzogen werden kann. Eine Inhaltsanreicherung mit den Indexaten zum Vorteil beim Retrieval kann, je nach System oder auch über die Einbindung durch einen Thesaurus, erreicht werden.

Klinger, K.-H.: Automatische Inhaltserschließung einer Volltextdatenbank : Machbarkeitsstudie am Beispiel der FAZ (1994) 0.01

0.007062511 = product of:
  0.028250044 = sum of:
    0.028250044 = product of:
      0.08475013 = sum of:
        0.08475013 = weight(_text_:k in 2766) [ClassicSimilarity], result of:
          0.08475013 = score(doc=2766,freq=2.0), product of:
            0.13429943 = queryWeight, product of:
              3.569778 = idf(docFreq=3384, maxDocs=44218)
              0.037621226 = queryNorm
            0.63105357 = fieldWeight in 2766, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.569778 = idf(docFreq=3384, maxDocs=44218)
              0.125 = fieldNorm(doc=2766)
      0.33333334 = coord(1/3)
  0.25 = coord(1/4)

Glaesener, L.: Automatisches Indexieren einer informationswissenschaftlichen Datenbank mit Mehrwortgruppen (2012) 0.01

0.0050971564 = product of:
  0.020388626 = sum of:
    0.020388626 = product of:
      0.04077725 = sum of:
        0.04077725 = weight(_text_:22 in 401) [ClassicSimilarity], result of:
          0.04077725 = score(doc=401,freq=2.0), product of:
            0.13174312 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.037621226 = queryNorm
            0.30952093 = fieldWeight in 401, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=401)
      0.5 = coord(1/2)
  0.25 = coord(1/4)

Date: 11. 9.2012 19:43:22

Lepsky, K.: Maschinelle Indexierung von Titelaufnahmen zur Verbesserung der sachlichen Erschließung in Online-Publikumskatalogen (1994) 0.00

0.0044140695 = product of:
  0.017656278 = sum of:
    0.017656278 = product of:
      0.05296883 = sum of:
        0.05296883 = weight(_text_:k in 7064) [ClassicSimilarity], result of:
          0.05296883 = score(doc=7064,freq=2.0), product of:
            0.13429943 = queryWeight, product of:
              3.569778 = idf(docFreq=3384, maxDocs=44218)
              0.037621226 = queryNorm
            0.39440846 = fieldWeight in 7064, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.569778 = idf(docFreq=3384, maxDocs=44218)
              0.078125 = fieldNorm(doc=7064)
      0.33333334 = coord(1/3)
  0.25 = coord(1/4)

Lorenz, S.: Konzeption und prototypische Realisierung einer begriffsbasierten Texterschließung (2006) 0.00

0.0038228673 = product of:
  0.015291469 = sum of:
    0.015291469 = product of:
      0.030582938 = sum of:
        0.030582938 = weight(_text_:22 in 1746) [ClassicSimilarity], result of:
          0.030582938 = score(doc=1746,freq=2.0), product of:
            0.13174312 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.037621226 = queryNorm
            0.23214069 = fieldWeight in 1746, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=1746)
      0.5 = coord(1/2)
  0.25 = coord(1/4)

Date: 22. 3.2015 9:17:30

Grün, S.: Mehrwortbegriffe und Latent Semantic Analysis : Bewertung automatisch extrahierter Mehrwortgruppen mit LSA (2017) 0.00
```
0.0022070347 = product of:
  0.008828139 = sum of:
    0.008828139 = product of:
      0.026484415 = sum of:
        0.026484415 = weight(_text_:k in 3954) [ClassicSimilarity], result of:
          0.026484415 = score(doc=3954,freq=2.0), product of:
            0.13429943 = queryWeight, product of:
              3.569778 = idf(docFreq=3384, maxDocs=44218)
              0.037621226 = queryNorm
            0.19720423 = fieldWeight in 3954, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.569778 = idf(docFreq=3384, maxDocs=44218)
              0.0390625 = fieldNorm(doc=3954)
      0.33333334 = coord(1/3)
  0.25 = coord(1/4)
```
Abstract

Die vorliegende Studie untersucht das Potenzial von Mehrwortbegriffen für das Information Retrieval. Zielsetzung der Arbeit ist es, intellektuell positiv bewertete Kandidaten mithilfe des Latent Semantic Analysis (LSA) Verfahren höher zu gewichten, als negativ bewertete Kandidaten. Die positiven Kandidaten sollen demnach bei einem Ranking im Information Retrieval bevorzugt werden. Als Kollektion wurde eine Version der sozialwissenschaftlichen GIRT-Datenbank (German Indexing and Retrieval Testdatabase) eingesetzt. Um Kandidaten für Mehrwortbegriffe zu identifizieren wurde die automatische Indexierung Lingo verwendet. Die notwendigen Kernfunktionalitäten waren Lemmatisierung, Identifizierung von Komposita, algorithmische Mehrworterkennung sowie Gewichtung von Indextermen durch das LSA-Modell. Die durch Lingo erkannten und LSAgewichteten Mehrwortkandidaten wurden evaluiert. Zuerst wurde dazu eine intellektuelle Auswahl von positiven und negativen Mehrwortkandidaten vorgenommen. Im zweiten Schritt der Evaluierung erfolgte die Berechnung der Ausbeute, um den Anteil der positiven Mehrwortkandidaten zu erhalten. Im letzten Schritt der Evaluierung wurde auf der Basis der R-Precision berechnet, wie viele positiv bewerteten Mehrwortkandidaten es an der Stelle k des Rankings geschafft haben. Die Ausbeute der positiven Mehrwortkandidaten lag bei durchschnittlich ca. 39%, während die R-Precision einen Durchschnittswert von 54% erzielte. Das LSA-Modell erzielt ein ambivalentes Ergebnis mit positiver Tendenz.

Search (6 results, page 1 of 1)

Authors

Years

Themes