Search (354 results, page 1 of 18)

Nohr, H.: Automatische Indexierung : Einführung in betriebliche Verfahren, Systeme und Anwendungen (2001) 0.11

0.11122362 = product of:
  0.23833634 = sum of:
    0.058955584 = weight(_text_:allgemeines in 2543) [ClassicSimilarity], result of:
      0.058955584 = score(doc=2543,freq=4.0), product of:
        0.16533206 = queryWeight, product of:
          5.705423 = idf(docFreq=399, maxDocs=44218)
          0.028978055 = queryNorm
        0.35658893 = fieldWeight in 2543, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.705423 = idf(docFreq=399, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.0479494 = weight(_text_:buch in 2543) [ClassicSimilarity], result of:
      0.0479494 = score(doc=2543,freq=6.0), product of:
        0.13472971 = queryWeight, product of:
          4.64937 = idf(docFreq=1149, maxDocs=44218)
          0.028978055 = queryNorm
        0.35589328 = fieldWeight in 2543, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          4.64937 = idf(docFreq=1149, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.022682417 = weight(_text_:und in 2543) [ClassicSimilarity], result of:
      0.022682417 = score(doc=2543,freq=26.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.3531656 = fieldWeight in 2543, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.017994322 = product of:
      0.035988644 = sum of:
        0.035988644 = weight(_text_:bibliothekswesen in 2543) [ClassicSimilarity], result of:
          0.035988644 = score(doc=2543,freq=4.0), product of:
            0.12917466 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.028978055 = queryNorm
            0.2786045 = fieldWeight in 2543, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.03125 = fieldNorm(doc=2543)
      0.5 = coord(1/2)
    0.05197529 = weight(_text_:informationswissenschaft in 2543) [ClassicSimilarity], result of:
      0.05197529 = score(doc=2543,freq=8.0), product of:
        0.13053758 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.028978055 = queryNorm
        0.3981634 = fieldWeight in 2543, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.035988644 = weight(_text_:bibliothekswesen in 2543) [ClassicSimilarity], result of:
      0.035988644 = score(doc=2543,freq=4.0), product of:
        0.12917466 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.028978055 = queryNorm
        0.2786045 = fieldWeight in 2543, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.0027906797 = product of:
      0.0055813594 = sum of:
        0.0055813594 = weight(_text_:information in 2543) [ClassicSimilarity], result of:
          0.0055813594 = score(doc=2543,freq=4.0), product of:
            0.050870337 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.028978055 = queryNorm
            0.10971737 = fieldWeight in 2543, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.03125 = fieldNorm(doc=2543)
      0.5 = coord(1/2)
  0.46666667 = coord(7/15)

Abstract: Das vorliegende Buch zur automatischen Indexierung trägt dem Umstand Rechnung, dass ein ständig wachsender Berg von Dokumenten in Unternehmen, öffentlichen Verwaltungen, Einrichtungen der Fachinformation oder dem Internet entscheidungsrelevante Informationen enthält, die mit manuellen Mitteln und Methoden kaum mehr beherrschbar und erschließbar sind. Diese unstrukturierten Informationen sind in einer zunehmend von der schnellen Verarbeitung der Ressource Information abhängigen Wirtschaft von größter Bedeutung, ihre Beherrschung ist unabdingbar für den Wettbewerbserfolg. Verfahren der automatischen Indexierung von Dokumenten sind damit eine Basistechnik der betrieblichen Informationswirtschaft geworden. Trotz dieses Urnstandes, liegt bis auf den heutigen Tag keine einführende Darstellung in die Thematik vor. Die Zielsetzung dieses Buches ist es, einführend die Grundlagen sowie die verschiedenen Ansätze und Verfahren der automatischen Indexierung von Dokumenten vorzustellen. Die Darstellung verzichtet dabei bewusst auf die allzu detaillierte Tiefendarstellung einzelner Verfahren und Indexierungssysteme zugunsten einer Übersicht der grundsätzlichen Ansätze mit ihren jeweiligen Voraussetzungen, ihren Möglichkeiten und ihren Beschränkungen. Soweit einzelne Verfahren und Indexierungssysteme behandelt werden, besitzen diese beispielhaften Charakter für den behandelten Ansatz. Bei der Darstellung war ich stets uni eine verständliche Sprache bemüht. Der Text dieses Buches ist entstanden aus Vorlesungen in entsprechenden Lehrveranstaltungen im Studiengang Informationswirtschaft an der Fachhochschule Stuttgart. Die Darstellung richtet sich an Studierende und Lehrende der Informationswirtschaft, des Informationsmanagements, der Dokumentation sowie der Wirtschaftsinformatik, zugleich aber auch an die interessierten und mit der Thernatik konfrontierten Praktiker, die weniger an der technischen Seite der automatischen Indexierung, als vielmehr einen grundsätzlichen Informationsbedarf über die Möglichkeiten und die Schwierigkeiten des Einsatzes entsprechender Verfahren haben
Classification: AN 95300 Allgemeines / Buch- und Bibliothekswesen, Informationswissenschaft / Informationswissenschaft / Informationspraxis / Automatisches Indexing (z.B. KWIC, KWOC)
RVK: AN 95300 Allgemeines / Buch- und Bibliothekswesen, Informationswissenschaft / Informationswissenschaft / Informationspraxis / Automatisches Indexing (z.B. KWIC, KWOC)
Series: Materialien zur Information und Dokumentation; Bd.13

Automatische Indexierung zwischen Forschung und Anwendung (1986) 0.05

0.046906166 = product of:
  0.14071849 = sum of:
    0.048446298 = weight(_text_:buch in 953) [ClassicSimilarity], result of:
      0.048446298 = score(doc=953,freq=2.0), product of:
        0.13472971 = queryWeight, product of:
          4.64937 = idf(docFreq=1149, maxDocs=44218)
          0.028978055 = queryNorm
        0.35958138 = fieldWeight in 953, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.64937 = idf(docFreq=1149, maxDocs=44218)
          0.0546875 = fieldNorm(doc=953)
    0.022018395 = weight(_text_:und in 953) [ClassicSimilarity], result of:
      0.022018395 = score(doc=953,freq=8.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.34282678 = fieldWeight in 953, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=953)
    0.022266837 = product of:
      0.044533674 = sum of:
        0.044533674 = weight(_text_:bibliothekswesen in 953) [ClassicSimilarity], result of:
          0.044533674 = score(doc=953,freq=2.0), product of:
            0.12917466 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.028978055 = queryNorm
            0.34475547 = fieldWeight in 953, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.0546875 = fieldNorm(doc=953)
      0.5 = coord(1/2)
    0.044533674 = weight(_text_:bibliothekswesen in 953) [ClassicSimilarity], result of:
      0.044533674 = score(doc=953,freq=2.0), product of:
        0.12917466 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.028978055 = queryNorm
        0.34475547 = fieldWeight in 953, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.0546875 = fieldNorm(doc=953)
    0.00345329 = product of:
      0.00690658 = sum of:
        0.00690658 = weight(_text_:information in 953) [ClassicSimilarity], result of:
          0.00690658 = score(doc=953,freq=2.0), product of:
            0.050870337 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.028978055 = queryNorm
            0.13576832 = fieldWeight in 953, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.0546875 = fieldNorm(doc=953)
      0.5 = coord(1/2)
  0.33333334 = coord(5/15)

Abstract: Die automatische Indexierung von Dokumenten für das Information Retrieval, d. h. die automatische Charakterisierung von Dokumentinhalten mittels Deskriptoren (Schlagwörtern) ist bereits seit über 25 Jahren ein Gebiet theoretischer und experimenteller Forschung. Dagegen wurde erst im Oktober 1985 mit der Anwendung der automatischen Indexierung in der Inputproduktion für ein großes Retrievalsystem begonnen. Es handelt sich um die Indexierung englischer Referatetexte für die Physik-Datenbasis des Informationszentrums Energie, Physik, Mathematik GmbH in Karlsruhe. In dem vorliegenden Buch beschreiben Mitarbeiter der Technischen Hochschule Darmstadt ihre Forschungs- und Entwicklungsarbeiten, die zu dieser Pilotanwendung geführt haben.
Footnote: Rez. in: Zeitschrift für Bibliothekswesen und Bibliographie 35(1988) S.508-510 (W. Gödert)

Niggemann, E.: Wer suchet, der findet? : Verbesserung der inhaltlichen Suchmöglichkeiten im Informationssystem Der Deutschen Bibliothek (2006) 0.05

0.046783164 = product of:
  0.14034949 = sum of:
    0.024617316 = weight(_text_:und in 5812) [ClassicSimilarity], result of:
      0.024617316 = score(doc=5812,freq=10.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.38329202 = fieldWeight in 5812, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5812)
    0.022266837 = product of:
      0.044533674 = sum of:
        0.044533674 = weight(_text_:bibliothekswesen in 5812) [ClassicSimilarity], result of:
          0.044533674 = score(doc=5812,freq=2.0), product of:
            0.12917466 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.028978055 = queryNorm
            0.34475547 = fieldWeight in 5812, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5812)
      0.5 = coord(1/2)
    0.04547838 = weight(_text_:informationswissenschaft in 5812) [ClassicSimilarity], result of:
      0.04547838 = score(doc=5812,freq=2.0), product of:
        0.13053758 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.028978055 = queryNorm
        0.348393 = fieldWeight in 5812, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5812)
    0.044533674 = weight(_text_:bibliothekswesen in 5812) [ClassicSimilarity], result of:
      0.044533674 = score(doc=5812,freq=2.0), product of:
        0.12917466 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.028978055 = queryNorm
        0.34475547 = fieldWeight in 5812, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5812)
    0.00345329 = product of:
      0.00690658 = sum of:
        0.00690658 = weight(_text_:information in 5812) [ClassicSimilarity], result of:
          0.00690658 = score(doc=5812,freq=2.0), product of:
            0.050870337 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.028978055 = queryNorm
            0.13576832 = fieldWeight in 5812, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5812)
      0.5 = coord(1/2)
  0.33333334 = coord(5/15)

Abstract: Elektronische Bibliothekskataloge und Bibliografien haben ihr Monopol bei der Suche nach Büchern, Aufsätzen, musikalischen Werken u. a. verloren. Globale Suchmaschinen sind starke Konkurrenten, und Bibliotheken müssen heute so planen, dass ihre Dienstleistungen auch morgen noch interessant sind. Die Deutsche Bibliothek (DDB) wird ihre traditionelle Katalogrecherche zu einem globalen, netzbasierten Informationssystem erweitern, das die Vorteile der neutralen, qualitätsbasierten Katalogsuche mit den Vorteilen moderner Suchmaschinen zu verbinden sucht. Dieser Beitrag beschäftigt sich mit der Verbesserung der inhaltlichen Suchmöglichkeiten im Informationssystem Der Deutschen Bibliothek. Weitere Entwicklungsstränge sollen nur kurz im Ausblick angerissen werden.
Source: Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen

7e Dag van het Document : 19 & 20 mei 1998, Congrescentrum De Reehorst, Ede ; proceedings (1998) 0.04

0.03532152 = product of:
  0.1766076 = sum of:
    0.14738896 = weight(_text_:allgemeines in 2427) [ClassicSimilarity], result of:
      0.14738896 = score(doc=2427,freq=4.0), product of:
        0.16533206 = queryWeight, product of:
          5.705423 = idf(docFreq=399, maxDocs=44218)
          0.028978055 = queryNorm
        0.89147234 = fieldWeight in 2427, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.705423 = idf(docFreq=399, maxDocs=44218)
          0.078125 = fieldNorm(doc=2427)
    0.022241939 = weight(_text_:und in 2427) [ClassicSimilarity], result of:
      0.022241939 = score(doc=2427,freq=4.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.34630734 = fieldWeight in 2427, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=2427)
    0.0069766995 = product of:
      0.013953399 = sum of:
        0.013953399 = weight(_text_:information in 2427) [ClassicSimilarity], result of:
          0.013953399 = score(doc=2427,freq=4.0), product of:
            0.050870337 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.028978055 = queryNorm
            0.27429342 = fieldWeight in 2427, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.078125 = fieldNorm(doc=2427)
      0.5 = coord(1/2)
  0.2 = coord(3/15)

BK: 06.00 (Information und Dokumentation: Allgemeines)
Classification: 06.00 (Information und Dokumentation: Allgemeines)

Glaesener, L.: Automatisches Indexieren einer informationswissenschaftlichen Datenbank mit Mehrwortgruppen (2012) 0.03

0.03204854 = product of:
  0.120182015 = sum of:
    0.028134076 = weight(_text_:und in 401) [ClassicSimilarity], result of:
      0.028134076 = score(doc=401,freq=10.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.438048 = fieldWeight in 401, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=401)
    0.025447812 = product of:
      0.050895624 = sum of:
        0.050895624 = weight(_text_:bibliothekswesen in 401) [ClassicSimilarity], result of:
          0.050895624 = score(doc=401,freq=2.0), product of:
            0.12917466 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.028978055 = queryNorm
            0.39400625 = fieldWeight in 401, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.0625 = fieldNorm(doc=401)
      0.5 = coord(1/2)
    0.050895624 = weight(_text_:bibliothekswesen in 401) [ClassicSimilarity], result of:
      0.050895624 = score(doc=401,freq=2.0), product of:
        0.12917466 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.028978055 = queryNorm
        0.39400625 = fieldWeight in 401, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.0625 = fieldNorm(doc=401)
    0.015704507 = product of:
      0.031409014 = sum of:
        0.031409014 = weight(_text_:22 in 401) [ClassicSimilarity], result of:
          0.031409014 = score(doc=401,freq=2.0), product of:
            0.101476215 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.028978055 = queryNorm
            0.30952093 = fieldWeight in 401, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=401)
      0.5 = coord(1/2)
  0.26666668 = coord(4/15)

Abstract: Ein Bericht über die Ergebnisse und die Prozessanalyse einer automatischen Indexierung mit Mehrwortgruppen. Diese Bachelorarbeit beschreibt, inwieweit der Inhalt informationswissenschaftlicher Fachtexte durch informationswissenschaftliches Fachvokabular erschlossen werden kann und sollte und dass in diesen wissenschaftlichen Texten ein Großteil der fachlichen Inhalte in Mehrwortgruppen vorkommt. Die Ergebnisse wurden durch eine automatische Indexierung mit Mehrwortgruppen mithilfe des Programme Lingo an einer informationswissenschaftlichen Datenbank ermittelt.
Content: Bachelorarbeit im Studiengang Bibliothekswesen der Fakultät für Informations- und Kommunikationswissenschaften an der Fachhochschule Köln.
Date: 11. 9.2012 19:43:22
Imprint: Köln : Fachhochschule / Fakultät für Informations- und Kommunikationswissenschaften

Gaus, W.; Kaluscha, R.: Maschinelle inhaltliche Erschließung von Arztbriefen und Auswertung von Reha-Entlassungsberichten (2006) 0.03
```
0.03145725 = product of:
  0.09437174 = sum of:
    0.027421704 = weight(_text_:und in 6078) [ClassicSimilarity], result of:
      0.027421704 = score(doc=6078,freq=38.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.42695636 = fieldWeight in 6078, product of:
          6.164414 = tf(freq=38.0), with freq of:
            38.0 = termFreq=38.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=6078)
    0.012723906 = product of:
      0.025447812 = sum of:
        0.025447812 = weight(_text_:bibliothekswesen in 6078) [ClassicSimilarity], result of:
          0.025447812 = score(doc=6078,freq=2.0), product of:
            0.12917466 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.028978055 = queryNorm
            0.19700313 = fieldWeight in 6078, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.03125 = fieldNorm(doc=6078)
      0.5 = coord(1/2)
    0.025987646 = weight(_text_:informationswissenschaft in 6078) [ClassicSimilarity], result of:
      0.025987646 = score(doc=6078,freq=2.0), product of:
        0.13053758 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.028978055 = queryNorm
        0.1990817 = fieldWeight in 6078, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.03125 = fieldNorm(doc=6078)
    0.025447812 = weight(_text_:bibliothekswesen in 6078) [ClassicSimilarity], result of:
      0.025447812 = score(doc=6078,freq=2.0), product of:
        0.12917466 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.028978055 = queryNorm
        0.19700313 = fieldWeight in 6078, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.03125 = fieldNorm(doc=6078)
    0.0027906797 = product of:
      0.0055813594 = sum of:
        0.0055813594 = weight(_text_:information in 6078) [ClassicSimilarity], result of:
          0.0055813594 = score(doc=6078,freq=4.0), product of:
            0.050870337 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.028978055 = queryNorm
            0.10971737 = fieldWeight in 6078, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.03125 = fieldNorm(doc=6078)
      0.5 = coord(1/2)
  0.33333334 = coord(5/15)
```
Abstract

Schon Hippokrates empfahl den Ärzten, Krankenakten zu führen. Heute ist die detaillierte Dokumentation eine Standespflicht der Ärzte [Gaus et al 1999]. Diese Dokumentationen medizinischer Behandlungen bergen einen riesigen und wertvollen Erfahrungsschatz. Informationen zu Therapien und Behandlungsergebnissen, die in Studien erst mühsam erhoben werden müssten, sind bereits in der Routinedokumentation wie Operations- und Entlassungsberichten oder Arztbriefen zahlreich vorhanden. Mit der Einführung der elektronischen Datenverarbeitung in der Medizin liegen diese Informationen seit einigen Jahren auch maschinenlesbar vor, so dass ein Haupthemmnis für die Nutzung dieser Dokumentationen, nämlich die mühsame manuelle Aufbereitung der Papierakten, entfällt. Während die formale Erschließung nach Patientenmerkmalen wie Name und Geburtsdatum von den Krankenhaus- bzw. Praxisinformationssystemen heutzutage gut gelöst ist, bleibt die inhaltliche Erschließung dieser Dokumentationen schwierig, da nur wenige Informationen in strukturierter oder intellektuell indexierter Form vorliegen [Leiner et al. 2003]. Auch wenn nach der Einführung der Fallpauschalen (diagnosis related groups, DRG) in den Krankenhäusern die Diagnosen nach ICD-10 verschlüsselt werden, besteht ein Großteil der Informationen weiterhin aus freiem Text, dessen computerbasierte Erschließung aufgrund der Komplexität menschlicher Sprache nicht trivial ist. Zu diesen medizinischen Texten gehören u.a. Gutachten, verbal beschriebene (Differential-) Diagnosen, vielfältige Untersuchungs- und Befundberichte, Visitenblätter, Operationsberichte und der Arztbrief bzw. Entlassungsbericht. Arztbrief und Entlassbericht dienen der Information des einweisenden oder weiterbehandelnden Arztes (z.B. Hausarzt) über das, was mit dem Patienten geschehen ist, und geben Empfehlungen zur Weiterbehandlung. Sie fassen eine (stationäre) Behandlung epikritisch - also nachdem die Krankheit überwunden ist, im Rückblick - zusammen und geben einen Überblick über Anamnese (Vorgeschichte), Beschwerden und Symptome, die eingesetzten diagnostischen Verfahren, die gestellte(n) Diagnose(n), Therapie, Verlauf, Komplikationen und das erzielte Ergebnis. Sie haben somit eine ähnliche Funktion wie das Abstract in der Literaturdokumentation, oft wird eine Kopie in der Krankenakte obenauf abgelegt. Zumindest in Universitätskliniken möchten wissenschaftlich arbeitende Ärzte auch unter inhaltlichen Gesichtspunkten auf die Krankenakten zugreifen können, z.B. die Krankenakten aller Patienten mit einer bestimmten Diagnose einsehen, exzerpieren und die exzerpierten Daten auswerten. Auch bei der Suche nach ähnlichen Fällen oder im Bereich der Aus- und Fortbildung hilft eine inhaltliche Erschließung weiter. So könnte etwa ein Assistenzarzt, der im Rahmen seiner Weiterbildung demnächst Sonografien des Kniegelenkes durchzuführen hat, sich vorhandene Berichte von solchen Sonografien anschauen und sich so über relevante Untersuchungstechniken und Befunde vorab informieren.

Source

Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen

Grün, S.: Bildung von Komposita-Indextermen auf der Basis einer algorithmischen Mehrwortgruppenanalyse mit Lingo (2015) 0.03

0.031290565 = product of:
  0.11733961 = sum of:
    0.021100556 = weight(_text_:und in 1335) [ClassicSimilarity], result of:
      0.021100556 = score(doc=1335,freq=10.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.328536 = fieldWeight in 1335, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1335)
    0.01908586 = product of:
      0.03817172 = sum of:
        0.03817172 = weight(_text_:bibliothekswesen in 1335) [ClassicSimilarity], result of:
          0.03817172 = score(doc=1335,freq=2.0), product of:
            0.12917466 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.028978055 = queryNorm
            0.2955047 = fieldWeight in 1335, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.046875 = fieldNorm(doc=1335)
      0.5 = coord(1/2)
    0.038981467 = weight(_text_:informationswissenschaft in 1335) [ClassicSimilarity], result of:
      0.038981467 = score(doc=1335,freq=2.0), product of:
        0.13053758 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.028978055 = queryNorm
        0.29862255 = fieldWeight in 1335, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.046875 = fieldNorm(doc=1335)
    0.03817172 = weight(_text_:bibliothekswesen in 1335) [ClassicSimilarity], result of:
      0.03817172 = score(doc=1335,freq=2.0), product of:
        0.12917466 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.028978055 = queryNorm
        0.2955047 = fieldWeight in 1335, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.046875 = fieldNorm(doc=1335)
  0.26666668 = coord(4/15)

Abstract: In der deutschen Sprache lassen sich Begriffe durch Komposita und Mehrwortgruppen ausdrücken. Letztere können dabei aber auch als Kompositum selbst ausgedrückt werden und entsprechend auf den gleichen Begriff verweisen. In der nachfolgenden Studie werden Mehrwortgruppen analysiert, die auch Komposita sein können. Ziel der Untersuchung ist es, diese Wortfolgen über Muster zu identifizieren. Analysiert wurden Daten des Karrieremanagers Placement24 GmbH - in Form von Stellenanzeigen. Die Extraktion von Mehrwortgruppen erfolgte algorithmisch und wurde mit der Open-Source Software Lingo durch geführt. Auf der Basis von Erweiterungen bzw. Anpassungen in Wörterbüchern und den darin getaggten Wörtern wurde drei- bis fünfstelligen Kandidaten analysiert. Aus positiv bewerteten Mehrwortgruppen wurden Komposita gebildet. Diese wurden mit den identifizierten Komposita aus den Stellenanzeigen verglichen. Der Vergleich zeigte, dass ein Großteil der neu generierten Komposita nicht durch eine Kompositaidentifizierung erzeugt wurde.
Content: Bachelorarbeit, Studiengang Bibliothekswesen, Fakultät für Informations- und Kommunikationswissenschaften, Fachhochschule Köln
Imprint: Köln : Fachhochschule, Institut für Informationswissenschaft

Dreis, G.: Formen des sachlichen Zugriffs : Probleme des automatischen Indexierens (1991) 0.03

0.028241098 = product of:
  0.14120549 = sum of:
    0.026690327 = weight(_text_:und in 2995) [ClassicSimilarity], result of:
      0.026690327 = score(doc=2995,freq=4.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.41556883 = fieldWeight in 2995, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=2995)
    0.03817172 = product of:
      0.07634344 = sum of:
        0.07634344 = weight(_text_:bibliothekswesen in 2995) [ClassicSimilarity], result of:
          0.07634344 = score(doc=2995,freq=2.0), product of:
            0.12917466 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.028978055 = queryNorm
            0.5910094 = fieldWeight in 2995, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.09375 = fieldNorm(doc=2995)
      0.5 = coord(1/2)
    0.07634344 = weight(_text_:bibliothekswesen in 2995) [ClassicSimilarity], result of:
      0.07634344 = score(doc=2995,freq=2.0), product of:
        0.12917466 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.028978055 = queryNorm
        0.5910094 = fieldWeight in 2995, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.09375 = fieldNorm(doc=2995)
  0.2 = coord(3/15)

Series: Zeitschrift für Bibliothekswesen und Bibliographie: Sonderh.52
Source: Der Online-Publikumskatalog der Universitätsbibliothek Düsseldorf: methodische Erkenntnisse und Erfahrungen, OPAC-Kolloquium am 27. u.28.11.1989. Hrsg.: G. Gattermann

Lepsky, K.: Automatisierung in der Sacherschließung : Maschinelles Indexieren von Titeldaten (1996) 0.03

0.028241098 = product of:
  0.14120549 = sum of:
    0.026690327 = weight(_text_:und in 3418) [ClassicSimilarity], result of:
      0.026690327 = score(doc=3418,freq=4.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.41556883 = fieldWeight in 3418, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=3418)
    0.03817172 = product of:
      0.07634344 = sum of:
        0.07634344 = weight(_text_:bibliothekswesen in 3418) [ClassicSimilarity], result of:
          0.07634344 = score(doc=3418,freq=2.0), product of:
            0.12917466 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.028978055 = queryNorm
            0.5910094 = fieldWeight in 3418, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.09375 = fieldNorm(doc=3418)
      0.5 = coord(1/2)
    0.07634344 = weight(_text_:bibliothekswesen in 3418) [ClassicSimilarity], result of:
      0.07634344 = score(doc=3418,freq=2.0), product of:
        0.12917466 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.028978055 = queryNorm
        0.5910094 = fieldWeight in 3418, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.09375 = fieldNorm(doc=3418)
  0.2 = coord(3/15)

Series: Zeitschrift für Bibliothekswesen und Bibliographie: Sonderh.63
Source: 85. Deutscher Bibliothekartag in Göttingen 1995: Die Herausforderung der Bibliotheken durch elektronische Medien und neue Organisationsformen. Hrsg.: S. Wefers

Salton, G.: Future prospects for text-based information retrieval (1990) 0.03

0.027009815 = product of:
  0.13504907 = sum of:
    0.018872911 = weight(_text_:und in 2327) [ClassicSimilarity], result of:
      0.018872911 = score(doc=2327,freq=2.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.29385152 = fieldWeight in 2327, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=2327)
    0.11025624 = weight(_text_:informationswissenschaft in 2327) [ClassicSimilarity], result of:
      0.11025624 = score(doc=2327,freq=4.0), product of:
        0.13053758 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.028978055 = queryNorm
        0.84463215 = fieldWeight in 2327, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.09375 = fieldNorm(doc=2327)
    0.005919926 = product of:
      0.011839852 = sum of:
        0.011839852 = weight(_text_:information in 2327) [ClassicSimilarity], result of:
          0.011839852 = score(doc=2327,freq=2.0), product of:
            0.050870337 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.028978055 = queryNorm
            0.23274569 = fieldWeight in 2327, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.09375 = fieldNorm(doc=2327)
      0.5 = coord(1/2)
  0.2 = coord(3/15)

Series: Konstanzer Schriften zur Informationswissenschaft; Bd.1
Source: Pragmatische Aspekte beim Entwurf und Betrieb von Informationssystemen: Proc. des 1. Int. Symposiums für Informationswissenschaft, Universität Konstanz, 17.-19.10.1990. Hrsg.: J. Herget u. R. Kuhlen

Gil-Leiva, I.; Munoz, J.V.R.: Analisis de los descriptores de diferentes areas del conocimiento indizades en bases de datos del CSIC : Aplicacion a la indizacion automatica (1997) 0.03

0.02645307 = product of:
  0.09919901 = sum of:
    0.01908586 = product of:
      0.03817172 = sum of:
        0.03817172 = weight(_text_:bibliothekswesen in 2637) [ClassicSimilarity], result of:
          0.03817172 = score(doc=2637,freq=2.0), product of:
            0.12917466 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.028978055 = queryNorm
            0.2955047 = fieldWeight in 2637, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.046875 = fieldNorm(doc=2637)
      0.5 = coord(1/2)
    0.038981467 = weight(_text_:informationswissenschaft in 2637) [ClassicSimilarity], result of:
      0.038981467 = score(doc=2637,freq=2.0), product of:
        0.13053758 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.028978055 = queryNorm
        0.29862255 = fieldWeight in 2637, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.046875 = fieldNorm(doc=2637)
    0.03817172 = weight(_text_:bibliothekswesen in 2637) [ClassicSimilarity], result of:
      0.03817172 = score(doc=2637,freq=2.0), product of:
        0.12917466 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.028978055 = queryNorm
        0.2955047 = fieldWeight in 2637, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.046875 = fieldNorm(doc=2637)
    0.002959963 = product of:
      0.005919926 = sum of:
        0.005919926 = weight(_text_:information in 2637) [ClassicSimilarity], result of:
          0.005919926 = score(doc=2637,freq=2.0), product of:
            0.050870337 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.028978055 = queryNorm
            0.116372846 = fieldWeight in 2637, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.046875 = fieldNorm(doc=2637)
      0.5 = coord(1/2)
  0.26666668 = coord(4/15)

Abstract: Studies the value of scientific articles' titles and abstracts as sources of terms for document indexing in relation to 6 areas of knowledge: library and information science, medicine, chemistry, biology, psychology and physics, indexed in the databases ISOC, IME and ICYT of the CSIC. Also examines the syntagmatic structures of the indexing terms found in the field 'descriptors'. as well as the relationship between length of document and number of descriptors. Concludes that if the abstracts are not well made and the titles are not precise, they are not definitive sources for the extractions of concepts; the most common syntactic structure is the noun phrase, followed by noun+adjective and noun+noun; and no significant relationship was found between length of document and number of descriptors assigned to it
Field: Informationswissenschaft
Bibliothekswesen

Maas, H.-D.: Indexieren mit AUTINDEX (2006) 0.03
```
0.026395103 = product of:
  0.07918531 = sum of:
    0.021319222 = weight(_text_:und in 6077) [ClassicSimilarity], result of:
      0.021319222 = score(doc=6077,freq=30.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.33194062 = fieldWeight in 6077, product of:
          5.477226 = tf(freq=30.0), with freq of:
            30.0 = termFreq=30.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02734375 = fieldNorm(doc=6077)
    0.011133418 = product of:
      0.022266837 = sum of:
        0.022266837 = weight(_text_:bibliothekswesen in 6077) [ClassicSimilarity], result of:
          0.022266837 = score(doc=6077,freq=2.0), product of:
            0.12917466 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.028978055 = queryNorm
            0.17237774 = fieldWeight in 6077, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.02734375 = fieldNorm(doc=6077)
      0.5 = coord(1/2)
    0.02273919 = weight(_text_:informationswissenschaft in 6077) [ClassicSimilarity], result of:
      0.02273919 = score(doc=6077,freq=2.0), product of:
        0.13053758 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.028978055 = queryNorm
        0.1741965 = fieldWeight in 6077, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.02734375 = fieldNorm(doc=6077)
    0.022266837 = weight(_text_:bibliothekswesen in 6077) [ClassicSimilarity], result of:
      0.022266837 = score(doc=6077,freq=2.0), product of:
        0.12917466 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.028978055 = queryNorm
        0.17237774 = fieldWeight in 6077, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.02734375 = fieldNorm(doc=6077)
    0.001726645 = product of:
      0.00345329 = sum of:
        0.00345329 = weight(_text_:information in 6077) [ClassicSimilarity], result of:
          0.00345329 = score(doc=6077,freq=2.0), product of:
            0.050870337 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.028978055 = queryNorm
            0.06788416 = fieldWeight in 6077, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.02734375 = fieldNorm(doc=6077)
      0.5 = coord(1/2)
  0.33333334 = coord(5/15)
```
Abstract

Wenn man ein Computerprogramm besitzt, das einem zu fast jedem Textwort dessen grammatische Merkmale bestimmt und außerdem noch seine interne Struktur und einige semantische Informationen liefert, dann fragt man sich irgendwann: Könnte ich nicht auf der Grundlage dieser Angaben einen Text global charakterisieren, etwa indem ich versuche, die wichtigen Wörter dieses Textes zu errechnen? Die häufigsten Textwörter können es nicht sein, denn gerade sie sind sehr nichtssagend. Die seltensten Textwörter sind zwar aussagekräftig, aber sie sind zu viele - die meisten Lemmata eines Textes erscheinen nur ein einziges Mal. Irgendwie müsste man den Wortschatz einschränken können. Die rettende Idee war: Wir tun so, als seien die semantischen Merkmale Wörter, denn dann enthält der Wortschatz dieser Sprache nur noch etwa hundert Elemente, weil unsere morphologische Analyse (Mpro) rund 100 semantische Features verwendet. Wir vermuteten nun, dass die häufig vorkommenden Features wichtig für den Text sind und die selteneren als Ausreißer betrachten werden können. Die Implementierung dieser Idee ist der Urahn unseres Programmpaketes AUTINDEX zur automatischen Indexierung von Texten. Dieses allererste Programm erstellte also zu einem Text eine Statistik der semantischen Merkmale und gab die drei häufigsten Klassen mit den zugehörigen Lemmata aus. Das Ergebnis war verblüffend: Auf den ersten Blick konnte man sehen, worum es in dem Text ging. Bei näherem Hinsehen wurden aber auch Unzulänglichkeiten deutlich. Einige der Schlagwörter waren doch ziemlich nichtssagend, andere hätte man gerne in der Liste gehabt, und schließlich hätte man sich noch eine ganz globale Charakterisierung des Textes durch die Angabe von Fachgebieten gewünscht, etwa in der Form: Der Text hat mit Politik oder Wirtschaft zu tun, er berichtet über einen Unfall, eine Feierlichkeit usw. Es wurde also sofort deutlich, dass das Programm ohne eine weitere Wissensquelle keine wirklich guten Ergebnisse würde liefern können. Man braucht also einen Thesaurus, ein Wörterbuch, in dem einzelne Lemmata und auch mehrwortige Ausdrücke mit zusätzlichen Informationen versehen sind.
Die erste Implementierung wurde in Zusammenarbeit mit dem Fachinformationszentrum Technik (Frankfurt) erstellt. Eine Kontrolle der manuell vergebenen Grob- und Feinklassifizierung der Lexikonartikel des Brockhaus Multimedial und anderer Brockhaus-Lexika wurde mit AUTINDEX in Zusammenarbeit mit BIFAB (Mannheim) durchgeführt. AUTINDEX ist auch Bestandteil des Indexierungs- und Retrievalsystems der Firma AGI (Neustadt/Weinstraße), das in der Landesbibliothek Vorarlberg eingesetzt wird. Weiterhin wird AUTINDEX im System LEWI verwendet, das zusammen mit BIFAB entwickelt wird. Dieses System erlaubt natürlichsprachliche Anfragen an den Brockhaus Multimedial und liefert als Antwort die relevanten Lexikonartikel. Im IAI selbst wurden große Textmengen indexiert (Brockhaus- und Dudenlexika, Zeitungstexte usw.), die man für die Weiterentwicklung diverser Thesauri und Wörterbücher nutzen kann. Beispielsweise kann man sich für ein Wort alle Texte ausgeben lassen, in denen dieses Wort wichtig ist. Dabei sind die Texte nach Wichtigkeit sortiert. Zu einem gegebenen Wort kann man sich auch die Assoziationen oder die möglichen Klassifikationen berechnen lassen. Auf diese Weise kann man einen Thesaurus halbautomatisch erweitern.

Source

Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen
Lepsky, K.: Automatische Indexierung des Reallexikons zur Deutschen Kunstgeschichte (2006) 0.03
```
0.026356278 = product of:
  0.07906883 = sum of:
    0.01906849 = weight(_text_:und in 6080) [ClassicSimilarity], result of:
      0.01906849 = score(doc=6080,freq=24.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.2968967 = fieldWeight in 6080, product of:
          4.8989797 = tf(freq=24.0), with freq of:
            24.0 = termFreq=24.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02734375 = fieldNorm(doc=6080)
    0.011133418 = product of:
      0.022266837 = sum of:
        0.022266837 = weight(_text_:bibliothekswesen in 6080) [ClassicSimilarity], result of:
          0.022266837 = score(doc=6080,freq=2.0), product of:
            0.12917466 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.028978055 = queryNorm
            0.17237774 = fieldWeight in 6080, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.02734375 = fieldNorm(doc=6080)
      0.5 = coord(1/2)
    0.02273919 = weight(_text_:informationswissenschaft in 6080) [ClassicSimilarity], result of:
      0.02273919 = score(doc=6080,freq=2.0), product of:
        0.13053758 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.028978055 = queryNorm
        0.1741965 = fieldWeight in 6080, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.02734375 = fieldNorm(doc=6080)
    0.022266837 = weight(_text_:bibliothekswesen in 6080) [ClassicSimilarity], result of:
      0.022266837 = score(doc=6080,freq=2.0), product of:
        0.12917466 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.028978055 = queryNorm
        0.17237774 = fieldWeight in 6080, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.02734375 = fieldNorm(doc=6080)
    0.0038608958 = product of:
      0.0077217915 = sum of:
        0.0077217915 = weight(_text_:information in 6080) [ClassicSimilarity], result of:
          0.0077217915 = score(doc=6080,freq=10.0), product of:
            0.050870337 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.028978055 = queryNorm
            0.1517936 = fieldWeight in 6080, product of:
              3.1622777 = tf(freq=10.0), with freq of:
                10.0 = termFreq=10.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.02734375 = fieldNorm(doc=6080)
      0.5 = coord(1/2)
  0.33333334 = coord(5/15)
```
Abstract

Digitalisierungsvorhaben sorgen für eine immer größere Verfügbarkeit von Inhalten bislang ausschließlich gedruckt vorliegender Werke, zunehmend auch von ganzen Büchern. Projekte wie "Google Print" versprechen die völlige elektronische Verfügbarkeit von Informationen nahezu unabhängig von Zeit und Ort und sorgen dafür, dass die Hüter der konventionellen Information, die Bibliotheken, in Angst und Schrecken versetzt werden angesichts des befürchteten Verlusts ihrer traditionellen Rolle. Die Debatte kreist dabei eher selten um die Frage, welcher Nutzen sich konkret aus dem elektronischen Volltext ergibt: Der Nutzen steht schlichtweg außer Frage, Volltexte gelten prinzipiell als nützlich. Das ist insofern zu optimistisch, als die reine Verfügbarkeit von Information noch lange nicht fir deren sinnvolle Verwertung sorgt - die bloße Verfügbarkeit des Volltexts von Kants "Kritik der reinen Vernunft" enthebt nicht der Notwendigkeit, das Werk zu lesen und verstehen zu wollen. Lesen wird man besser auch nicht am Bildschirm sondern in der (neu-deutsch) "PrintAusgabe". Elektronische Volltexte von Büchern dienen nicht der Lektüre. Falls ihr Sinn nicht ohnehin ein rein verkaufsfördernder ist (das "Publishers Program" von Google Print erweckt in der Tat diesen Eindruck), bleibt ihr potenzieller Nutzen als Nachschlageinstrument. Nur der Volltext bietet die Möglichkeit, Informationen in einem Werk zu finden, die nicht explizit erschlossen wurden, durch ein Inhaltsverzeichnis etwa oder, eine noch günstigere Ausgangslage, durch ein Sachregister. Allerdings sind die meisten Werke nicht für einen solchen Zweck verfasst worden, d.h. es ist nicht zu erwarten, dass ein Werk über die "Geschichte des Römischen Reiches" im Volltextzugriff zu einem Lexikon zur Geschichte des Römischen Reiches wird. Entspricht also die hinter Google Print und zahllosen anderen Digitalisierungsinitiativen stehende Auffassung einem doch sehr naiven Bild von der Nützlichkeit gedruckter Information?
Seriöse Information darf erwarten, wer renommierte Nachschlagewerke befragt. Zumindest für die über die Primärordnung (Stichwort/Lemma) erschlossenen Sachverhalte ist für Buchausgaben ein gezielter Zugriff möglich, Verweisungen zwischen Artikeln sorgen für weitere Einstiege. Anzunehmen ist, dass sich der Nutzen von Nachschlagewerken in elektronischer Form noch deutlich erhöhen lässt: Produkte wie z.B. "Brockhaus multimedial" oder "Encyclopedia Britannica" sorgen mit leistungsfähigen Techniken über den wahlfreien Volltextzugriff hinaus für zahlreiche Navigations- und Recherchemöglichkeiten. Es liegt daher nahe, über eine Digitalisierung konventionell vorliegender Nachschlagewerke auch deren Anwendung zu verbessern, die im Print möglichen Zugriffsmöglichkeiten deutlich zu erweitern. Beispiele für diesen Ansatz sind die Digitalisierung der "Oekonomischen Encyklopädie" von Johann Georg Krünitz, die mit hohem Aufwand nicht maschinell (Scanning und OCR) sondern manuell realisiert wurde oder auch die im "Projekt Runeberg' , vorgenommenen zahlreichen Digitalisierungen u.a. auch von Nachschlagewerken. Ob die einfache Volltextindexierung derartig umfangreicher und - weil bereits als Nachschlagewerk konzipiert - gleichzeitig extrem verdichteter Quellen für einen größtmöglichen Nutzen der elektronischen Version ausreicht, darf zu Recht bezweifelt werden. In kommerziellen Produkten sorgen daher zusätzliche Techniken für einerseits thematisch gezielte Zugriffe auch über Nicht-Stichwörter, andererseits für Querverbindungen zu möglicherweise weiteren Artikeln von Interesse ("Wissensnetz" des Brockhaus, "Knowledge Navigator" der Britannica). Es darf angenommen werden, dass derartige Techniken dabei auf Informationen aufsetzen können (Strukturierung der Artikel, gekennzeichnete (getaggte) Personennamen, Querverweise etc.), die in den zu verarbeitenden Artikeln in nutzbarer Form vorliegen. Für digitalisierte Druckausgaben kommen derartige Verfahren nicht in Frage, weil lediglich flache, noch dazu in der Regel mit OCR-Fehlern behaftete Texte vorliegen. Die Zugriffsmöglichkeiten bewegen sich daher zwischen der 1:1-Umsetzung der Druckausgabe, d.h. dem Primärzugriff über Stichwort, und der Volltextsuche auf den vollständigen Lexikontext. Beides ist angesichts der im elektronischen Volltext liegenden Möglichkeiten sicher nicht die Methode der Wahl. Für die Digitalisierung des "Reallexikons zur Deutschen Kunstgeschichte" im Rahmen des von der Deutschen Forschungsgemeinschaft geförderten Projekts "RDKWeb" wird daher versucht, mit den Mitteln der Automatischen Indexierung eine Lösung zu erzielen, die über eine reine Volltextsuchmöglichkeit hinaus Suchunterstützungen bietet, die sich an den Fähigkeiten kommerzieller Produkte orientieren (nicht messen!).

Source

Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen

Gödert, W.; Lepsky, K.: Semantische Umfeldsuche im Information Retrieval (1998) 0.02

0.023819279 = product of:
  0.08932229 = sum of:
    0.01906849 = weight(_text_:und in 606) [ClassicSimilarity], result of:
      0.01906849 = score(doc=606,freq=6.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.2968967 = fieldWeight in 606, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=606)
    0.022266837 = product of:
      0.044533674 = sum of:
        0.044533674 = weight(_text_:bibliothekswesen in 606) [ClassicSimilarity], result of:
          0.044533674 = score(doc=606,freq=2.0), product of:
            0.12917466 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.028978055 = queryNorm
            0.34475547 = fieldWeight in 606, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.0546875 = fieldNorm(doc=606)
      0.5 = coord(1/2)
    0.044533674 = weight(_text_:bibliothekswesen in 606) [ClassicSimilarity], result of:
      0.044533674 = score(doc=606,freq=2.0), product of:
        0.12917466 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.028978055 = queryNorm
        0.34475547 = fieldWeight in 606, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.0546875 = fieldNorm(doc=606)
    0.00345329 = product of:
      0.00690658 = sum of:
        0.00690658 = weight(_text_:information in 606) [ClassicSimilarity], result of:
          0.00690658 = score(doc=606,freq=2.0), product of:
            0.050870337 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.028978055 = queryNorm
            0.13576832 = fieldWeight in 606, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.0546875 = fieldNorm(doc=606)
      0.5 = coord(1/2)
  0.26666668 = coord(4/15)

Abstract: Sachliche Suchen in bibliothekarischen Online-Katalogen enden häufig mit unbefriedigenden Ergebnissen. Als eine Ursache dafür kann angesehen werden, daß die Gestaltung des Suchprozesses das semantische Umfeld einer Suchanfrage nicht mit einbezieht, daß in Übertragung der Verhältnisse in konventionellen Katalogen am Paradigma des Wort-Matching zwischen Suchwort und Indexat festgehalten wird. Es wird statt dessen das Konzept einer semantischen Umfeldsuche entwickelt und gezeigt, welche Rolle die Verwendung strukturierten Vokabulars dafür spielen kann. Insbesondere wird dargestellt, welche Möglichkeiten Verfahren der wörterbuchgestützten maschinellen Indexierung in diesem Zusammenhang spielen können. Die Ausführungen werden durch Beispiele illustriert
Source: Zeitschrift für Bibliothekswesen und Bibliographie. 45(1998) H.4, S.401-423

Reimer, U.: Verfahren der automatischen Indexierung : benötigtes Vorwissen und Ansätze zu seiner automatischen Akquisition, ein Überblick (1992) 0.02

0.022114638 = product of:
  0.11057319 = sum of:
    0.026690327 = weight(_text_:und in 7858) [ClassicSimilarity], result of:
      0.026690327 = score(doc=7858,freq=4.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.41556883 = fieldWeight in 7858, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=7858)
    0.077962935 = weight(_text_:informationswissenschaft in 7858) [ClassicSimilarity], result of:
      0.077962935 = score(doc=7858,freq=2.0), product of:
        0.13053758 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.028978055 = queryNorm
        0.5972451 = fieldWeight in 7858, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.09375 = fieldNorm(doc=7858)
    0.005919926 = product of:
      0.011839852 = sum of:
        0.011839852 = weight(_text_:information in 7858) [ClassicSimilarity], result of:
          0.011839852 = score(doc=7858,freq=2.0), product of:
            0.050870337 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.028978055 = queryNorm
            0.23274569 = fieldWeight in 7858, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.09375 = fieldNorm(doc=7858)
      0.5 = coord(1/2)
  0.2 = coord(3/15)

Series: Schriften zur Informationswissenschaft; Bd.3
Source: Experimentelles und praktisches Information Retrieval: Festschrift für Gerhard Lustig. Hrsg. R. Kuhlen

Lepsky, K.; Siepmann, J.; Zimmermann, A.: Automatische Indexierung für Online-Kataloge : Ergebnisse eines Retrievaltests (1996) 0.02

0.021670135 = product of:
  0.081263 = sum of:
    0.011009198 = weight(_text_:und in 3251) [ClassicSimilarity], result of:
      0.011009198 = score(doc=3251,freq=2.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.17141339 = fieldWeight in 3251, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3251)
    0.022266837 = product of:
      0.044533674 = sum of:
        0.044533674 = weight(_text_:bibliothekswesen in 3251) [ClassicSimilarity], result of:
          0.044533674 = score(doc=3251,freq=2.0), product of:
            0.12917466 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.028978055 = queryNorm
            0.34475547 = fieldWeight in 3251, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3251)
      0.5 = coord(1/2)
    0.044533674 = weight(_text_:bibliothekswesen in 3251) [ClassicSimilarity], result of:
      0.044533674 = score(doc=3251,freq=2.0), product of:
        0.12917466 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.028978055 = queryNorm
        0.34475547 = fieldWeight in 3251, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3251)
    0.00345329 = product of:
      0.00690658 = sum of:
        0.00690658 = weight(_text_:information in 3251) [ClassicSimilarity], result of:
          0.00690658 = score(doc=3251,freq=2.0), product of:
            0.050870337 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.028978055 = queryNorm
            0.13576832 = fieldWeight in 3251, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3251)
      0.5 = coord(1/2)
  0.26666668 = coord(4/15)

Abstract: Examines the effectiveness of automated indexing and presents the results of a study of information retrieval from a segment (40.000 items) of the ULB Düsseldorf database. The segment was selected randomly and all the documents included were indexed automatically. The search topics included 50 subject areas ranging from economic growth to alternative energy sources. While there were 876 relevant documents in the database segment for each of the 50 search topics, the recall ranged from 1 to 244 references, with the average being 17.52 documents per topic. Therefore it seems that, in the immediate future, automatic indexing should be used in combination with intellectual indexing
Source: Zeitschrift für Bibliothekswesen und Bibliographie. 43(1996) H.1, S.47-56

Lepsky, K.: Auf dem Weg zur automatischen Inhaltserschließung? : Das DFG-Projekt MILOS und seine Ergebnisse (1997) 0.02

0.021432554 = product of:
  0.10716277 = sum of:
    0.030819334 = weight(_text_:und in 11) [ClassicSimilarity], result of:
      0.030819334 = score(doc=11,freq=12.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.47985753 = fieldWeight in 11, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=11)
    0.025447812 = product of:
      0.050895624 = sum of:
        0.050895624 = weight(_text_:bibliothekswesen in 11) [ClassicSimilarity], result of:
          0.050895624 = score(doc=11,freq=2.0), product of:
            0.12917466 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.028978055 = queryNorm
            0.39400625 = fieldWeight in 11, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.0625 = fieldNorm(doc=11)
      0.5 = coord(1/2)
    0.050895624 = weight(_text_:bibliothekswesen in 11) [ClassicSimilarity], result of:
      0.050895624 = score(doc=11,freq=2.0), product of:
        0.12917466 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.028978055 = queryNorm
        0.39400625 = fieldWeight in 11, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.0625 = fieldNorm(doc=11)
  0.2 = coord(3/15)

Abstract: Der Beitrag beschäftigt sich mit der Anwendung eines Verfahrens zur Automatischen Indexierung von Titeldaten in Bibliotheken. Die Arbeitsweise des Verfahrens und seine Nutzung innerhalb des von der Deutschen Forschungsgemeinschaft geförderten und an der Universitäts- und Landesbibliothek Düsseldorf durchgeführten Projekts MILOS werden geschildert. Die Ergebnisse eines Retrievaltests belegen die Tauglichkeit des Verfahrens für den Einsatz in Bibliotheken. Aufbauend auf diesen Ergebnissen werden Perspektiven für eine sinnvolle Verbindung von konventioneller bibliothekarischer Sacherschließung und automatischen Verfahren entworfen
Source: Mitteilungen der Gesellschaft für Bibliothekswesen und Dokumentation des Landbaus. 1997, H.53, S.46-52

Lepsky, K.; Zimmermann, H.H.: Katalogerweiterung durch Scanning und automatische Dokumenterschließung : Ergebnisse des DFG-Projekts KASCADE (2000) 0.02

0.021432554 = product of:
  0.10716277 = sum of:
    0.030819334 = weight(_text_:und in 4966) [ClassicSimilarity], result of:
      0.030819334 = score(doc=4966,freq=12.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.47985753 = fieldWeight in 4966, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=4966)
    0.025447812 = product of:
      0.050895624 = sum of:
        0.050895624 = weight(_text_:bibliothekswesen in 4966) [ClassicSimilarity], result of:
          0.050895624 = score(doc=4966,freq=2.0), product of:
            0.12917466 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.028978055 = queryNorm
            0.39400625 = fieldWeight in 4966, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.0625 = fieldNorm(doc=4966)
      0.5 = coord(1/2)
    0.050895624 = weight(_text_:bibliothekswesen in 4966) [ClassicSimilarity], result of:
      0.050895624 = score(doc=4966,freq=2.0), product of:
        0.12917466 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.028978055 = queryNorm
        0.39400625 = fieldWeight in 4966, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.0625 = fieldNorm(doc=4966)
  0.2 = coord(3/15)

Abstract: Der Beitrag befasst sich mit den Zielen, Inhalten und Ergebnissen des von der DFG geförderten Projekts KASCADE. Für KASCADE wurden Katalogdaten aus dem Fachbereich Rechtswissenschafft um Inhaltsverzeichnisse angereichert. Die angereicherten Titeldaten wurden mit einem erweiterten MILOS-Verfahren automatisch indexiert sowie mit den beiden linguistisch und statistisch basierten Verfahren SELIX und THEAS zusätzlich erschlossen. In einem umfangreichen Retrievaltest wurden die Ergebnisse der automatischen Indexierung und Gewichtung untersucht
Source: Zeitschrift für Bibliothekswesen und Bibliographie. 47(2000) H.4, S.305-316

Mittelbach, J.; Probst, M.: Möglichkeiten und Grenzen maschineller Indexierung in der Sacherschließung : Strategien für das Bibliothekssystem der Freien Universität Berlin (2006) 0.02

0.019672645 = product of:
  0.073772416 = sum of:
    0.023591138 = weight(_text_:und in 1411) [ClassicSimilarity], result of:
      0.023591138 = score(doc=1411,freq=18.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.3673144 = fieldWeight in 1411, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1411)
    0.015904883 = product of:
      0.031809766 = sum of:
        0.031809766 = weight(_text_:bibliothekswesen in 1411) [ClassicSimilarity], result of:
          0.031809766 = score(doc=1411,freq=2.0), product of:
            0.12917466 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.028978055 = queryNorm
            0.24625391 = fieldWeight in 1411, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.0390625 = fieldNorm(doc=1411)
      0.5 = coord(1/2)
    0.031809766 = weight(_text_:bibliothekswesen in 1411) [ClassicSimilarity], result of:
      0.031809766 = score(doc=1411,freq=2.0), product of:
        0.12917466 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.028978055 = queryNorm
        0.24625391 = fieldWeight in 1411, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1411)
    0.0024666358 = product of:
      0.0049332716 = sum of:
        0.0049332716 = weight(_text_:information in 1411) [ClassicSimilarity], result of:
          0.0049332716 = score(doc=1411,freq=2.0), product of:
            0.050870337 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.028978055 = queryNorm
            0.09697737 = fieldWeight in 1411, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.0390625 = fieldNorm(doc=1411)
      0.5 = coord(1/2)
  0.26666668 = coord(4/15)

Abstract: Automatische Indexierung wird zunehmend als sinnvolle Möglichkeit erkannt, Daten für Informationsretrievalsysteme zu erzeugen und somit die Auffindbarkeit von Do-kumenten zu erhöhen. Die dafür geeigneten Methoden sind seit geraumer Zeit bekannt und umfassen statistische bzw. computerlinguistische Sprachanalysetechniken, die im Gegensatz zur gebräuchlichen Freitextinvertierung entscheidende Vor-teile hinsichtlich des Retrievals bieten. So bilden erst die Wortformenreduzierung und die semantische Zerlegung sowie die Gewichtung der ermittelten Indexterme die Grundlagen für die gezielte sachliche Suche im Online-Katalog. Entsprechende Ver-fahren, die sich für Bibliotheken eignen, stehen seit Mitte der neunziger Jahre auch für den praktischen Einsatz bereit und werden - nicht zuletzt aufgrund steigender Akzeptanz - ständig weiterentwickelt. Dabei geht es nicht nur um die Steigerung der allgemeinen Leistungsfähigkeit von maschinellen Indexierungssystemen, sondern auch um ihre Fähigkeit, die im Bibliothekswesen verfügbare, sehr heterogene Daten-grundlage optimal zu nutzen. Wichtige Kriterien sind zudem eine vertretbare Fehler-quote, die Integrierbarkeit in die Geschäftsgänge und die Darstellbarkeit der anfal-lenden Datenmengen in entsprechenden Datenrepräsentationsmodellen. Im Fokus der Untersuchung stehen die allgemeine Betrachtung der Vor- und Nachteile der beiden gängigen Indexierungssysteme MILOS und intelligentCAPTURE sowie die Möglichkeiten und Grenzen ihres Einsatzes im Bibliothekssystem der Freien Universität Berlin. Diese Veröffentlichung geht zurück auf eine Master-Arbeit im postgradualen Fernstudiengang Master of Arts (Library and Information Science) an der Humboldt-Universität zu Berlin. Online-Version: http://www.ib.hu-berlin.de/~kumlau/handreichungen/h183/

Hüther, H.: Selix im DFG-Projekt Kascade (1998) 0.02

0.01942209 = product of:
  0.14566566 = sum of:
    0.015727427 = weight(_text_:und in 5151) [ClassicSimilarity], result of:
      0.015727427 = score(doc=5151,freq=2.0), product of:
        0.06422601 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.028978055 = queryNorm
        0.24487628 = fieldWeight in 5151, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=5151)
    0.12993823 = weight(_text_:informationswissenschaft in 5151) [ClassicSimilarity], result of:
      0.12993823 = score(doc=5151,freq=8.0), product of:
        0.13053758 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.028978055 = queryNorm
        0.99540854 = fieldWeight in 5151, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.078125 = fieldNorm(doc=5151)
  0.13333334 = coord(2/15)

Series: Schriften zur Informationswissenschaft; Bd.34
Source: Knowledge Management und Kommunikationssysteme: Proceedings des 6. Internationalen Symposiums für Informationswissenschaft (ISI '98) Prag, 3.-7. November 1998 / Hochschulverband für Informationswissenschaft (HI) e.V. Konstanz ; Fachrichtung Informationswissenschaft der Universität des Saarlandes, Saarbrücken. Hrsg.: Harald H. Zimmermann u. Volker Schramm

Search (354 results, page 1 of 18)

Authors

Years

Languages

Types

Themes

Subjects

Classifications