Search (276 results, page 1 of 14)

Nohr, H.: Automatische Indexierung : Einführung in betriebliche Verfahren, Systeme und Anwendungen (2001) 0.14

0.13936104 = product of:
  0.3205304 = sum of:
    0.04794863 = weight(_text_:allgemeines in 2543) [ClassicSimilarity], result of:
      0.04794863 = score(doc=2543,freq=4.0), product of:
        0.13446471 = queryWeight, product of:
          5.705423 = idf(docFreq=399, maxDocs=44218)
          0.023567878 = queryNorm
        0.35658893 = fieldWeight in 2543, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.705423 = idf(docFreq=399, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.038997285 = weight(_text_:buch in 2543) [ClassicSimilarity], result of:
      0.038997285 = score(doc=2543,freq=6.0), product of:
        0.109575786 = queryWeight, product of:
          4.64937 = idf(docFreq=1149, maxDocs=44218)
          0.023567878 = queryNorm
        0.35589328 = fieldWeight in 2543, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          4.64937 = idf(docFreq=1149, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.018447628 = weight(_text_:und in 2543) [ClassicSimilarity], result of:
      0.018447628 = score(doc=2543,freq=26.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.3531656 = fieldWeight in 2543, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.014634798 = product of:
      0.029269597 = sum of:
        0.029269597 = weight(_text_:bibliothekswesen in 2543) [ClassicSimilarity], result of:
          0.029269597 = score(doc=2543,freq=4.0), product of:
            0.10505787 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.023567878 = queryNorm
            0.2786045 = fieldWeight in 2543, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.03125 = fieldNorm(doc=2543)
      0.5 = coord(1/2)
    0.04227155 = weight(_text_:informationswissenschaft in 2543) [ClassicSimilarity], result of:
      0.04227155 = score(doc=2543,freq=8.0), product of:
        0.10616633 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023567878 = queryNorm
        0.3981634 = fieldWeight in 2543, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.029269597 = weight(_text_:bibliothekswesen in 2543) [ClassicSimilarity], result of:
      0.029269597 = score(doc=2543,freq=4.0), product of:
        0.10505787 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.023567878 = queryNorm
        0.2786045 = fieldWeight in 2543, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.048331883 = weight(_text_:katalogisierung in 2543) [ClassicSimilarity], result of:
      0.048331883 = score(doc=2543,freq=4.0), product of:
        0.13500103 = queryWeight, product of:
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.023567878 = queryNorm
        0.35801122 = fieldWeight in 2543, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.048331883 = weight(_text_:katalogisierung in 2543) [ClassicSimilarity], result of:
      0.048331883 = score(doc=2543,freq=4.0), product of:
        0.13500103 = queryWeight, product of:
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.023567878 = queryNorm
        0.35801122 = fieldWeight in 2543, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.008322839 = weight(_text_:im in 2543) [ClassicSimilarity], result of:
      0.008322839 = score(doc=2543,freq=2.0), product of:
        0.066621356 = queryWeight, product of:
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.023567878 = queryNorm
        0.12492748 = fieldWeight in 2543, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.023974314 = product of:
      0.04794863 = sum of:
        0.04794863 = weight(_text_:allgemeines in 2543) [ClassicSimilarity], result of:
          0.04794863 = score(doc=2543,freq=4.0), product of:
            0.13446471 = queryWeight, product of:
              5.705423 = idf(docFreq=399, maxDocs=44218)
              0.023567878 = queryNorm
            0.35658893 = fieldWeight in 2543, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.705423 = idf(docFreq=399, maxDocs=44218)
              0.03125 = fieldNorm(doc=2543)
      0.5 = coord(1/2)
  0.4347826 = coord(10/23)

Abstract: Das vorliegende Buch zur automatischen Indexierung trägt dem Umstand Rechnung, dass ein ständig wachsender Berg von Dokumenten in Unternehmen, öffentlichen Verwaltungen, Einrichtungen der Fachinformation oder dem Internet entscheidungsrelevante Informationen enthält, die mit manuellen Mitteln und Methoden kaum mehr beherrschbar und erschließbar sind. Diese unstrukturierten Informationen sind in einer zunehmend von der schnellen Verarbeitung der Ressource Information abhängigen Wirtschaft von größter Bedeutung, ihre Beherrschung ist unabdingbar für den Wettbewerbserfolg. Verfahren der automatischen Indexierung von Dokumenten sind damit eine Basistechnik der betrieblichen Informationswirtschaft geworden. Trotz dieses Urnstandes, liegt bis auf den heutigen Tag keine einführende Darstellung in die Thematik vor. Die Zielsetzung dieses Buches ist es, einführend die Grundlagen sowie die verschiedenen Ansätze und Verfahren der automatischen Indexierung von Dokumenten vorzustellen. Die Darstellung verzichtet dabei bewusst auf die allzu detaillierte Tiefendarstellung einzelner Verfahren und Indexierungssysteme zugunsten einer Übersicht der grundsätzlichen Ansätze mit ihren jeweiligen Voraussetzungen, ihren Möglichkeiten und ihren Beschränkungen. Soweit einzelne Verfahren und Indexierungssysteme behandelt werden, besitzen diese beispielhaften Charakter für den behandelten Ansatz. Bei der Darstellung war ich stets uni eine verständliche Sprache bemüht. Der Text dieses Buches ist entstanden aus Vorlesungen in entsprechenden Lehrveranstaltungen im Studiengang Informationswirtschaft an der Fachhochschule Stuttgart. Die Darstellung richtet sich an Studierende und Lehrende der Informationswirtschaft, des Informationsmanagements, der Dokumentation sowie der Wirtschaftsinformatik, zugleich aber auch an die interessierten und mit der Thernatik konfrontierten Praktiker, die weniger an der technischen Seite der automatischen Indexierung, als vielmehr einen grundsätzlichen Informationsbedarf über die Möglichkeiten und die Schwierigkeiten des Einsatzes entsprechender Verfahren haben
BK: 06.70 / Katalogisierung / Bestandserschließung
Classification: AN 95300 Allgemeines / Buch- und Bibliothekswesen, Informationswissenschaft / Informationswissenschaft / Informationspraxis / Automatisches Indexing (z.B. KWIC, KWOC)
06.70 / Katalogisierung / Bestandserschließung
RVK: AN 95300 Allgemeines / Buch- und Bibliothekswesen, Informationswissenschaft / Informationswissenschaft / Informationspraxis / Automatisches Indexing (z.B. KWIC, KWOC)
Series: Materialien zur Information und Dokumentation; Bd.13

7e Dag van het Document : 19 & 20 mei 1998, Congrescentrum De Reehorst, Ede ; proceedings (1998) 0.10

0.095555685 = product of:
  0.43955615 = sum of:
    0.11987157 = weight(_text_:allgemeines in 2427) [ClassicSimilarity], result of:
      0.11987157 = score(doc=2427,freq=4.0), product of:
        0.13446471 = queryWeight, product of:
          5.705423 = idf(docFreq=399, maxDocs=44218)
          0.023567878 = queryNorm
        0.89147234 = fieldWeight in 2427, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.705423 = idf(docFreq=399, maxDocs=44218)
          0.078125 = fieldNorm(doc=2427)
    0.018089388 = weight(_text_:und in 2427) [ClassicSimilarity], result of:
      0.018089388 = score(doc=2427,freq=4.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.34630734 = fieldWeight in 2427, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=2427)
    0.12082971 = weight(_text_:katalogisierung in 2427) [ClassicSimilarity], result of:
      0.12082971 = score(doc=2427,freq=4.0), product of:
        0.13500103 = queryWeight, product of:
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.023567878 = queryNorm
        0.89502805 = fieldWeight in 2427, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.078125 = fieldNorm(doc=2427)
    0.12082971 = weight(_text_:katalogisierung in 2427) [ClassicSimilarity], result of:
      0.12082971 = score(doc=2427,freq=4.0), product of:
        0.13500103 = queryWeight, product of:
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.023567878 = queryNorm
        0.89502805 = fieldWeight in 2427, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.078125 = fieldNorm(doc=2427)
    0.059935786 = product of:
      0.11987157 = sum of:
        0.11987157 = weight(_text_:allgemeines in 2427) [ClassicSimilarity], result of:
          0.11987157 = score(doc=2427,freq=4.0), product of:
            0.13446471 = queryWeight, product of:
              5.705423 = idf(docFreq=399, maxDocs=44218)
              0.023567878 = queryNorm
            0.89147234 = fieldWeight in 2427, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.705423 = idf(docFreq=399, maxDocs=44218)
              0.078125 = fieldNorm(doc=2427)
      0.5 = coord(1/2)
  0.2173913 = coord(5/23)

BK: 06.00 (Information und Dokumentation: Allgemeines)
06.70 (Katalogisierung / Bestandserschließung)
Classification: 06.00 (Information und Dokumentation: Allgemeines)
06.70 (Katalogisierung / Bestandserschließung)

Groß, T.: Automatische Indexierung von Dokumenten in einer wissenschaftlichen Bibliothek : Implementierung und Evaluierung am Beispiel der Deutschen Zentralbibliothek für Wirtschaftswissenschaften (2011) 0.03

0.034676753 = product of:
  0.15951307 = sum of:
    0.02022455 = weight(_text_:und in 1083) [ClassicSimilarity], result of:
      0.02022455 = score(doc=1083,freq=20.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.3871834 = fieldWeight in 1083, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1083)
    0.060414854 = weight(_text_:katalogisierung in 1083) [ClassicSimilarity], result of:
      0.060414854 = score(doc=1083,freq=4.0), product of:
        0.13500103 = queryWeight, product of:
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.023567878 = queryNorm
        0.44751403 = fieldWeight in 1083, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1083)
    0.060414854 = weight(_text_:katalogisierung in 1083) [ClassicSimilarity], result of:
      0.060414854 = score(doc=1083,freq=4.0), product of:
        0.13500103 = queryWeight, product of:
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.023567878 = queryNorm
        0.44751403 = fieldWeight in 1083, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1083)
    0.010403548 = weight(_text_:im in 1083) [ClassicSimilarity], result of:
      0.010403548 = score(doc=1083,freq=2.0), product of:
        0.066621356 = queryWeight, product of:
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.023567878 = queryNorm
        0.15615936 = fieldWeight in 1083, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1083)
    0.008055268 = product of:
      0.016110536 = sum of:
        0.016110536 = weight(_text_:29 in 1083) [ClassicSimilarity], result of:
          0.016110536 = score(doc=1083,freq=2.0), product of:
            0.08290443 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.023567878 = queryNorm
            0.19432661 = fieldWeight in 1083, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.0390625 = fieldNorm(doc=1083)
      0.5 = coord(1/2)
  0.2173913 = coord(5/23)

Abstract: Die Bewertung der Indexierungsqualität bzw. -güte ist ein grundlegendes Problem von intellektuellen und automatischen Indexierungsverfahren. Letztere werden aber gerade im digitalen Zeitalter als einzige Möglichkeit angesehen, den zunehmenden Schwierigkeiten bibliothekarischer Informationsstrukturierung gerecht zu werden. Diese Studie befasst sich mit der Funktionsweise, Implementierung und Evaluierung der Sacherschließungssoftware MindServer Categorizer der Firma Recommind an der Deutschen Zentralbibliothek für Wirtschaftswissenschaften. Grundlage der maschinellen Sacherschließung und anschließenden quantitativen und qualitativen Auswertung bilden rund 39.000 wirtschaftswissenschaftliche Dokumente aus den Datenbanken Econis und EconStor. Unter Zuhilfenahme des rund 6.000 Schlagwörter umfassenden Standard-Thesaurus Wirtschaft wird der ursprünglich rein statistische Indexierungsansatz des MindServer Categorizer zu einem begriffsorientierten Verfahren weiterentwickelt und zur Inhaltserschließung digitaler Informationsressourcen eingesetzt. Der zentrale Fokus dieser Studie liegt vor allem auf der Evaluierung der maschinell beschlagworteten Titel, in Anlehnung an die hierzu von Stock und Lancaster vorgeschlagenen Kriterien: Indexierungskonsistenz, -tiefe, -breite, -spezifität, -effektivität. Weiterhin wird die Belegungsbilanz des STW evaluiert und es erfolgt zusätzlich eine qualitative, stichprobenartige Bewertung der Ergebnisse seitens der zuständigen Fachreferenten und -referentinnen.
BK: 06.70 Katalogisierung, Bestandserschließung
Classification: 06.70 Katalogisierung, Bestandserschließung
Date: 19. 6.2015 18:00:29

Niggemann, E.: Wer suchet, der findet? : Verbesserung der inhaltlichen Suchmöglichkeiten im Informationssystem Der Deutschen Bibliothek (2006) 0.03

0.029688058 = product of:
  0.13656507 = sum of:
    0.020021284 = weight(_text_:und in 5812) [ClassicSimilarity], result of:
      0.020021284 = score(doc=5812,freq=10.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.38329202 = fieldWeight in 5812, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5812)
    0.018109638 = product of:
      0.036219276 = sum of:
        0.036219276 = weight(_text_:bibliothekswesen in 5812) [ClassicSimilarity], result of:
          0.036219276 = score(doc=5812,freq=2.0), product of:
            0.10505787 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.023567878 = queryNorm
            0.34475547 = fieldWeight in 5812, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5812)
      0.5 = coord(1/2)
    0.036987606 = weight(_text_:informationswissenschaft in 5812) [ClassicSimilarity], result of:
      0.036987606 = score(doc=5812,freq=2.0), product of:
        0.10616633 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023567878 = queryNorm
        0.348393 = fieldWeight in 5812, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5812)
    0.036219276 = weight(_text_:bibliothekswesen in 5812) [ClassicSimilarity], result of:
      0.036219276 = score(doc=5812,freq=2.0), product of:
        0.10505787 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.023567878 = queryNorm
        0.34475547 = fieldWeight in 5812, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5812)
    0.025227265 = weight(_text_:im in 5812) [ClassicSimilarity], result of:
      0.025227265 = score(doc=5812,freq=6.0), product of:
        0.066621356 = queryWeight, product of:
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.023567878 = queryNorm
        0.37866634 = fieldWeight in 5812, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5812)
  0.2173913 = coord(5/23)

Abstract: Elektronische Bibliothekskataloge und Bibliografien haben ihr Monopol bei der Suche nach Büchern, Aufsätzen, musikalischen Werken u. a. verloren. Globale Suchmaschinen sind starke Konkurrenten, und Bibliotheken müssen heute so planen, dass ihre Dienstleistungen auch morgen noch interessant sind. Die Deutsche Bibliothek (DDB) wird ihre traditionelle Katalogrecherche zu einem globalen, netzbasierten Informationssystem erweitern, das die Vorteile der neutralen, qualitätsbasierten Katalogsuche mit den Vorteilen moderner Suchmaschinen zu verbinden sucht. Dieser Beitrag beschäftigt sich mit der Verbesserung der inhaltlichen Suchmöglichkeiten im Informationssystem Der Deutschen Bibliothek. Weitere Entwicklungsstränge sollen nur kurz im Ausblick angerissen werden.
Source: Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen

Automatische Indexierung zwischen Forschung und Anwendung (1986) 0.03

0.027435409 = product of:
  0.12620288 = sum of:
    0.039401412 = weight(_text_:buch in 953) [ClassicSimilarity], result of:
      0.039401412 = score(doc=953,freq=2.0), product of:
        0.109575786 = queryWeight, product of:
          4.64937 = idf(docFreq=1149, maxDocs=44218)
          0.023567878 = queryNorm
        0.35958138 = fieldWeight in 953, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.64937 = idf(docFreq=1149, maxDocs=44218)
          0.0546875 = fieldNorm(doc=953)
    0.01790758 = weight(_text_:und in 953) [ClassicSimilarity], result of:
      0.01790758 = score(doc=953,freq=8.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.34282678 = fieldWeight in 953, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=953)
    0.018109638 = product of:
      0.036219276 = sum of:
        0.036219276 = weight(_text_:bibliothekswesen in 953) [ClassicSimilarity], result of:
          0.036219276 = score(doc=953,freq=2.0), product of:
            0.10505787 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.023567878 = queryNorm
            0.34475547 = fieldWeight in 953, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.0546875 = fieldNorm(doc=953)
      0.5 = coord(1/2)
    0.036219276 = weight(_text_:bibliothekswesen in 953) [ClassicSimilarity], result of:
      0.036219276 = score(doc=953,freq=2.0), product of:
        0.10505787 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.023567878 = queryNorm
        0.34475547 = fieldWeight in 953, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.0546875 = fieldNorm(doc=953)
    0.014564968 = weight(_text_:im in 953) [ClassicSimilarity], result of:
      0.014564968 = score(doc=953,freq=2.0), product of:
        0.066621356 = queryWeight, product of:
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.023567878 = queryNorm
        0.2186231 = fieldWeight in 953, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.0546875 = fieldNorm(doc=953)
  0.2173913 = coord(5/23)

Abstract: Die automatische Indexierung von Dokumenten für das Information Retrieval, d. h. die automatische Charakterisierung von Dokumentinhalten mittels Deskriptoren (Schlagwörtern) ist bereits seit über 25 Jahren ein Gebiet theoretischer und experimenteller Forschung. Dagegen wurde erst im Oktober 1985 mit der Anwendung der automatischen Indexierung in der Inputproduktion für ein großes Retrievalsystem begonnen. Es handelt sich um die Indexierung englischer Referatetexte für die Physik-Datenbasis des Informationszentrums Energie, Physik, Mathematik GmbH in Karlsruhe. In dem vorliegenden Buch beschreiben Mitarbeiter der Technischen Hochschule Darmstadt ihre Forschungs- und Entwicklungsarbeiten, die zu dieser Pilotanwendung geführt haben.
Footnote: Rez. in: Zeitschrift für Bibliothekswesen und Bibliographie 35(1988) S.508-510 (W. Gödert)

Hüther, H.: Selix im DFG-Projekt Kascade (1998) 0.03

0.027023938 = product of:
  0.15538764 = sum of:
    0.012791129 = weight(_text_:und in 5151) [ClassicSimilarity], result of:
      0.012791129 = score(doc=5151,freq=2.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.24487628 = fieldWeight in 5151, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=5151)
    0.10567887 = weight(_text_:informationswissenschaft in 5151) [ClassicSimilarity], result of:
      0.10567887 = score(doc=5151,freq=8.0), product of:
        0.10616633 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023567878 = queryNorm
        0.99540854 = fieldWeight in 5151, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.078125 = fieldNorm(doc=5151)
    0.020807097 = weight(_text_:im in 5151) [ClassicSimilarity], result of:
      0.020807097 = score(doc=5151,freq=2.0), product of:
        0.066621356 = queryWeight, product of:
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.023567878 = queryNorm
        0.3123187 = fieldWeight in 5151, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.078125 = fieldNorm(doc=5151)
    0.016110536 = product of:
      0.03222107 = sum of:
        0.03222107 = weight(_text_:29 in 5151) [ClassicSimilarity], result of:
          0.03222107 = score(doc=5151,freq=2.0), product of:
            0.08290443 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.023567878 = queryNorm
            0.38865322 = fieldWeight in 5151, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.078125 = fieldNorm(doc=5151)
      0.5 = coord(1/2)
  0.17391305 = coord(4/23)

Date: 25. 8.2000 19:55:29
Series: Schriften zur Informationswissenschaft; Bd.34
Source: Knowledge Management und Kommunikationssysteme: Proceedings des 6. Internationalen Symposiums für Informationswissenschaft (ISI '98) Prag, 3.-7. November 1998 / Hochschulverband für Informationswissenschaft (HI) e.V. Konstanz ; Fachrichtung Informationswissenschaft der Universität des Saarlandes, Saarbrücken. Hrsg.: Harald H. Zimmermann u. Volker Schramm

Glaesener, L.: Automatisches Indexieren einer informationswissenschaftlichen Datenbank mit Mehrwortgruppen (2012) 0.02

0.02486735 = product of:
  0.114389814 = sum of:
    0.022881467 = weight(_text_:und in 401) [ClassicSimilarity], result of:
      0.022881467 = score(doc=401,freq=10.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.438048 = fieldWeight in 401, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=401)
    0.02069673 = product of:
      0.04139346 = sum of:
        0.04139346 = weight(_text_:bibliothekswesen in 401) [ClassicSimilarity], result of:
          0.04139346 = score(doc=401,freq=2.0), product of:
            0.10505787 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.023567878 = queryNorm
            0.39400625 = fieldWeight in 401, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.0625 = fieldNorm(doc=401)
      0.5 = coord(1/2)
    0.04139346 = weight(_text_:bibliothekswesen in 401) [ClassicSimilarity], result of:
      0.04139346 = score(doc=401,freq=2.0), product of:
        0.10505787 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.023567878 = queryNorm
        0.39400625 = fieldWeight in 401, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.0625 = fieldNorm(doc=401)
    0.016645677 = weight(_text_:im in 401) [ClassicSimilarity], result of:
      0.016645677 = score(doc=401,freq=2.0), product of:
        0.066621356 = queryWeight, product of:
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.023567878 = queryNorm
        0.24985497 = fieldWeight in 401, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.0625 = fieldNorm(doc=401)
    0.012772488 = product of:
      0.025544977 = sum of:
        0.025544977 = weight(_text_:22 in 401) [ClassicSimilarity], result of:
          0.025544977 = score(doc=401,freq=2.0), product of:
            0.08253069 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.023567878 = queryNorm
            0.30952093 = fieldWeight in 401, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=401)
      0.5 = coord(1/2)
  0.2173913 = coord(5/23)

Abstract: Ein Bericht über die Ergebnisse und die Prozessanalyse einer automatischen Indexierung mit Mehrwortgruppen. Diese Bachelorarbeit beschreibt, inwieweit der Inhalt informationswissenschaftlicher Fachtexte durch informationswissenschaftliches Fachvokabular erschlossen werden kann und sollte und dass in diesen wissenschaftlichen Texten ein Großteil der fachlichen Inhalte in Mehrwortgruppen vorkommt. Die Ergebnisse wurden durch eine automatische Indexierung mit Mehrwortgruppen mithilfe des Programme Lingo an einer informationswissenschaftlichen Datenbank ermittelt.
Content: Bachelorarbeit im Studiengang Bibliothekswesen der Fakultät für Informations- und Kommunikationswissenschaften an der Fachhochschule Köln.
Date: 11. 9.2012 19:43:22
Imprint: Köln : Fachhochschule / Fakultät für Informations- und Kommunikationswissenschaften

Lepsky, K.: Automatische Indexierung und bibliothekarische Inhaltserschließung : Ergebnisse des DFG-Projekts MILOS I (1996) 0.02

0.023533383 = product of:
  0.13531695 = sum of:
    0.020305287 = weight(_text_:und in 2061) [ClassicSimilarity], result of:
      0.020305287 = score(doc=2061,freq=14.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.38872904 = fieldWeight in 2061, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=2061)
    0.05126371 = weight(_text_:katalogisierung in 2061) [ClassicSimilarity], result of:
      0.05126371 = score(doc=2061,freq=2.0), product of:
        0.13500103 = queryWeight, product of:
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.023567878 = queryNorm
        0.37972826 = fieldWeight in 2061, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.046875 = fieldNorm(doc=2061)
    0.05126371 = weight(_text_:katalogisierung in 2061) [ClassicSimilarity], result of:
      0.05126371 = score(doc=2061,freq=2.0), product of:
        0.13500103 = queryWeight, product of:
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.023567878 = queryNorm
        0.37972826 = fieldWeight in 2061, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.046875 = fieldNorm(doc=2061)
    0.012484257 = weight(_text_:im in 2061) [ClassicSimilarity], result of:
      0.012484257 = score(doc=2061,freq=2.0), product of:
        0.066621356 = queryWeight, product of:
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.023567878 = queryNorm
        0.18739122 = fieldWeight in 2061, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.046875 = fieldNorm(doc=2061)
  0.17391305 = coord(4/23)

Abstract: Kooperative Katalogisierung in der Bibliotheksverbünden und steigende Zahlen retrokonvertierter Altdaten füfhren zu einem stetigen Anwachsen maschinenlesbar verfügbarer Titeldaten. Dieser Entewicklung aud ser Katalogisat- bzw. Datenseite entspricht eine ähnlich rasante Entwicklung auf der Seite der Zugangsmöglichkeiten, den Online-Publikumskatalogen. Immer mehr Katalogdaten von immer mehr Bibliotheken sind in immer mehr OPACs nachgewiesen. Mit dieser auch durch neue Zugriffsformen (Internet) verbesserten Verfügbarkeit hält die bibliothekarische Sacherschließung längst nicht mehr Schritt. In diesem Beitrag werden die Vorgehensweise und Ergebnisse des Projektes MILOS I vorgestellt, das an der Universitäts- und Landesbibliothek zur automatischen Indexierung bibliothekarischer Titeldaten und zur Anreicherung von Katalogdaten durchgeführt wurde.
Imprint: Düsseldorf : Universitäts- und Landesbibliothek
Series: Schriften der Universitäts- und Landesbibliothek Düsseldorf; Bd.25
Source: Zukunft der Sacherschließung im OPAC: Vorträge des 2. Düsseldorfer OPAC-Kolloquiums am 21. Juni 1995. Hrsg.: E. Niggemann u. K. Lepsky

Lepsky, K.; Siepmann, J.; Zimmermann, A.: Automatische Indexierung für Online-Kataloge : Ergebnisse eines Retrievaltests (1996) 0.02

0.02196036 = product of:
  0.10101766 = sum of:
    0.00895379 = weight(_text_:und in 3251) [ClassicSimilarity], result of:
      0.00895379 = score(doc=3251,freq=2.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.17141339 = fieldWeight in 3251, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3251)
    0.018109638 = product of:
      0.036219276 = sum of:
        0.036219276 = weight(_text_:bibliothekswesen in 3251) [ClassicSimilarity], result of:
          0.036219276 = score(doc=3251,freq=2.0), product of:
            0.10505787 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.023567878 = queryNorm
            0.34475547 = fieldWeight in 3251, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3251)
      0.5 = coord(1/2)
    0.036219276 = weight(_text_:bibliothekswesen in 3251) [ClassicSimilarity], result of:
      0.036219276 = score(doc=3251,freq=2.0), product of:
        0.10505787 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.023567878 = queryNorm
        0.34475547 = fieldWeight in 3251, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3251)
    0.029957397 = product of:
      0.059914794 = sum of:
        0.059914794 = weight(_text_:kataloge in 3251) [ClassicSimilarity], result of:
          0.059914794 = score(doc=3251,freq=2.0), product of:
            0.1351219 = queryWeight, product of:
              5.733308 = idf(docFreq=388, maxDocs=44218)
              0.023567878 = queryNorm
            0.4434129 = fieldWeight in 3251, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.733308 = idf(docFreq=388, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3251)
      0.5 = coord(1/2)
    0.0077775535 = product of:
      0.015555107 = sum of:
        0.015555107 = weight(_text_:1 in 3251) [ClassicSimilarity], result of:
          0.015555107 = score(doc=3251,freq=4.0), product of:
            0.057894554 = queryWeight, product of:
              2.4565027 = idf(docFreq=10304, maxDocs=44218)
              0.023567878 = queryNorm
            0.26867998 = fieldWeight in 3251, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              2.4565027 = idf(docFreq=10304, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3251)
      0.5 = coord(1/2)
  0.2173913 = coord(5/23)

Abstract: Examines the effectiveness of automated indexing and presents the results of a study of information retrieval from a segment (40.000 items) of the ULB Düsseldorf database. The segment was selected randomly and all the documents included were indexed automatically. The search topics included 50 subject areas ranging from economic growth to alternative energy sources. While there were 876 relevant documents in the database segment for each of the 50 search topics, the recall ranged from 1 to 244 references, with the average being 17.52 documents per topic. Therefore it seems that, in the immediate future, automatic indexing should be used in combination with intellectual indexing
Source: Zeitschrift für Bibliothekswesen und Bibliographie. 43(1996) H.1, S.47-56

Lepsky, K.: Automatische Indexierung des Reallexikons zur Deutschen Kunstgeschichte (2006) 0.02
```
0.02121902 = product of:
  0.08133958 = sum of:
    0.015508419 = weight(_text_:und in 6080) [ClassicSimilarity], result of:
      0.015508419 = score(doc=6080,freq=24.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.2968967 = fieldWeight in 6080, product of:
          4.8989797 = tf(freq=24.0), with freq of:
            24.0 = termFreq=24.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02734375 = fieldNorm(doc=6080)
    0.009054819 = product of:
      0.018109638 = sum of:
        0.018109638 = weight(_text_:bibliothekswesen in 6080) [ClassicSimilarity], result of:
          0.018109638 = score(doc=6080,freq=2.0), product of:
            0.10505787 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.023567878 = queryNorm
            0.17237774 = fieldWeight in 6080, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.02734375 = fieldNorm(doc=6080)
      0.5 = coord(1/2)
    0.018493803 = weight(_text_:informationswissenschaft in 6080) [ClassicSimilarity], result of:
      0.018493803 = score(doc=6080,freq=2.0), product of:
        0.10616633 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023567878 = queryNorm
        0.1741965 = fieldWeight in 6080, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.02734375 = fieldNorm(doc=6080)
    0.018109638 = weight(_text_:bibliothekswesen in 6080) [ClassicSimilarity], result of:
      0.018109638 = score(doc=6080,freq=2.0), product of:
        0.10505787 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.023567878 = queryNorm
        0.17237774 = fieldWeight in 6080, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.02734375 = fieldNorm(doc=6080)
    0.016284129 = weight(_text_:im in 6080) [ClassicSimilarity], result of:
      0.016284129 = score(doc=6080,freq=10.0), product of:
        0.066621356 = queryWeight, product of:
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.023567878 = queryNorm
        0.24442805 = fieldWeight in 6080, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.02734375 = fieldNorm(doc=6080)
    0.0038887768 = product of:
      0.0077775535 = sum of:
        0.0077775535 = weight(_text_:1 in 6080) [ClassicSimilarity], result of:
          0.0077775535 = score(doc=6080,freq=4.0), product of:
            0.057894554 = queryWeight, product of:
              2.4565027 = idf(docFreq=10304, maxDocs=44218)
              0.023567878 = queryNorm
            0.13433999 = fieldWeight in 6080, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              2.4565027 = idf(docFreq=10304, maxDocs=44218)
              0.02734375 = fieldNorm(doc=6080)
      0.5 = coord(1/2)
  0.26086956 = coord(6/23)
```
Abstract

Digitalisierungsvorhaben sorgen für eine immer größere Verfügbarkeit von Inhalten bislang ausschließlich gedruckt vorliegender Werke, zunehmend auch von ganzen Büchern. Projekte wie "Google Print" versprechen die völlige elektronische Verfügbarkeit von Informationen nahezu unabhängig von Zeit und Ort und sorgen dafür, dass die Hüter der konventionellen Information, die Bibliotheken, in Angst und Schrecken versetzt werden angesichts des befürchteten Verlusts ihrer traditionellen Rolle. Die Debatte kreist dabei eher selten um die Frage, welcher Nutzen sich konkret aus dem elektronischen Volltext ergibt: Der Nutzen steht schlichtweg außer Frage, Volltexte gelten prinzipiell als nützlich. Das ist insofern zu optimistisch, als die reine Verfügbarkeit von Information noch lange nicht fir deren sinnvolle Verwertung sorgt - die bloße Verfügbarkeit des Volltexts von Kants "Kritik der reinen Vernunft" enthebt nicht der Notwendigkeit, das Werk zu lesen und verstehen zu wollen. Lesen wird man besser auch nicht am Bildschirm sondern in der (neu-deutsch) "PrintAusgabe". Elektronische Volltexte von Büchern dienen nicht der Lektüre. Falls ihr Sinn nicht ohnehin ein rein verkaufsfördernder ist (das "Publishers Program" von Google Print erweckt in der Tat diesen Eindruck), bleibt ihr potenzieller Nutzen als Nachschlageinstrument. Nur der Volltext bietet die Möglichkeit, Informationen in einem Werk zu finden, die nicht explizit erschlossen wurden, durch ein Inhaltsverzeichnis etwa oder, eine noch günstigere Ausgangslage, durch ein Sachregister. Allerdings sind die meisten Werke nicht für einen solchen Zweck verfasst worden, d.h. es ist nicht zu erwarten, dass ein Werk über die "Geschichte des Römischen Reiches" im Volltextzugriff zu einem Lexikon zur Geschichte des Römischen Reiches wird. Entspricht also die hinter Google Print und zahllosen anderen Digitalisierungsinitiativen stehende Auffassung einem doch sehr naiven Bild von der Nützlichkeit gedruckter Information?
Seriöse Information darf erwarten, wer renommierte Nachschlagewerke befragt. Zumindest für die über die Primärordnung (Stichwort/Lemma) erschlossenen Sachverhalte ist für Buchausgaben ein gezielter Zugriff möglich, Verweisungen zwischen Artikeln sorgen für weitere Einstiege. Anzunehmen ist, dass sich der Nutzen von Nachschlagewerken in elektronischer Form noch deutlich erhöhen lässt: Produkte wie z.B. "Brockhaus multimedial" oder "Encyclopedia Britannica" sorgen mit leistungsfähigen Techniken über den wahlfreien Volltextzugriff hinaus für zahlreiche Navigations- und Recherchemöglichkeiten. Es liegt daher nahe, über eine Digitalisierung konventionell vorliegender Nachschlagewerke auch deren Anwendung zu verbessern, die im Print möglichen Zugriffsmöglichkeiten deutlich zu erweitern. Beispiele für diesen Ansatz sind die Digitalisierung der "Oekonomischen Encyklopädie" von Johann Georg Krünitz, die mit hohem Aufwand nicht maschinell (Scanning und OCR) sondern manuell realisiert wurde oder auch die im "Projekt Runeberg' , vorgenommenen zahlreichen Digitalisierungen u.a. auch von Nachschlagewerken. Ob die einfache Volltextindexierung derartig umfangreicher und - weil bereits als Nachschlagewerk konzipiert - gleichzeitig extrem verdichteter Quellen für einen größtmöglichen Nutzen der elektronischen Version ausreicht, darf zu Recht bezweifelt werden. In kommerziellen Produkten sorgen daher zusätzliche Techniken für einerseits thematisch gezielte Zugriffe auch über Nicht-Stichwörter, andererseits für Querverbindungen zu möglicherweise weiteren Artikeln von Interesse ("Wissensnetz" des Brockhaus, "Knowledge Navigator" der Britannica). Es darf angenommen werden, dass derartige Techniken dabei auf Informationen aufsetzen können (Strukturierung der Artikel, gekennzeichnete (getaggte) Personennamen, Querverweise etc.), die in den zu verarbeitenden Artikeln in nutzbarer Form vorliegen. Für digitalisierte Druckausgaben kommen derartige Verfahren nicht in Frage, weil lediglich flache, noch dazu in der Regel mit OCR-Fehlern behaftete Texte vorliegen. Die Zugriffsmöglichkeiten bewegen sich daher zwischen der 1:1-Umsetzung der Druckausgabe, d.h. dem Primärzugriff über Stichwort, und der Volltextsuche auf den vollständigen Lexikontext. Beides ist angesichts der im elektronischen Volltext liegenden Möglichkeiten sicher nicht die Methode der Wahl. Für die Digitalisierung des "Reallexikons zur Deutschen Kunstgeschichte" im Rahmen des von der Deutschen Forschungsgemeinschaft geförderten Projekts "RDKWeb" wird daher versucht, mit den Mitteln der Automatischen Indexierung eine Lösung zu erzielen, die über eine reine Volltextsuchmöglichkeit hinaus Suchunterstützungen bietet, die sich an den Fähigkeiten kommerzieller Produkte orientieren (nicht messen!).

Source

Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen

Giesselbach, S.; Estler-Ziegler, T.: Dokumente schneller analysieren mit Künstlicher Intelligenz (2021) 0.02

0.02052138 = product of:
  0.11799794 = sum of:
    0.022154884 = weight(_text_:und in 128) [ClassicSimilarity], result of:
      0.022154884 = score(doc=128,freq=24.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.42413816 = fieldWeight in 128, product of:
          4.8989797 = tf(freq=24.0), with freq of:
            24.0 = termFreq=24.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=128)
    0.04271975 = weight(_text_:katalogisierung in 128) [ClassicSimilarity], result of:
      0.04271975 = score(doc=128,freq=2.0), product of:
        0.13500103 = queryWeight, product of:
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.023567878 = queryNorm
        0.3164402 = fieldWeight in 128, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.0390625 = fieldNorm(doc=128)
    0.04271975 = weight(_text_:katalogisierung in 128) [ClassicSimilarity], result of:
      0.04271975 = score(doc=128,freq=2.0), product of:
        0.13500103 = queryWeight, product of:
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.023567878 = queryNorm
        0.3164402 = fieldWeight in 128, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.7281795 = idf(docFreq=390, maxDocs=44218)
          0.0390625 = fieldNorm(doc=128)
    0.010403548 = weight(_text_:im in 128) [ClassicSimilarity], result of:
      0.010403548 = score(doc=128,freq=2.0), product of:
        0.066621356 = queryWeight, product of:
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.023567878 = queryNorm
        0.15615936 = fieldWeight in 128, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.0390625 = fieldNorm(doc=128)
  0.17391305 = coord(4/23)

Abstract: Künstliche Intelligenz (KI) und natürliches Sprachverstehen (natural language understanding/NLU) verändern viele Aspekte unseres Alltags und unserer Arbeitsweise. Besondere Prominenz erlangte NLU durch Sprachassistenten wie Siri, Alexa und Google Now. NLU bietet Firmen und Einrichtungen das Potential, Prozesse effizienter zu gestalten und Mehrwert aus textuellen Inhalten zu schöpfen. So sind NLU-Lösungen in der Lage, komplexe, unstrukturierte Dokumente inhaltlich zu erschließen. Für die semantische Textanalyse hat das NLU-Team des IAIS Sprachmodelle entwickelt, die mit Deep-Learning-Verfahren trainiert werden. Die NLU-Suite analysiert Dokumente, extrahiert Eckdaten und erstellt bei Bedarf sogar eine strukturierte Zusammenfassung. Mit diesen Ergebnissen, aber auch über den Inhalt der Dokumente selbst, lassen sich Dokumente vergleichen oder Texte mit ähnlichen Informationen finden. KI-basierten Sprachmodelle sind der klassischen Verschlagwortung deutlich überlegen. Denn sie finden nicht nur Texte mit vordefinierten Schlagwörtern, sondern suchen intelligent nach Begriffen, die in ähnlichem Zusammenhang auftauchen oder als Synonym gebraucht werden. Der Vortrag liefert eine Einordnung der Begriffe "Künstliche Intelligenz" und "Natural Language Understanding" und zeigt Möglichkeiten, Grenzen, aktuelle Forschungsrichtungen und Methoden auf. Anhand von Praxisbeispielen wird anschließend demonstriert, wie NLU zur automatisierten Belegverarbeitung, zur Katalogisierung von großen Datenbeständen wie Nachrichten und Patenten und zur automatisierten thematischen Gruppierung von Social Media Beiträgen und Publikationen genutzt werden kann.
Footnote: Vortrag im Rahmen des Berliner Arbeitskreis Information (BAK) am 25.02.2021.

Gaus, W.; Kaluscha, R.: Maschinelle inhaltliche Erschließung von Arztbriefen und Auswertung von Reha-Entlassungsberichten (2006) 0.02
```
0.019325769 = product of:
  0.08889854 = sum of:
    0.022302093 = weight(_text_:und in 6078) [ClassicSimilarity], result of:
      0.022302093 = score(doc=6078,freq=38.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.42695636 = fieldWeight in 6078, product of:
          6.164414 = tf(freq=38.0), with freq of:
            38.0 = termFreq=38.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=6078)
    0.010348365 = product of:
      0.02069673 = sum of:
        0.02069673 = weight(_text_:bibliothekswesen in 6078) [ClassicSimilarity], result of:
          0.02069673 = score(doc=6078,freq=2.0), product of:
            0.10505787 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.023567878 = queryNorm
            0.19700313 = fieldWeight in 6078, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.03125 = fieldNorm(doc=6078)
      0.5 = coord(1/2)
    0.021135775 = weight(_text_:informationswissenschaft in 6078) [ClassicSimilarity], result of:
      0.021135775 = score(doc=6078,freq=2.0), product of:
        0.10616633 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023567878 = queryNorm
        0.1990817 = fieldWeight in 6078, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.03125 = fieldNorm(doc=6078)
    0.02069673 = weight(_text_:bibliothekswesen in 6078) [ClassicSimilarity], result of:
      0.02069673 = score(doc=6078,freq=2.0), product of:
        0.10505787 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.023567878 = queryNorm
        0.19700313 = fieldWeight in 6078, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.03125 = fieldNorm(doc=6078)
    0.01441558 = weight(_text_:im in 6078) [ClassicSimilarity], result of:
      0.01441558 = score(doc=6078,freq=6.0), product of:
        0.066621356 = queryWeight, product of:
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.023567878 = queryNorm
        0.21638076 = fieldWeight in 6078, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.03125 = fieldNorm(doc=6078)
  0.2173913 = coord(5/23)
```
Abstract

Schon Hippokrates empfahl den Ärzten, Krankenakten zu führen. Heute ist die detaillierte Dokumentation eine Standespflicht der Ärzte [Gaus et al 1999]. Diese Dokumentationen medizinischer Behandlungen bergen einen riesigen und wertvollen Erfahrungsschatz. Informationen zu Therapien und Behandlungsergebnissen, die in Studien erst mühsam erhoben werden müssten, sind bereits in der Routinedokumentation wie Operations- und Entlassungsberichten oder Arztbriefen zahlreich vorhanden. Mit der Einführung der elektronischen Datenverarbeitung in der Medizin liegen diese Informationen seit einigen Jahren auch maschinenlesbar vor, so dass ein Haupthemmnis für die Nutzung dieser Dokumentationen, nämlich die mühsame manuelle Aufbereitung der Papierakten, entfällt. Während die formale Erschließung nach Patientenmerkmalen wie Name und Geburtsdatum von den Krankenhaus- bzw. Praxisinformationssystemen heutzutage gut gelöst ist, bleibt die inhaltliche Erschließung dieser Dokumentationen schwierig, da nur wenige Informationen in strukturierter oder intellektuell indexierter Form vorliegen [Leiner et al. 2003]. Auch wenn nach der Einführung der Fallpauschalen (diagnosis related groups, DRG) in den Krankenhäusern die Diagnosen nach ICD-10 verschlüsselt werden, besteht ein Großteil der Informationen weiterhin aus freiem Text, dessen computerbasierte Erschließung aufgrund der Komplexität menschlicher Sprache nicht trivial ist. Zu diesen medizinischen Texten gehören u.a. Gutachten, verbal beschriebene (Differential-) Diagnosen, vielfältige Untersuchungs- und Befundberichte, Visitenblätter, Operationsberichte und der Arztbrief bzw. Entlassungsbericht. Arztbrief und Entlassbericht dienen der Information des einweisenden oder weiterbehandelnden Arztes (z.B. Hausarzt) über das, was mit dem Patienten geschehen ist, und geben Empfehlungen zur Weiterbehandlung. Sie fassen eine (stationäre) Behandlung epikritisch - also nachdem die Krankheit überwunden ist, im Rückblick - zusammen und geben einen Überblick über Anamnese (Vorgeschichte), Beschwerden und Symptome, die eingesetzten diagnostischen Verfahren, die gestellte(n) Diagnose(n), Therapie, Verlauf, Komplikationen und das erzielte Ergebnis. Sie haben somit eine ähnliche Funktion wie das Abstract in der Literaturdokumentation, oft wird eine Kopie in der Krankenakte obenauf abgelegt. Zumindest in Universitätskliniken möchten wissenschaftlich arbeitende Ärzte auch unter inhaltlichen Gesichtspunkten auf die Krankenakten zugreifen können, z.B. die Krankenakten aller Patienten mit einer bestimmten Diagnose einsehen, exzerpieren und die exzerpierten Daten auswerten. Auch bei der Suche nach ähnlichen Fällen oder im Bereich der Aus- und Fortbildung hilft eine inhaltliche Erschließung weiter. So könnte etwa ein Assistenzarzt, der im Rahmen seiner Weiterbildung demnächst Sonografien des Kniegelenkes durchzuführen hat, sich vorhandene Berichte von solchen Sonografien anschauen und sich so über relevante Untersuchungstechniken und Befunde vorab informieren.

Source

Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen
Carevic, Z.: Semi-automatische Verschlagwortung zur Integration externer semantischer Inhalte innerhalb einer medizinischen Kooperationsplattform (2012) 0.02
```
0.01673494 = product of:
  0.09622591 = sum of:
    0.04794863 = weight(_text_:allgemeines in 897) [ClassicSimilarity], result of:
      0.04794863 = score(doc=897,freq=4.0), product of:
        0.13446471 = queryWeight, product of:
          5.705423 = idf(docFreq=399, maxDocs=44218)
          0.023567878 = queryNorm
        0.35658893 = fieldWeight in 897, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.705423 = idf(docFreq=399, maxDocs=44218)
          0.03125 = fieldNorm(doc=897)
    0.012532695 = weight(_text_:und in 897) [ClassicSimilarity], result of:
      0.012532695 = score(doc=897,freq=12.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.23992877 = fieldWeight in 897, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=897)
    0.011770271 = weight(_text_:im in 897) [ClassicSimilarity], result of:
      0.011770271 = score(doc=897,freq=4.0), product of:
        0.066621356 = queryWeight, product of:
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.023567878 = queryNorm
        0.17667414 = fieldWeight in 897, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.03125 = fieldNorm(doc=897)
    0.023974314 = product of:
      0.04794863 = sum of:
        0.04794863 = weight(_text_:allgemeines in 897) [ClassicSimilarity], result of:
          0.04794863 = score(doc=897,freq=4.0), product of:
            0.13446471 = queryWeight, product of:
              5.705423 = idf(docFreq=399, maxDocs=44218)
              0.023567878 = queryNorm
            0.35658893 = fieldWeight in 897, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.705423 = idf(docFreq=399, maxDocs=44218)
              0.03125 = fieldNorm(doc=897)
      0.5 = coord(1/2)
  0.17391305 = coord(4/23)
```
Abstract

Die vorliegende Arbeit beschäftigt sich mit der Integration von externen semantischen Inhalten auf Basis eines medizinischen Begriffssystems. Die zugrundeliegende Annahme ist, dass die Verwendung einer einheitlichen Terminologie auf Seiten des Anfragesystems und der Wissensbasis zu qualitativ hochwertigen Ergebnissen führt. Um dies zu erreichen muss auf Seiten des Anfragesystems eine Abbildung natürlicher Sprache auf die verwendete Terminologie gewährleistet werden. Dies geschieht auf Basis einer (semi-)automatischen Verschlagwortung textbasierter Inhalte. Im Wesentlichen lassen sich folgende Fragestellungen festhalten: Automatische Verschlagwortung textbasierter Inhalte Kann eine automatische Verschlagwortung textbasierter Inhalte auf Basis eines Begriffssystems optimiert werden? Der zentrale Aspekt der vorliegenden Arbeit ist die (semi-)automatische Verschlagwortung textbasierter Inhalte auf Basis eines medizinischen Begriffssystems. Zu diesem Zweck wird der aktuelle Stand der Forschung betrachtet. Es werden eine Reihe von Tokenizern verglichen um zu erfahren welche Algorithmen sich zur Ermittlung von Wortgrenzen eignen. Speziell wird betrachtet, wie die Ermittlung von Wortgrenzen in einer domänenspezifischen Umgebung eingesetzt werden kann. Auf Basis von identifizierten Token in einem Text werden die Auswirkungen des Stemming und POS-Tagging auf die Gesamtmenge der zu analysierenden Inhalte beobachtet. Abschließend wird evaluiert wie ein kontrolliertes Vokabular die Präzision bei der Verschlagwortung erhöhen kann. Dies geschieht unter der Annahme dass domänenspezifische Inhalte auch innerhalb eines domänenspezifischen Begriffssystems definiert sind. Zu diesem Zweck wird ein allgemeines Prozessmodell entwickelt anhand dessen eine Verschlagwortung vorgenommen wird.
Integration externer Inhalte Inwieweit kann die Nutzung einer einheitlichen Terminologie zwischen Anfragesystem und Wissensbasis den Prozess der Informationsbeschaffung unterstützen? Zu diesem Zweck wird in einer ersten Phase ermittelt welche Wissensbasen aus der medizinischen Domäne in der Linked Data Cloud zur Verfügung stehen. Aufbauend auf den Ergebnissen werden Informationen aus verschiedenen dezentralen Wissensbasen exemplarisch integriert. Der Fokus der Betrachtung liegt dabei auf der verwendeten Terminologie sowie der Nutzung von Semantic Web Technologien. Neben Informationen aus der Linked Data Cloud erfolgt eine Suche nach medizinischer Literatur in PubMed. Wie auch in der Linked Data Cloud erfolgt die Integration unter Verwendung einer einheitlichen Terminologie. Eine weitere Fragestellung ist, wie Informationen aus insgesamt 21. Mio Aufsatzzitaten in PubMed sinnvoll integriert werden können. Dabei wird ermittelt welche Mechanismen eingesetzt werden können um die Präzision der Ergebnisse zu optimieren. Eignung medizinischer Begriffssystem Welche medizinischen Begriffssysteme existieren und wie eignen sich diese als zugrungeliegendes Vokabular für die automatische Verschlagwortung und Integration semantischer Inhalte? Der Fokus liegt dabei speziell auf einer Bewertung der Reichhaltigkeit von Begriffssystemen, wobei insbesondere der Detaillierungsgrad von Interesse ist. Handelt es sich um ein spezifisches oder allgemeines Begriffssystem und eignet sich dieses auch dafür bestimmte Teilaspekte der Medizin, wie bspw. die Chirurige oder die Anästhesie, in einer ausreichenden Tiefe zu beschreiben?

Content

Masterarbeit, ausgearbeitet von Zeljko Carevic zur Erlangung des akademischen Grades Master of Science vorgelegt an der Fachhochschule Köln Campus Gummersbach im Studiengang Medieninformatik. Vgl.. unter: http://opus.bibl.fh-koeln.de/volltexte/2012/376/pdf/Carevic.pdf.

Grün, S.: Bildung von Komposita-Indextermen auf der Basis einer algorithmischen Mehrwortgruppenanalyse mit Lingo (2015) 0.02

0.01659694 = product of:
  0.0954324 = sum of:
    0.0171611 = weight(_text_:und in 1335) [ClassicSimilarity], result of:
      0.0171611 = score(doc=1335,freq=10.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.328536 = fieldWeight in 1335, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1335)
    0.015522547 = product of:
      0.031045094 = sum of:
        0.031045094 = weight(_text_:bibliothekswesen in 1335) [ClassicSimilarity], result of:
          0.031045094 = score(doc=1335,freq=2.0), product of:
            0.10505787 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.023567878 = queryNorm
            0.2955047 = fieldWeight in 1335, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.046875 = fieldNorm(doc=1335)
      0.5 = coord(1/2)
    0.031703662 = weight(_text_:informationswissenschaft in 1335) [ClassicSimilarity], result of:
      0.031703662 = score(doc=1335,freq=2.0), product of:
        0.10616633 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023567878 = queryNorm
        0.29862255 = fieldWeight in 1335, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.046875 = fieldNorm(doc=1335)
    0.031045094 = weight(_text_:bibliothekswesen in 1335) [ClassicSimilarity], result of:
      0.031045094 = score(doc=1335,freq=2.0), product of:
        0.10505787 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.023567878 = queryNorm
        0.2955047 = fieldWeight in 1335, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.046875 = fieldNorm(doc=1335)
  0.17391305 = coord(4/23)

Abstract: In der deutschen Sprache lassen sich Begriffe durch Komposita und Mehrwortgruppen ausdrücken. Letztere können dabei aber auch als Kompositum selbst ausgedrückt werden und entsprechend auf den gleichen Begriff verweisen. In der nachfolgenden Studie werden Mehrwortgruppen analysiert, die auch Komposita sein können. Ziel der Untersuchung ist es, diese Wortfolgen über Muster zu identifizieren. Analysiert wurden Daten des Karrieremanagers Placement24 GmbH - in Form von Stellenanzeigen. Die Extraktion von Mehrwortgruppen erfolgte algorithmisch und wurde mit der Open-Source Software Lingo durch geführt. Auf der Basis von Erweiterungen bzw. Anpassungen in Wörterbüchern und den darin getaggten Wörtern wurde drei- bis fünfstelligen Kandidaten analysiert. Aus positiv bewerteten Mehrwortgruppen wurden Komposita gebildet. Diese wurden mit den identifizierten Komposita aus den Stellenanzeigen verglichen. Der Vergleich zeigte, dass ein Großteil der neu generierten Komposita nicht durch eine Kompositaidentifizierung erzeugt wurde.
Content: Bachelorarbeit, Studiengang Bibliothekswesen, Fakultät für Informations- und Kommunikationswissenschaften, Fachhochschule Köln
Imprint: Köln : Fachhochschule, Institut für Informationswissenschaft

Probst, M.; Mittelbach, J.: Maschinelle Indexierung in der Sacherschließung wissenschaftlicher Bibliotheken (2006) 0.02

0.01624896 = product of:
  0.09343152 = sum of:
    0.022881467 = weight(_text_:und in 1755) [ClassicSimilarity], result of:
      0.022881467 = score(doc=1755,freq=10.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.438048 = fieldWeight in 1755, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1755)
    0.034237023 = product of:
      0.06847405 = sum of:
        0.06847405 = weight(_text_:kataloge in 1755) [ClassicSimilarity], result of:
          0.06847405 = score(doc=1755,freq=2.0), product of:
            0.1351219 = queryWeight, product of:
              5.733308 = idf(docFreq=388, maxDocs=44218)
              0.023567878 = queryNorm
            0.5067576 = fieldWeight in 1755, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.733308 = idf(docFreq=388, maxDocs=44218)
              0.0625 = fieldNorm(doc=1755)
      0.5 = coord(1/2)
    0.023540542 = weight(_text_:im in 1755) [ClassicSimilarity], result of:
      0.023540542 = score(doc=1755,freq=4.0), product of:
        0.066621356 = queryWeight, product of:
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.023567878 = queryNorm
        0.35334828 = fieldWeight in 1755, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.0625 = fieldNorm(doc=1755)
    0.012772488 = product of:
      0.025544977 = sum of:
        0.025544977 = weight(_text_:22 in 1755) [ClassicSimilarity], result of:
          0.025544977 = score(doc=1755,freq=2.0), product of:
            0.08253069 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.023567878 = queryNorm
            0.30952093 = fieldWeight in 1755, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=1755)
      0.5 = coord(1/2)
  0.17391305 = coord(4/23)

Abstract: Obwohl fast alle größeren Bibliotheken intellektuelle Sacherschließung betreiben, sind elektronische Kataloge für die zielgerichtete sachliche Suche nur eingeschränkt nutzbar. Durch maschinelle Indexierung können ohne nennenswerten personellen Mehraufwand ausreichend große Datenmengen für Informationsretrievalsysteme erzeugt und somit die Auffindbarkeit von Dokumenten erhöht werden. Geeignete Sprachanalysetechniken zur Indextermerzeugung sind bekannt und bieten im Gegensatz zur gebräuchlichen Freitextinvertierung entscheidende Vorteile beim Retrieval. Im Fokus steht die Betrachtung der Vor- und Nachteile der gängigen Indexierungssysteme MILOS und intelligentCAPTURE.
Date: 22. 3.2008 12:35:19
Source: Bibliothek: Forschung und Praxis. 30(2006) H.2, S.168-176

Maas, H.-D.: Indexieren mit AUTINDEX (2006) 0.02
```
0.015933955 = product of:
  0.0732962 = sum of:
    0.01733894 = weight(_text_:und in 6077) [ClassicSimilarity], result of:
      0.01733894 = score(doc=6077,freq=30.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.33194062 = fieldWeight in 6077, product of:
          5.477226 = tf(freq=30.0), with freq of:
            30.0 = termFreq=30.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02734375 = fieldNorm(doc=6077)
    0.009054819 = product of:
      0.018109638 = sum of:
        0.018109638 = weight(_text_:bibliothekswesen in 6077) [ClassicSimilarity], result of:
          0.018109638 = score(doc=6077,freq=2.0), product of:
            0.10505787 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.023567878 = queryNorm
            0.17237774 = fieldWeight in 6077, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.02734375 = fieldNorm(doc=6077)
      0.5 = coord(1/2)
    0.018493803 = weight(_text_:informationswissenschaft in 6077) [ClassicSimilarity], result of:
      0.018493803 = score(doc=6077,freq=2.0), product of:
        0.10616633 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023567878 = queryNorm
        0.1741965 = fieldWeight in 6077, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.02734375 = fieldNorm(doc=6077)
    0.018109638 = weight(_text_:bibliothekswesen in 6077) [ClassicSimilarity], result of:
      0.018109638 = score(doc=6077,freq=2.0), product of:
        0.10505787 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.023567878 = queryNorm
        0.17237774 = fieldWeight in 6077, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.02734375 = fieldNorm(doc=6077)
    0.010298987 = weight(_text_:im in 6077) [ClassicSimilarity], result of:
      0.010298987 = score(doc=6077,freq=4.0), product of:
        0.066621356 = queryWeight, product of:
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.023567878 = queryNorm
        0.15458988 = fieldWeight in 6077, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.02734375 = fieldNorm(doc=6077)
  0.2173913 = coord(5/23)
```
Abstract

Wenn man ein Computerprogramm besitzt, das einem zu fast jedem Textwort dessen grammatische Merkmale bestimmt und außerdem noch seine interne Struktur und einige semantische Informationen liefert, dann fragt man sich irgendwann: Könnte ich nicht auf der Grundlage dieser Angaben einen Text global charakterisieren, etwa indem ich versuche, die wichtigen Wörter dieses Textes zu errechnen? Die häufigsten Textwörter können es nicht sein, denn gerade sie sind sehr nichtssagend. Die seltensten Textwörter sind zwar aussagekräftig, aber sie sind zu viele - die meisten Lemmata eines Textes erscheinen nur ein einziges Mal. Irgendwie müsste man den Wortschatz einschränken können. Die rettende Idee war: Wir tun so, als seien die semantischen Merkmale Wörter, denn dann enthält der Wortschatz dieser Sprache nur noch etwa hundert Elemente, weil unsere morphologische Analyse (Mpro) rund 100 semantische Features verwendet. Wir vermuteten nun, dass die häufig vorkommenden Features wichtig für den Text sind und die selteneren als Ausreißer betrachten werden können. Die Implementierung dieser Idee ist der Urahn unseres Programmpaketes AUTINDEX zur automatischen Indexierung von Texten. Dieses allererste Programm erstellte also zu einem Text eine Statistik der semantischen Merkmale und gab die drei häufigsten Klassen mit den zugehörigen Lemmata aus. Das Ergebnis war verblüffend: Auf den ersten Blick konnte man sehen, worum es in dem Text ging. Bei näherem Hinsehen wurden aber auch Unzulänglichkeiten deutlich. Einige der Schlagwörter waren doch ziemlich nichtssagend, andere hätte man gerne in der Liste gehabt, und schließlich hätte man sich noch eine ganz globale Charakterisierung des Textes durch die Angabe von Fachgebieten gewünscht, etwa in der Form: Der Text hat mit Politik oder Wirtschaft zu tun, er berichtet über einen Unfall, eine Feierlichkeit usw. Es wurde also sofort deutlich, dass das Programm ohne eine weitere Wissensquelle keine wirklich guten Ergebnisse würde liefern können. Man braucht also einen Thesaurus, ein Wörterbuch, in dem einzelne Lemmata und auch mehrwortige Ausdrücke mit zusätzlichen Informationen versehen sind.
Die erste Implementierung wurde in Zusammenarbeit mit dem Fachinformationszentrum Technik (Frankfurt) erstellt. Eine Kontrolle der manuell vergebenen Grob- und Feinklassifizierung der Lexikonartikel des Brockhaus Multimedial und anderer Brockhaus-Lexika wurde mit AUTINDEX in Zusammenarbeit mit BIFAB (Mannheim) durchgeführt. AUTINDEX ist auch Bestandteil des Indexierungs- und Retrievalsystems der Firma AGI (Neustadt/Weinstraße), das in der Landesbibliothek Vorarlberg eingesetzt wird. Weiterhin wird AUTINDEX im System LEWI verwendet, das zusammen mit BIFAB entwickelt wird. Dieses System erlaubt natürlichsprachliche Anfragen an den Brockhaus Multimedial und liefert als Antwort die relevanten Lexikonartikel. Im IAI selbst wurden große Textmengen indexiert (Brockhaus- und Dudenlexika, Zeitungstexte usw.), die man für die Weiterentwicklung diverser Thesauri und Wörterbücher nutzen kann. Beispielsweise kann man sich für ein Wort alle Texte ausgeben lassen, in denen dieses Wort wichtig ist. Dabei sind die Texte nach Wichtigkeit sortiert. Zu einem gegebenen Wort kann man sich auch die Assoziationen oder die möglichen Klassifikationen berechnen lassen. Auf diese Weise kann man einen Thesaurus halbautomatisch erweitern.

Source

Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen

Salton, G.: Future prospects for text-based information retrieval (1990) 0.02

0.015437452 = product of:
  0.1183538 = sum of:
    0.015349354 = weight(_text_:und in 2327) [ClassicSimilarity], result of:
      0.015349354 = score(doc=2327,freq=2.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.29385152 = fieldWeight in 2327, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=2327)
    0.0896715 = weight(_text_:informationswissenschaft in 2327) [ClassicSimilarity], result of:
      0.0896715 = score(doc=2327,freq=4.0), product of:
        0.10616633 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023567878 = queryNorm
        0.84463215 = fieldWeight in 2327, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.09375 = fieldNorm(doc=2327)
    0.013332949 = product of:
      0.026665898 = sum of:
        0.026665898 = weight(_text_:1 in 2327) [ClassicSimilarity], result of:
          0.026665898 = score(doc=2327,freq=4.0), product of:
            0.057894554 = queryWeight, product of:
              2.4565027 = idf(docFreq=10304, maxDocs=44218)
              0.023567878 = queryNorm
            0.46059424 = fieldWeight in 2327, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              2.4565027 = idf(docFreq=10304, maxDocs=44218)
              0.09375 = fieldNorm(doc=2327)
      0.5 = coord(1/2)
  0.13043478 = coord(3/23)

Series: Konstanzer Schriften zur Informationswissenschaft; Bd.1
Source: Pragmatische Aspekte beim Entwurf und Betrieb von Informationssystemen: Proc. des 1. Int. Symposiums für Informationswissenschaft, Universität Konstanz, 17.-19.10.1990. Hrsg.: J. Herget u. R. Kuhlen

Junger, U.; Scholze, F.: Neue Wege und Qualitäten : die Inhaltserschließungspolitik der Deutschen Nationalbibliothek (2021) 0.02

0.0151734045 = product of:
  0.08724707 = sum of:
    0.023024032 = weight(_text_:und in 365) [ClassicSimilarity], result of:
      0.023024032 = score(doc=365,freq=18.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.4407773 = fieldWeight in 365, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=365)
    0.015522547 = product of:
      0.031045094 = sum of:
        0.031045094 = weight(_text_:bibliothekswesen in 365) [ClassicSimilarity], result of:
          0.031045094 = score(doc=365,freq=2.0), product of:
            0.10505787 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.023567878 = queryNorm
            0.2955047 = fieldWeight in 365, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.046875 = fieldNorm(doc=365)
      0.5 = coord(1/2)
    0.031045094 = weight(_text_:bibliothekswesen in 365) [ClassicSimilarity], result of:
      0.031045094 = score(doc=365,freq=2.0), product of:
        0.10505787 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.023567878 = queryNorm
        0.2955047 = fieldWeight in 365, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.046875 = fieldNorm(doc=365)
    0.017655406 = weight(_text_:im in 365) [ClassicSimilarity], result of:
      0.017655406 = score(doc=365,freq=4.0), product of:
        0.066621356 = queryWeight, product of:
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.023567878 = queryNorm
        0.26501122 = fieldWeight in 365, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.8267863 = idf(docFreq=7115, maxDocs=44218)
          0.046875 = fieldNorm(doc=365)
  0.17391305 = coord(4/23)

Abstract: Es kommt nicht oft vor, dass ein bibliothekfachliches Thema Gegenstand eines ganzseitigen Artikels im Feuilleton einer der wichtigsten überregionalen Zeitungen in Deutschland wird. Am 31. Juli 2017 war dies der Fall: Die Frankfurter Allgemeine Zeitung veröffentlichte einen Artikel des Generaldirektors der Bayerischen Staatsbibliothek, Klaus Ceynowa, in dem dieser sich kritisch mit einem Konzept zur inhaltlichen Erschließung auseinandersetzte, das die Deutsche Nationalbibliothek (DNB) zuvor für die deutschsprachige bibliothekarische Community veröffentlicht hatte. Hatten bereits zuvor die Bemühungen der DNB, Verfahren zur maschinellen Dokumenterschließung zu entwickeln und einzusetzen, zu kontroversen Reaktionen im Bibliothekswesen geführt, so sorgte dieser Artikel noch einmal in besonderer Weise für Aufmerksamkeit und Diskussionen zu einem Thema, das vielen als eher verstaubt und unattraktiv galt: die Inhaltserschließung. Der folgende Beitrag zeichnet einige Grundlinien der Erschließungspolitik der DNB seit 2010 nach und beschreibt, welche Instrumente und Verfahren bei der Inhaltserschließung zum Einsatz kommen, welche konzeptionellen Entscheidungen ihr zugrunde liegen, wie versucht wird, Qualität zu erfassen und welche Entwicklungs- und Handlungsfelder für die Zukunft gesehen werden.
Series: Bibliotheks- und Informationspraxis; 70

Dreis, G.: Formen des sachlichen Zugriffs : Probleme des automatischen Indexierens (1991) 0.01

0.014979463 = product of:
  0.11484255 = sum of:
    0.021707265 = weight(_text_:und in 2995) [ClassicSimilarity], result of:
      0.021707265 = score(doc=2995,freq=4.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.41556883 = fieldWeight in 2995, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=2995)
    0.031045094 = product of:
      0.06209019 = sum of:
        0.06209019 = weight(_text_:bibliothekswesen in 2995) [ClassicSimilarity], result of:
          0.06209019 = score(doc=2995,freq=2.0), product of:
            0.10505787 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.023567878 = queryNorm
            0.5910094 = fieldWeight in 2995, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.09375 = fieldNorm(doc=2995)
      0.5 = coord(1/2)
    0.06209019 = weight(_text_:bibliothekswesen in 2995) [ClassicSimilarity], result of:
      0.06209019 = score(doc=2995,freq=2.0), product of:
        0.10505787 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.023567878 = queryNorm
        0.5910094 = fieldWeight in 2995, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.09375 = fieldNorm(doc=2995)
  0.13043478 = coord(3/23)

Series: Zeitschrift für Bibliothekswesen und Bibliographie: Sonderh.52
Source: Der Online-Publikumskatalog der Universitätsbibliothek Düsseldorf: methodische Erkenntnisse und Erfahrungen, OPAC-Kolloquium am 27. u.28.11.1989. Hrsg.: G. Gattermann

Lepsky, K.: Automatisierung in der Sacherschließung : Maschinelles Indexieren von Titeldaten (1996) 0.01

0.014979463 = product of:
  0.11484255 = sum of:
    0.021707265 = weight(_text_:und in 3418) [ClassicSimilarity], result of:
      0.021707265 = score(doc=3418,freq=4.0), product of:
        0.052235067 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023567878 = queryNorm
        0.41556883 = fieldWeight in 3418, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=3418)
    0.031045094 = product of:
      0.06209019 = sum of:
        0.06209019 = weight(_text_:bibliothekswesen in 3418) [ClassicSimilarity], result of:
          0.06209019 = score(doc=3418,freq=2.0), product of:
            0.10505787 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.023567878 = queryNorm
            0.5910094 = fieldWeight in 3418, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.09375 = fieldNorm(doc=3418)
      0.5 = coord(1/2)
    0.06209019 = weight(_text_:bibliothekswesen in 3418) [ClassicSimilarity], result of:
      0.06209019 = score(doc=3418,freq=2.0), product of:
        0.10505787 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.023567878 = queryNorm
        0.5910094 = fieldWeight in 3418, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.09375 = fieldNorm(doc=3418)
  0.13043478 = coord(3/23)

Series: Zeitschrift für Bibliothekswesen und Bibliographie: Sonderh.63
Source: 85. Deutscher Bibliothekartag in Göttingen 1995: Die Herausforderung der Bibliotheken durch elektronische Medien und neue Organisationsformen. Hrsg.: S. Wefers

Search (276 results, page 1 of 14)

Authors

Years

Languages

Types

Themes

Subjects

Classifications