Search (193 results, page 1 of 10)

Nohr, H.: Automatische Indexierung : Einführung in betriebliche Verfahren, Systeme und Anwendungen (2001) 0.07

0.070653744 = product of:
  0.2001856 = sum of:
    0.04692065 = weight(_text_:allgemeines in 2543) [ClassicSimilarity], result of:
      0.04692065 = score(doc=2543,freq=4.0), product of:
        0.1315819 = queryWeight, product of:
          5.705423 = idf(docFreq=399, maxDocs=44218)
          0.023062602 = queryNorm
        0.35658893 = fieldWeight in 2543, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.705423 = idf(docFreq=399, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.03816122 = weight(_text_:buch in 2543) [ClassicSimilarity], result of:
      0.03816122 = score(doc=2543,freq=6.0), product of:
        0.10722657 = queryWeight, product of:
          4.64937 = idf(docFreq=1149, maxDocs=44218)
          0.023062602 = queryNorm
        0.35589328 = fieldWeight in 2543, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          4.64937 = idf(docFreq=1149, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.018052125 = weight(_text_:und in 2543) [ClassicSimilarity], result of:
      0.018052125 = score(doc=2543,freq=26.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.3531656 = fieldWeight in 2543, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.01432104 = product of:
      0.02864208 = sum of:
        0.02864208 = weight(_text_:bibliothekswesen in 2543) [ClassicSimilarity], result of:
          0.02864208 = score(doc=2543,freq=4.0), product of:
            0.10280552 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.023062602 = queryNorm
            0.2786045 = fieldWeight in 2543, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.03125 = fieldNorm(doc=2543)
      0.5 = coord(1/2)
    0.041365284 = weight(_text_:informationswissenschaft in 2543) [ClassicSimilarity], result of:
      0.041365284 = score(doc=2543,freq=8.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.3981634 = fieldWeight in 2543, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.041365284 = weight(_text_:informationswissenschaft in 2543) [ClassicSimilarity], result of:
      0.041365284 = score(doc=2543,freq=8.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.3981634 = fieldWeight in 2543, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
  0.3529412 = coord(6/17)

Abstract: Das vorliegende Buch zur automatischen Indexierung trägt dem Umstand Rechnung, dass ein ständig wachsender Berg von Dokumenten in Unternehmen, öffentlichen Verwaltungen, Einrichtungen der Fachinformation oder dem Internet entscheidungsrelevante Informationen enthält, die mit manuellen Mitteln und Methoden kaum mehr beherrschbar und erschließbar sind. Diese unstrukturierten Informationen sind in einer zunehmend von der schnellen Verarbeitung der Ressource Information abhängigen Wirtschaft von größter Bedeutung, ihre Beherrschung ist unabdingbar für den Wettbewerbserfolg. Verfahren der automatischen Indexierung von Dokumenten sind damit eine Basistechnik der betrieblichen Informationswirtschaft geworden. Trotz dieses Urnstandes, liegt bis auf den heutigen Tag keine einführende Darstellung in die Thematik vor. Die Zielsetzung dieses Buches ist es, einführend die Grundlagen sowie die verschiedenen Ansätze und Verfahren der automatischen Indexierung von Dokumenten vorzustellen. Die Darstellung verzichtet dabei bewusst auf die allzu detaillierte Tiefendarstellung einzelner Verfahren und Indexierungssysteme zugunsten einer Übersicht der grundsätzlichen Ansätze mit ihren jeweiligen Voraussetzungen, ihren Möglichkeiten und ihren Beschränkungen. Soweit einzelne Verfahren und Indexierungssysteme behandelt werden, besitzen diese beispielhaften Charakter für den behandelten Ansatz. Bei der Darstellung war ich stets uni eine verständliche Sprache bemüht. Der Text dieses Buches ist entstanden aus Vorlesungen in entsprechenden Lehrveranstaltungen im Studiengang Informationswirtschaft an der Fachhochschule Stuttgart. Die Darstellung richtet sich an Studierende und Lehrende der Informationswirtschaft, des Informationsmanagements, der Dokumentation sowie der Wirtschaftsinformatik, zugleich aber auch an die interessierten und mit der Thernatik konfrontierten Praktiker, die weniger an der technischen Seite der automatischen Indexierung, als vielmehr einen grundsätzlichen Informationsbedarf über die Möglichkeiten und die Schwierigkeiten des Einsatzes entsprechender Verfahren haben
Classification: AN 95300 Allgemeines / Buch- und Bibliothekswesen, Informationswissenschaft / Informationswissenschaft / Informationspraxis / Automatisches Indexing (z.B. KWIC, KWOC)
RVK: AN 95300 Allgemeines / Buch- und Bibliothekswesen, Informationswissenschaft / Informationswissenschaft / Informationspraxis / Automatisches Indexing (z.B. KWIC, KWOC)
Series: Materialien zur Information und Dokumentation; Bd.13

Hüther, H.: Selix im DFG-Projekt Kascade (1998) 0.04

0.038707644 = product of:
  0.21934332 = sum of:
    0.012516897 = weight(_text_:und in 5151) [ClassicSimilarity], result of:
      0.012516897 = score(doc=5151,freq=2.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.24487628 = fieldWeight in 5151, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=5151)
    0.10341321 = weight(_text_:informationswissenschaft in 5151) [ClassicSimilarity], result of:
      0.10341321 = score(doc=5151,freq=8.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.99540854 = fieldWeight in 5151, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.078125 = fieldNorm(doc=5151)
    0.10341321 = weight(_text_:informationswissenschaft in 5151) [ClassicSimilarity], result of:
      0.10341321 = score(doc=5151,freq=8.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.99540854 = fieldWeight in 5151, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.078125 = fieldNorm(doc=5151)
  0.1764706 = coord(3/17)

Series: Schriften zur Informationswissenschaft; Bd.34
Source: Knowledge Management und Kommunikationssysteme: Proceedings des 6. Internationalen Symposiums für Informationswissenschaft (ISI '98) Prag, 3.-7. November 1998 / Hochschulverband für Informationswissenschaft (HI) e.V. Konstanz ; Fachrichtung Informationswissenschaft der Universität des Saarlandes, Saarbrücken. Hrsg.: Harald H. Zimmermann u. Volker Schramm

Krause, J.; Womser-Hacker, C.: PADOK-II : Retrievaltests zur Bewertung von Volltextindexierungsvarianten für das deutsche Patentinformationssystem (1990) 0.04

0.03708074 = product of:
  0.15759313 = sum of:
    0.017343922 = weight(_text_:und in 2653) [ClassicSimilarity], result of:
      0.017343922 = score(doc=2653,freq=6.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.33931053 = fieldWeight in 2653, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=2653)
    0.041365284 = weight(_text_:informationswissenschaft in 2653) [ClassicSimilarity], result of:
      0.041365284 = score(doc=2653,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.3981634 = fieldWeight in 2653, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0625 = fieldNorm(doc=2653)
    0.041365284 = weight(_text_:informationswissenschaft in 2653) [ClassicSimilarity], result of:
      0.041365284 = score(doc=2653,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.3981634 = fieldWeight in 2653, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0625 = fieldNorm(doc=2653)
    0.05751865 = product of:
      0.1150373 = sum of:
        0.1150373 = weight(_text_:bewertung in 2653) [ClassicSimilarity], result of:
          0.1150373 = score(doc=2653,freq=4.0), product of:
            0.14568622 = queryWeight, product of:
              6.31699 = idf(docFreq=216, maxDocs=44218)
              0.023062602 = queryNorm
            0.78962374 = fieldWeight in 2653, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              6.31699 = idf(docFreq=216, maxDocs=44218)
              0.0625 = fieldNorm(doc=2653)
      0.5 = coord(1/2)
  0.23529412 = coord(4/17)

Abstract: Vorgestellt werden die Ergebnisse extensiver Retrievaltests von zwei Varianten von Inhalteserschließungen (Freitext und PASSAT) für das deutsche Patentinformationssystem auf der Basis von Volltexten. Die Tests führte die Fachgruppe Linguistische Informationswissenschaft der Universität Regensburg von 1986-1989 in Zusammenarbeit mit dem Deutschen Patentamt, dem Fachinformationszentrum Karlsruhe und meheren industrieellen Partnern durch. Der Schwerpunkt des Berichts liegt auf dem allgemeinen Ansatz der Bewertung der Ziele des Projekts und auf der Darstellung der statistischen Evaluierungsergebnisse.

Salton, G.: Future prospects for text-based information retrieval (1990) 0.03

0.03362088 = product of:
  0.19051832 = sum of:
    0.015020276 = weight(_text_:und in 2327) [ClassicSimilarity], result of:
      0.015020276 = score(doc=2327,freq=2.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.29385152 = fieldWeight in 2327, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=2327)
    0.08774902 = weight(_text_:informationswissenschaft in 2327) [ClassicSimilarity], result of:
      0.08774902 = score(doc=2327,freq=4.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.84463215 = fieldWeight in 2327, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.09375 = fieldNorm(doc=2327)
    0.08774902 = weight(_text_:informationswissenschaft in 2327) [ClassicSimilarity], result of:
      0.08774902 = score(doc=2327,freq=4.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.84463215 = fieldWeight in 2327, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.09375 = fieldNorm(doc=2327)
  0.1764706 = coord(3/17)

Series: Konstanzer Schriften zur Informationswissenschaft; Bd.1
Source: Pragmatische Aspekte beim Entwurf und Betrieb von Informationssystemen: Proc. des 1. Int. Symposiums für Informationswissenschaft, Universität Konstanz, 17.-19.10.1990. Hrsg.: J. Herget u. R. Kuhlen

Groß, T.: Automatische Indexierung von wirtschaftswissenschaftlichen Dokumenten : Implementierung und Evaluierung am Beispiel der Deutschen Zentralbibliothek für Wirtschaftswissenschaften (2010) 0.03

0.025934335 = product of:
  0.110220924 = sum of:
    0.022565158 = weight(_text_:und in 2078) [ClassicSimilarity], result of:
      0.022565158 = score(doc=2078,freq=26.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.441457 = fieldWeight in 2078, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2078)
    0.025853302 = weight(_text_:informationswissenschaft in 2078) [ClassicSimilarity], result of:
      0.025853302 = score(doc=2078,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.24885213 = fieldWeight in 2078, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2078)
    0.025853302 = weight(_text_:informationswissenschaft in 2078) [ClassicSimilarity], result of:
      0.025853302 = score(doc=2078,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.24885213 = fieldWeight in 2078, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2078)
    0.035949156 = product of:
      0.07189831 = sum of:
        0.07189831 = weight(_text_:bewertung in 2078) [ClassicSimilarity], result of:
          0.07189831 = score(doc=2078,freq=4.0), product of:
            0.14568622 = queryWeight, product of:
              6.31699 = idf(docFreq=216, maxDocs=44218)
              0.023062602 = queryNorm
            0.49351484 = fieldWeight in 2078, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              6.31699 = idf(docFreq=216, maxDocs=44218)
              0.0390625 = fieldNorm(doc=2078)
      0.5 = coord(1/2)
  0.23529412 = coord(4/17)

Abstract: Die Bewertung der Indexierungsqualität bzw. -güte ist ein grundlegendes Problem von manuellen und automatischen Indexierungsverfahren. Letztere werden aber gerade im digitalen Zeitalter als einzige Möglichkeit angesehen, den zunehmenden Schwierigkeiten bibliothekarischer Informationsstrukturierung gerecht zu werden. Diese Arbeit befasst sich mit der Funktionsweise, Implementierung und Evaluierung der Sacherschließungssoftware MindServer Categorizer, der Firma Recommind, an der Deutschen Zentralbibliothek für Wirtschaftswissenschaften (ZBW). Grundlage der maschinellen Sacherschließung und anschließenden quantitativen und qualitativen Auswertung bilden rund 39.000 wirtschaftswissenschaftliche Dokumente aus den Datenbanken Econis und EconStor. Unter Zuhilfenahme des rund 6.000 Deskriptoren umfassenden Standard-Thesaurus Wirtschaft (STW) wird der ursprünglich rein statistische Indexierungsansatz des MindServer Categorizer zu einem begriffsorientierten Verfahren weiterentwickelt und zur Inhaltserschließung digitaler Informationsressourcen eingesetzt. Der zentrale Fokus dieser Arbeit liegt vor allem auf der Evaluierung der maschinell beschlagworteten Titel, in Anlehnung und entsprechender Anpassung der von Stock (2008) und Lancaster (2003) hierzu vorgeschlagenen Kriterien: Indexierungskonsistenz, -tiefe, -breite, -spezifität, -effektivität. Zusätzlich wird die Belegungsbilanz des STW evaluiert und es erfolgt ferner eine stichprobenartige, qualitative Bewertung der Ergebnisse seitens der zuständigen Fachreferenten und -referentinnen.
Content: Vgl. unter: http://edoc.hu-berlin.de/series/berliner-handreichungen/2010-284/PDF/284.pdf. Auch als: Automatische Indexierung von Dokumenten in einer wissenschaftlichen Bibliothek: Implementierung und Evaluierung am Beispiel der Deutschen Zentralbibliothek für Wirtschaftswissenschaften. Diplomica Verlag, 2011.
Imprint: Berlin : Institut für Bibliotheks- und Informationswissenschaft der Humboldt-Universität zu Berlin

Niggemann, E.: Wer suchet, der findet? : Verbesserung der inhaltlichen Suchmöglichkeiten im Informationssystem Der Deutschen Bibliothek (2006) 0.03

0.025812393 = product of:
  0.10970267 = sum of:
    0.019592043 = weight(_text_:und in 5812) [ClassicSimilarity], result of:
      0.019592043 = score(doc=5812,freq=10.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.38329202 = fieldWeight in 5812, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5812)
    0.017721383 = product of:
      0.035442766 = sum of:
        0.035442766 = weight(_text_:bibliothekswesen in 5812) [ClassicSimilarity], result of:
          0.035442766 = score(doc=5812,freq=2.0), product of:
            0.10280552 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.023062602 = queryNorm
            0.34475547 = fieldWeight in 5812, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5812)
      0.5 = coord(1/2)
    0.036194623 = weight(_text_:informationswissenschaft in 5812) [ClassicSimilarity], result of:
      0.036194623 = score(doc=5812,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.348393 = fieldWeight in 5812, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5812)
    0.036194623 = weight(_text_:informationswissenschaft in 5812) [ClassicSimilarity], result of:
      0.036194623 = score(doc=5812,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.348393 = fieldWeight in 5812, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5812)
  0.23529412 = coord(4/17)

Abstract: Elektronische Bibliothekskataloge und Bibliografien haben ihr Monopol bei der Suche nach Büchern, Aufsätzen, musikalischen Werken u. a. verloren. Globale Suchmaschinen sind starke Konkurrenten, und Bibliotheken müssen heute so planen, dass ihre Dienstleistungen auch morgen noch interessant sind. Die Deutsche Bibliothek (DDB) wird ihre traditionelle Katalogrecherche zu einem globalen, netzbasierten Informationssystem erweitern, das die Vorteile der neutralen, qualitätsbasierten Katalogsuche mit den Vorteilen moderner Suchmaschinen zu verbinden sucht. Dieser Beitrag beschäftigt sich mit der Verbesserung der inhaltlichen Suchmöglichkeiten im Informationssystem Der Deutschen Bibliothek. Weitere Entwicklungsstränge sollen nur kurz im Ausblick angerissen werden.
Source: Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen

Reimer, U.: Verfahren der automatischen Indexierung : benötigtes Vorwissen und Ansätze zu seiner automatischen Akquisition, ein Überblick (1992) 0.03

0.025647836 = product of:
  0.14533773 = sum of:
    0.02124188 = weight(_text_:und in 7858) [ClassicSimilarity], result of:
      0.02124188 = score(doc=7858,freq=4.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.41556883 = fieldWeight in 7858, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=7858)
    0.062047925 = weight(_text_:informationswissenschaft in 7858) [ClassicSimilarity], result of:
      0.062047925 = score(doc=7858,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.5972451 = fieldWeight in 7858, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.09375 = fieldNorm(doc=7858)
    0.062047925 = weight(_text_:informationswissenschaft in 7858) [ClassicSimilarity], result of:
      0.062047925 = score(doc=7858,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.5972451 = fieldWeight in 7858, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.09375 = fieldNorm(doc=7858)
  0.1764706 = coord(3/17)

Series: Schriften zur Informationswissenschaft; Bd.3
Source: Experimentelles und praktisches Information Retrieval: Festschrift für Gerhard Lustig. Hrsg. R. Kuhlen

Grün, S.: Bildung von Komposita-Indextermen auf der Basis einer algorithmischen Mehrwortgruppenanalyse mit Lingo (2015) 0.02

0.022124909 = product of:
  0.094030865 = sum of:
    0.01679318 = weight(_text_:und in 1335) [ClassicSimilarity], result of:
      0.01679318 = score(doc=1335,freq=10.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.328536 = fieldWeight in 1335, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1335)
    0.015189757 = product of:
      0.030379513 = sum of:
        0.030379513 = weight(_text_:bibliothekswesen in 1335) [ClassicSimilarity], result of:
          0.030379513 = score(doc=1335,freq=2.0), product of:
            0.10280552 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.023062602 = queryNorm
            0.2955047 = fieldWeight in 1335, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.046875 = fieldNorm(doc=1335)
      0.5 = coord(1/2)
    0.031023962 = weight(_text_:informationswissenschaft in 1335) [ClassicSimilarity], result of:
      0.031023962 = score(doc=1335,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.29862255 = fieldWeight in 1335, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.046875 = fieldNorm(doc=1335)
    0.031023962 = weight(_text_:informationswissenschaft in 1335) [ClassicSimilarity], result of:
      0.031023962 = score(doc=1335,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.29862255 = fieldWeight in 1335, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.046875 = fieldNorm(doc=1335)
  0.23529412 = coord(4/17)

Abstract: In der deutschen Sprache lassen sich Begriffe durch Komposita und Mehrwortgruppen ausdrücken. Letztere können dabei aber auch als Kompositum selbst ausgedrückt werden und entsprechend auf den gleichen Begriff verweisen. In der nachfolgenden Studie werden Mehrwortgruppen analysiert, die auch Komposita sein können. Ziel der Untersuchung ist es, diese Wortfolgen über Muster zu identifizieren. Analysiert wurden Daten des Karrieremanagers Placement24 GmbH - in Form von Stellenanzeigen. Die Extraktion von Mehrwortgruppen erfolgte algorithmisch und wurde mit der Open-Source Software Lingo durch geführt. Auf der Basis von Erweiterungen bzw. Anpassungen in Wörterbüchern und den darin getaggten Wörtern wurde drei- bis fünfstelligen Kandidaten analysiert. Aus positiv bewerteten Mehrwortgruppen wurden Komposita gebildet. Diese wurden mit den identifizierten Komposita aus den Stellenanzeigen verglichen. Der Vergleich zeigte, dass ein Großteil der neu generierten Komposita nicht durch eine Kompositaidentifizierung erzeugt wurde.
Content: Bachelorarbeit, Studiengang Bibliothekswesen, Fakultät für Informations- und Kommunikationswissenschaften, Fachhochschule Köln
Imprint: Köln : Fachhochschule, Institut für Informationswissenschaft

Grün, S.: Mehrwortbegriffe und Latent Semantic Analysis : Bewertung automatisch extrahierter Mehrwortgruppen mit LSA (2017) 0.02

0.021754472 = product of:
  0.092456505 = sum of:
    0.015330005 = weight(_text_:und in 3954) [ClassicSimilarity], result of:
      0.015330005 = score(doc=3954,freq=12.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.29991096 = fieldWeight in 3954, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3954)
    0.025853302 = weight(_text_:informationswissenschaft in 3954) [ClassicSimilarity], result of:
      0.025853302 = score(doc=3954,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.24885213 = fieldWeight in 3954, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3954)
    0.025853302 = weight(_text_:informationswissenschaft in 3954) [ClassicSimilarity], result of:
      0.025853302 = score(doc=3954,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.24885213 = fieldWeight in 3954, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3954)
    0.02541989 = product of:
      0.05083978 = sum of:
        0.05083978 = weight(_text_:bewertung in 3954) [ClassicSimilarity], result of:
          0.05083978 = score(doc=3954,freq=2.0), product of:
            0.14568622 = queryWeight, product of:
              6.31699 = idf(docFreq=216, maxDocs=44218)
              0.023062602 = queryNorm
            0.34896767 = fieldWeight in 3954, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              6.31699 = idf(docFreq=216, maxDocs=44218)
              0.0390625 = fieldNorm(doc=3954)
      0.5 = coord(1/2)
  0.23529412 = coord(4/17)

Abstract: Die vorliegende Studie untersucht das Potenzial von Mehrwortbegriffen für das Information Retrieval. Zielsetzung der Arbeit ist es, intellektuell positiv bewertete Kandidaten mithilfe des Latent Semantic Analysis (LSA) Verfahren höher zu gewichten, als negativ bewertete Kandidaten. Die positiven Kandidaten sollen demnach bei einem Ranking im Information Retrieval bevorzugt werden. Als Kollektion wurde eine Version der sozialwissenschaftlichen GIRT-Datenbank (German Indexing and Retrieval Testdatabase) eingesetzt. Um Kandidaten für Mehrwortbegriffe zu identifizieren wurde die automatische Indexierung Lingo verwendet. Die notwendigen Kernfunktionalitäten waren Lemmatisierung, Identifizierung von Komposita, algorithmische Mehrworterkennung sowie Gewichtung von Indextermen durch das LSA-Modell. Die durch Lingo erkannten und LSAgewichteten Mehrwortkandidaten wurden evaluiert. Zuerst wurde dazu eine intellektuelle Auswahl von positiven und negativen Mehrwortkandidaten vorgenommen. Im zweiten Schritt der Evaluierung erfolgte die Berechnung der Ausbeute, um den Anteil der positiven Mehrwortkandidaten zu erhalten. Im letzten Schritt der Evaluierung wurde auf der Basis der R-Precision berechnet, wie viele positiv bewerteten Mehrwortkandidaten es an der Stelle k des Rankings geschafft haben. Die Ausbeute der positiven Mehrwortkandidaten lag bei durchschnittlich ca. 39%, während die R-Precision einen Durchschnittswert von 54% erzielte. Das LSA-Modell erzielt ein ambivalentes Ergebnis mit positiver Tendenz.
Footnote: Masterarbeit, Studiengang Informationswissenschaft und Sprachtechnologie, Institut für Sprache und Information, Philosophische Fakultät, Heinrich-Heine-Universität Düsseldorf
Imprint: Düsseldorf : Heinrich-Heine-Universität / Philosophische Fakultät / Institut für Sprache und Information

Lepsky, K.: Automatische Indexierung (2013) 0.02

0.021373196 = product of:
  0.121114776 = sum of:
    0.017701564 = weight(_text_:und in 720) [ClassicSimilarity], result of:
      0.017701564 = score(doc=720,freq=4.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.34630734 = fieldWeight in 720, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=720)
    0.051706605 = weight(_text_:informationswissenschaft in 720) [ClassicSimilarity], result of:
      0.051706605 = score(doc=720,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.49770427 = fieldWeight in 720, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.078125 = fieldNorm(doc=720)
    0.051706605 = weight(_text_:informationswissenschaft in 720) [ClassicSimilarity], result of:
      0.051706605 = score(doc=720,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.49770427 = fieldWeight in 720, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.078125 = fieldNorm(doc=720)
  0.1764706 = coord(3/17)

Source: Grundlagen der praktischen Information und Dokumentation. Handbuch zur Einführung in die Informationswissenschaft und -praxis. 6., völlig neu gefaßte Ausgabe. Hrsg. von R. Kuhlen, W. Semar u. D. Strauch. Begründet von Klaus Laisiepen, Ernst Lutterbeck, Karl-Heinrich Meyer-Uhlenried

Kempf, A.O.: Automatische Indexierung in der sozialwissenschaftlichen Fachinformation : eine Evaluationsstudie zur maschinellen Erschließung für die Datenbank SOLIS (2012) 0.02

0.018991586 = product of:
  0.10761898 = sum of:
    0.019869957 = weight(_text_:und in 903) [ClassicSimilarity], result of:
      0.019869957 = score(doc=903,freq=14.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.38872904 = fieldWeight in 903, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=903)
    0.04387451 = weight(_text_:informationswissenschaft in 903) [ClassicSimilarity], result of:
      0.04387451 = score(doc=903,freq=4.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.42231607 = fieldWeight in 903, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.046875 = fieldNorm(doc=903)
    0.04387451 = weight(_text_:informationswissenschaft in 903) [ClassicSimilarity], result of:
      0.04387451 = score(doc=903,freq=4.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.42231607 = fieldWeight in 903, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.046875 = fieldNorm(doc=903)
  0.1764706 = coord(3/17)

Abstract: Automatische Indexierungsverfahren werden mit Zunahme der digitalen Verfügbarkeit von Metadaten und Volltexten mehr und mehr als eine mögliche Antwort auf das Management unstrukturierter Daten diskutiert. In der sozialwissenschaftlichen Fachinformation existiert in diesem Zusammenhang seit einiger Zeit der Vorschlag eines sogenannten Schalenmodells (vgl. Krause, 1996) mit unterschiedlichen Qualitätsstufen bei der inhaltlichen Erschließung. Vor diesem Hintergrund beschreibt die Arbeit zunächst Methoden und Verfahren der inhaltlichen und automatischen Indexierung, bevor vier Testläufe eines automatischen Indexierungssystems (MindServer) zur automatischen Erschließung von Datensätzen der bibliographischen Literaturdatenbank SOLIS mit Deskriptoren des Thesaurus Sozialwissenschaften sowie der Klassifikation Sozialwissenschaften beschrieben und analysiert werden. Es erfolgt eine ausführliche Fehleranalyse mit Beispielen sowie eine abschließende Diskussion, inwieweit die automatische Erschließung in dieser Form für die Randbereiche der Datenbank SOLIS für die Zukunft einen gangbaren Weg darstellt.
Imprint: Berlin : Humboldt-Universität zu Berlin, Philosophische Fakultät I, Institut für Bibliotheks- und Informationswissenschaft
Series: Berliner Handreichungen zur Bibliotheks- und Informationswissenschaft; 329

Lepsky, K.: Automatische Indexierung zur Erschließung deutschsprachiger Dokumente (1999) 0.02

0.018133694 = product of:
  0.1027576 = sum of:
    0.020027036 = weight(_text_:und in 4656) [ClassicSimilarity], result of:
      0.020027036 = score(doc=4656,freq=8.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.39180204 = fieldWeight in 4656, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=4656)
    0.041365284 = weight(_text_:informationswissenschaft in 4656) [ClassicSimilarity], result of:
      0.041365284 = score(doc=4656,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.3981634 = fieldWeight in 4656, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0625 = fieldNorm(doc=4656)
    0.041365284 = weight(_text_:informationswissenschaft in 4656) [ClassicSimilarity], result of:
      0.041365284 = score(doc=4656,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.3981634 = fieldWeight in 4656, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0625 = fieldNorm(doc=4656)
  0.1764706 = coord(3/17)

Abstract: Der Beitrag beschäftigt sich mit der Anwendung eines Verfahrens zur automatischen Indexierung deutschsprachiger Texte in Bibliotheken. Die Arbeitsweise des Verfahrens und seine Entwicklung innerhalb der von der Deutschen Forschungsgemeinschaft geförderte und an der ULB Düsseldorf gemeinsam mit der Fachrichtung Informationswissenschaft der Universität des Saarlandes durchgeführten Projekte MILOS I, MILOS II und KASCADE werden geschildert. Die Ergebnisse von Retrievaltests belegen die Tauglichkeit des Verfahrens für den Einsatz in Bibliotheken. Aufsetzend auf diesen Ergebnissen werden Perspektiven für die bibliothekarische Sacherschließung im Hinblick auf den Einsatz von automatischen Verfahren entworfen
Source: nfd Information - Wissenschaft und Praxis. 50(1999) H.6, S.325-330

Gaus, W.; Kaluscha, R.: Maschinelle inhaltliche Erschließung von Arztbriefen und Auswertung von Reha-Entlassungsberichten (2006) 0.02
```
0.017250763 = product of:
  0.07331574 = sum of:
    0.021823954 = weight(_text_:und in 6078) [ClassicSimilarity], result of:
      0.021823954 = score(doc=6078,freq=38.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.42695636 = fieldWeight in 6078, product of:
          6.164414 = tf(freq=38.0), with freq of:
            38.0 = termFreq=38.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=6078)
    0.010126504 = product of:
      0.020253008 = sum of:
        0.020253008 = weight(_text_:bibliothekswesen in 6078) [ClassicSimilarity], result of:
          0.020253008 = score(doc=6078,freq=2.0), product of:
            0.10280552 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.023062602 = queryNorm
            0.19700313 = fieldWeight in 6078, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.03125 = fieldNorm(doc=6078)
      0.5 = coord(1/2)
    0.020682642 = weight(_text_:informationswissenschaft in 6078) [ClassicSimilarity], result of:
      0.020682642 = score(doc=6078,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.1990817 = fieldWeight in 6078, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.03125 = fieldNorm(doc=6078)
    0.020682642 = weight(_text_:informationswissenschaft in 6078) [ClassicSimilarity], result of:
      0.020682642 = score(doc=6078,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.1990817 = fieldWeight in 6078, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.03125 = fieldNorm(doc=6078)
  0.23529412 = coord(4/17)
```
Abstract

Schon Hippokrates empfahl den Ärzten, Krankenakten zu führen. Heute ist die detaillierte Dokumentation eine Standespflicht der Ärzte [Gaus et al 1999]. Diese Dokumentationen medizinischer Behandlungen bergen einen riesigen und wertvollen Erfahrungsschatz. Informationen zu Therapien und Behandlungsergebnissen, die in Studien erst mühsam erhoben werden müssten, sind bereits in der Routinedokumentation wie Operations- und Entlassungsberichten oder Arztbriefen zahlreich vorhanden. Mit der Einführung der elektronischen Datenverarbeitung in der Medizin liegen diese Informationen seit einigen Jahren auch maschinenlesbar vor, so dass ein Haupthemmnis für die Nutzung dieser Dokumentationen, nämlich die mühsame manuelle Aufbereitung der Papierakten, entfällt. Während die formale Erschließung nach Patientenmerkmalen wie Name und Geburtsdatum von den Krankenhaus- bzw. Praxisinformationssystemen heutzutage gut gelöst ist, bleibt die inhaltliche Erschließung dieser Dokumentationen schwierig, da nur wenige Informationen in strukturierter oder intellektuell indexierter Form vorliegen [Leiner et al. 2003]. Auch wenn nach der Einführung der Fallpauschalen (diagnosis related groups, DRG) in den Krankenhäusern die Diagnosen nach ICD-10 verschlüsselt werden, besteht ein Großteil der Informationen weiterhin aus freiem Text, dessen computerbasierte Erschließung aufgrund der Komplexität menschlicher Sprache nicht trivial ist. Zu diesen medizinischen Texten gehören u.a. Gutachten, verbal beschriebene (Differential-) Diagnosen, vielfältige Untersuchungs- und Befundberichte, Visitenblätter, Operationsberichte und der Arztbrief bzw. Entlassungsbericht. Arztbrief und Entlassbericht dienen der Information des einweisenden oder weiterbehandelnden Arztes (z.B. Hausarzt) über das, was mit dem Patienten geschehen ist, und geben Empfehlungen zur Weiterbehandlung. Sie fassen eine (stationäre) Behandlung epikritisch - also nachdem die Krankheit überwunden ist, im Rückblick - zusammen und geben einen Überblick über Anamnese (Vorgeschichte), Beschwerden und Symptome, die eingesetzten diagnostischen Verfahren, die gestellte(n) Diagnose(n), Therapie, Verlauf, Komplikationen und das erzielte Ergebnis. Sie haben somit eine ähnliche Funktion wie das Abstract in der Literaturdokumentation, oft wird eine Kopie in der Krankenakte obenauf abgelegt. Zumindest in Universitätskliniken möchten wissenschaftlich arbeitende Ärzte auch unter inhaltlichen Gesichtspunkten auf die Krankenakten zugreifen können, z.B. die Krankenakten aller Patienten mit einer bestimmten Diagnose einsehen, exzerpieren und die exzerpierten Daten auswerten. Auch bei der Suche nach ähnlichen Fällen oder im Bereich der Aus- und Fortbildung hilft eine inhaltliche Erschließung weiter. So könnte etwa ein Assistenzarzt, der im Rahmen seiner Weiterbildung demnächst Sonografien des Kniegelenkes durchzuführen hat, sich vorhandene Berichte von solchen Sonografien anschauen und sich so über relevante Untersuchungstechniken und Befunde vorab informieren.

Source

Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen
Rapke, K.: Automatische Indexierung von Volltexten für die Gruner+Jahr Pressedatenbank (2001) 0.02
```
0.016028075 = product of:
  0.09082575 = sum of:
    0.017701564 = weight(_text_:und in 5863) [ClassicSimilarity], result of:
      0.017701564 = score(doc=5863,freq=16.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.34630734 = fieldWeight in 5863, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5863)
    0.036562093 = weight(_text_:informationswissenschaft in 5863) [ClassicSimilarity], result of:
      0.036562093 = score(doc=5863,freq=4.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.35193008 = fieldWeight in 5863, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5863)
    0.036562093 = weight(_text_:informationswissenschaft in 5863) [ClassicSimilarity], result of:
      0.036562093 = score(doc=5863,freq=4.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.35193008 = fieldWeight in 5863, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5863)
  0.1764706 = coord(3/17)
```
Abstract

Retrievaltests sind die anerkannteste Methode, um neue Verfahren der Inhaltserschließung gegenüber traditionellen Verfahren zu rechtfertigen. Im Rahmen einer Diplomarbeit wurden zwei grundsätzlich unterschiedliche Systeme der automatischen inhaltlichen Erschließung anhand der Pressedatenbank des Verlagshauses Gruner + Jahr (G+J) getestet und evaluiert. Untersucht wurde dabei natürlichsprachliches Retrieval im Vergleich zu Booleschem Retrieval. Bei den beiden Systemen handelt es sich zum einen um Autonomy von Autonomy Inc. und DocCat, das von IBM an die Datenbankstruktur der G+J Pressedatenbank angepasst wurde. Ersteres ist ein auf natürlichsprachlichem Retrieval basierendes, probabilistisches System. DocCat demgegenüber basiert auf Booleschem Retrieval und ist ein lernendes System, das aufgrund einer intellektuell erstellten Trainingsvorlage indexiert. Methodisch geht die Evaluation vom realen Anwendungskontext der Textdokumentation von G+J aus. Die Tests werden sowohl unter statistischen wie auch qualitativen Gesichtspunkten bewertet. Ein Ergebnis der Tests ist, dass DocCat einige Mängel gegenüber der intellektuellen Inhaltserschließung aufweist, die noch behoben werden müssen, während das natürlichsprachliche Retrieval von Autonomy in diesem Rahmen und für die speziellen Anforderungen der G+J Textdokumentation so nicht einsetzbar ist

Series

Tagungen der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis; 4

Source

Information Research & Content Management: Orientierung, Ordnung und Organisation im Wissensmarkt; 23. DGI-Online-Tagung der DGI und 53. Jahrestagung der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis e.V. DGI, Frankfurt am Main, 8.-10.5.2001. Proceedings. Hrsg.: R. Schmidt
Experimentelles und praktisches Information Retrieval : Festschrift für Gerhard Lustig (1992) 0.02
```
0.015908523 = product of:
  0.09014829 = sum of:
    0.028100364 = weight(_text_:und in 4) [ClassicSimilarity], result of:
      0.028100364 = score(doc=4,freq=28.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.54974586 = fieldWeight in 4, product of:
          5.2915025 = tf(freq=28.0), with freq of:
            28.0 = termFreq=28.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=4)
    0.031023962 = weight(_text_:informationswissenschaft in 4) [ClassicSimilarity], result of:
      0.031023962 = score(doc=4,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.29862255 = fieldWeight in 4, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.046875 = fieldNorm(doc=4)
    0.031023962 = weight(_text_:informationswissenschaft in 4) [ClassicSimilarity], result of:
      0.031023962 = score(doc=4,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.29862255 = fieldWeight in 4, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.046875 = fieldNorm(doc=4)
  0.1764706 = coord(3/17)
```
Content

Enthält die Beiträge: SALTON, G.: Effective text understanding in information retrieval; KRAUSE, J.: Intelligentes Information retrieval; FUHR, N.: Konzepte zur Gestaltung zukünftiger Information-Retrieval-Systeme; HÜTHER, H.: Überlegungen zu einem mathematischen Modell für die Type-Token-, die Grundform-Token und die Grundform-Type-Relation; KNORZ, G.: Automatische Generierung inferentieller Links in und zwischen Hyperdokumenten; KONRAD, E.: Zur Effektivitätsbewertung von Information-Retrieval-Systemen; HENRICHS, N.: Retrievalunterstützung durch automatisch generierte Wortfelder; LÜCK, W., W. RITTBERGER u. M. SCHWANTNER: Der Einsatz des Automatischen Indexierungs- und Retrieval-System (AIR) im Fachinformationszentrum Karlsruhe; REIMER, U.: Verfahren der Automatischen Indexierung. Benötigtes Vorwissen und Ansätze zu seiner automatischen Akquisition: Ein Überblick; ENDRES-NIGGEMEYER, B.: Dokumentrepräsentation: Ein individuelles prozedurales Modell des Abstracting, des Indexierens und Klassifizierens; SEELBACH, D.: Zur Entwicklung von zwei- und mehrsprachigen lexikalischen Datenbanken und Terminologiedatenbanken; ZIMMERMANN, H.: Der Einfluß der Sprachbarrieren in Europa und Möglichkeiten zu ihrer Minderung; LENDERS, W.: Wörter zwischen Welt und Wissen; PANYR, J.: Frames, Thesauri und automatische Klassifikation (Clusteranalyse): HAHN, U.: Forschungsstrategien und Erkenntnisinteressen in der anwendungsorientierten automatischen Sprachverarbeitung. Überlegungen zu einer ingenieurorientierten Computerlinguistik; KUHLEN, R.: Hypertext und Information Retrieval - mehr als Browsing und Suche.

Series

Schriften zur Informationswissenschaft; Bd.3

7e Dag van het Document : 19 & 20 mei 1998, Congrescentrum De Reehorst, Ede ; proceedings (1998) 0.02

0.015882729 = product of:
  0.1350032 = sum of:
    0.11730163 = weight(_text_:allgemeines in 2427) [ClassicSimilarity], result of:
      0.11730163 = score(doc=2427,freq=4.0), product of:
        0.1315819 = queryWeight, product of:
          5.705423 = idf(docFreq=399, maxDocs=44218)
          0.023062602 = queryNorm
        0.89147234 = fieldWeight in 2427, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.705423 = idf(docFreq=399, maxDocs=44218)
          0.078125 = fieldNorm(doc=2427)
    0.017701564 = weight(_text_:und in 2427) [ClassicSimilarity], result of:
      0.017701564 = score(doc=2427,freq=4.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.34630734 = fieldWeight in 2427, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=2427)
  0.11764706 = coord(2/17)

BK: 06.00 (Information und Dokumentation: Allgemeines)
Classification: 06.00 (Information und Dokumentation: Allgemeines)

Sachse, E.; Liebig, M.; Gödert, W.: Automatische Indexierung unter Einbeziehung semantischer Relationen : Ergebnisse des Retrievaltests zum MILOS II-Projekt (1998) 0.02

0.015866982 = product of:
  0.0899129 = sum of:
    0.017523656 = weight(_text_:und in 3577) [ClassicSimilarity], result of:
      0.017523656 = score(doc=3577,freq=8.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.34282678 = fieldWeight in 3577, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3577)
    0.036194623 = weight(_text_:informationswissenschaft in 3577) [ClassicSimilarity], result of:
      0.036194623 = score(doc=3577,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.348393 = fieldWeight in 3577, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3577)
    0.036194623 = weight(_text_:informationswissenschaft in 3577) [ClassicSimilarity], result of:
      0.036194623 = score(doc=3577,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.348393 = fieldWeight in 3577, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3577)
  0.1764706 = coord(3/17)

Abstract: Im Rahmen von MILOS II wurde das erste MILOS-Projekt zur automatischen Indexierung von Titeldaten um eine semantischer Komponente erweitert, indem Thesaurusrelationen der Schlagwortnormdatei eingebunden wurden. Der abschließend zur Evaluierung durchgeführte Retrievaltest und seine Ergebnisse stehen im Mittelpunkt dieses Texts. Zusätzlich wird ein Überblick über bereits durchgeführte Retrievaltests (vorwiegend des anglo-amerikanischen Raums) gegeben und es wird erläutert, welche grundlegenden Fragestellungen bei der praktischen Durchführung eines Retrievaltests zu beachten sind
Imprint: Köln : FH Köln, Fachbereich Bibliotheks- und Informationswesen
Series: Kölner Arbeitspapiere zur Bibliotheks- und Informationswissenschaft; Bd.14

Schulz, K.U.; Brunner, L.: Vollautomatische thematische Verschlagwortung großer Textkollektionen mittels semantischer Netze (2017) 0.02

0.015866982 = product of:
  0.0899129 = sum of:
    0.017523656 = weight(_text_:und in 3493) [ClassicSimilarity], result of:
      0.017523656 = score(doc=3493,freq=8.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.34282678 = fieldWeight in 3493, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3493)
    0.036194623 = weight(_text_:informationswissenschaft in 3493) [ClassicSimilarity], result of:
      0.036194623 = score(doc=3493,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.348393 = fieldWeight in 3493, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3493)
    0.036194623 = weight(_text_:informationswissenschaft in 3493) [ClassicSimilarity], result of:
      0.036194623 = score(doc=3493,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.348393 = fieldWeight in 3493, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3493)
  0.1764706 = coord(3/17)

Source: Theorie, Semantik und Organisation von Wissen: Proceedings der 13. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) und dem 13. Internationalen Symposium der Informationswissenschaft der Higher Education Association for Information Science (HI) Potsdam (19.-20.03.2013): 'Theory, Information and Organization of Knowledge' / Proceedings der 14. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) und Natural Language & Information Systems (NLDB) Passau (16.06.2015): 'Lexical Resources for Knowledge Organization' / Proceedings des Workshops der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) auf der SEMANTICS Leipzig (1.09.2014): 'Knowledge Organization and Semantic Web' / Proceedings des Workshops der Polnischen und Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) Cottbus (29.-30.09.2011): 'Economics of Knowledge Production and Organization'. Hrsg. von W. Babik, H.P. Ohly u. K. Weber

Böhm, A.; Seifert, C.; Schlötterer, J.; Granitzer, M.: Identifying tweets from the economic domain (2017) 0.02

0.015866982 = product of:
  0.0899129 = sum of:
    0.017523656 = weight(_text_:und in 3495) [ClassicSimilarity], result of:
      0.017523656 = score(doc=3495,freq=8.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.34282678 = fieldWeight in 3495, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3495)
    0.036194623 = weight(_text_:informationswissenschaft in 3495) [ClassicSimilarity], result of:
      0.036194623 = score(doc=3495,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.348393 = fieldWeight in 3495, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3495)
    0.036194623 = weight(_text_:informationswissenschaft in 3495) [ClassicSimilarity], result of:
      0.036194623 = score(doc=3495,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.348393 = fieldWeight in 3495, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3495)
  0.1764706 = coord(3/17)

Source: Theorie, Semantik und Organisation von Wissen: Proceedings der 13. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) und dem 13. Internationalen Symposium der Informationswissenschaft der Higher Education Association for Information Science (HI) Potsdam (19.-20.03.2013): 'Theory, Information and Organization of Knowledge' / Proceedings der 14. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) und Natural Language & Information Systems (NLDB) Passau (16.06.2015): 'Lexical Resources for Knowledge Organization' / Proceedings des Workshops der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) auf der SEMANTICS Leipzig (1.09.2014): 'Knowledge Organization and Semantic Web' / Proceedings des Workshops der Polnischen und Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) Cottbus (29.-30.09.2011): 'Economics of Knowledge Production and Organization'. Hrsg. von W. Babik, H.P. Ohly u. K. Weber

Kempf, A.O.: Neue Verfahrenswege der Wissensorganisation : eine Evaluation automatischer Indexierung in der sozialwissenschaftlichen Fachinformation (2017) 0.02

0.015866982 = product of:
  0.0899129 = sum of:
    0.017523656 = weight(_text_:und in 3497) [ClassicSimilarity], result of:
      0.017523656 = score(doc=3497,freq=8.0), product of:
        0.05111519 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.023062602 = queryNorm
        0.34282678 = fieldWeight in 3497, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3497)
    0.036194623 = weight(_text_:informationswissenschaft in 3497) [ClassicSimilarity], result of:
      0.036194623 = score(doc=3497,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.348393 = fieldWeight in 3497, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3497)
    0.036194623 = weight(_text_:informationswissenschaft in 3497) [ClassicSimilarity], result of:
      0.036194623 = score(doc=3497,freq=2.0), product of:
        0.10389022 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.023062602 = queryNorm
        0.348393 = fieldWeight in 3497, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3497)
  0.1764706 = coord(3/17)

Source: Theorie, Semantik und Organisation von Wissen: Proceedings der 13. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) und dem 13. Internationalen Symposium der Informationswissenschaft der Higher Education Association for Information Science (HI) Potsdam (19.-20.03.2013): 'Theory, Information and Organization of Knowledge' / Proceedings der 14. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) und Natural Language & Information Systems (NLDB) Passau (16.06.2015): 'Lexical Resources for Knowledge Organization' / Proceedings des Workshops der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) auf der SEMANTICS Leipzig (1.09.2014): 'Knowledge Organization and Semantic Web' / Proceedings des Workshops der Polnischen und Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) Cottbus (29.-30.09.2011): 'Economics of Knowledge Production and Organization'. Hrsg. von W. Babik, H.P. Ohly u. K. Weber

Search (193 results, page 1 of 10)

Authors

Years

Languages

Types

Themes

Subjects

Classifications