Search (142 results, page 1 of 8)

  • × theme_ss:"Automatisches Indexieren"
  • × type_ss:"a"
  1. Hüther, H.: Selix im DFG-Projekt Kascade (1998) 0.05
    0.048257627 = product of:
      0.25737402 = sum of:
        0.014687132 = weight(_text_:und in 5151) [ClassicSimilarity], result of:
          0.014687132 = score(doc=5151,freq=2.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.24487628 = fieldWeight in 5151, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.078125 = fieldNorm(doc=5151)
        0.12134344 = weight(_text_:informationswissenschaft in 5151) [ClassicSimilarity], result of:
          0.12134344 = score(doc=5151,freq=8.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.99540854 = fieldWeight in 5151, product of:
              2.828427 = tf(freq=8.0), with freq of:
                8.0 = termFreq=8.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.078125 = fieldNorm(doc=5151)
        0.12134344 = weight(_text_:informationswissenschaft in 5151) [ClassicSimilarity], result of:
          0.12134344 = score(doc=5151,freq=8.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.99540854 = fieldWeight in 5151, product of:
              2.828427 = tf(freq=8.0), with freq of:
                8.0 = termFreq=8.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.078125 = fieldNorm(doc=5151)
      0.1875 = coord(3/16)
    
    Series
    Schriften zur Informationswissenschaft; Bd.34
    Source
    Knowledge Management und Kommunikationssysteme: Proceedings des 6. Internationalen Symposiums für Informationswissenschaft (ISI '98) Prag, 3.-7. November 1998 / Hochschulverband für Informationswissenschaft (HI) e.V. Konstanz ; Fachrichtung Informationswissenschaft der Universität des Saarlandes, Saarbrücken. Hrsg.: Harald H. Zimmermann u. Volker Schramm
  2. Lepsky, K.: Automatische Indexierung (2013) 0.04
    0.044111207 = product of:
      0.17644483 = sum of:
        0.02077074 = weight(_text_:und in 720) [ClassicSimilarity], result of:
          0.02077074 = score(doc=720,freq=4.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.34630734 = fieldWeight in 720, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.078125 = fieldNorm(doc=720)
        0.06067172 = weight(_text_:informationswissenschaft in 720) [ClassicSimilarity], result of:
          0.06067172 = score(doc=720,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.49770427 = fieldWeight in 720, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.078125 = fieldNorm(doc=720)
        0.06067172 = weight(_text_:informationswissenschaft in 720) [ClassicSimilarity], result of:
          0.06067172 = score(doc=720,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.49770427 = fieldWeight in 720, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.078125 = fieldNorm(doc=720)
        0.034330647 = product of:
          0.068661295 = sum of:
            0.068661295 = weight(_text_:grundlagen in 720) [ClassicSimilarity], result of:
              0.068661295 = score(doc=720,freq=2.0), product of:
                0.12968144 = queryWeight, product of:
                  4.7921367 = idf(docFreq=996, maxDocs=44218)
                  0.027061297 = queryNorm
                0.52946126 = fieldWeight in 720, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  4.7921367 = idf(docFreq=996, maxDocs=44218)
                  0.078125 = fieldNorm(doc=720)
          0.5 = coord(1/2)
      0.25 = coord(4/16)
    
    Source
    Grundlagen der praktischen Information und Dokumentation. Handbuch zur Einführung in die Informationswissenschaft und -praxis. 6., völlig neu gefaßte Ausgabe. Hrsg. von R. Kuhlen, W. Semar u. D. Strauch. Begründet von Klaus Laisiepen, Ernst Lutterbeck, Karl-Heinrich Meyer-Uhlenried
  3. Nohr, H.: Theorie des Information Retrieval II : Automatische Indexierung (2004) 0.04
    0.041979868 = product of:
      0.13433558 = sum of:
        0.016420713 = weight(_text_:und in 8) [ClassicSimilarity], result of:
          0.016420713 = score(doc=8,freq=10.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.27378 = fieldWeight in 8, product of:
              3.1622777 = tf(freq=10.0), with freq of:
                10.0 = termFreq=10.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0390625 = fieldNorm(doc=8)
        0.03033586 = weight(_text_:informationswissenschaft in 8) [ClassicSimilarity], result of:
          0.03033586 = score(doc=8,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.24885213 = fieldWeight in 8, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0390625 = fieldNorm(doc=8)
        0.03033586 = weight(_text_:informationswissenschaft in 8) [ClassicSimilarity], result of:
          0.03033586 = score(doc=8,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.24885213 = fieldWeight in 8, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0390625 = fieldNorm(doc=8)
        0.017165324 = product of:
          0.034330647 = sum of:
            0.034330647 = weight(_text_:grundlagen in 8) [ClassicSimilarity], result of:
              0.034330647 = score(doc=8,freq=2.0), product of:
                0.12968144 = queryWeight, product of:
                  4.7921367 = idf(docFreq=996, maxDocs=44218)
                  0.027061297 = queryNorm
                0.26473063 = fieldWeight in 8, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  4.7921367 = idf(docFreq=996, maxDocs=44218)
                  0.0390625 = fieldNorm(doc=8)
          0.5 = coord(1/2)
        0.040077824 = weight(_text_:theorie in 8) [ClassicSimilarity], result of:
          0.040077824 = score(doc=8,freq=2.0), product of:
            0.14011636 = queryWeight, product of:
              5.17774 = idf(docFreq=677, maxDocs=44218)
              0.027061297 = queryNorm
            0.28603244 = fieldWeight in 8, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.17774 = idf(docFreq=677, maxDocs=44218)
              0.0390625 = fieldNorm(doc=8)
      0.3125 = coord(5/16)
    
    Abstract
    Ein großer Teil der Informationen - Schätzungen zufolge bis zu 80% - liegt in Organisationen in unstrukturierten Dokumenten vor. In der Vergangenheit wurden Lösungen für das Management strukturierter Informationen entwickelt, die es nun auch zu erreichen gilt für unstrukturierte Informationen. Neben Verfahren des Data Mining für die Datenanalyse treten Versuche, Text Mining (Lit. 06) auf die Textanalyse anzuwenden. Um gezielt Dokumente im Repository suchen zu können, ist eine effektive Inhaltserkennung und -kennzeichnung erforderlich, d.h. eine Zuordnung der Dokumente zu Themengebieten bzw die Speicherung geeigneter Indexterme als Metadaten. Zu diesem Zweck müssen die Dokumenteninhalte repräsentiert, d.h. indexiert oder klassifiziert, werden. Dokumentanalyse dient auch der Steuerung des Informations- und Dokumentenflusses. Ziel ist die Einleitung eines "Workflow nach Posteingang". Eine Dokumentanalyse kann anhand erkannter Merkmale Eingangspost automatisch an den Sachbearbeiter oder die zuständige Organisationseinheit (Rechnungen in die Buchhaltung, Aufträge in den Vertrieb) im Unternehmen leiten. Dokumentanalysen werden auch benötigt, wenn Mitarbeiter über einen persönlichen Informationsfilter relevante Dokumente automatisch zugestellt bekommen sollen. Aufgrund der Systemintegration werden Indexierungslösungen in den Funktionsumfang von DMS- bzw. Workflow-Produkten integriert. Eine Architektur solcher Systeme zeigt Abb. 1. Die Architektur zeigt die Indexierungs- bzw. Klassifizierungsfunktion im Zentrum der Anwendung. Dabei erfüllt sie Aufgaben für die Repräsentation von Dokumenten (Metadaten) und das spätere Retrieval.
    Source
    Grundlagen der praktischen Information und Dokumentation. 5., völlig neu gefaßte Ausgabe. 2 Bde. Hrsg. von R. Kuhlen, Th. Seeger u. D. Strauch. Begründet von Klaus Laisiepen, Ernst Lutterbeck, Karl-Heinrich Meyer-Uhlenried. Bd.1: Handbuch zur Einführung in die Informationswissenschaft und -praxis
  4. Salton, G.: Future prospects for text-based information retrieval (1990) 0.04
    0.041915853 = product of:
      0.22355121 = sum of:
        0.017624559 = weight(_text_:und in 2327) [ClassicSimilarity], result of:
          0.017624559 = score(doc=2327,freq=2.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.29385152 = fieldWeight in 2327, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.09375 = fieldNorm(doc=2327)
        0.10296333 = weight(_text_:informationswissenschaft in 2327) [ClassicSimilarity], result of:
          0.10296333 = score(doc=2327,freq=4.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.84463215 = fieldWeight in 2327, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.09375 = fieldNorm(doc=2327)
        0.10296333 = weight(_text_:informationswissenschaft in 2327) [ClassicSimilarity], result of:
          0.10296333 = score(doc=2327,freq=4.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.84463215 = fieldWeight in 2327, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.09375 = fieldNorm(doc=2327)
      0.1875 = coord(3/16)
    
    Series
    Konstanzer Schriften zur Informationswissenschaft; Bd.1
    Source
    Pragmatische Aspekte beim Entwurf und Betrieb von Informationssystemen: Proc. des 1. Int. Symposiums für Informationswissenschaft, Universität Konstanz, 17.-19.10.1990. Hrsg.: J. Herget u. R. Kuhlen
  5. Schulz, K.U.; Brunner, L.: Vollautomatische thematische Verschlagwortung großer Textkollektionen mittels semantischer Netze (2017) 0.04
    0.040402837 = product of:
      0.16161135 = sum of:
        0.020561984 = weight(_text_:und in 3493) [ClassicSimilarity], result of:
          0.020561984 = score(doc=3493,freq=8.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.34282678 = fieldWeight in 3493, product of:
              2.828427 = tf(freq=8.0), with freq of:
                8.0 = termFreq=8.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3493)
        0.042470206 = weight(_text_:informationswissenschaft in 3493) [ClassicSimilarity], result of:
          0.042470206 = score(doc=3493,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.348393 = fieldWeight in 3493, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3493)
        0.042470206 = weight(_text_:informationswissenschaft in 3493) [ClassicSimilarity], result of:
          0.042470206 = score(doc=3493,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.348393 = fieldWeight in 3493, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3493)
        0.056108955 = weight(_text_:theorie in 3493) [ClassicSimilarity], result of:
          0.056108955 = score(doc=3493,freq=2.0), product of:
            0.14011636 = queryWeight, product of:
              5.17774 = idf(docFreq=677, maxDocs=44218)
              0.027061297 = queryNorm
            0.4004454 = fieldWeight in 3493, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.17774 = idf(docFreq=677, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3493)
      0.25 = coord(4/16)
    
    Source
    Theorie, Semantik und Organisation von Wissen: Proceedings der 13. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) und dem 13. Internationalen Symposium der Informationswissenschaft der Higher Education Association for Information Science (HI) Potsdam (19.-20.03.2013): 'Theory, Information and Organization of Knowledge' / Proceedings der 14. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) und Natural Language & Information Systems (NLDB) Passau (16.06.2015): 'Lexical Resources for Knowledge Organization' / Proceedings des Workshops der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) auf der SEMANTICS Leipzig (1.09.2014): 'Knowledge Organization and Semantic Web' / Proceedings des Workshops der Polnischen und Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) Cottbus (29.-30.09.2011): 'Economics of Knowledge Production and Organization'. Hrsg. von W. Babik, H.P. Ohly u. K. Weber
  6. Böhm, A.; Seifert, C.; Schlötterer, J.; Granitzer, M.: Identifying tweets from the economic domain (2017) 0.04
    0.040402837 = product of:
      0.16161135 = sum of:
        0.020561984 = weight(_text_:und in 3495) [ClassicSimilarity], result of:
          0.020561984 = score(doc=3495,freq=8.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.34282678 = fieldWeight in 3495, product of:
              2.828427 = tf(freq=8.0), with freq of:
                8.0 = termFreq=8.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3495)
        0.042470206 = weight(_text_:informationswissenschaft in 3495) [ClassicSimilarity], result of:
          0.042470206 = score(doc=3495,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.348393 = fieldWeight in 3495, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3495)
        0.042470206 = weight(_text_:informationswissenschaft in 3495) [ClassicSimilarity], result of:
          0.042470206 = score(doc=3495,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.348393 = fieldWeight in 3495, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3495)
        0.056108955 = weight(_text_:theorie in 3495) [ClassicSimilarity], result of:
          0.056108955 = score(doc=3495,freq=2.0), product of:
            0.14011636 = queryWeight, product of:
              5.17774 = idf(docFreq=677, maxDocs=44218)
              0.027061297 = queryNorm
            0.4004454 = fieldWeight in 3495, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.17774 = idf(docFreq=677, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3495)
      0.25 = coord(4/16)
    
    Source
    Theorie, Semantik und Organisation von Wissen: Proceedings der 13. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) und dem 13. Internationalen Symposium der Informationswissenschaft der Higher Education Association for Information Science (HI) Potsdam (19.-20.03.2013): 'Theory, Information and Organization of Knowledge' / Proceedings der 14. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) und Natural Language & Information Systems (NLDB) Passau (16.06.2015): 'Lexical Resources for Knowledge Organization' / Proceedings des Workshops der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) auf der SEMANTICS Leipzig (1.09.2014): 'Knowledge Organization and Semantic Web' / Proceedings des Workshops der Polnischen und Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) Cottbus (29.-30.09.2011): 'Economics of Knowledge Production and Organization'. Hrsg. von W. Babik, H.P. Ohly u. K. Weber
  7. Kempf, A.O.: Neue Verfahrenswege der Wissensorganisation : eine Evaluation automatischer Indexierung in der sozialwissenschaftlichen Fachinformation (2017) 0.04
    0.040402837 = product of:
      0.16161135 = sum of:
        0.020561984 = weight(_text_:und in 3497) [ClassicSimilarity], result of:
          0.020561984 = score(doc=3497,freq=8.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.34282678 = fieldWeight in 3497, product of:
              2.828427 = tf(freq=8.0), with freq of:
                8.0 = termFreq=8.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3497)
        0.042470206 = weight(_text_:informationswissenschaft in 3497) [ClassicSimilarity], result of:
          0.042470206 = score(doc=3497,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.348393 = fieldWeight in 3497, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3497)
        0.042470206 = weight(_text_:informationswissenschaft in 3497) [ClassicSimilarity], result of:
          0.042470206 = score(doc=3497,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.348393 = fieldWeight in 3497, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3497)
        0.056108955 = weight(_text_:theorie in 3497) [ClassicSimilarity], result of:
          0.056108955 = score(doc=3497,freq=2.0), product of:
            0.14011636 = queryWeight, product of:
              5.17774 = idf(docFreq=677, maxDocs=44218)
              0.027061297 = queryNorm
            0.4004454 = fieldWeight in 3497, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.17774 = idf(docFreq=677, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3497)
      0.25 = coord(4/16)
    
    Source
    Theorie, Semantik und Organisation von Wissen: Proceedings der 13. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) und dem 13. Internationalen Symposium der Informationswissenschaft der Higher Education Association for Information Science (HI) Potsdam (19.-20.03.2013): 'Theory, Information and Organization of Knowledge' / Proceedings der 14. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) und Natural Language & Information Systems (NLDB) Passau (16.06.2015): 'Lexical Resources for Knowledge Organization' / Proceedings des Workshops der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) auf der SEMANTICS Leipzig (1.09.2014): 'Knowledge Organization and Semantic Web' / Proceedings des Workshops der Polnischen und Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) Cottbus (29.-30.09.2011): 'Economics of Knowledge Production and Organization'. Hrsg. von W. Babik, H.P. Ohly u. K. Weber
  8. Niggemann, E.: Wer suchet, der findet? : Verbesserung der inhaltlichen Suchmöglichkeiten im Informationssystem Der Deutschen Bibliothek (2006) 0.03
    0.03218085 = product of:
      0.1287234 = sum of:
        0.022989 = weight(_text_:und in 5812) [ClassicSimilarity], result of:
          0.022989 = score(doc=5812,freq=10.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.38329202 = fieldWeight in 5812, product of:
              3.1622777 = tf(freq=10.0), with freq of:
                10.0 = termFreq=10.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5812)
        0.020793993 = product of:
          0.041587986 = sum of:
            0.041587986 = weight(_text_:bibliothekswesen in 5812) [ClassicSimilarity], result of:
              0.041587986 = score(doc=5812,freq=2.0), product of:
                0.12063039 = queryWeight, product of:
                  4.457672 = idf(docFreq=1392, maxDocs=44218)
                  0.027061297 = queryNorm
                0.34475547 = fieldWeight in 5812, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  4.457672 = idf(docFreq=1392, maxDocs=44218)
                  0.0546875 = fieldNorm(doc=5812)
          0.5 = coord(1/2)
        0.042470206 = weight(_text_:informationswissenschaft in 5812) [ClassicSimilarity], result of:
          0.042470206 = score(doc=5812,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.348393 = fieldWeight in 5812, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5812)
        0.042470206 = weight(_text_:informationswissenschaft in 5812) [ClassicSimilarity], result of:
          0.042470206 = score(doc=5812,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.348393 = fieldWeight in 5812, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5812)
      0.25 = coord(4/16)
    
    Abstract
    Elektronische Bibliothekskataloge und Bibliografien haben ihr Monopol bei der Suche nach Büchern, Aufsätzen, musikalischen Werken u. a. verloren. Globale Suchmaschinen sind starke Konkurrenten, und Bibliotheken müssen heute so planen, dass ihre Dienstleistungen auch morgen noch interessant sind. Die Deutsche Bibliothek (DDB) wird ihre traditionelle Katalogrecherche zu einem globalen, netzbasierten Informationssystem erweitern, das die Vorteile der neutralen, qualitätsbasierten Katalogsuche mit den Vorteilen moderner Suchmaschinen zu verbinden sucht. Dieser Beitrag beschäftigt sich mit der Verbesserung der inhaltlichen Suchmöglichkeiten im Informationssystem Der Deutschen Bibliothek. Weitere Entwicklungsstränge sollen nur kurz im Ausblick angerissen werden.
    Source
    Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen
  9. Reimer, U.: Verfahren der automatischen Indexierung : benötigtes Vorwissen und Ansätze zu seiner automatischen Akquisition, ein Überblick (1992) 0.03
    0.03197569 = product of:
      0.17053701 = sum of:
        0.02492489 = weight(_text_:und in 7858) [ClassicSimilarity], result of:
          0.02492489 = score(doc=7858,freq=4.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.41556883 = fieldWeight in 7858, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.09375 = fieldNorm(doc=7858)
        0.07280606 = weight(_text_:informationswissenschaft in 7858) [ClassicSimilarity], result of:
          0.07280606 = score(doc=7858,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.5972451 = fieldWeight in 7858, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.09375 = fieldNorm(doc=7858)
        0.07280606 = weight(_text_:informationswissenschaft in 7858) [ClassicSimilarity], result of:
          0.07280606 = score(doc=7858,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.5972451 = fieldWeight in 7858, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.09375 = fieldNorm(doc=7858)
      0.1875 = coord(3/16)
    
    Series
    Schriften zur Informationswissenschaft; Bd.3
    Source
    Experimentelles und praktisches Information Retrieval: Festschrift für Gerhard Lustig. Hrsg. R. Kuhlen
  10. Lepsky, K.: Automatisches Indexieren (2023) 0.03
    0.031694766 = product of:
      0.12677906 = sum of:
        0.0178072 = weight(_text_:und in 781) [ClassicSimilarity], result of:
          0.0178072 = score(doc=781,freq=6.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.2968967 = fieldWeight in 781, product of:
              2.4494898 = tf(freq=6.0), with freq of:
                6.0 = termFreq=6.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0546875 = fieldNorm(doc=781)
        0.042470206 = weight(_text_:informationswissenschaft in 781) [ClassicSimilarity], result of:
          0.042470206 = score(doc=781,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.348393 = fieldWeight in 781, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0546875 = fieldNorm(doc=781)
        0.042470206 = weight(_text_:informationswissenschaft in 781) [ClassicSimilarity], result of:
          0.042470206 = score(doc=781,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.348393 = fieldWeight in 781, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0546875 = fieldNorm(doc=781)
        0.024031455 = product of:
          0.04806291 = sum of:
            0.04806291 = weight(_text_:grundlagen in 781) [ClassicSimilarity], result of:
              0.04806291 = score(doc=781,freq=2.0), product of:
                0.12968144 = queryWeight, product of:
                  4.7921367 = idf(docFreq=996, maxDocs=44218)
                  0.027061297 = queryNorm
                0.3706229 = fieldWeight in 781, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  4.7921367 = idf(docFreq=996, maxDocs=44218)
                  0.0546875 = fieldNorm(doc=781)
          0.5 = coord(1/2)
      0.25 = coord(4/16)
    
    Abstract
    Unter Indexierung versteht man die Zuordnung von inhaltskennzeichnenden Ausdrücken (Indextermen, Indexaten, Erschließungsmerkmalen) zu Dokumenten. Über die zugeteilten Indexterme soll ein gezieltes Auffinden der Dokumente ermöglicht werden. Indexterme können inhaltsbeschreibende Merkmale wie Notationen, Deskriptoren, kontrollierte oder freie Schlagwörter sein; es kann sich auch um reine Stichwörter handeln, die aus dem Text des Dokuments gewonnen werden. Eine Indexierung kann intellektuell, computerunterstützt oder automatisch erfolgen. Computerunterstützte Indexierungsverfahren kombinieren die intellektuelle Indexierung mit automatischen Vorarbeiten. Bei der automatischen Indexierung werden die Indexterme automatisch aus dem Dokumenttext ermittelt und dem Dokument zugeordnet. Automatische Indexierung bedient sich für die Verarbeitung der Zeichenketten im Dokument linguistischer und statistischer Verfahren.
    Source
    Grundlagen der Informationswissenschaft. Hrsg.: Rainer Kuhlen, Dirk Lewandowski, Wolfgang Semar und Christa Womser-Hacker. 7., völlig neu gefasste Ausg
  11. Kempf, A.O.: Automatische Indexierung in der sozialwissenschaftlichen Fachinformation : eine Evaluationsstudie zur maschinellen Erschließung für die Datenbank SOLIS (2012) 0.02
    0.023677206 = product of:
      0.12627843 = sum of:
        0.0233151 = weight(_text_:und in 903) [ClassicSimilarity], result of:
          0.0233151 = score(doc=903,freq=14.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.38872904 = fieldWeight in 903, product of:
              3.7416575 = tf(freq=14.0), with freq of:
                14.0 = termFreq=14.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.046875 = fieldNorm(doc=903)
        0.051481664 = weight(_text_:informationswissenschaft in 903) [ClassicSimilarity], result of:
          0.051481664 = score(doc=903,freq=4.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.42231607 = fieldWeight in 903, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.046875 = fieldNorm(doc=903)
        0.051481664 = weight(_text_:informationswissenschaft in 903) [ClassicSimilarity], result of:
          0.051481664 = score(doc=903,freq=4.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.42231607 = fieldWeight in 903, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.046875 = fieldNorm(doc=903)
      0.1875 = coord(3/16)
    
    Abstract
    Automatische Indexierungsverfahren werden mit Zunahme der digitalen Verfügbarkeit von Metadaten und Volltexten mehr und mehr als eine mögliche Antwort auf das Management unstrukturierter Daten diskutiert. In der sozialwissenschaftlichen Fachinformation existiert in diesem Zusammenhang seit einiger Zeit der Vorschlag eines sogenannten Schalenmodells (vgl. Krause, 1996) mit unterschiedlichen Qualitätsstufen bei der inhaltlichen Erschließung. Vor diesem Hintergrund beschreibt die Arbeit zunächst Methoden und Verfahren der inhaltlichen und automatischen Indexierung, bevor vier Testläufe eines automatischen Indexierungssystems (MindServer) zur automatischen Erschließung von Datensätzen der bibliographischen Literaturdatenbank SOLIS mit Deskriptoren des Thesaurus Sozialwissenschaften sowie der Klassifikation Sozialwissenschaften beschrieben und analysiert werden. Es erfolgt eine ausführliche Fehleranalyse mit Beispielen sowie eine abschließende Diskussion, inwieweit die automatische Erschließung in dieser Form für die Randbereiche der Datenbank SOLIS für die Zukunft einen gangbaren Weg darstellt.
    Imprint
    Berlin : Humboldt-Universität zu Berlin, Philosophische Fakultät I, Institut für Bibliotheks- und Informationswissenschaft
    Series
    Berliner Handreichungen zur Bibliotheks- und Informationswissenschaft; 329
  12. Lepsky, K.: Automatische Indexierung zur Erschließung deutschsprachiger Dokumente (1999) 0.02
    0.022607654 = product of:
      0.12057416 = sum of:
        0.02349941 = weight(_text_:und in 4656) [ClassicSimilarity], result of:
          0.02349941 = score(doc=4656,freq=8.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.39180204 = fieldWeight in 4656, product of:
              2.828427 = tf(freq=8.0), with freq of:
                8.0 = termFreq=8.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0625 = fieldNorm(doc=4656)
        0.048537377 = weight(_text_:informationswissenschaft in 4656) [ClassicSimilarity], result of:
          0.048537377 = score(doc=4656,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.3981634 = fieldWeight in 4656, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0625 = fieldNorm(doc=4656)
        0.048537377 = weight(_text_:informationswissenschaft in 4656) [ClassicSimilarity], result of:
          0.048537377 = score(doc=4656,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.3981634 = fieldWeight in 4656, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0625 = fieldNorm(doc=4656)
      0.1875 = coord(3/16)
    
    Abstract
    Der Beitrag beschäftigt sich mit der Anwendung eines Verfahrens zur automatischen Indexierung deutschsprachiger Texte in Bibliotheken. Die Arbeitsweise des Verfahrens und seine Entwicklung innerhalb der von der Deutschen Forschungsgemeinschaft geförderte und an der ULB Düsseldorf gemeinsam mit der Fachrichtung Informationswissenschaft der Universität des Saarlandes durchgeführten Projekte MILOS I, MILOS II und KASCADE werden geschildert. Die Ergebnisse von Retrievaltests belegen die Tauglichkeit des Verfahrens für den Einsatz in Bibliotheken. Aufsetzend auf diesen Ergebnissen werden Perspektiven für die bibliothekarische Sacherschließung im Hinblick auf den Einsatz von automatischen Verfahren entworfen
    Source
    nfd Information - Wissenschaft und Praxis. 50(1999) H.6, S.325-330
  13. Krause, J.; Womser-Hacker, C.: PADOK-II : Retrievaltests zur Bewertung von Volltextindexierungsvarianten für das deutsche Patentinformationssystem (1990) 0.02
    0.022017345 = product of:
      0.117425844 = sum of:
        0.020351088 = weight(_text_:und in 2653) [ClassicSimilarity], result of:
          0.020351088 = score(doc=2653,freq=6.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.33931053 = fieldWeight in 2653, product of:
              2.4494898 = tf(freq=6.0), with freq of:
                6.0 = termFreq=6.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0625 = fieldNorm(doc=2653)
        0.048537377 = weight(_text_:informationswissenschaft in 2653) [ClassicSimilarity], result of:
          0.048537377 = score(doc=2653,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.3981634 = fieldWeight in 2653, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0625 = fieldNorm(doc=2653)
        0.048537377 = weight(_text_:informationswissenschaft in 2653) [ClassicSimilarity], result of:
          0.048537377 = score(doc=2653,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.3981634 = fieldWeight in 2653, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0625 = fieldNorm(doc=2653)
      0.1875 = coord(3/16)
    
    Abstract
    Vorgestellt werden die Ergebnisse extensiver Retrievaltests von zwei Varianten von Inhalteserschließungen (Freitext und PASSAT) für das deutsche Patentinformationssystem auf der Basis von Volltexten. Die Tests führte die Fachgruppe Linguistische Informationswissenschaft der Universität Regensburg von 1986-1989 in Zusammenarbeit mit dem Deutschen Patentamt, dem Fachinformationszentrum Karlsruhe und meheren industrieellen Partnern durch. Der Schwerpunkt des Berichts liegt auf dem allgemeinen Ansatz der Bewertung der Ziele des Projekts und auf der Darstellung der statistischen Evaluierungsergebnisse.
  14. Gaus, W.; Kaluscha, R.: Maschinelle inhaltliche Erschließung von Arztbriefen und Auswertung von Reha-Entlassungsberichten (2006) 0.02
    0.021506887 = product of:
      0.08602755 = sum of:
        0.025607888 = weight(_text_:und in 6078) [ClassicSimilarity], result of:
          0.025607888 = score(doc=6078,freq=38.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.42695636 = fieldWeight in 6078, product of:
              6.164414 = tf(freq=38.0), with freq of:
                38.0 = termFreq=38.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.03125 = fieldNorm(doc=6078)
        0.011882282 = product of:
          0.023764564 = sum of:
            0.023764564 = weight(_text_:bibliothekswesen in 6078) [ClassicSimilarity], result of:
              0.023764564 = score(doc=6078,freq=2.0), product of:
                0.12063039 = queryWeight, product of:
                  4.457672 = idf(docFreq=1392, maxDocs=44218)
                  0.027061297 = queryNorm
                0.19700313 = fieldWeight in 6078, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  4.457672 = idf(docFreq=1392, maxDocs=44218)
                  0.03125 = fieldNorm(doc=6078)
          0.5 = coord(1/2)
        0.024268689 = weight(_text_:informationswissenschaft in 6078) [ClassicSimilarity], result of:
          0.024268689 = score(doc=6078,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.1990817 = fieldWeight in 6078, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.03125 = fieldNorm(doc=6078)
        0.024268689 = weight(_text_:informationswissenschaft in 6078) [ClassicSimilarity], result of:
          0.024268689 = score(doc=6078,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.1990817 = fieldWeight in 6078, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.03125 = fieldNorm(doc=6078)
      0.25 = coord(4/16)
    
    Abstract
    Schon Hippokrates empfahl den Ärzten, Krankenakten zu führen. Heute ist die detaillierte Dokumentation eine Standespflicht der Ärzte [Gaus et al 1999]. Diese Dokumentationen medizinischer Behandlungen bergen einen riesigen und wertvollen Erfahrungsschatz. Informationen zu Therapien und Behandlungsergebnissen, die in Studien erst mühsam erhoben werden müssten, sind bereits in der Routinedokumentation wie Operations- und Entlassungsberichten oder Arztbriefen zahlreich vorhanden. Mit der Einführung der elektronischen Datenverarbeitung in der Medizin liegen diese Informationen seit einigen Jahren auch maschinenlesbar vor, so dass ein Haupthemmnis für die Nutzung dieser Dokumentationen, nämlich die mühsame manuelle Aufbereitung der Papierakten, entfällt. Während die formale Erschließung nach Patientenmerkmalen wie Name und Geburtsdatum von den Krankenhaus- bzw. Praxisinformationssystemen heutzutage gut gelöst ist, bleibt die inhaltliche Erschließung dieser Dokumentationen schwierig, da nur wenige Informationen in strukturierter oder intellektuell indexierter Form vorliegen [Leiner et al. 2003]. Auch wenn nach der Einführung der Fallpauschalen (diagnosis related groups, DRG) in den Krankenhäusern die Diagnosen nach ICD-10 verschlüsselt werden, besteht ein Großteil der Informationen weiterhin aus freiem Text, dessen computerbasierte Erschließung aufgrund der Komplexität menschlicher Sprache nicht trivial ist. Zu diesen medizinischen Texten gehören u.a. Gutachten, verbal beschriebene (Differential-) Diagnosen, vielfältige Untersuchungs- und Befundberichte, Visitenblätter, Operationsberichte und der Arztbrief bzw. Entlassungsbericht. Arztbrief und Entlassbericht dienen der Information des einweisenden oder weiterbehandelnden Arztes (z.B. Hausarzt) über das, was mit dem Patienten geschehen ist, und geben Empfehlungen zur Weiterbehandlung. Sie fassen eine (stationäre) Behandlung epikritisch - also nachdem die Krankheit überwunden ist, im Rückblick - zusammen und geben einen Überblick über Anamnese (Vorgeschichte), Beschwerden und Symptome, die eingesetzten diagnostischen Verfahren, die gestellte(n) Diagnose(n), Therapie, Verlauf, Komplikationen und das erzielte Ergebnis. Sie haben somit eine ähnliche Funktion wie das Abstract in der Literaturdokumentation, oft wird eine Kopie in der Krankenakte obenauf abgelegt. Zumindest in Universitätskliniken möchten wissenschaftlich arbeitende Ärzte auch unter inhaltlichen Gesichtspunkten auf die Krankenakten zugreifen können, z.B. die Krankenakten aller Patienten mit einer bestimmten Diagnose einsehen, exzerpieren und die exzerpierten Daten auswerten. Auch bei der Suche nach ähnlichen Fällen oder im Bereich der Aus- und Fortbildung hilft eine inhaltliche Erschließung weiter. So könnte etwa ein Assistenzarzt, der im Rahmen seiner Weiterbildung demnächst Sonografien des Kniegelenkes durchzuführen hat, sich vorhandene Berichte von solchen Sonografien anschauen und sich so über relevante Untersuchungstechniken und Befunde vorab informieren.
    Source
    Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen
  15. Rapke, K.: Automatische Indexierung von Volltexten für die Gruner+Jahr Pressedatenbank (2001) 0.02
    0.019982534 = product of:
      0.106573515 = sum of:
        0.02077074 = weight(_text_:und in 5863) [ClassicSimilarity], result of:
          0.02077074 = score(doc=5863,freq=16.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.34630734 = fieldWeight in 5863, product of:
              4.0 = tf(freq=16.0), with freq of:
                16.0 = termFreq=16.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0390625 = fieldNorm(doc=5863)
        0.04290139 = weight(_text_:informationswissenschaft in 5863) [ClassicSimilarity], result of:
          0.04290139 = score(doc=5863,freq=4.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.35193008 = fieldWeight in 5863, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0390625 = fieldNorm(doc=5863)
        0.04290139 = weight(_text_:informationswissenschaft in 5863) [ClassicSimilarity], result of:
          0.04290139 = score(doc=5863,freq=4.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.35193008 = fieldWeight in 5863, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0390625 = fieldNorm(doc=5863)
      0.1875 = coord(3/16)
    
    Abstract
    Retrievaltests sind die anerkannteste Methode, um neue Verfahren der Inhaltserschließung gegenüber traditionellen Verfahren zu rechtfertigen. Im Rahmen einer Diplomarbeit wurden zwei grundsätzlich unterschiedliche Systeme der automatischen inhaltlichen Erschließung anhand der Pressedatenbank des Verlagshauses Gruner + Jahr (G+J) getestet und evaluiert. Untersucht wurde dabei natürlichsprachliches Retrieval im Vergleich zu Booleschem Retrieval. Bei den beiden Systemen handelt es sich zum einen um Autonomy von Autonomy Inc. und DocCat, das von IBM an die Datenbankstruktur der G+J Pressedatenbank angepasst wurde. Ersteres ist ein auf natürlichsprachlichem Retrieval basierendes, probabilistisches System. DocCat demgegenüber basiert auf Booleschem Retrieval und ist ein lernendes System, das aufgrund einer intellektuell erstellten Trainingsvorlage indexiert. Methodisch geht die Evaluation vom realen Anwendungskontext der Textdokumentation von G+J aus. Die Tests werden sowohl unter statistischen wie auch qualitativen Gesichtspunkten bewertet. Ein Ergebnis der Tests ist, dass DocCat einige Mängel gegenüber der intellektuellen Inhaltserschließung aufweist, die noch behoben werden müssen, während das natürlichsprachliche Retrieval von Autonomy in diesem Rahmen und für die speziellen Anforderungen der G+J Textdokumentation so nicht einsetzbar ist
    Series
    Tagungen der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis; 4
    Source
    Information Research & Content Management: Orientierung, Ordnung und Organisation im Wissensmarkt; 23. DGI-Online-Tagung der DGI und 53. Jahrestagung der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis e.V. DGI, Frankfurt am Main, 8.-10.5.2001. Proceedings. Hrsg.: R. Schmidt
  16. Maas, H.-D.: Indexieren mit AUTINDEX (2006) 0.02
    0.018194064 = product of:
      0.07277626 = sum of:
        0.019909058 = weight(_text_:und in 6077) [ClassicSimilarity], result of:
          0.019909058 = score(doc=6077,freq=30.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.33194062 = fieldWeight in 6077, product of:
              5.477226 = tf(freq=30.0), with freq of:
                30.0 = termFreq=30.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.02734375 = fieldNorm(doc=6077)
        0.0103969965 = product of:
          0.020793993 = sum of:
            0.020793993 = weight(_text_:bibliothekswesen in 6077) [ClassicSimilarity], result of:
              0.020793993 = score(doc=6077,freq=2.0), product of:
                0.12063039 = queryWeight, product of:
                  4.457672 = idf(docFreq=1392, maxDocs=44218)
                  0.027061297 = queryNorm
                0.17237774 = fieldWeight in 6077, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  4.457672 = idf(docFreq=1392, maxDocs=44218)
                  0.02734375 = fieldNorm(doc=6077)
          0.5 = coord(1/2)
        0.021235103 = weight(_text_:informationswissenschaft in 6077) [ClassicSimilarity], result of:
          0.021235103 = score(doc=6077,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.1741965 = fieldWeight in 6077, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.02734375 = fieldNorm(doc=6077)
        0.021235103 = weight(_text_:informationswissenschaft in 6077) [ClassicSimilarity], result of:
          0.021235103 = score(doc=6077,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.1741965 = fieldWeight in 6077, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.02734375 = fieldNorm(doc=6077)
      0.25 = coord(4/16)
    
    Abstract
    Wenn man ein Computerprogramm besitzt, das einem zu fast jedem Textwort dessen grammatische Merkmale bestimmt und außerdem noch seine interne Struktur und einige semantische Informationen liefert, dann fragt man sich irgendwann: Könnte ich nicht auf der Grundlage dieser Angaben einen Text global charakterisieren, etwa indem ich versuche, die wichtigen Wörter dieses Textes zu errechnen? Die häufigsten Textwörter können es nicht sein, denn gerade sie sind sehr nichtssagend. Die seltensten Textwörter sind zwar aussagekräftig, aber sie sind zu viele - die meisten Lemmata eines Textes erscheinen nur ein einziges Mal. Irgendwie müsste man den Wortschatz einschränken können. Die rettende Idee war: Wir tun so, als seien die semantischen Merkmale Wörter, denn dann enthält der Wortschatz dieser Sprache nur noch etwa hundert Elemente, weil unsere morphologische Analyse (Mpro) rund 100 semantische Features verwendet. Wir vermuteten nun, dass die häufig vorkommenden Features wichtig für den Text sind und die selteneren als Ausreißer betrachten werden können. Die Implementierung dieser Idee ist der Urahn unseres Programmpaketes AUTINDEX zur automatischen Indexierung von Texten. Dieses allererste Programm erstellte also zu einem Text eine Statistik der semantischen Merkmale und gab die drei häufigsten Klassen mit den zugehörigen Lemmata aus. Das Ergebnis war verblüffend: Auf den ersten Blick konnte man sehen, worum es in dem Text ging. Bei näherem Hinsehen wurden aber auch Unzulänglichkeiten deutlich. Einige der Schlagwörter waren doch ziemlich nichtssagend, andere hätte man gerne in der Liste gehabt, und schließlich hätte man sich noch eine ganz globale Charakterisierung des Textes durch die Angabe von Fachgebieten gewünscht, etwa in der Form: Der Text hat mit Politik oder Wirtschaft zu tun, er berichtet über einen Unfall, eine Feierlichkeit usw. Es wurde also sofort deutlich, dass das Programm ohne eine weitere Wissensquelle keine wirklich guten Ergebnisse würde liefern können. Man braucht also einen Thesaurus, ein Wörterbuch, in dem einzelne Lemmata und auch mehrwortige Ausdrücke mit zusätzlichen Informationen versehen sind.
    Die erste Implementierung wurde in Zusammenarbeit mit dem Fachinformationszentrum Technik (Frankfurt) erstellt. Eine Kontrolle der manuell vergebenen Grob- und Feinklassifizierung der Lexikonartikel des Brockhaus Multimedial und anderer Brockhaus-Lexika wurde mit AUTINDEX in Zusammenarbeit mit BIFAB (Mannheim) durchgeführt. AUTINDEX ist auch Bestandteil des Indexierungs- und Retrievalsystems der Firma AGI (Neustadt/Weinstraße), das in der Landesbibliothek Vorarlberg eingesetzt wird. Weiterhin wird AUTINDEX im System LEWI verwendet, das zusammen mit BIFAB entwickelt wird. Dieses System erlaubt natürlichsprachliche Anfragen an den Brockhaus Multimedial und liefert als Antwort die relevanten Lexikonartikel. Im IAI selbst wurden große Textmengen indexiert (Brockhaus- und Dudenlexika, Zeitungstexte usw.), die man für die Weiterentwicklung diverser Thesauri und Wörterbücher nutzen kann. Beispielsweise kann man sich für ein Wort alle Texte ausgeben lassen, in denen dieses Wort wichtig ist. Dabei sind die Texte nach Wichtigkeit sortiert. Zu einem gegebenen Wort kann man sich auch die Assoziationen oder die möglichen Klassifikationen berechnen lassen. Auf diese Weise kann man einen Thesaurus halbautomatisch erweitern.
    Source
    Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen
  17. Lepsky, K.: Automatische Indexierung des Reallexikons zur Deutschen Kunstgeschichte (2006) 0.02
    0.017668601 = product of:
      0.070674405 = sum of:
        0.0178072 = weight(_text_:und in 6080) [ClassicSimilarity], result of:
          0.0178072 = score(doc=6080,freq=24.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.2968967 = fieldWeight in 6080, product of:
              4.8989797 = tf(freq=24.0), with freq of:
                24.0 = termFreq=24.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.02734375 = fieldNorm(doc=6080)
        0.0103969965 = product of:
          0.020793993 = sum of:
            0.020793993 = weight(_text_:bibliothekswesen in 6080) [ClassicSimilarity], result of:
              0.020793993 = score(doc=6080,freq=2.0), product of:
                0.12063039 = queryWeight, product of:
                  4.457672 = idf(docFreq=1392, maxDocs=44218)
                  0.027061297 = queryNorm
                0.17237774 = fieldWeight in 6080, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  4.457672 = idf(docFreq=1392, maxDocs=44218)
                  0.02734375 = fieldNorm(doc=6080)
          0.5 = coord(1/2)
        0.021235103 = weight(_text_:informationswissenschaft in 6080) [ClassicSimilarity], result of:
          0.021235103 = score(doc=6080,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.1741965 = fieldWeight in 6080, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.02734375 = fieldNorm(doc=6080)
        0.021235103 = weight(_text_:informationswissenschaft in 6080) [ClassicSimilarity], result of:
          0.021235103 = score(doc=6080,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.1741965 = fieldWeight in 6080, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.02734375 = fieldNorm(doc=6080)
      0.25 = coord(4/16)
    
    Abstract
    Digitalisierungsvorhaben sorgen für eine immer größere Verfügbarkeit von Inhalten bislang ausschließlich gedruckt vorliegender Werke, zunehmend auch von ganzen Büchern. Projekte wie "Google Print" versprechen die völlige elektronische Verfügbarkeit von Informationen nahezu unabhängig von Zeit und Ort und sorgen dafür, dass die Hüter der konventionellen Information, die Bibliotheken, in Angst und Schrecken versetzt werden angesichts des befürchteten Verlusts ihrer traditionellen Rolle. Die Debatte kreist dabei eher selten um die Frage, welcher Nutzen sich konkret aus dem elektronischen Volltext ergibt: Der Nutzen steht schlichtweg außer Frage, Volltexte gelten prinzipiell als nützlich. Das ist insofern zu optimistisch, als die reine Verfügbarkeit von Information noch lange nicht fir deren sinnvolle Verwertung sorgt - die bloße Verfügbarkeit des Volltexts von Kants "Kritik der reinen Vernunft" enthebt nicht der Notwendigkeit, das Werk zu lesen und verstehen zu wollen. Lesen wird man besser auch nicht am Bildschirm sondern in der (neu-deutsch) "PrintAusgabe". Elektronische Volltexte von Büchern dienen nicht der Lektüre. Falls ihr Sinn nicht ohnehin ein rein verkaufsfördernder ist (das "Publishers Program" von Google Print erweckt in der Tat diesen Eindruck), bleibt ihr potenzieller Nutzen als Nachschlageinstrument. Nur der Volltext bietet die Möglichkeit, Informationen in einem Werk zu finden, die nicht explizit erschlossen wurden, durch ein Inhaltsverzeichnis etwa oder, eine noch günstigere Ausgangslage, durch ein Sachregister. Allerdings sind die meisten Werke nicht für einen solchen Zweck verfasst worden, d.h. es ist nicht zu erwarten, dass ein Werk über die "Geschichte des Römischen Reiches" im Volltextzugriff zu einem Lexikon zur Geschichte des Römischen Reiches wird. Entspricht also die hinter Google Print und zahllosen anderen Digitalisierungsinitiativen stehende Auffassung einem doch sehr naiven Bild von der Nützlichkeit gedruckter Information?
    Seriöse Information darf erwarten, wer renommierte Nachschlagewerke befragt. Zumindest für die über die Primärordnung (Stichwort/Lemma) erschlossenen Sachverhalte ist für Buchausgaben ein gezielter Zugriff möglich, Verweisungen zwischen Artikeln sorgen für weitere Einstiege. Anzunehmen ist, dass sich der Nutzen von Nachschlagewerken in elektronischer Form noch deutlich erhöhen lässt: Produkte wie z.B. "Brockhaus multimedial" oder "Encyclopedia Britannica" sorgen mit leistungsfähigen Techniken über den wahlfreien Volltextzugriff hinaus für zahlreiche Navigations- und Recherchemöglichkeiten. Es liegt daher nahe, über eine Digitalisierung konventionell vorliegender Nachschlagewerke auch deren Anwendung zu verbessern, die im Print möglichen Zugriffsmöglichkeiten deutlich zu erweitern. Beispiele für diesen Ansatz sind die Digitalisierung der "Oekonomischen Encyklopädie" von Johann Georg Krünitz, die mit hohem Aufwand nicht maschinell (Scanning und OCR) sondern manuell realisiert wurde oder auch die im "Projekt Runeberg' , vorgenommenen zahlreichen Digitalisierungen u.a. auch von Nachschlagewerken. Ob die einfache Volltextindexierung derartig umfangreicher und - weil bereits als Nachschlagewerk konzipiert - gleichzeitig extrem verdichteter Quellen für einen größtmöglichen Nutzen der elektronischen Version ausreicht, darf zu Recht bezweifelt werden. In kommerziellen Produkten sorgen daher zusätzliche Techniken für einerseits thematisch gezielte Zugriffe auch über Nicht-Stichwörter, andererseits für Querverbindungen zu möglicherweise weiteren Artikeln von Interesse ("Wissensnetz" des Brockhaus, "Knowledge Navigator" der Britannica). Es darf angenommen werden, dass derartige Techniken dabei auf Informationen aufsetzen können (Strukturierung der Artikel, gekennzeichnete (getaggte) Personennamen, Querverweise etc.), die in den zu verarbeitenden Artikeln in nutzbarer Form vorliegen. Für digitalisierte Druckausgaben kommen derartige Verfahren nicht in Frage, weil lediglich flache, noch dazu in der Regel mit OCR-Fehlern behaftete Texte vorliegen. Die Zugriffsmöglichkeiten bewegen sich daher zwischen der 1:1-Umsetzung der Druckausgabe, d.h. dem Primärzugriff über Stichwort, und der Volltextsuche auf den vollständigen Lexikontext. Beides ist angesichts der im elektronischen Volltext liegenden Möglichkeiten sicher nicht die Methode der Wahl. Für die Digitalisierung des "Reallexikons zur Deutschen Kunstgeschichte" im Rahmen des von der Deutschen Forschungsgemeinschaft geförderten Projekts "RDKWeb" wird daher versucht, mit den Mitteln der Automatischen Indexierung eine Lösung zu erzielen, die über eine reine Volltextsuchmöglichkeit hinaus Suchunterstützungen bietet, die sich an den Fähigkeiten kommerzieller Produkte orientieren (nicht messen!).
    Source
    Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen
  18. Gil-Leiva, I.; Munoz, J.V.R.: Analisis de los descriptores de diferentes areas del conocimiento indizades en bases de datos del CSIC : Aplicacion a la indizacion automatica (1997) 0.02
    0.016993027 = product of:
      0.09062948 = sum of:
        0.017823422 = product of:
          0.035646845 = sum of:
            0.035646845 = weight(_text_:bibliothekswesen in 2637) [ClassicSimilarity], result of:
              0.035646845 = score(doc=2637,freq=2.0), product of:
                0.12063039 = queryWeight, product of:
                  4.457672 = idf(docFreq=1392, maxDocs=44218)
                  0.027061297 = queryNorm
                0.2955047 = fieldWeight in 2637, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  4.457672 = idf(docFreq=1392, maxDocs=44218)
                  0.046875 = fieldNorm(doc=2637)
          0.5 = coord(1/2)
        0.03640303 = weight(_text_:informationswissenschaft in 2637) [ClassicSimilarity], result of:
          0.03640303 = score(doc=2637,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.29862255 = fieldWeight in 2637, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.046875 = fieldNorm(doc=2637)
        0.03640303 = weight(_text_:informationswissenschaft in 2637) [ClassicSimilarity], result of:
          0.03640303 = score(doc=2637,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.29862255 = fieldWeight in 2637, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.046875 = fieldNorm(doc=2637)
      0.1875 = coord(3/16)
    
    Field
    Informationswissenschaft
    Bibliothekswesen
  19. Mielke, B.: Wider einige gängige Ansichten zur juristischen Informationserschließung (2002) 0.02
    0.015987845 = product of:
      0.085268505 = sum of:
        0.012462445 = weight(_text_:und in 2145) [ClassicSimilarity], result of:
          0.012462445 = score(doc=2145,freq=4.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.20778441 = fieldWeight in 2145, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.046875 = fieldNorm(doc=2145)
        0.03640303 = weight(_text_:informationswissenschaft in 2145) [ClassicSimilarity], result of:
          0.03640303 = score(doc=2145,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.29862255 = fieldWeight in 2145, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.046875 = fieldNorm(doc=2145)
        0.03640303 = weight(_text_:informationswissenschaft in 2145) [ClassicSimilarity], result of:
          0.03640303 = score(doc=2145,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.29862255 = fieldWeight in 2145, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.046875 = fieldNorm(doc=2145)
      0.1875 = coord(3/16)
    
    Source
    Information und Mobilität: Optimierung und Vermeidung von Mobilität durch Information. Proceedings des 8. Internationalen Symposiums für Informationswissenschaft (ISI 2002), 7.-10.10.2002, Regensburg. Hrsg.: Rainer Hammwöhner, Christian Wolff, Christa Womser-Hacker
  20. Kempf, A.O.: Automatische Inhaltserschließung in der Fachinformation (2013) 0.01
    0.014129785 = product of:
      0.07535885 = sum of:
        0.014687132 = weight(_text_:und in 905) [ClassicSimilarity], result of:
          0.014687132 = score(doc=905,freq=8.0), product of:
            0.059977766 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.027061297 = queryNorm
            0.24487628 = fieldWeight in 905, product of:
              2.828427 = tf(freq=8.0), with freq of:
                8.0 = termFreq=8.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0390625 = fieldNorm(doc=905)
        0.03033586 = weight(_text_:informationswissenschaft in 905) [ClassicSimilarity], result of:
          0.03033586 = score(doc=905,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.24885213 = fieldWeight in 905, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0390625 = fieldNorm(doc=905)
        0.03033586 = weight(_text_:informationswissenschaft in 905) [ClassicSimilarity], result of:
          0.03033586 = score(doc=905,freq=2.0), product of:
            0.12190316 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.027061297 = queryNorm
            0.24885213 = fieldWeight in 905, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0390625 = fieldNorm(doc=905)
      0.1875 = coord(3/16)
    
    Abstract
    Der Artikel basiert auf einer Masterarbeit mit dem Titel "Automatische Indexierung in der sozialwissenschaftlichen Fachinformation. Eine Evaluationsstudie zur maschinellen Erschließung für die Datenbank SOLIS" (Kempf 2012), die im Rahmen des Aufbaustudiengangs Bibliotheks- und Informationswissenschaft an der Humboldt- Universität zu Berlin am Lehrstuhl Information Retrieval verfasst wurde. Auf der Grundlage des Schalenmodells zur Inhaltserschließung in der Fachinformation stellt der Artikel Evaluationsergebnisse eines automatischen Erschließungsverfahrens für den Einsatz in der sozialwissenschaftlichen Fachinformation vor. Ausgehend von dem von Krause beschriebenen Anwendungsszenario, wonach SOLIS-Datenbestände (Sozialwissenschaftliches Literaturinformationssystem) von geringerer Relevanz automatisch erschlossen werden sollten, wurden auf dieser Dokumentgrundlage zwei Testreihen mit der Indexierungssoftware MindServer der Firma Recommind durchgeführt. Neben den Auswirkungen allgemeiner Systemeinstellungen in der ersten Testreihe wurde in der zweiten Testreihe die Indexierungsleistung der Software für die Rand- und die Kernbereiche der Literaturdatenbank miteinander verglichen. Für letztere Testreihe wurden für beide Bereiche der Datenbank spezifische Versionen der Indexierungssoftware aufgebaut, die anhand von Dokumentkorpora aus den entsprechenden Bereichen trainiert wurden. Die Ergebnisse der Evaluation, die auf der Grundlage intellektuell generierter Vergleichsdaten erfolgt, weisen auf Unterschiede in der Indexierungsleistung zwischen Rand- und Kernbereichen hin, die einerseits gegen den Einsatz automatischer Indexierungsverfahren in den Randbereichen sprechen. Andererseits deutet sich an, dass sich die Indexierungsresultate durch den Aufbau fachteilgebietsspezifischer Trainingsmengen verbessern lassen.
    Source
    Information - Wissenschaft und Praxis. 64(2013) H.2/3, S.96-106

Languages

  • d 116
  • e 24
  • ru 1
  • sp 1
  • More… Less…