Document (#26769)

Author
Nohr, H.
Title
Grundlagen der automatischen Indexierung : ein Lehrbuch
Imprint
Berlin : Logos
Year
2003
Pages
153 S
Isbn
3-8325-0121-5
Footnote
Rez. in: nfd 54(2003) H.5, S.314 (W. Ratzek): "Um entscheidungsrelevante Daten aus der ständig wachsenden Flut von mehr oder weniger relevanten Dokumenten zu extrahieren, müssen Unternehmen, öffentliche Verwaltung oder Einrichtungen der Fachinformation effektive und effiziente Filtersysteme entwickeln, einsetzen und pflegen. Das vorliegende Lehrbuch von Holger Nohr bietet erstmalig eine grundlegende Einführung in das Thema "automatische Indexierung". Denn: "Wie man Information sammelt, verwaltet und verwendet, wird darüber entscheiden, ob man zu den Gewinnern oder Verlierern gehört" (Bill Gates), heißt es einleitend. Im ersten Kapitel "Einleitung" stehen die Grundlagen im Mittelpunkt. Die Zusammenhänge zwischen Dokumenten-Management-Systeme, Information Retrieval und Indexierung für Planungs-, Entscheidungs- oder Innovationsprozesse, sowohl in Profit- als auch Non-Profit-Organisationen werden beschrieben. Am Ende des einleitenden Kapitels geht Nohr auf die Diskussion um die intellektuelle und automatische Indexierung ein und leitet damit über zum zweiten Kapitel "automatisches Indexieren. Hier geht der Autor überblickartig unter anderem ein auf - Probleme der automatischen Sprachverarbeitung und Indexierung - verschiedene Verfahren der automatischen Indexierung z.B. einfache Stichwortextraktion / Volltextinvertierung, - statistische Verfahren, Pattern-Matching-Verfahren. Die "Verfahren der automatischen Indexierung" behandelt Nohr dann vertiefend und mit vielen Beispielen versehen im umfangreichsten dritten Kapitel. Das vierte Kapitel "Keyphrase Extraction" nimmt eine Passpartout-Status ein: "Eine Zwischenstufe auf dem Weg von der automatischen Indexierung hin zur automatischen Generierung textueller Zusammenfassungen (Automatic Text Summarization) stellen Ansätze dar, die Schlüsselphrasen aus Dokumenten extrahieren (Keyphrase Extraction). Die Grenzen zwischen den automatischen Verfahren der Indexierung und denen des Text Summarization sind fließend." (S. 91). Am Beispiel NCR"s Extractor/Copernic Summarizer beschreibt Nohr die Funktionsweise.
Im fünften Kapitel "Information Extraction" geht Nohr auf eine Problemstellung ein, die in der Fachwelt eine noch stärkere Betonung verdiente: "Die stetig ansteigende Zahl elektronischer Dokumente macht neben einer automatischen Erschließung auch eine automatische Gewinnung der relevanten Informationen aus diesen Dokumenten wünschenswert, um diese z.B. für weitere Bearbeitungen oder Auswertungen in betriebliche Informationssysteme übernehmen zu können." (S. 103) "Indexierung und Retrievalverfahren" als voneinander abhängige Verfahren werden im sechsten Kapitel behandelt. Hier stehen Relevance Ranking und Relevance Feedback sowie die Anwendung informationslinguistischer Verfahren in der Recherche im Mittelpunkt. Die "Evaluation automatischer Indexierung" setzt den thematischen Schlusspunkt. Hier geht es vor allem um die Oualität einer Indexierung, um gängige Retrievalmaße in Retrievaltest und deren Einssatz. Weiterhin ist hervorzuheben, dass jedes Kapitel durch die Vorgabe von Lernzielen eingeleitet wird und zu den jeweiligen Kapiteln (im hinteren Teil des Buches) einige Kontrollfragen gestellt werden. Die sehr zahlreichen Beispiele aus der Praxis, ein Abkürzungsverzeichnis und ein Sachregister erhöhen den Nutzwert des Buches. Die Lektüre förderte beim Rezensenten das Verständnis für die Zusammenhänge von BID-Handwerkzeug, Wirtschaftsinformatik (insbesondere Data Warehousing) und Künstlicher Intelligenz. Die "Grundlagen der automatischen Indexierung" sollte auch in den bibliothekarischen Studiengängen zur Pflichtlektüre gehören. Holger Nohrs Lehrbuch ist auch für den BID-Profi geeignet, um die mehr oder weniger fundierten Kenntnisse auf dem Gebiet "automatisches Indexieren" schnell, leicht verständlich und informativ aufzufrischen."
Theme
Automatisches Indexieren
Grundlagen u. Einführungen: Allgemeine Literatur

Similar documents (author)

  1. Nohr, H.: Sachliche Erschließung in deutschsprachigen Online-Publikumskatalogen (1989) 4.93
    4.9321775 = sum of:
      4.9321775 = weight(author_txt:nohr in 106) [ClassicSimilarity], result of:
        4.9321775 = fieldWeight in 106, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          7.8914843 = idf(docFreq=42, maxDocs=42306)
          0.625 = fieldNorm(doc=106)
    
  2. Nohr, H.: Thesaurusarbeit mit LIDOS (1991) 4.93
    4.9321775 = sum of:
      4.9321775 = weight(author_txt:nohr in 202) [ClassicSimilarity], result of:
        4.9321775 = fieldWeight in 202, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          7.8914843 = idf(docFreq=42, maxDocs=42306)
          0.625 = fieldNorm(doc=202)
    
  3. Nohr, H.: Ausbildung im Fach Inhaltserschließung : Einige Gedanken zu künftigen Notwendigkeiten (1990) 4.93
    4.9321775 = sum of:
      4.9321775 = weight(author_txt:nohr in 432) [ClassicSimilarity], result of:
        4.9321775 = fieldWeight in 432, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          7.8914843 = idf(docFreq=42, maxDocs=42306)
          0.625 = fieldNorm(doc=432)
    
  4. Nohr, H.: BISMAS : Ein PC-gestütztes bibliothekarisches Datenbanksystem im Test (1991) 4.93
    4.9321775 = sum of:
      4.9321775 = weight(author_txt:nohr in 457) [ClassicSimilarity], result of:
        4.9321775 = fieldWeight in 457, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          7.8914843 = idf(docFreq=42, maxDocs=42306)
          0.625 = fieldNorm(doc=457)
    
  5. Nohr, H.: Tendenzen der OPAC-Entwicklung (1990) 4.93
    4.9321775 = sum of:
      4.9321775 = weight(author_txt:nohr in 756) [ClassicSimilarity], result of:
        4.9321775 = fieldWeight in 756, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          7.8914843 = idf(docFreq=42, maxDocs=42306)
          0.625 = fieldNorm(doc=756)
    

Similar documents (content)

  1. Gaus, W.: Dokumentations- und Ordnungslehre : Theorie und Praxis des Information Retrieval (2000) 1.48
    1.4827318 = sum of:
      1.4827318 = product of:
        2.9654636 = sum of:
          0.23436144 = weight(abstract_txt:grundlagen in 2083) [ClassicSimilarity], result of:
            0.23436144 = score(doc=2083,freq=1.0), product of:
              0.3979365 = queryWeight, product of:
                6.2820463 = idf(docFreq=214, maxDocs=42306)
                0.063345045 = queryNorm
              0.5889418 = fieldWeight in 2083, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.2820463 = idf(docFreq=214, maxDocs=42306)
                0.09375 = fieldNorm(doc=2083)
          2.7311022 = weight(subject_txt:lehrbuch in 2083) [ClassicSimilarity], result of:
            2.7311022 = score(doc=2083,freq=3.0), product of:
              0.6355583 = queryWeight, product of:
                1.2637781 = boost
                7.939112 = idf(docFreq=40, maxDocs=42306)
                0.063345045 = queryNorm
              4.29717 = fieldWeight in 2083, product of:
                1.7320508 = tf(freq=3.0), with freq of:
                  3.0 = termFreq=3.0
                7.939112 = idf(docFreq=40, maxDocs=42306)
                0.3125 = fieldNorm(doc=2083)
        0.5 = coord(2/4)
    
  2. Böhringer, J.; Bühler, P.; Schlaich, P.; Ziegler, H.-J.: Kompendium der Mediengestaltung für Digital- und Printmedien (2000) 1.46
    1.4567434 = sum of:
      1.4567434 = product of:
        2.9134867 = sum of:
          0.39060244 = weight(abstract_txt:grundlagen in 757) [ClassicSimilarity], result of:
            0.39060244 = score(doc=757,freq=1.0), product of:
              0.3979365 = queryWeight, product of:
                6.2820463 = idf(docFreq=214, maxDocs=42306)
                0.063345045 = queryNorm
              0.98156977 = fieldWeight in 757, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.2820463 = idf(docFreq=214, maxDocs=42306)
                0.15625 = fieldNorm(doc=757)
          2.5228844 = weight(subject_txt:lehrbuch in 757) [ClassicSimilarity], result of:
            2.5228844 = score(doc=757,freq=1.0), product of:
              0.6355583 = queryWeight, product of:
                1.2637781 = boost
                7.939112 = idf(docFreq=40, maxDocs=42306)
                0.063345045 = queryNorm
              3.969556 = fieldWeight in 757, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                7.939112 = idf(docFreq=40, maxDocs=42306)
                0.5 = fieldNorm(doc=757)
        0.5 = coord(2/4)
    
  3. Lobin, H: Computerlinguistik und Texttechnologie (2010) 1.38
    1.3786229 = sum of:
      1.3786229 = product of:
        2.7572458 = sum of:
          0.23436144 = weight(abstract_txt:grundlagen in 1565) [ClassicSimilarity], result of:
            0.23436144 = score(doc=1565,freq=1.0), product of:
              0.3979365 = queryWeight, product of:
                6.2820463 = idf(docFreq=214, maxDocs=42306)
                0.063345045 = queryNorm
              0.5889418 = fieldWeight in 1565, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.2820463 = idf(docFreq=214, maxDocs=42306)
                0.09375 = fieldNorm(doc=1565)
          2.5228844 = weight(subject_txt:lehrbuch in 1565) [ClassicSimilarity], result of:
            2.5228844 = score(doc=1565,freq=1.0), product of:
              0.6355583 = queryWeight, product of:
                1.2637781 = boost
                7.939112 = idf(docFreq=40, maxDocs=42306)
                0.063345045 = queryNorm
              3.969556 = fieldWeight in 1565, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                7.939112 = idf(docFreq=40, maxDocs=42306)
                0.5 = fieldNorm(doc=1565)
        0.5 = coord(2/4)
    
  4. Lämmel, U.; Cleve, J.: Künstliche Intelligenz : mit 50 Tabellen, 43 Beispielen, 208 Aufgaben, 89 Kontrollfragen und Referatsthemen (2008) 1.33
    1.3297976 = sum of:
      1.3297976 = product of:
        2.6595953 = sum of:
          0.13671084 = weight(abstract_txt:grundlagen in 2643) [ClassicSimilarity], result of:
            0.13671084 = score(doc=2643,freq=1.0), product of:
              0.3979365 = queryWeight, product of:
                6.2820463 = idf(docFreq=214, maxDocs=42306)
                0.063345045 = queryNorm
              0.3435494 = fieldWeight in 2643, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.2820463 = idf(docFreq=214, maxDocs=42306)
                0.0546875 = fieldNorm(doc=2643)
          2.5228844 = weight(subject_txt:lehrbuch in 2643) [ClassicSimilarity], result of:
            2.5228844 = score(doc=2643,freq=1.0), product of:
              0.6355583 = queryWeight, product of:
                1.2637781 = boost
                7.939112 = idf(docFreq=40, maxDocs=42306)
                0.063345045 = queryNorm
              3.969556 = fieldWeight in 2643, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                7.939112 = idf(docFreq=40, maxDocs=42306)
                0.5 = fieldNorm(doc=2643)
        0.5 = coord(2/4)
    
  5. Hitzler, P.; Krötzsch, M.; Rudolph, S.; Sure, Y.: Semantic Web : Grundlagen (2008) 1.08
    1.0841805 = sum of:
      1.0841805 = product of:
        2.168361 = sum of:
          0.2761976 = weight(abstract_txt:grundlagen in 2359) [ClassicSimilarity], result of:
            0.2761976 = score(doc=2359,freq=2.0), product of:
              0.3979365 = queryWeight, product of:
                6.2820463 = idf(docFreq=214, maxDocs=42306)
                0.063345045 = queryNorm
              0.69407463 = fieldWeight in 2359, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                6.2820463 = idf(docFreq=214, maxDocs=42306)
                0.078125 = fieldNorm(doc=2359)
          1.8921633 = weight(subject_txt:lehrbuch in 2359) [ClassicSimilarity], result of:
            1.8921633 = score(doc=2359,freq=1.0), product of:
              0.6355583 = queryWeight, product of:
                1.2637781 = boost
                7.939112 = idf(docFreq=40, maxDocs=42306)
                0.063345045 = queryNorm
              2.9771671 = fieldWeight in 2359, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                7.939112 = idf(docFreq=40, maxDocs=42306)
                0.375 = fieldNorm(doc=2359)
        0.5 = coord(2/4)