Document (#30137)

Author
Rosemann, L.
Title
¬Die Volltextabfrage und das Alleinstellungsmerkmal des physischen Buches
Source
Information - Wissenschaft und Praxis. 57(2006) H.4, S.217-218
Year
2006
Content
"Mit Google Print bzw. mittlerweile Google Book Search und dem Projekt zur Übernahme eines brancheneigenen Portals zur Pflege und Bereitstellung digitaler Daten aus Büchern namens "Volltextsuche online" initiiert durch den Börsenverein des Deutschen Buchhandels tritt ein Thema auf den Plan, das im deutschen Sprachraum lange vernachlässigt wurde: allgemein gesprochen, die Notwendigkeit der Texterschließung durch Indexierung - sei sie gedruckt in Form von Registern im Anhang von Sach- und wissenschaftlichen Büchern oder ungedruckt in Form sog. Volltextabfragen per Suchmaske am Computer. Angesichts der exponentiell wachsenden Menge an Wissen ist es gut, wenn hierzu Überlegungen angestellt werden und damit die Chance besteht, neben der wirtschaftlichen auch über die wissenstheoretische Dimension dieser Dienste nachzudenken. Zweifellos wird die Bedeutung der Indexierung von Fließtext aus wissenstheoretischer Sicht in Zukunft noch weiter wachsen und bedeutet im Falle einer Online-Plattform (wenn sie denn in naher Zukunft eine hinreichend große Menge an Büchern in ihrem Datenbestand aufweisen wird) die Erfüllung eines Traumes für die wissenschaftliche Arbeit: Es ist fantastisch, in Millisekunden das Vorhandensein von Personen, Termen, Phrasen und Wortkomposita zu ermitteln, um die Ein- bzw. Nichteinschlägigkeit eines Buches und - mehr noch -vieler Bücher für die eigene Arbeit eindeutig beantworten zu können. Es ist fantastisch, im Trefferfall die gesuchte Information sogleich auf dem Monitor exzerpieren zu können oder sich auch bei ausbleibenden Treffern das Durcharbeiten eines ganzen Buches, vielleicht sogar einer halben Bibliothek ersparen zu können. Dabei ist das letztere Resultat mindestens eine genauso wichtige Information wie die erste, denn auch sie wird- man darf fast sagen, so gut wie immer - zu einer unglaublichen Ersparnis an Zeit verhelfen; hier bedeutet allein schon die Verringerung der Datenmenge einen Zuwachs an Wissen unter minimalem Zeitaufwand. Angesichts dieser Diagnose ist die These zu wagen, die digitale Revolution beginnt erst wirklich bei der Nutzung der Volltexte selbst als Datenquelle zur Wissensabfrage.
. . . Ich plädiere hier aus den oben genannten wissenstheoretischen Gründen nicht nur für die Aufrechterhaltung eines Mindestmaßes an Registern und Indexen im Anhang von physischen Büchern, sondern sogar für deren Ausbau, deren standardmäßige Zugabe bei Sach- und wissenschaftlichen Büchern gerade angesichts der Volltextnutzung durch Online-Abfragen. Warum? Hierzu sechs Argumente: 1. Wie oben bereits angerissen, lehrt die Erfahrung bei CD-ROM-Zugaben zu opulenten Werken, dass Parallelmedien mit Parallelinhalten von den Nutzern nicht wirklich angenommen werden; es ist umständlich, zur Auffindung bestimmter Textstellen den Computer befragen zu müssen und die Fundstellen dann zwischen zwei Buchdeckeln nachzuschlagen. 2. Über frei wählbare Suchbegriffe seitens des Nutzers ist noch keine Qualität der Suchergebnisse garantiert. Erst das Einrechnen entsprechender Verweisungsbegriffe und Synonyme in die Suchabfrage führt zu Qualität des Ergebnisses. Die scheinbar eingesparten Kosten einer einmaligen bzw. abonnementartigen Investition in eine Online-Verfügbarkeit der Buchinhalte vonseiten der Verlage werden dann über die Hintertür doch wieder fällig, wenn sich nämlich herausstellt, dass Nutzer bei der von ihnen gesuchten Information nicht fündig werden, weil sie unter dem "falschen", d.h. entweder ihnen nicht bekannten oder einem ihnen gerade nicht präsenten Schlagwort gesucht haben. Die Online-Suchabfrage, die auf den ersten Blick höchst nutzerfreundlich erscheint, da eine ungeheure Menge an Titeln die Abfrage umfasst, erweist sich womöglich als wenig brauchbar, wenn sich die Trefferqualität aus den genannten Gründen als beschränkt herausstellt. 3. Nur bei entsprechenden Restriktionen des Zugangs bzw. der präsentierten Textausschnitte werden die Verlage es gewährleistet sehen, dass die Nutzerin, der Nutzer nicht vom Kauf des physischen Buches Abstand nehmen. Nur wenn die Nutzer wissen, dass ihnen gerade jene Informationen am Bildschirm vorenthalten werden, die sie im zu erwerbenden Buch mit Gewissheit finden werden, werden sie das Buch noch erwerben wollen. Wer auf die Schnelle nur ein Kochrezept aus einem teuer bebilderten Kochbuch der Oberklasse abrufen kann, wird das teure Kochbuch eben nicht mehr kaufen. Analog stellt sich die Frage, ob nicht aus diesem Grunde auch Bibliotheken erwägen werden, angesichts der elektronischen Präsenz teuerer physischer Bücher auf den Erwerb der Letzteren zu verzichten, wohl wissend, dass den Wissenschaftlern im Zweifel einige Mausklicks genügen, um die gewünschte Begriffsrecherche erschöpfend beantwortet zu finden.
4. Vermutlich wird sich aufgrund der genannten Gründe der Buchservice Volltextsuche als heterogen darstellen: Einige Verlage werden gar nicht mitspielen, andere werden ein Buch im Vollzugriff, ein anderes nur zum Teil, ein drittes nur als Metainformation usw. indizieren lassen. Dies wird letztlich ebenfalls die Trefferqualität schmälern, da der Nutzer dann wiederum wissen muss, genau welche Informationen und Texte ihm bei seiner Suche vorenthalten werden. Das gedruckte Sachbuch wird gegen seinen eigenen digitalen Klon ein Alleinstellungsmerkmal brauchen, um weiterhin attraktiv zu sein. 5. Ein solches Alleinstellungsmerkmal würde m.E. maßgeblich durch die Erstellung von gedruckten Registern bereits in der Druckausgabe erreicht werden. Damit würde die Druckausgabe tatsächlich an Wert gewinnen und der Buchkäufer erhielte einen echten Mehrwert. Zum einen spiegelt sich bereits in der Erstellung konventioneller gedruckter Register die zweite digitale Revolution wider: Moderne Registererstellung basiert heutzutage ebenfalls auf der digitalen Verwertung des Volltextes. Zum anderen erfordert das "Registermachen" zugleich die Erbringung jener o.g. sachdienlichen Mehrinformationen wie Verweisungsbegriffe, vernünftige Klassifizierungen, nicht-redundante Begriffsauswahl etc., die nur begrenzt automatisierbar sind und Fachwissen erfordern. Erst diese beiden Komponenten lassen die Indexierung schlussendlich zu einer hochwertigen Aufbereitung sequentieller Information werden. 6. Genau diese Mehr- und Metainformationen, die die vorausgegangene Erstellung eines Print-Vollregisters geliefert hat, lassen sich dann in den Suchalgorithmus der Online-Suche zur Qualitätssteigerung der Treffer einrechnen."
Theme
Register
Volltextretrieval

Similar documents (author)

  1. Rosemann, U.: Auf dem Weg zu dem Kompetenzzentrum für Literaturversorgung : TIB zum Start von GetInfo (2002) 5.89
    5.890278 = sum of:
      5.890278 = weight(author_txt:rosemann in 4268) [ClassicSimilarity], result of:
        5.890278 = fieldWeight in 4268, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          9.424444 = idf(docFreq=8, maxDocs=41014)
          0.625 = fieldNorm(doc=4268)
    
  2. Rosemann, U.: Beginn einer wunderbaren Zusammenarbeit?! : ¬Die Arbeitsgruppe der Informationsverbünde und die Virtuellen Fachbibliotheken (2003) 5.89
    5.890278 = sum of:
      5.890278 = weight(author_txt:rosemann in 2349) [ClassicSimilarity], result of:
        5.890278 = fieldWeight in 2349, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          9.424444 = idf(docFreq=8, maxDocs=41014)
          0.625 = fieldNorm(doc=2349)
    
  3. Rosemann, U.; Sens, I.: ¬Das Online-Fernleihsystem im GBV : Auf dem Weg zu einem leistungsfähigen Dokumentliefer-System (1997) 4.71
    4.712222 = sum of:
      4.712222 = weight(author_txt:rosemann in 6607) [ClassicSimilarity], result of:
        4.712222 = fieldWeight in 6607, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          9.424444 = idf(docFreq=8, maxDocs=41014)
          0.5 = fieldNorm(doc=6607)
    
  4. Rosemann, S.; Witt, W.: Vergleich der Suche im Internet und in Fachdatenbanken aus der Sicht einer IVS (1998) 4.71
    4.712222 = sum of:
      4.712222 = weight(author_txt:rosemann in 1891) [ClassicSimilarity], result of:
        4.712222 = fieldWeight in 1891, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          9.424444 = idf(docFreq=8, maxDocs=41014)
          0.5 = fieldNorm(doc=1891)
    
  5. Rosemann, S.; Witt, W.: Vergleich der Suche im Internet und in Fachdatenbanken (1997) 4.71
    4.712222 = sum of:
      4.712222 = weight(author_txt:rosemann in 2048) [ClassicSimilarity], result of:
        4.712222 = fieldWeight in 2048, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          9.424444 = idf(docFreq=8, maxDocs=41014)
          0.5 = fieldNorm(doc=2048)
    

Similar documents (content)

  1. Weber, J.: ¬"The copy in hand" : Voraussetzungen und Ziele exemplarspezifischer Erschließung (2002) 0.98
    0.9819879 = sum of:
      0.9819879 = sum of:
        0.29011697 = weight(abstract_txt:buches in 1592) [ClassicSimilarity], result of:
          0.29011697 = score(doc=1592,freq=2.0), product of:
            0.53983086 = queryWeight, product of:
              6.94884 = idf(docFreq=106, maxDocs=41014)
              0.077686474 = queryNorm
            0.53742194 = fieldWeight in 1592, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              6.94884 = idf(docFreq=106, maxDocs=41014)
              0.0546875 = fieldNorm(doc=1592)
        0.6918709 = weight(abstract_txt:physischen in 1592) [ClassicSimilarity], result of:
          0.6918709 = score(doc=1592,freq=3.0), product of:
            0.84177357 = queryWeight, product of:
              1.2487307 = boost
              8.67723 = idf(docFreq=18, maxDocs=41014)
              0.077686474 = queryNorm
            0.82192045 = fieldWeight in 1592, product of:
              1.7320508 = tf(freq=3.0), with freq of:
                3.0 = termFreq=3.0
              8.67723 = idf(docFreq=18, maxDocs=41014)
              0.0546875 = fieldNorm(doc=1592)
    
  2. Kleiner, E.: Blended Shelf : Ein realitätsbasierter Ansatz zur Präsentation und Exploration von Bibliotheksbeständen (2014) 0.98
    0.9771739 = sum of:
      0.9771739 = sum of:
        0.33156222 = weight(abstract_txt:buches in 3267) [ClassicSimilarity], result of:
          0.33156222 = score(doc=3267,freq=2.0), product of:
            0.53983086 = queryWeight, product of:
              6.94884 = idf(docFreq=106, maxDocs=41014)
              0.077686474 = queryNorm
            0.6141965 = fieldWeight in 3267, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              6.94884 = idf(docFreq=106, maxDocs=41014)
              0.0625 = fieldNorm(doc=3267)
        0.6456117 = weight(abstract_txt:physischen in 3267) [ClassicSimilarity], result of:
          0.6456117 = score(doc=3267,freq=2.0), product of:
            0.84177357 = queryWeight, product of:
              1.2487307 = boost
              8.67723 = idf(docFreq=18, maxDocs=41014)
              0.077686474 = queryNorm
            0.766966 = fieldWeight in 3267, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.67723 = idf(docFreq=18, maxDocs=41014)
              0.0625 = fieldNorm(doc=3267)
    
  3. Ratzek, W.: Virtuelle Unternehmen : das Networking-Konzept (1996) 0.56
    0.56491023 = sum of:
      0.56491023 = product of:
        1.1298205 = sum of:
          1.1298205 = weight(abstract_txt:physischen in 5418) [ClassicSimilarity], result of:
            1.1298205 = score(doc=5418,freq=2.0), product of:
              0.84177357 = queryWeight, product of:
                1.2487307 = boost
                8.67723 = idf(docFreq=18, maxDocs=41014)
                0.077686474 = queryNorm
              1.3421905 = fieldWeight in 5418, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                8.67723 = idf(docFreq=18, maxDocs=41014)
                0.109375 = fieldNorm(doc=5418)
        0.5 = coord(1/2)
    
  4. Hjoerland, B.: Theory of information science : Reply to Professor Gernot Wersig (1998) 0.41
    0.41028732 = sum of:
      0.41028732 = product of:
        0.82057464 = sum of:
          0.82057464 = weight(abstract_txt:buches in 1398) [ClassicSimilarity], result of:
            0.82057464 = score(doc=1398,freq=1.0), product of:
              0.53983086 = queryWeight, product of:
                6.94884 = idf(docFreq=106, maxDocs=41014)
                0.077686474 = queryNorm
              1.5200588 = fieldWeight in 1398, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.94884 = idf(docFreq=106, maxDocs=41014)
                0.21875 = fieldNorm(doc=1398)
        0.5 = coord(1/2)
    
  5. Tetens, H.: Geist, Gehirn, Maschine : Philosophische Versuche über ihren Zusammenhang (1994) 0.40
    0.3953548 = sum of:
      0.3953548 = product of:
        0.7907096 = sum of:
          0.7907096 = weight(abstract_txt:physischen in 3620) [ClassicSimilarity], result of:
            0.7907096 = score(doc=3620,freq=3.0), product of:
              0.84177357 = queryWeight, product of:
                1.2487307 = boost
                8.67723 = idf(docFreq=18, maxDocs=41014)
                0.077686474 = queryNorm
              0.9393377 = fieldWeight in 3620, product of:
                1.7320508 = tf(freq=3.0), with freq of:
                  3.0 = termFreq=3.0
                8.67723 = idf(docFreq=18, maxDocs=41014)
                0.0625 = fieldNorm(doc=3620)
        0.5 = coord(1/2)