Document (#32402)

Author
Weber, A.
Title
"HeiIFASTen" - Entschlacken mit Leistungsgewinn : Neue Möglichkeiten für Bibliothekskataloge durch den Einsatz von Suchmaschinentechnologie
Source
Information - Wissenschaft und Praxis. 58(2007) H.4, S.225
Year
2007
Content
"Der Einsatz von Suchmaschinentechnologie in Bibliothekskatalogen hat bewiesen, dass durch optimierte Indexierungsverfahren Verbesserungen der Informationsversorgung für Bibliotheksbenutzer erreicht werden. Im Dezember 2006 wurde das lokale Bibliotheksportal "SISIS-InfoGuide" von OCLC PICA um eine auf FAST Technologie basierende Suchmaschine erweitert. Die Investition des Freistaates Bayern in eine Landeslizenz für den Einsatz von FAST in den Bayerischen Universitätsbibliotheken hat sich ausgezahlt. Nachfolgend werden einige der Vorteile kurz skizziert, die sich aus dieser Erweiterung ergeben haben. Am deutlichsten ist die Auswirkung dieser Technik bei den Antwortzeiten. Insbesondere die Suche nach häufig in den Bibliotheksdaten vorkommenden Begriffen, z.B. Deutschland oder Geschichte, werden selbst sehr große Treffermengen in Bruchteilen von Sekunden geliefert. Das Scheitern von Abfragen wegen erreichter Zeitlimits gehört damit der Vergangenheit an. Aus dieser Tatsache ergibt sich auch, dass Benutzer nicht mehr spezifisch suchen müssen, da nun auch große Treffermengen in kurzer Zeit präsentiert werden. Das alleine wäre kein Vorteil, wenn nicht auch Methoden zur Verfügung gestellt würden, mit diesen Treffermengen umzugehen. Auch hier liefert die Suchmaschinentechnologie adäquate Hilfsmittel, die so genannten "Drill Downs". Bestimmte, vordefinierte Felder werden beim Aufbau der Trefferlisten analysiert und die Feldinhalte nach Häufigkeit sortiert als Sucheinschränkung angeboten. Die Eingrenzung auf eine Sprache, einen Erscheinungszeitraum oder ein bestimmtes Schlagwort ist so mit einem einzigen Mausklick möglich. Die daraus neu entstehende Treffermenge wird wiederum dieser Analyse unterworfen. Mit wenigen Mausklicks gelangt der Benutzer so von einem allgemeinen Ergebnis zu einer überschaubaren Menge an Treffern Standardmäßig werden die Treffer nicht mehr nach dem Alphabet oder Erscheinungsjahren sortiert, sondern es wird aus dem Vorkommen der Suchmuster in den Elementen der Katalogaufnahme und dem Erscheinungsjahr eine Relevanz ermittelt. Wie bei Internetsuchmaschinen gewohnt, werden die Treffer, die der Suchanfrage am besten entsprechen, in der Trefferliste ganz oben präsentiert,. Weiterhin ermöglicht die FAST Technologie eine Ähnlichkeitssuche, die auf Dokumentvektoren aufbaut. Diese werden an Hand statistischer Verfahren für das zu indexierende Dokument errechnet. Die Ermittlung von Ähnlichkeiten wird auf die erstellte Treffermenge angewendet und erlaubt sowohl Einschränkungen als auch Ausweitungen der ermittelten Suchergebnisse.
Eine zusätzliche Unterstützung der Recherche bietet die auf Wörterbüchern basierende linguistische Komponente der Suchmaschine. Die Begriffe werden beim Indexieren der Daten lemmatisiert - also auf eine Grundform zurückgeführt. Bei der Eingabe der Suchanfrage werden dieselben linguistischen Methoden verwendet, um die eingegebenen Begriffe der Suchanfrage zu analysieren und ggf. auf die im Index enthaltene Form zu verändern. Dies führt zu Treffern auch wenn Suchbegriffe nicht exakt eingegeben werden und steigert so die Erfolgsquote. Mit Hilfe der Linguistik werden zusätzlich evtl. vorhandene Rechtschreibfehler korrigiert, oder ggf. alternative Begriffe vorgeschlagen. ("Meinten Sie?"). Der wesentliche Vorteil des Einsatzes der FAST Suchmaschine besteht aber darin, dass ein zusätzlicher Index zur Verfügung steht, der unabhängig von den internen Bibliotheksanwendungen ist. Die für die bibliotheksinternen Abläufe optimiert gespeicherten Daten können so vor der Indexierung durch die Suchmaschine verändert werden, ohne dass interne Arbeitsvorgänge davon betroffen wären. Auf diese Weise lassen sich viele, für den Benutzer nicht transparente, fachspezifische Daten aussondern oder transparenter gestalten. Das einfachste Beispiel dafür ist das Filtern von Sonderzeichen, z. B. im Erscheinungsjahr. Weiterhin können aus verschiedenen codiert gespeicherten Kategorien neue, mit sprechenden Bezeichnungen versehene Kategorien gebildet werden, z.B. für die Erscheinungsform eines Werkes. Die Bildung eines zusätzlichen Feldes "Fach" aus der in der Bibliothek verwendeten Klassifikation hat sich als effektiver Filter für die Selektion relevanter Treffer bei der Suche nach unspezifischen Suchbegriffen, wie z.B. Chaos, herausgestellt. Die Möglichkeit nach Schlagwortketten, also der Kombination von Schlagworten einzugrenzen, führt den Benutzer sehr einfach zu spezifischen Treffern und ist auch bei kleineren Treffermengen wirkungsvoll. Die Einbindung der FAST Suchmaschine in den lokalen Bibliothekskatalog bietet nicht nur eine wesentliche Verbesserung der Suchgeschwindigkeit, sondern sie eröffnet dem Benutzer durch die vielfältigen Analysemethoden der Treffer während der Anzeige auch ganz neue Wege im Umgang mit Treffermengen. Hinzu kommt, dass durch die geeignete Aufbereitung der Ausgangsdaten es nun auch möglich ist, die von der Bibliothek geleistete Sacherschließung als effektives Hilfsmittel für den Endanwender einzusetzen."
Theme
Katalogfragen allgemein
Object
FAST
Location
D
Bayreuth

Similar documents (author)

  1. Weber, C.: ¬Die Realkataloge der preussischen Universitätsbibliotheken (1930) 4.66
    4.664238 = sum of:
      4.664238 = weight(author_txt:weber in 1901) [ClassicSimilarity], result of:
        4.664238 = fieldWeight in 1901, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          7.462781 = idf(docFreq=68, maxDocs=44218)
          0.625 = fieldNorm(doc=1901)
    
  2. Weber, K.: Retrospektive Konversion - für viele Bibliotheken noch ein Einstieg ins Ungewisse : zur Einrichtung eines neuen Beratungsbereiches beim Deutschen Bibliotheksinstitut (1992) 4.66
    4.664238 = sum of:
      4.664238 = weight(author_txt:weber in 4753) [ClassicSimilarity], result of:
        4.664238 = fieldWeight in 4753, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          7.462781 = idf(docFreq=68, maxDocs=44218)
          0.625 = fieldNorm(doc=4753)
    
  3. Weber, A.: Datenbankrecherchen für ein Butterbrot (1994) 4.66
    4.664238 = sum of:
      4.664238 = weight(author_txt:weber in 6339) [ClassicSimilarity], result of:
        4.664238 = fieldWeight in 6339, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          7.462781 = idf(docFreq=68, maxDocs=44218)
          0.625 = fieldNorm(doc=6339)
    
  4. Weber, V.: Elektronische Nachschlagewerke auf CD-ROM (1994) 4.66
    4.664238 = sum of:
      4.664238 = weight(author_txt:weber in 1225) [ClassicSimilarity], result of:
        4.664238 = fieldWeight in 1225, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          7.462781 = idf(docFreq=68, maxDocs=44218)
          0.625 = fieldNorm(doc=1225)
    
  5. Weber, A.: ¬Die Dimension des digitalen Druckens (1995) 4.66
    4.664238 = sum of:
      4.664238 = weight(author_txt:weber in 1473) [ClassicSimilarity], result of:
        4.664238 = fieldWeight in 1473, product of:
          1.0 = tf(freq=1.0), with freq of:
            1.0 = termFreq=1.0
          7.462781 = idf(docFreq=68, maxDocs=44218)
          0.625 = fieldNorm(doc=1473)
    

Similar documents (content)

  1. Burblies, C.; Wolff, J.E.: Vascoda - Effiziente Vermittlung wissenschaftlicher information (2009) 0.64
    0.64183784 = sum of:
      0.64183784 = product of:
        0.77020544 = sum of:
          0.05164179 = weight(abstract_txt:durch in 2783) [ClassicSimilarity], result of:
            0.05164179 = score(doc=2783,freq=2.0), product of:
              0.15720855 = queryWeight, product of:
                4.2473893 = idf(docFreq=1718, maxDocs=44218)
                0.037012983 = queryNorm
              0.32849225 = fieldWeight in 2783, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                4.2473893 = idf(docFreq=1718, maxDocs=44218)
                0.0546875 = fieldNorm(doc=2783)
          0.07678471 = weight(abstract_txt:neue in 2783) [ClassicSimilarity], result of:
            0.07678471 = score(doc=2783,freq=2.0), product of:
              0.20479773 = queryWeight, product of:
                1.1413648 = boost
                4.8478208 = idf(docFreq=942, maxDocs=44218)
                0.037012983 = queryNorm
              0.3749295 = fieldWeight in 2783, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                4.8478208 = idf(docFreq=942, maxDocs=44218)
                0.0546875 = fieldNorm(doc=2783)
          0.080933794 = weight(abstract_txt:möglichkeiten in 2783) [ClassicSimilarity], result of:
            0.080933794 = score(doc=2783,freq=1.0), product of:
              0.2672423 = queryWeight, product of:
                1.3038107 = boost
                5.5377917 = idf(docFreq=472, maxDocs=44218)
                0.037012983 = queryNorm
              0.30284798 = fieldWeight in 2783, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.5377917 = idf(docFreq=472, maxDocs=44218)
                0.0546875 = fieldNorm(doc=2783)
          0.13129334 = weight(abstract_txt:einsatz in 2783) [ClassicSimilarity], result of:
            0.13129334 = score(doc=2783,freq=2.0), product of:
              0.29284453 = queryWeight, product of:
                1.364836 = boost
                5.79699 = idf(docFreq=364, maxDocs=44218)
                0.037012983 = queryNorm
              0.44833803 = fieldWeight in 2783, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                5.79699 = idf(docFreq=364, maxDocs=44218)
                0.0546875 = fieldNorm(doc=2783)
          0.4295518 = weight(abstract_txt:suchmaschinentechnologie in 2783) [ClassicSimilarity], result of:
            0.4295518 = score(doc=2783,freq=2.0), product of:
              0.6453852 = queryWeight, product of:
                2.0261493 = boost
                8.6058445 = idf(docFreq=21, maxDocs=44218)
                0.037012983 = queryNorm
              0.6655743 = fieldWeight in 2783, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                8.6058445 = idf(docFreq=21, maxDocs=44218)
                0.0546875 = fieldNorm(doc=2783)
        0.8333333 = coord(5/6)
    
  2. Maylein, L.; Langenstein, A.: Neues vom Relevanz-Ranking im HEIDI-Katalog der Universitätsbibliothek Heidelberg : Perspektiven für bibliothekarische Dienstleistungen (2013) 0.44
    0.43744487 = sum of:
      0.43744487 = product of:
        0.65616727 = sum of:
          0.08346574 = weight(abstract_txt:durch in 775) [ClassicSimilarity], result of:
            0.08346574 = score(doc=775,freq=1.0), product of:
              0.15720855 = queryWeight, product of:
                4.2473893 = idf(docFreq=1718, maxDocs=44218)
                0.037012983 = queryNorm
              0.53092366 = fieldWeight in 775, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                4.2473893 = idf(docFreq=1718, maxDocs=44218)
                0.125 = fieldNorm(doc=775)
          0.1755079 = weight(abstract_txt:neue in 775) [ClassicSimilarity], result of:
            0.1755079 = score(doc=775,freq=2.0), product of:
              0.20479773 = queryWeight, product of:
                1.1413648 = boost
                4.8478208 = idf(docFreq=942, maxDocs=44218)
                0.037012983 = queryNorm
              0.8569817 = fieldWeight in 775, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                4.8478208 = idf(docFreq=942, maxDocs=44218)
                0.125 = fieldNorm(doc=775)
          0.18499154 = weight(abstract_txt:möglichkeiten in 775) [ClassicSimilarity], result of:
            0.18499154 = score(doc=775,freq=1.0), product of:
              0.2672423 = queryWeight, product of:
                1.3038107 = boost
                5.5377917 = idf(docFreq=472, maxDocs=44218)
                0.037012983 = queryNorm
              0.69222397 = fieldWeight in 775, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.5377917 = idf(docFreq=472, maxDocs=44218)
                0.125 = fieldNorm(doc=775)
          0.2122021 = weight(abstract_txt:einsatz in 775) [ClassicSimilarity], result of:
            0.2122021 = score(doc=775,freq=1.0), product of:
              0.29284453 = queryWeight, product of:
                1.364836 = boost
                5.79699 = idf(docFreq=364, maxDocs=44218)
                0.037012983 = queryNorm
              0.72462374 = fieldWeight in 775, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.79699 = idf(docFreq=364, maxDocs=44218)
                0.125 = fieldNorm(doc=775)
        0.6666667 = coord(4/6)
    
  3. Hochschulbibliothekszentrum NRW: Medienserver und Suchmaschinentechnologie (2006) 0.40
    0.39921892 = sum of:
      0.39921892 = product of:
        0.79843783 = sum of:
          0.052166086 = weight(abstract_txt:durch in 4967) [ClassicSimilarity], result of:
            0.052166086 = score(doc=4967,freq=1.0), product of:
              0.15720855 = queryWeight, product of:
                4.2473893 = idf(docFreq=1718, maxDocs=44218)
                0.037012983 = queryNorm
              0.33182728 = fieldWeight in 4967, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                4.2473893 = idf(docFreq=1718, maxDocs=44218)
                0.078125 = fieldNorm(doc=4967)
          0.13262631 = weight(abstract_txt:einsatz in 4967) [ClassicSimilarity], result of:
            0.13262631 = score(doc=4967,freq=1.0), product of:
              0.29284453 = queryWeight, product of:
                1.364836 = boost
                5.79699 = idf(docFreq=364, maxDocs=44218)
                0.037012983 = queryNorm
              0.45288983 = fieldWeight in 4967, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.79699 = idf(docFreq=364, maxDocs=44218)
                0.078125 = fieldNorm(doc=4967)
          0.61364543 = weight(abstract_txt:suchmaschinentechnologie in 4967) [ClassicSimilarity], result of:
            0.61364543 = score(doc=4967,freq=2.0), product of:
              0.6453852 = queryWeight, product of:
                2.0261493 = boost
                8.6058445 = idf(docFreq=21, maxDocs=44218)
                0.037012983 = queryNorm
              0.95082045 = fieldWeight in 4967, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                8.6058445 = idf(docFreq=21, maxDocs=44218)
                0.078125 = fieldNorm(doc=4967)
        0.5 = coord(3/6)
    
  4. Krause, J.; Mayr, P.: Allgemeiner Bibliothekszugang und Varianten der Suchtypologie : Konsequenzen für die Modellbildung in vascoda (2007) 0.38
    0.3838714 = sum of:
      0.3838714 = product of:
        1.1516142 = sum of:
          0.5441361 = weight(abstract_txt:bibliothekskataloge in 5998) [ClassicSimilarity], result of:
            0.5441361 = score(doc=5998,freq=1.0), product of:
              0.599704 = queryWeight, product of:
                1.9531267 = boost
                8.29569 = idf(docFreq=29, maxDocs=44218)
                0.037012983 = queryNorm
              0.90734106 = fieldWeight in 5998, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.29569 = idf(docFreq=29, maxDocs=44218)
                0.109375 = fieldNorm(doc=5998)
          0.607478 = weight(abstract_txt:suchmaschinentechnologie in 5998) [ClassicSimilarity], result of:
            0.607478 = score(doc=5998,freq=1.0), product of:
              0.6453852 = queryWeight, product of:
                2.0261493 = boost
                8.6058445 = idf(docFreq=21, maxDocs=44218)
                0.037012983 = queryNorm
              0.9412643 = fieldWeight in 5998, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.6058445 = idf(docFreq=21, maxDocs=44218)
                0.109375 = fieldNorm(doc=5998)
        0.33333334 = coord(2/6)
    
  5. Pfister, R.-D.: Neue Produkte auf der Basis von Multimedia (1995) 0.37
    0.36509222 = sum of:
      0.36509222 = product of:
        0.5476383 = sum of:
          0.088528775 = weight(abstract_txt:durch in 1391) [ClassicSimilarity], result of:
            0.088528775 = score(doc=1391,freq=2.0), product of:
              0.15720855 = queryWeight, product of:
                4.2473893 = idf(docFreq=1718, maxDocs=44218)
                0.037012983 = queryNorm
              0.56312954 = fieldWeight in 1391, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                4.2473893 = idf(docFreq=1718, maxDocs=44218)
                0.09375 = fieldNorm(doc=1391)
          0.1612143 = weight(abstract_txt:neue in 1391) [ClassicSimilarity], result of:
            0.1612143 = score(doc=1391,freq=3.0), product of:
              0.20479773 = queryWeight, product of:
                1.1413648 = boost
                4.8478208 = idf(docFreq=942, maxDocs=44218)
                0.037012983 = queryNorm
              0.78718793 = fieldWeight in 1391, product of:
                1.7320508 = tf(freq=3.0), with freq of:
                  3.0 = termFreq=3.0
                4.8478208 = idf(docFreq=942, maxDocs=44218)
                0.09375 = fieldNorm(doc=1391)
          0.13874364 = weight(abstract_txt:möglichkeiten in 1391) [ClassicSimilarity], result of:
            0.13874364 = score(doc=1391,freq=1.0), product of:
              0.2672423 = queryWeight, product of:
                1.3038107 = boost
                5.5377917 = idf(docFreq=472, maxDocs=44218)
                0.037012983 = queryNorm
              0.51916796 = fieldWeight in 1391, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.5377917 = idf(docFreq=472, maxDocs=44218)
                0.09375 = fieldNorm(doc=1391)
          0.15915158 = weight(abstract_txt:einsatz in 1391) [ClassicSimilarity], result of:
            0.15915158 = score(doc=1391,freq=1.0), product of:
              0.29284453 = queryWeight, product of:
                1.364836 = boost
                5.79699 = idf(docFreq=364, maxDocs=44218)
                0.037012983 = queryNorm
              0.5434678 = fieldWeight in 1391, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.79699 = idf(docFreq=364, maxDocs=44218)
                0.09375 = fieldNorm(doc=1391)
        0.6666667 = coord(4/6)