Document (#27989)

Author
Lanvent, A.
Title
Know-how - Suchverfahren : Intelligente Suchmaschinen erzielen mit assoziativen und linguistischen Verfahren beste Ergebnisse.
Source
PC professionell. 2004, H.10, S.134
Year
2004
Content
"Die einfachste Form der Volltextsuche ist die Phrasensuche. Hierbei gilt es, den eingegebenen Text in der exakten Schreibweise in sämtlichen relevanten Dokumenten zu finden. Anhand von Joker-Zeichen wie Stern und Fragezeichen kann der Anwender diese Art der Suche erweitern. Boole'sche Parameter verknüpfen einen, zwei oder mehrere Begriffe zu einem Suchstring. Die häufigsten Parameter lauten UND, ODER und NICHT. So lassen sich auch komplexe Anfragen starten, etwa sollen alle Dokumente gefunden werden, die die Begriffe »Schröder« oder »Schroeder«, aber nicht »Bundeskanzler« enthalten. Kennt der Anwender nicht die exakte Schreibweise oder kommen unterschiedliche Ausprägungen eines Wortes in den gesuchten Dokumenten vor, wie Deklinationen, muss er auf fehlertolerante oder linguistische Verfahren zurückgreifen. Einige Tools wie etwa Dt Search und Findword arbeiten mit Wörterbüchern, die auch Flexionen enthalten. Sucht der Nutzer etwa nach »Baum«, findet das Tool auch »Bäume« oder etwa »Baumstamm«. Bei der phonetischen Suche setzen Programme wie Documind Pro und Findword auf einen Algorithmus, der nach dem ähnlichen Klang der Wörter recherchiert. Solche Verfahren sind demnach sprachenabhängig. Sie nehmen den Suchstring »Meier« zum Anlass, auch »Mayer« oder »Meier« nachzuschlagen. Fuzzy Logic ist ein verwandtes Verfahren, das alternative Schreibweisen oder Tippfehler verzeiht. Dieses Verfahren berücksichtigt auch Abweichungen und stellt dabei fest, dass ein bestimmter Begriff zu einem Wortstamm gehört. Eine solche Methode liefert eine größere Trefferliste und findet bei Eingabe von »Microsoft« auch Dokumente mit »Mircosoft« und »Microaoft«. Die Königsdisziplin ist die Assoziative Suche, die die Recherche nach Eingabe eines beliebigen Satzes in der natürlichen Sprache startet. Das Suchkommando »Die Meistertitel von Borussia Mönchengladbach« findet im Idealfall Texte zu den Themen Fußball, Bundesliga und Netzer."
Footnote
Teilbeitrag in: Licht im Daten Chaos
Theme
Retrievalalgorithmen

Similar documents (content)

  1. Bachfeld, S.: Möglichkeiten und Grenzen linguistischer Verfahren der automatischen Indexierung : Entwurf einer Simulation für den Einsatz im Grundstudium (2003) 0.23
    0.22985278 = sum of:
      0.22985278 = product of:
        0.5746319 = sum of:
          0.045516625 = weight(abstract_txt:ergebnisse in 2827) [ClassicSimilarity], result of:
            0.045516625 = score(doc=2827,freq=1.0), product of:
              0.1518725 = queryWeight, product of:
                5.4802814 = idf(docFreq=500, maxDocs=44218)
                0.027712537 = queryNorm
              0.29970288 = fieldWeight in 2827, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.4802814 = idf(docFreq=500, maxDocs=44218)
                0.0546875 = fieldNorm(doc=2827)
          0.12958518 = weight(abstract_txt:verfahren in 2827) [ClassicSimilarity], result of:
            0.12958518 = score(doc=2827,freq=6.0), product of:
              0.1678877 = queryWeight, product of:
                1.0514046 = boost
                5.761993 = idf(docFreq=377, maxDocs=44218)
                0.027712537 = queryNorm
              0.77185625 = fieldWeight in 2827, product of:
                2.4494898 = tf(freq=6.0), with freq of:
                  6.0 = termFreq=6.0
                5.761993 = idf(docFreq=377, maxDocs=44218)
                0.0546875 = fieldNorm(doc=2827)
          0.14620349 = weight(abstract_txt:erzielen in 2827) [ClassicSimilarity], result of:
            0.14620349 = score(doc=2827,freq=1.0), product of:
              0.33062643 = queryWeight, product of:
                1.475466 = boost
                8.085969 = idf(docFreq=36, maxDocs=44218)
                0.027712537 = queryNorm
              0.44220144 = fieldWeight in 2827, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.085969 = idf(docFreq=36, maxDocs=44218)
                0.0546875 = fieldNorm(doc=2827)
          0.25332665 = weight(abstract_txt:linguistischen in 2827) [ClassicSimilarity], result of:
            0.25332665 = score(doc=2827,freq=2.0), product of:
              0.37856725 = queryWeight, product of:
                1.5788176 = boost
                8.652365 = idf(docFreq=20, maxDocs=44218)
                0.027712537 = queryNorm
              0.66917217 = fieldWeight in 2827, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                8.652365 = idf(docFreq=20, maxDocs=44218)
                0.0546875 = fieldNorm(doc=2827)
        0.4 = coord(4/10)
    
  2. Mayer, M.: Kontextvisualisierung : BrowsingIcons and BrowsingGraphs zur Verbesserung der Orientierung und Navigation im World Wide Web (2000) 0.22
    0.22020487 = sum of:
      0.22020487 = product of:
        0.5505122 = sum of:
          0.052019004 = weight(abstract_txt:ergebnisse in 6651) [ClassicSimilarity], result of:
            0.052019004 = score(doc=6651,freq=1.0), product of:
              0.1518725 = queryWeight, product of:
                5.4802814 = idf(docFreq=500, maxDocs=44218)
                0.027712537 = queryNorm
              0.34251758 = fieldWeight in 6651, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.4802814 = idf(docFreq=500, maxDocs=44218)
                0.0625 = fieldNorm(doc=6651)
          0.060460486 = weight(abstract_txt:verfahren in 6651) [ClassicSimilarity], result of:
            0.060460486 = score(doc=6651,freq=1.0), product of:
              0.1678877 = queryWeight, product of:
                1.0514046 = boost
                5.761993 = idf(docFreq=377, maxDocs=44218)
                0.027712537 = queryNorm
              0.36012456 = fieldWeight in 6651, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.761993 = idf(docFreq=377, maxDocs=44218)
                0.0625 = fieldNorm(doc=6651)
          0.16708969 = weight(abstract_txt:erzielen in 6651) [ClassicSimilarity], result of:
            0.16708969 = score(doc=6651,freq=1.0), product of:
              0.33062643 = queryWeight, product of:
                1.475466 = boost
                8.085969 = idf(docFreq=36, maxDocs=44218)
                0.027712537 = queryNorm
              0.50537306 = fieldWeight in 6651, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.085969 = idf(docFreq=36, maxDocs=44218)
                0.0625 = fieldNorm(doc=6651)
          0.27094305 = weight(abstract_txt:assoziativen in 6651) [ClassicSimilarity], result of:
            0.27094305 = score(doc=6651,freq=1.0), product of:
              0.45634133 = queryWeight, product of:
                1.7334261 = boost
                9.499662 = idf(docFreq=8, maxDocs=44218)
                0.027712537 = queryNorm
              0.5937289 = fieldWeight in 6651, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.499662 = idf(docFreq=8, maxDocs=44218)
                0.0625 = fieldNorm(doc=6651)
        0.4 = coord(4/10)
    
  3. Bekavac, B.: Suchverfahren und Suchdienste des World Wide Web (1996) 0.15
    0.15214723 = sum of:
      0.15214723 = product of:
        0.50715744 = sum of:
          0.075575605 = weight(abstract_txt:verfahren in 4803) [ClassicSimilarity], result of:
            0.075575605 = score(doc=4803,freq=1.0), product of:
              0.1678877 = queryWeight, product of:
                1.0514046 = boost
                5.761993 = idf(docFreq=377, maxDocs=44218)
                0.027712537 = queryNorm
              0.4501557 = fieldWeight in 4803, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.761993 = idf(docFreq=377, maxDocs=44218)
                0.078125 = fieldNorm(doc=4803)
          0.11391554 = weight(abstract_txt:suchmaschinen in 4803) [ClassicSimilarity], result of:
            0.11391554 = score(doc=4803,freq=2.0), product of:
              0.17517674 = queryWeight, product of:
                1.073986 = boost
                5.885746 = idf(docFreq=333, maxDocs=44218)
                0.027712537 = queryNorm
              0.6502892 = fieldWeight in 4803, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                5.885746 = idf(docFreq=333, maxDocs=44218)
                0.078125 = fieldNorm(doc=4803)
          0.31766626 = weight(abstract_txt:suchverfahren in 4803) [ClassicSimilarity], result of:
            0.31766626 = score(doc=4803,freq=1.0), product of:
              0.4372655 = queryWeight, product of:
                1.6968093 = boost
                9.298992 = idf(docFreq=10, maxDocs=44218)
                0.027712537 = queryNorm
              0.72648376 = fieldWeight in 4803, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.298992 = idf(docFreq=10, maxDocs=44218)
                0.078125 = fieldNorm(doc=4803)
        0.3 = coord(3/10)
    
  4. Lewandowski, D.: Freiwillige Selbstkontrolle, Stärkung "alternativer Suchmaschinen" : Suchmaschinen und Politik (2005) 0.13
    0.13471614 = sum of:
      0.13471614 = product of:
        0.6735807 = sum of:
          0.22783108 = weight(abstract_txt:suchmaschinen in 3374) [ClassicSimilarity], result of:
            0.22783108 = score(doc=3374,freq=2.0), product of:
              0.17517674 = queryWeight, product of:
                1.073986 = boost
                5.885746 = idf(docFreq=333, maxDocs=44218)
                0.027712537 = queryNorm
              1.3005784 = fieldWeight in 3374, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                5.885746 = idf(docFreq=333, maxDocs=44218)
                0.15625 = fieldNorm(doc=3374)
          0.44574964 = weight(abstract_txt:beste in 3374) [ClassicSimilarity], result of:
            0.44574964 = score(doc=3374,freq=1.0), product of:
              0.3452538 = queryWeight, product of:
                1.5077511 = boost
                8.2629 = idf(docFreq=30, maxDocs=44218)
                0.027712537 = queryNorm
              1.2910782 = fieldWeight in 3374, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.2629 = idf(docFreq=30, maxDocs=44218)
                0.15625 = fieldNorm(doc=3374)
        0.2 = coord(2/10)
    
  5. Behnert, C.; Plassmeier, K.; Borst, T.; Lewandowski, D.: Evaluierung von Rankingverfahren für bibliothekarische Informationssysteme (2019) 0.13
    0.12580614 = sum of:
      0.12580614 = product of:
        0.41935378 = sum of:
          0.0780285 = weight(abstract_txt:ergebnisse in 5023) [ClassicSimilarity], result of:
            0.0780285 = score(doc=5023,freq=1.0), product of:
              0.1518725 = queryWeight, product of:
                5.4802814 = idf(docFreq=500, maxDocs=44218)
                0.027712537 = queryNorm
              0.51377636 = fieldWeight in 5023, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.4802814 = idf(docFreq=500, maxDocs=44218)
                0.09375 = fieldNorm(doc=5023)
          0.090690725 = weight(abstract_txt:verfahren in 5023) [ClassicSimilarity], result of:
            0.090690725 = score(doc=5023,freq=1.0), product of:
              0.1678877 = queryWeight, product of:
                1.0514046 = boost
                5.761993 = idf(docFreq=377, maxDocs=44218)
                0.027712537 = queryNorm
              0.5401868 = fieldWeight in 5023, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.761993 = idf(docFreq=377, maxDocs=44218)
                0.09375 = fieldNorm(doc=5023)
          0.25063455 = weight(abstract_txt:erzielen in 5023) [ClassicSimilarity], result of:
            0.25063455 = score(doc=5023,freq=1.0), product of:
              0.33062643 = queryWeight, product of:
                1.475466 = boost
                8.085969 = idf(docFreq=36, maxDocs=44218)
                0.027712537 = queryNorm
              0.7580596 = fieldWeight in 5023, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.085969 = idf(docFreq=36, maxDocs=44218)
                0.09375 = fieldNorm(doc=5023)
        0.3 = coord(3/10)