Search (1 results, page 1 of 1)

  • × author_ss:"James, M."
  • × language_ss:"d"
  • × theme_ss:"Suchmaschinen"
  1. James, M.: Suchmaschine mit Mehrwert : Mirago (2004) 0.01
    0.0128323175 = product of:
      0.025664635 = sum of:
        0.025664635 = product of:
          0.05132927 = sum of:
            0.05132927 = weight(_text_:daten in 2317) [ClassicSimilarity], result of:
              0.05132927 = score(doc=2317,freq=2.0), product of:
                0.24402376 = queryWeight, product of:
                  4.759573 = idf(docFreq=1029, maxDocs=44218)
                  0.051270094 = queryNorm
                0.21034539 = fieldWeight in 2317, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  4.759573 = idf(docFreq=1029, maxDocs=44218)
                  0.03125 = fieldNorm(doc=2317)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Abstract
    Basis der Indexierung ist Miragos Robot "Heinrich". Heinrichs Aufgabe ist es, sich wie ein Webbrowser zu verhalten und Webseiten zu lesen. Bei der Indexierung wird der Inhalt der Seiten analysiert, das Thema bestimmt und der Text mit Links entnommen. Anschließend werden die so gesammelten Informationen in durchsuchbare Indexe umgewandelt. Dabei beachtet Heinrich sowohl das robot.txt-Protokoll als auch die Robot "noindex" und "nofollow" Meta Commands. Sobald die Indexe erstellt sind werden sie an Q3, das Mirago Ouery System, weitergegeben. Wie auch andere führende Suchmaschinen indexiert Mirago dabei mehr als nur die Worte auf einer Seite. Beinahe ohne Ausnahme benutzen die großen Suchmaschinen die Links zwischen Seiten wie auch den Text auf diesen Links, um die Wichtigkeit einer Webseite und ihre Rankingposition zu bestimmen. Mirago geht einen Schritt weiter, indem weiterführende Links der jeweiligen Seiten zur Bestimmung der Relevanz hinzugezogen werden. Sind die weiterführenden Seiten themenverwandt, so wird die Relevanz der Ursprungsseite automatisch höher eingestuft. Auch rechnet Miragos Technologie die Aktualisierungsfrequenz der Seiten mit ein und berücksichtigt, wie tief die relevanten Informationen in der Seite verborgen sind. Q3 ermöglicht es außerdem, Informationen zu suchen, die aus Datenbanksystemen stammen. Diese enthalten dynamische Inhalte, die von herkömmlichen Robots wie Heinrich nicht gelesen und damit nicht in den Webindex aufgenommen werden können. Über ein Trusted Feeds Programm, das von ausgesuchten Resellern verwaltet wird, können Sites mit dynamischen Inhalten wie Jobbörsen oder Auktionen, ihre Daten zur automatischen Aufnahme in Miragos durchsuchbaren Index übermitteln. Durch einen separaten Robot werden diese Feeds indexiert und unabhängig vom normalen Webindex tagtäglich aktualisiert.