Search (148 results, page 1 of 8)

  • × theme_ss:"Suchmaschinen"
  1. Jörn, F.: Wie Google für uns nach der ominösen Gluonenkraft stöbert : Software-Krabbler machen sich vor der Anfrage auf die Suche - Das Netz ist etwa fünfhundertmal größer als alles Durchforschte (2001) 0.05
    0.048037108 = product of:
      0.096074216 = sum of:
        0.096074216 = sum of:
          0.08271569 = weight(_text_:700 in 3684) [ClassicSimilarity], result of:
            0.08271569 = score(doc=3684,freq=4.0), product of:
              0.36123154 = queryWeight, product of:
                7.3274393 = idf(docFreq=78, maxDocs=44218)
                0.04929847 = queryNorm
              0.22898248 = fieldWeight in 3684, product of:
                2.0 = tf(freq=4.0), with freq of:
                  4.0 = termFreq=4.0
                7.3274393 = idf(docFreq=78, maxDocs=44218)
                0.015625 = fieldNorm(doc=3684)
          0.013358524 = weight(_text_:22 in 3684) [ClassicSimilarity], result of:
            0.013358524 = score(doc=3684,freq=2.0), product of:
              0.17263484 = queryWeight, product of:
                3.5018296 = idf(docFreq=3622, maxDocs=44218)
                0.04929847 = queryNorm
              0.07738023 = fieldWeight in 3684, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                3.5018296 = idf(docFreq=3622, maxDocs=44218)
                0.015625 = fieldNorm(doc=3684)
      0.5 = coord(1/2)
    
    Abstract
    Der weitere Speicher wird für die URL-Adreßdatenbank gebraucht, welche die Krabbler steuert, und als Zwischenspeicher für frisch aufgesuchte Dokumente, die dort ihrer Indizierung harren. An Anfragen kommen bei Infoseek, die T-Online und andere bedienen, täglich zwei Millionen herein; Hauptsuchzeit ist abends 20 bis 23 Uhr. Ja, Spitzenreiter der Suchbegriffe ist immer noch Sex. Gehen wir auf die Suche nach Seltenem. Im internationalen Wettstreit um die weitreichendste Netzausforschung hat zur Zeit die Suchmaschine Google (www.Google.com, "search 1.346.966.000 web pages") mit über 700 Millionen indizierten, teils sogar gespeicherten Seiten die Nase vorn, zumal sie dank ihrer Linktechnik weitere fast 700 Millionen Seiten kennt. Täglich bekommt Google 70 Millionen Anfragen. An zweiter Stelle mit knapp 600 Millionen Seiten folgt Fast, als "Alltheweb" bekannt (www.alltheweb.com), danach etwa gleichrangig mit über 500 Millionen Seiten der Oldtimer Altavista (www.altavista.com), Inktomi und Webtop (www.webtop.com). Inktomi liefert seine Ergebnisse an andere, erst an Hotbot, dann an Microsoft (www.msn.com), bis zum Juli 2000 auch an Yahoo (www.yahoo.com). Yahoo, geboren 1994, ist die älteste und immer noch eine sehr beliebte Suchmaschine, nicht, weil sie Exotika wie "Gluonenkraft" liefern könnte-, sondern weil sich dort rund 150 Katalogisierer Menschen! - um Stichwörter kümmern. Nur wenn die nichts fanden, werden fremde Ergebnisse zugespielt, inzwischen von Google. Ähnlich ist das bei Look Smart (www.looksmart.com), die von Inktomi unterversorgt wird. In hartnäckigen Fällen nutze man Übersuchmaschinen, sogenannte Meta-Crawler wie www.ixquick.com oder hier www.metager.de, die den eingegebenen Begriff automatisch in mehreren Suchmaschinen aufzuspüren versuchen (nicht in Google). Bei den meisten Suchen geht es jedoch nicht um seltene Begriffe. Von den 75 Millionen Ausdrücken, die Altavista einst zählte, werden üblicherweise triviale gesucht. Die Datenbankgröße der Suchmaschine ist dann belanglos. Zudem stehen viele Inhalte mehrfach im Netz, und der Suchende will nicht fünfmal dasselbe vorgespielt bekommen. Bei den meist viel zu vielen Treffern ist die wirkliche Frage deren Anzeigereihenfolge. Da wird versucht, nach Häufigkeit des Wortes im Text zu sortieren oder danach, ob es im Titel und näher am Textanfang vorkommt. Die Suchmaschinen erklären selbst ein wenig davon, zugleich als Aufforderung an WebDesigner, einfache Seiten zu machen, sich kurz und möglichst rahmenlos zu fassen. Speziell für die Suchmaschinen haben die meisten Webseiten im Kopfeintrag Stichwörter, im Quelltext der Seite von jedermann zu sehen. Webseiten können sich "Roboter" sogar verbitten. In den Suchmaschinen-Redaktionen wird für viele Begriffe die Ausgabe manuell festgelegt - wobei zuweilen bereits ein gutes "Placement" bezahlt wird, was sicher bedenklich ist. Für den Neuankömmling Google haben sich 1998 Sergey Brin und Larry Page etwas Besonderes ausgedacht: Die Seiten werden nach Beliebtheit bewertet, und die hängt davon ab, wie viele (beliebte) Seiten zur jeweiligen Seite einen Link hin haben. Das ist gut für klassische Inhalte. Neuigkeiten, auf die noch niemand deutet, werden so nicht gefunden. Für allgemeine Fragen kommt die Lösung nicht von großen Automaten, sondern von spezialisierten Auskunfteien, die rubriziert nach Sachgebieten vorgehen.
    Date
    22. 6.2005 9:52:00
  2. Li, L.; Shang, Y.; Zhang, W.: Improvement of HITS-based algorithms on Web documents 0.04
    0.039149515 = product of:
      0.07829903 = sum of:
        0.07829903 = product of:
          0.23489709 = sum of:
            0.23489709 = weight(_text_:3a in 2514) [ClassicSimilarity], result of:
              0.23489709 = score(doc=2514,freq=2.0), product of:
                0.41795295 = queryWeight, product of:
                  8.478011 = idf(docFreq=24, maxDocs=44218)
                  0.04929847 = queryNorm
                0.56201804 = fieldWeight in 2514, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  8.478011 = idf(docFreq=24, maxDocs=44218)
                  0.046875 = fieldNorm(doc=2514)
          0.33333334 = coord(1/3)
      0.5 = coord(1/2)
    
    Content
    Vgl.: http%3A%2F%2Fdelab.csd.auth.gr%2F~dimitris%2Fcourses%2Fir_spring06%2Fpage_rank_computing%2Fp527-li.pdf. Vgl. auch: http://www2002.org/CDROM/refereed/643/.
  3. Großjohann, K.: Gathering-, Harvesting-, Suchmaschinen (1996) 0.03
    0.02833771 = product of:
      0.05667542 = sum of:
        0.05667542 = product of:
          0.11335084 = sum of:
            0.11335084 = weight(_text_:22 in 3227) [ClassicSimilarity], result of:
              0.11335084 = score(doc=3227,freq=4.0), product of:
                0.17263484 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.04929847 = queryNorm
                0.6565931 = fieldWeight in 3227, product of:
                  2.0 = tf(freq=4.0), with freq of:
                    4.0 = termFreq=4.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.09375 = fieldNorm(doc=3227)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Date
    7. 2.1996 22:38:41
    Pages
    22 S
  4. Höfer, W.: Detektive im Web (1999) 0.03
    0.02833771 = product of:
      0.05667542 = sum of:
        0.05667542 = product of:
          0.11335084 = sum of:
            0.11335084 = weight(_text_:22 in 4007) [ClassicSimilarity], result of:
              0.11335084 = score(doc=4007,freq=4.0), product of:
                0.17263484 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.04929847 = queryNorm
                0.6565931 = fieldWeight in 4007, product of:
                  2.0 = tf(freq=4.0), with freq of:
                    4.0 = termFreq=4.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.09375 = fieldNorm(doc=4007)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Date
    22. 8.1999 20:22:06
  5. Rensman, J.: Blick ins Getriebe (1999) 0.03
    0.02833771 = product of:
      0.05667542 = sum of:
        0.05667542 = product of:
          0.11335084 = sum of:
            0.11335084 = weight(_text_:22 in 4009) [ClassicSimilarity], result of:
              0.11335084 = score(doc=4009,freq=4.0), product of:
                0.17263484 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.04929847 = queryNorm
                0.6565931 = fieldWeight in 4009, product of:
                  2.0 = tf(freq=4.0), with freq of:
                    4.0 = termFreq=4.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.09375 = fieldNorm(doc=4009)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Date
    22. 8.1999 21:22:59
  6. Stock, M.; Stock, W.G.: Recherchieren im Internet (2004) 0.03
    0.026717048 = product of:
      0.053434096 = sum of:
        0.053434096 = product of:
          0.10686819 = sum of:
            0.10686819 = weight(_text_:22 in 4686) [ClassicSimilarity], result of:
              0.10686819 = score(doc=4686,freq=2.0), product of:
                0.17263484 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.04929847 = queryNorm
                0.61904186 = fieldWeight in 4686, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.125 = fieldNorm(doc=4686)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Date
    27.11.2005 18:04:22
  7. Neubauer, R.: Google ist auch eine weltweite Werbefläche : 100 000 Firmen bezahlen die Suchmaschine für zielgerichtete Reklame / Konkurrent Yahoo geht mit Overture in die Offensive (2003) 0.03
    0.025588863 = product of:
      0.051177725 = sum of:
        0.051177725 = product of:
          0.10235545 = sum of:
            0.10235545 = weight(_text_:700 in 843) [ClassicSimilarity], result of:
              0.10235545 = score(doc=843,freq=2.0), product of:
                0.36123154 = queryWeight, product of:
                  7.3274393 = idf(docFreq=78, maxDocs=44218)
                  0.04929847 = queryNorm
                0.28335136 = fieldWeight in 843, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  7.3274393 = idf(docFreq=78, maxDocs=44218)
                  0.02734375 = fieldNorm(doc=843)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Content
    "Gary Weiner's Schuhhandel mit Namen Shoedini ist kaum ein Markenname in den USA. Und Ge'Lena Vavra auch nicht. Beides sind kleine Unternehmen, deren Kundenstamm bis vor wenigen Jahren reichlich begrenzt war und deren Website einer Stecknadel im berühmten Heuhaufen, sprich World Wide Web, glich. Berühmt sind beide auch heute nicht. Doch die Geschäfte laufen flotter denn je - dank Google. Denn Weiner und Vavra, ein Anbieter italienischer Anzüge, entschieden sich für bezahlte Links auf der Suchmaschine. Sie zahlen Google zwischen 21 Cent und 1,50 Dollar, sobald ihr kommerzieller Link angeklickt wird. Und das Geschäft boomt, behauptet Vavra, die den Absatz von zehn Anzügen im Monat auf 120 steigerte. Auch Weiner ist zufrieden und gibt inzwischen 40 Prozent seines Werbebudgets für Links, so genannte Adwords oder Keywords bei Google aus. Sie gehören zu einem wachsenden Heer von mehr als 100 000 Unternehmen, die die Suchmaschine als Werbefläche nutzen. Das ist verständlich: Nicht nur mauserte sich Google, gegründet 1998 von zwei Studenten der Stanford University, zur beliebtesten Suchmaschine der Welt mit 200 Millionen Anfragen pro Tag. Sie stieg auch ganz nebenbei zu einer riesigen weltweiten Werbefläche im Internet auf. Und das, obwohl die Gründer beim Start von Google Werbung auf ihrer Website naiverweise als "heimtückisch" abgelehnt hatten. Doch einige hundert Millionen Dollar an Umsätzen später (Experten schätzen, dass Google dieses Jahr etwa 700 Millionen Dollar einnimmt), ist davon längst nicht mehr die Rede. Im Gegenteil: Google hat eine sprudelnde Geldquelle angezapft. Zwei Milliarden des zehn Milliarden Dollar schweren Werbemarktes in den USA werden inzwischen im Internet umgesetzt - Tendenz steigend. Und Google hat aus einer InternetSuchmaschine ein Geschäft mit Zukunft gemacht, vielleicht sogar den nächsten Goldrausch im Web initiiert. Denn anders als die nervige Bannerwerbung oder die Popups, die das Surfen zur Qual machen, ist die Werbung bei Google kontextabhängig und zielgerichtet. Nur wer "Hugo Boss" eintippt, sieht Vavras Anzeige für Anzüge. Nicht jedoch derjenige, der nach einem Tauchshop Ausschau hält. Dass die Konkurrenz diesem Erfolg nicht tatenlos zusehen würde, versteht sich. Vor allem Yahoo und der MicrosoftOnlinedienst MSN, ebenfalls Größen in der lnternet-Werbung, wappneten sich. in den vergangenen Monaten gegen die Vormachtstellung von Google, dessen Umsätze nur von dem Internet-Werbedienstleister Overture übertroffen werden. "Google hat einen Standard gesetzt, dem nun alle anderen nacheifern", meint der Branchenexperte Safa Rashtchy. So überraschte es nicht, als Yahoo kürzlich die Übernahme von Overture für 1,6 Milliarden Dollar ankündigte, nachdem der Online-Pionier in diesem Jahr bereits den Suchtechnik-Spezialisten Inktomi gekauft hatte. Mit dem neuen Deal verhindert er nicht nur, dass sich Microsoft die Firma unter den Nagel reißt, Yahoo stärkt auch die eigene Position im Kampf um die Web-Vorherrschaft. Denn Overture ist einer der führenden Anbieter bezahlter Suchergebnisse, die üblicherweise an vielfrequentierte Drittanbieter geliefert werden. Mit der Overture-Transaktion will Yahoo Google in die Schranken weisen und die Erweiterung des Modells auf ausländische Märkte - vor allem in Europa und Asien - ermöglichen. Zugleich dürfte der Deal zu einer weiteren Konsolidierung in der Branche führen. So wird spekuliert, dass Microsoft gezwungen wird, seine Position mit dem Zukauf kleinerer Firmen zu stärken. Ask Jeeves ist ebenso im Gespräch wie Looksmart. Microsoft, so eine fantasiereichere Variante, könnte aber auch leicht fünf Milliarden Dollar für den Erwerb von Google lockermachen. Eine Idee, die die Wagniskapitalgeber und die Gründer von Google jedoch als unrealistisch vom Tisch wischen."
  8. Schröter, H.G.: Microsoft lockt mit Rabatt : Neuer Dienst für Suchmaschinen-Nutzer / Google baut Führung aus (2008) 0.03
    0.025588863 = product of:
      0.051177725 = sum of:
        0.051177725 = product of:
          0.10235545 = sum of:
            0.10235545 = weight(_text_:700 in 1876) [ClassicSimilarity], result of:
              0.10235545 = score(doc=1876,freq=2.0), product of:
                0.36123154 = queryWeight, product of:
                  7.3274393 = idf(docFreq=78, maxDocs=44218)
                  0.04929847 = queryNorm
                0.28335136 = fieldWeight in 1876, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  7.3274393 = idf(docFreq=78, maxDocs=44218)
                  0.02734375 = fieldNorm(doc=1876)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Content
    "Google hat den Abstand zu den konkurrierenden Suchmaschinen im Web in den USA noch vergrößert. Der Marktanteil des Internet-Giganten an den Suchanfragen sei im April auf 61,6 Prozent von 59,8 Prozent im Vormonat gestiegen, berichtete die Marktforschungsfirma Comscore. Der Anteil von Yahoo sei dagegen von 21,3 auf 20,4 Prozent und der von Microsoft auf 9,1 von 9,4 Prozent gesunken. AOL und Ask Network folgen abgeschlagen mit 4,6 und 4,3 Prozent. Microsoft versucht seit langem immer wieder, den Abstand zu Google zu verringern. Denn die Beliebtheit der Suchmaschine spielt eine wichtige Rolle für das lukrative Geschäft mit Online-Werbung. Jetzt startet der Software-Riese mit dem "Live Search Cashback" getauften Programm einen neuen Versuch. Er will Nutzern seiner Suchmaschine einen Rabatt auf Kameras, Uhren, Sportschuhe und viele andere Produkte von Anzeigenkunden gewähren. Wer sich registriert hat und auf der Suchmaschine Windows Live Search besonders markierte Artikel bestimmter Händler findet und online erwirbt, bekommt 60 Tage nach dem Kauf Geld zurück. Die Rabatte sollen von zwei bis 30 Prozent reichen. Dabei arbeitet Microsoft nach eigenen Angaben mit mehr als 700 Partnerfirmen zusammen. Zu ihnen zählen unter anderem Ebay, der Buchhändler Barnes & Noble und Sears. Diese sollen für ihre bei Microsoft geschalteten Anzeigen nur dann eine Gebühr zahlen, wenn ein Kunde über das Cashback-Programm einen Kauf abschließt. Aus diesen Gebühren werden die Rabatte an die Kunden finanziert. Anders als bei diesem cost-per-action genannten Modell zahlen Unternehmen derzeit für jeden Klick der Internetnutzer auf ihre Anzeigen. Bei diesem Modell (cost-per-click) dominiert Google.
  9. MacLeod, R.: Promoting a subject gateway : a case study from EEVL (Edinburgh Engineering Virtual Library) (2000) 0.02
    0.023614757 = product of:
      0.047229514 = sum of:
        0.047229514 = product of:
          0.09445903 = sum of:
            0.09445903 = weight(_text_:22 in 4872) [ClassicSimilarity], result of:
              0.09445903 = score(doc=4872,freq=4.0), product of:
                0.17263484 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.04929847 = queryNorm
                0.54716086 = fieldWeight in 4872, product of:
                  2.0 = tf(freq=4.0), with freq of:
                    4.0 = termFreq=4.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.078125 = fieldNorm(doc=4872)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Date
    22. 6.2002 19:40:22
  10. Vidmar, D.J.: Darwin on the Web : the evolution of search tools (1999) 0.02
    0.023377417 = product of:
      0.046754833 = sum of:
        0.046754833 = product of:
          0.09350967 = sum of:
            0.09350967 = weight(_text_:22 in 3175) [ClassicSimilarity], result of:
              0.09350967 = score(doc=3175,freq=2.0), product of:
                0.17263484 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.04929847 = queryNorm
                0.5416616 = fieldWeight in 3175, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.109375 = fieldNorm(doc=3175)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Source
    Computers in libraries. 19(1999) no.5, S.22-28
  11. Back, J.: ¬An evaluation of relevancy ranking techniques used by Internet search engines (2000) 0.02
    0.023377417 = product of:
      0.046754833 = sum of:
        0.046754833 = product of:
          0.09350967 = sum of:
            0.09350967 = weight(_text_:22 in 3445) [ClassicSimilarity], result of:
              0.09350967 = score(doc=3445,freq=2.0), product of:
                0.17263484 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.04929847 = queryNorm
                0.5416616 = fieldWeight in 3445, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.109375 = fieldNorm(doc=3445)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Date
    25. 8.2005 17:42:22
  12. ap: Suchmaschinen in neuem Gewand : Metaspinner kennt 600 Millionen Seiten (1999) 0.02
    0.023377417 = product of:
      0.046754833 = sum of:
        0.046754833 = product of:
          0.09350967 = sum of:
            0.09350967 = weight(_text_:22 in 4224) [ClassicSimilarity], result of:
              0.09350967 = score(doc=4224,freq=2.0), product of:
                0.17263484 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.04929847 = queryNorm
                0.5416616 = fieldWeight in 4224, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.109375 = fieldNorm(doc=4224)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Date
    3. 5.1997 8:44:22
  13. Dunning, A.: Do we still need search engines? (1999) 0.02
    0.023377417 = product of:
      0.046754833 = sum of:
        0.046754833 = product of:
          0.09350967 = sum of:
            0.09350967 = weight(_text_:22 in 6021) [ClassicSimilarity], result of:
              0.09350967 = score(doc=6021,freq=2.0), product of:
                0.17263484 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.04929847 = queryNorm
                0.5416616 = fieldWeight in 6021, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.109375 = fieldNorm(doc=6021)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Source
    Ariadne. 1999, no.22
  14. Bawden, D.: Google and the universe of knowledge (2008) 0.02
    0.023377417 = product of:
      0.046754833 = sum of:
        0.046754833 = product of:
          0.09350967 = sum of:
            0.09350967 = weight(_text_:22 in 844) [ClassicSimilarity], result of:
              0.09350967 = score(doc=844,freq=2.0), product of:
                0.17263484 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.04929847 = queryNorm
                0.5416616 = fieldWeight in 844, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.109375 = fieldNorm(doc=844)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Date
    7. 6.2008 16:22:20
  15. Henzinger, M.; Pöppe, C.: "Qualität der Suchergebnisse ist unser höchstes Ziel" : Suchmaschine Google (2002) 0.02
    0.02193331 = product of:
      0.04386662 = sum of:
        0.04386662 = product of:
          0.08773324 = sum of:
            0.08773324 = weight(_text_:700 in 851) [ClassicSimilarity], result of:
              0.08773324 = score(doc=851,freq=2.0), product of:
                0.36123154 = queryWeight, product of:
                  7.3274393 = idf(docFreq=78, maxDocs=44218)
                  0.04929847 = queryNorm
                0.2428726 = fieldWeight in 851, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  7.3274393 = idf(docFreq=78, maxDocs=44218)
                  0.0234375 = fieldNorm(doc=851)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Content
    Spektrum der Wissenschaft: Frau Henzinger, wie viele Seiten des World Wide Web erschließt Google heute? Monika Henzinger: Wir haben über zwei Milliarden Webseiten in unserer Datenbank. Hinzu kommen 700 Millionen Newsgroup-Beiträge, die weit in die Vergangenheit reichen, und 300 Millionen Bilder. - Spektrum: Und diese Inhalte haben Sie komplett gespeichert? - Henzinger: In komprimierter Form, ja. Spektrum: Ist das nicht schon das gesamte Web? - Henzinger: Bei weitem nicht! Eigentlich ist das Web unendlich. Es gibt Datenbanken, die beliebig viele Webseiten auf Anfrage erzeugen können. Natürlich macht es keinen Sinn, die alle in der Suchmaschine zu haben. Wir beschränken uns auf Seiten hoher Qualität. - Spektrum: Wie wählen Sie die aus? - Henzinger: Nach dem so genannten PageRank. Das ist eine Note, die wir jeder Seite geben, unabhängig von irgendeiner Anfrage, für die diese Seite relevant sein könnte. Und zwar ist die Qualität einer Seite - oder anders gesagt: die Hochachtung, die sie innerhalb des Web genießt - umso größer, je mehr andere Seiten auf sie verweisen und je höher die Qualität der verweisenden Seite ist. Der PageRank bestimmt auch wesentlich die Reihenfolge, in der Google dem Anfrager die Ergebnisse präsentiert. - Spektrum: Ist der PageRank manipulierbar, etwa durch ein Zitierkartell? - Henzinger: Es wird zumindest immer wieder versucht. Zum Beispiel ist "Britney Spears" ein sehr häufiger Suchbegriff. Deswegen versuchen viele, ihren PageRank hochzutreiben, um unter den Antworten auf "Britney Spears" auf den vordersten Plätzen zu landen, auch wenn sie bloß Turnschuhe verkaufen. - Spektrum: Und was tun Sie dagegen? - Henzinger: Wenn wir offensichtlichen Missbrauch sehen, nehmen wir die entsprechenden Seiten gezielt heraus - im Interesse unserer Benutzer, für die wir die Qualität wahren wollen. - Spektrum: Gibt es auch andere Maßnahmen als diese Einzelkorrekturen? - Henzinger: Ja. Aber die diskutieren wir nicht öffentlich, um den "Rüstungswettlauf" nicht anzuheizen. - Spektrum: Seit wann gibt es Google? - Henzinger: Die Firma existiert seit dreieinhalb Jahren. Seit reichlich zwei Jahren sind wir auf dem Markt. Die Kunde von uns hat sich durch Mundpropaganda verbreitet, und inzwischen kommt die Hälfte der Anfragen von außerhalb der USA, zwölf Prozent allein aus dem deutschsprachigen Raum. Wir beantworten über 150 Millionen Anfragen am Tag, und zwar direkt oder über unsere Partner. Wenn zum Beispiel die Suchmaschine Yahoo ein Stichwort nicht im eigenen Verzeichnis findet, reicht sie die Anfrage an uns weiter und gibt dem Benutzer unsere Antwort. - Spektrum: Mit welcher Hardware läuft das System? - Henzinger: Mit über zehntausend PCs, verteilt auf vier Datenzentren. Betriebssystem ist Linux. - Spektrum: Wie prüfen Sie, ob die aufgeftihrten Webseiten noch existieren? - Henzinger: Besonders ereignisreiche Webseiten besuchen wir täglich. Alle 28 Tage aktualisieren wir den Index - das ist die Liste, die zu jedem Wort die Seiten aufführt, auf denen es vorkommt. - Spektrum: Wie aufwendig ist dieses Indizieren? - Henzinger: Sehr aufwendig. Etwa eine Woche. - Spektrum: Wie viele Leute hat die Firma? - Henzinger: Ungefähr 300. Bisher haben wir unsere Belegschaft in jedem Jahr ungefähr verdoppelt. -
  16. Auf der Suche nach Suchmaschinen (1996) 0.02
    0.020037785 = product of:
      0.04007557 = sum of:
        0.04007557 = product of:
          0.08015114 = sum of:
            0.08015114 = weight(_text_:22 in 5583) [ClassicSimilarity], result of:
              0.08015114 = score(doc=5583,freq=2.0), product of:
                0.17263484 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.04929847 = queryNorm
                0.46428138 = fieldWeight in 5583, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.09375 = fieldNorm(doc=5583)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Source
    Cogito. 12(1996) H.5, S.19-22
  17. Birmingham, J.: Internet search engines (1996) 0.02
    0.020037785 = product of:
      0.04007557 = sum of:
        0.04007557 = product of:
          0.08015114 = sum of:
            0.08015114 = weight(_text_:22 in 5664) [ClassicSimilarity], result of:
              0.08015114 = score(doc=5664,freq=2.0), product of:
                0.17263484 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.04929847 = queryNorm
                0.46428138 = fieldWeight in 5664, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.09375 = fieldNorm(doc=5664)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Date
    10.11.1996 16:36:22
  18. Bager, J.: Weniger ist mehr : Internet-Suchmaschinen richtig einsetzen (1998) 0.02
    0.020037785 = product of:
      0.04007557 = sum of:
        0.04007557 = product of:
          0.08015114 = sum of:
            0.08015114 = weight(_text_:22 in 1489) [ClassicSimilarity], result of:
              0.08015114 = score(doc=1489,freq=2.0), product of:
                0.17263484 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.04929847 = queryNorm
                0.46428138 = fieldWeight in 1489, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.09375 = fieldNorm(doc=1489)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Date
    29.12.1998 11:22:00
  19. Lob, S.: Per Mausklick auf die neusten Nachrichten : Internet-Suchmaschinen liefern Presse-Überblicke und stellen persönliche Zeitungen zusammen (1998) 0.02
    0.020037785 = product of:
      0.04007557 = sum of:
        0.04007557 = product of:
          0.08015114 = sum of:
            0.08015114 = weight(_text_:22 in 1622) [ClassicSimilarity], result of:
              0.08015114 = score(doc=1622,freq=2.0), product of:
                0.17263484 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.04929847 = queryNorm
                0.46428138 = fieldWeight in 1622, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.09375 = fieldNorm(doc=1622)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Date
    29.12.1998 11:22:25
  20. Hannemann, M.: Online ins Schlaraffenland der Wissenschaft : Literatur-Recherche im Internet ist ein teures Unterfangen ohne Erfolgsgarantie - Doch wer systematisch sucht, gelangt zügig ans Ziel (1999) 0.02
    0.020037785 = product of:
      0.04007557 = sum of:
        0.04007557 = product of:
          0.08015114 = sum of:
            0.08015114 = weight(_text_:22 in 3106) [ClassicSimilarity], result of:
              0.08015114 = score(doc=3106,freq=2.0), product of:
                0.17263484 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.04929847 = queryNorm
                0.46428138 = fieldWeight in 3106, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.09375 = fieldNorm(doc=3106)
          0.5 = coord(1/2)
      0.5 = coord(1/2)
    
    Date
    3. 5.1997 8:44:22

Languages

  • d 82
  • e 64
  • f 1
  • nl 1
  • More… Less…

Types

  • a 134
  • el 8
  • m 6
  • p 2
  • x 2
  • r 1
  • More… Less…

Classifications