Search (704 results, page 2 of 36)

Morville, P.: Ambient findability : what we find changes who we become (2005) 0.01
```
0.011479586 = product of:
  0.05165814 = sum of:
    0.038693886 = sum of:
      0.018309485 = weight(_text_:web in 312) [ClassicSimilarity], result of:
        0.018309485 = score(doc=312,freq=14.0), product of:
          0.09596372 = queryWeight, product of:
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.02940506 = queryNorm
          0.19079591 = fieldWeight in 312, product of:
            3.7416575 = tf(freq=14.0), with freq of:
              14.0 = termFreq=14.0
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.015625 = fieldNorm(doc=312)
      0.020384401 = weight(_text_:seite in 312) [ClassicSimilarity], result of:
        0.020384401 = score(doc=312,freq=2.0), product of:
          0.16469958 = queryWeight, product of:
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.02940506 = queryNorm
          0.12376717 = fieldWeight in 312, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.015625 = fieldNorm(doc=312)
    0.012964252 = product of:
      0.025928505 = sum of:
        0.025928505 = weight(_text_:bewertung in 312) [ClassicSimilarity], result of:
          0.025928505 = score(doc=312,freq=2.0), product of:
            0.18575147 = queryWeight, product of:
              6.31699 = idf(docFreq=216, maxDocs=44218)
              0.02940506 = queryNorm
            0.13958707 = fieldWeight in 312, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              6.31699 = idf(docFreq=216, maxDocs=44218)
              0.015625 = fieldNorm(doc=312)
      0.5 = coord(1/2)
  0.22222222 = coord(2/9)
```
Abstract

How do you find your way in an age of information overload? How can you filter streams of complex information to pull out only what you want? Why does it matter how information is structured when Google seems to magically bring up the right answer to your questions? What does it mean to be "findable" in this day and age? This eye-opening new book examines the convergence of information and connectivity. Written by Peter Morville, author of the groundbreakin Information Architecture for the World Wide Web, the book defines our current age as a state of unlimited findability. In other words, anyone can find anything at any time. Complete navigability. Morville discusses the Internet, GIS, and other network technologies that are coming together to make unlimited findability possible. He explores how the melding of these innovations impacts society, since Web access is now a standard requirement for successful people and businesses. But before he does that, Morville looks back at the history of wayfinding and human evolution, suggesting that our fear of being lost has driven us to create maps, charts, and now, the mobile Internet.

Footnote

Rez. in: nfd - Information Wissenschaft und Praxis 57(2006) H.3, S.177-178 (D. Lewandowski): "Wohl unbestritten ist, dass die Suche in Informationsbeständen eine immer größere Bedeutung erhält. Wir suchen nicht nur noch explizit, indem wir ein Informationssystem anwählen und dort eine Suche absetzen, sondern verwenden Suchfunktionen innerhalb von Programmen, auf Websites, innerhalb des Betriebssystems unseres Computers oder sogar ziemlich unbewusst, indem wir Informationen maßgeschneidert aufgrund einer einmal hinterlegten Suche oder eines automatisch erstellten Suchprofils erhalten. Man kann also in der Tat davon sprechen, dass wir von der Suche umgeben werden. Das ist mit dem Konzept der "Ambient Findability" gemeint. Angelehnt ist diese Bezeichnung an den Begriff der "Ambient Music" (in den 70er Jahren durch Brian Eno geprägt), die den Hörer umgibt und von ihm oft gar nicht aktiv wahrgenommen wird. Um eine Vorstellung von dieser Musik zu bekommen, eignet sich vielleicht am besten der Titel einer Platte eben von Brian Eno: "Music for Airports". Peter Morville, bekannt als Co-Autor des empfehlenswerten Buchs "Information Architecture for the World Wide Web"', hat sich nun mit der Veränderung der Suche auseinandergesetzt. Sein Buch bedient sich in ganz unterschiedlichen Disziplinen, um die Prozesse des Suchens, Stöberns und Findens aufzuzeigen. So finden sich Betrachtungen über die Orientierung des Menschen in unbekannten Umgebungen, über die Interaktion mit Informationssystemen, über das soziale Verhalten der Web-Nutzer (Stichworte: Content-Tagging, Folksonomies, Social Networking) und über technische Veränderungen durch die Verfügbarkeit von Informationssystemen in allen Lebenskontexten, vor allem auch über mobile Endgeräte. Das Buch ist in sieben Kapitel gegliedert. Das erste, "Lost and Found" betitelt, bietet auf wenigen Seiten die Definitionen der zentralen Begriffe ambient und findability, erläutert kurz das Konzept der Information Literacy und zeigt, dass die bessere Auffindbarkeit von Informationen nicht nur ein schöner Zusatznutzen ist, sondern sich für Unternehmen deutlich auszahlt.
Das zweite Kapitel ("A Brief History of Wayfinding") beschreibt, wie Menschen sich in Umgebungen zurechtfinden. Dies ist insofern interessant, als hier nicht erst bei Informationssystemen oder dem WWW begonnen wird, sondern allgemeine Erkenntnisse beispielsweise über die Orientierung in natürlichen Umgebungen präsentiert werden. Viele typische Verhaltensweisen der Nutzer von Informationssystemen können so erklärt werden. So interessant dieses Thema allerdings ist, wirkt das Kapitel leider doch nur wie eine Zusammenstellung von Informationen aus zweiter Hand. Offensichtlich ist, dass Morville nicht selbst an diesen Themen geforscht hat, sondern die Ergebnisse (wenn auch auf ansprechende Weise) zusammengeschrieben hat. Dieser Eindruck bestätigt sich auch in weiteren Kapiteln: Ein flüssig geschriebener Text, der es jedoch an einigen Stellen an Substanz fehlen lässt. Kapitel drei, "Information Interaction" beginnt mit einem Rückgriff auf Calvin Mooers zentrale Aussage aus dem Jahre 1959: "An information retrieval system will tend not to be used whenever it is more painful and troublesome for a customer to have information than for him not to have it." In der Tat sollte man sich dies bei der Erstellung von Informationssystemen immer vergegenwärtigen; die Reihe der Systeme, die gerade an dieser Hürde gescheitert sind, ist lang. Das weitere Kapitel führt in einige zentrale Konzepte der Informationswissenschaft (Definition des Begriffs Information, Erläuterung des Information Retrieval, Wissensrepräsentation, Information Seeking Behaviour) ein, allerdings ohne jeden Anspruch auf Vollständigkeit. Es wirkt vielmehr so, dass der Autor sich die gerade für sein Anliegen passenden Konzepte auswählt und konkurrierende Ansätze beiseite lässt. Nur ein Beispiel: Im Abschnitt "Information Interaction" wird relativ ausführlich das Konzept des Berrypicking nach Marcia J. Bates präsentiert, allerdings wird es geradezu als exklusiv verkauft, was es natürlich bei weitem nicht ist. Natürlich kann es nicht Aufgabe dieses Buchs sein, einen vollständigen Überblick über alle Theorien des menschlichen Suchverhaltens zu geben (dies ist an anderer Stelle vorbildlich geleistet worden'), aber doch wenigstens der Hinweis auf einige zentrale Ansätze wäre angebracht gewesen. Spätestens in diesem Kapitel wird klar, dass das Buch sich definitiv nicht an Informationswissenschaftler wendet, die auf der einen Seite mit den grundlegenden Themen vertraut sein dürften, andererseits ein wenig mehr Tiefgang erwarten würden. Also stellt sich die Frage - und diese ist zentral für die Bewertung des gesamten Werks.
Im Kapitel über das "Sociosemantic Web" werden die groben Grundzüge der Klassifikationslehre erläutert, um dann ausführlich auf neuere Ansätze der Web-Erschließung wie Social Tagging und Folksonomies einzugehen. Auch dieses Kapitel gibt eher einen Überblick als den schon Kundigen vertiefende Informationen zu liefern. Das letzte Kapitel widmet sich schließlich der Art, wie Entscheidungen getroffen werden, der Network Culture, dem Information Overload, um schließlich zu den "Inspired Decisions" zu gelangen - Entscheidungen, die sowohl auf "sachlichen Informationen" (also den klassischen Zutaten der "informed decisions") als auch aus aus Netzwerken stammenden Informationen wie etwa Empfehlungen durch Freunde oder Community-Mitglieder irgendeiner Art gewonnen werden. Fasst man zusammen, so ist an Morvilles Text besonders bemerkenswert, dass nach einigen Jahren, in denen die Suche im Web als ein Problem der Suche in unstrukturierten Daten angesehen wurde, nun wieder verstärkt Erschließungsansätze, die auf klassische Erschließungsinstrumente zurückgreifen, propagiert werden. Zwar sollen sie nicht in ihrer ursprünglichen Form angewandt werden, da den Nutzern nicht zuzumuten ist, sich mit den entsprechenden Regeln auseinanderzusetzen, aber auch hinter der auf den ersten Blick zumindest chaotisch wirkenden Folksonomy ist das Prinzip der Klassifikation zu erkennen. Um die modernen Ansätze erfolgreich zu machen, bedarf es aber dringend Information Professionals, die das "beste aus beiden Welten" verbinden, um moderne, für den Nutzer optimale Informationssysteme zu schaffen. Für die Gesamtbewertung des Buchs gelten die bereits zu einzelnen Kapitels angeführten Kritikpunkte: In erster Linie bleibt das Buch zu sehr an der Oberfläche und wirkt irgendwie "zusammengeschrieben" anstatt als Ergebnis der tiefgreifenden Beschäftigung mit dem Thema. Als eine Einführung in aufkommende Technologien rund um die Suche ist es aber durchaus geeignet - gut lesbar ist der Text auf jeden Fall.
Horch, A.; Kett, H.; Weisbecker, A.: Semantische Suchsysteme für das Internet : Architekturen und Komponenten semantischer Suchmaschinen (2013) 0.01
```
0.011046993 = product of:
  0.049711466 = sum of:
    0.017300837 = product of:
      0.034601673 = sum of:
        0.034601673 = weight(_text_:web in 4063) [ClassicSimilarity], result of:
          0.034601673 = score(doc=4063,freq=8.0), product of:
            0.09596372 = queryWeight, product of:
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.02940506 = queryNorm
            0.36057037 = fieldWeight in 4063, product of:
              2.828427 = tf(freq=8.0), with freq of:
                8.0 = termFreq=8.0
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.0390625 = fieldNorm(doc=4063)
      0.5 = coord(1/2)
    0.03241063 = product of:
      0.06482126 = sum of:
        0.06482126 = weight(_text_:bewertung in 4063) [ClassicSimilarity], result of:
          0.06482126 = score(doc=4063,freq=2.0), product of:
            0.18575147 = queryWeight, product of:
              6.31699 = idf(docFreq=216, maxDocs=44218)
              0.02940506 = queryNorm
            0.34896767 = fieldWeight in 4063, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              6.31699 = idf(docFreq=216, maxDocs=44218)
              0.0390625 = fieldNorm(doc=4063)
      0.5 = coord(1/2)
  0.22222222 = coord(2/9)
```
Abstract

In der heutigen Zeit nimmt die Flut an Informationen exponentiell zu. In dieser »Informationsexplosion« entsteht täglich eine unüberschaubare Menge an neuen Informationen im Web: Beispielsweise 430 deutschsprachige Artikel bei Wikipedia, 2,4 Mio. Tweets bei Twitter und 12,2 Mio. Kommentare bei Facebook. Während in Deutschland vor einigen Jahren noch Google als nahezu einzige Suchmaschine beim Zugriff auf Informationen im Web genutzt wurde, nehmen heute die u.a. in Social Media veröffentlichten Meinungen und damit die Vorauswahl sowie Bewertung von Informationen einzelner Experten und Meinungsführer an Bedeutung zu. Aber wie können themenspezifische Informationen nun effizient für konkrete Fragestellungen identifiziert und bedarfsgerecht aufbereitet und visualisiert werden? Diese Studie gibt einen Überblick über semantische Standards und Formate, die Prozesse der semantischen Suche, Methoden und Techniken semantischer Suchsysteme, Komponenten zur Entwicklung semantischer Suchmaschinen sowie den Aufbau bestehender Anwendungen. Die Studie erläutert den prinzipiellen Aufbau semantischer Suchsysteme und stellt Methoden der semantischen Suche vor. Zudem werden Softwarewerkzeuge vorgestellt, mithilfe derer einzelne Funktionalitäten von semantischen Suchmaschinen realisiert werden können. Abschließend erfolgt die Betrachtung bestehender semantischer Suchmaschinen zur Veranschaulichung der Unterschiede der Systeme im Aufbau sowie in der Funktionalität.

RSWK

Suchmaschine / Semantic Web / Information Retrieval

Subject

Suchmaschine / Semantic Web / Information Retrieval
deu: Suchmaschinen gegen den Infostau : Deutsches Forschungsnetz (2001) 0.01
```
0.01053191 = product of:
  0.047393594 = sum of:
    0.014982964 = product of:
      0.029965928 = sum of:
        0.029965928 = weight(_text_:web in 6725) [ClassicSimilarity], result of:
          0.029965928 = score(doc=6725,freq=6.0), product of:
            0.09596372 = queryWeight, product of:
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.02940506 = queryNorm
            0.3122631 = fieldWeight in 6725, product of:
              2.4494898 = tf(freq=6.0), with freq of:
                6.0 = termFreq=6.0
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.0390625 = fieldNorm(doc=6725)
      0.5 = coord(1/2)
    0.03241063 = product of:
      0.06482126 = sum of:
        0.06482126 = weight(_text_:bewertung in 6725) [ClassicSimilarity], result of:
          0.06482126 = score(doc=6725,freq=2.0), product of:
            0.18575147 = queryWeight, product of:
              6.31699 = idf(docFreq=216, maxDocs=44218)
              0.02940506 = queryNorm
            0.34896767 = fieldWeight in 6725, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              6.31699 = idf(docFreq=216, maxDocs=44218)
              0.0390625 = fieldNorm(doc=6725)
      0.5 = coord(1/2)
  0.22222222 = coord(2/9)
```
Content

"Das Web wuchert. Das Informationsangebot lässt zwar mit Maschinen nach Stichwörtern durchsuchen. Doch die Ergebnisse sind teils ernüchternd oder erschlagend: Die Fundlisten sind lang und trennen nur manchmal die Spreu vom Weizen. Da geben nicht nur Normalnutzer schnell auf. Auch Studierende streichen die Web-Segel. Nur wenige beschaffen sich wissenschaftliche Informationen aus dem Internet, ergab eine Studie der Sozialforschungsstelle an der Universität Dortmund. Zwar grast knapp zwei Drittel des akademischen Nachwuchses das Web mit den üblichen Suchmaschinen ab - durchaus auch nach fachlichen Informationen. Doch es herrscht allgemeine Unzufriedenheit mit den Ergebnissen der Recherchen. Wichtigster Kritikpunkt: ein umfassendes Auflisten aller Treffer ist meist nur hinderlich. Biologen etwa, die nach Veröffentlichungen über Eiweiße suchen, sind weniger an Küchenrezepten mit Eischnee interessiert - die sie aber mitserviert bekommen. Selbst die Recherche nach "Protein ohne Eiweiß", die bei einigen Suchmaschinen möglich ist, führt noch zu einem mittleren Informationsstau. Eine Maschine, die sich in Biologie auskennt und ausschließlich dieses Feld beackert, wäre gut. Im Auftrag des Bildungsministeriums entwickelt der Verein zur Förderung eines Deutschen Forschungsnetzes (DFN) nun solche fachspezifischen Suchmaschinen. Wie üblich, soll die Software unablässig im Netz stöbern - und die Funde nach einem Schlagwortkatalog festgelegten Fachgebieten zuordnen. Anfragen durchstöbern dann nur die entsprechende Sektion. Der Bezug der Dokumente untereinander, die Links auf den Seiten werden zur Bewertung herangezogen. Damit, hoffen die Forscher, sei ein effektives Ranking möglich: Die Dateien, auf die am häufigsten verwiesen wird, landen ganz oben. Die erfolgreiche allgemeine Suchmaschine Google arbeitet nach diesem Prinzip. Das Ministerium zahlt dafür 1,2 Millionen Mark. DFN-Chef Eike Jessen: "Spätestens im Frühjahr 2003 soll die innovative Suchsoftware für die Mitglieder des DFN-Vereins sowie für andere akademische Einrichtungen frei verfügbar sein.""

Berinstein, P.: Turning visual : image search engines on the Web (1998) 0.01

0.0104188 = product of:
  0.046884596 = sum of:
    0.030948678 = product of:
      0.061897356 = sum of:
        0.061897356 = weight(_text_:web in 3595) [ClassicSimilarity], result of:
          0.061897356 = score(doc=3595,freq=10.0), product of:
            0.09596372 = queryWeight, product of:
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.02940506 = queryNorm
            0.6450079 = fieldWeight in 3595, product of:
              3.1622777 = tf(freq=10.0), with freq of:
                10.0 = termFreq=10.0
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.0625 = fieldNorm(doc=3595)
      0.5 = coord(1/2)
    0.015935918 = product of:
      0.031871837 = sum of:
        0.031871837 = weight(_text_:22 in 3595) [ClassicSimilarity], result of:
          0.031871837 = score(doc=3595,freq=2.0), product of:
            0.10297151 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.02940506 = queryNorm
            0.30952093 = fieldWeight in 3595, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=3595)
      0.5 = coord(1/2)
  0.22222222 = coord(2/9)

Abstract: Gives an overview of image search engines on the Web. They work by: looking for graphics files; looking for a caption; looking for Web sites whose titles indicate the presence of picturres on a certain subject; or employing human intervention. Describes the image search capabilities of: AltaVista; Amazing Picture Machine (Http://www.ncrtec.org/picture.htm); HotBot; ImageSurfer (http://ipix.yahoo.com); Lycos; Web Clip Art Search Engine and WebSEEK. The search engines employing human intervention provide the best results
Object: Web Clip Art Search Engine
Source: Online. 22(1998) no.3, S.37-38,40-42

Mostafa, J.: Bessere Suchmaschinen für das Web (2006) 0.01
```
0.010367232 = product of:
  0.046652544 = sum of:
    0.042668566 = sum of:
      0.013840669 = weight(_text_:web in 4871) [ClassicSimilarity], result of:
        0.013840669 = score(doc=4871,freq=8.0), product of:
          0.09596372 = queryWeight, product of:
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.02940506 = queryNorm
          0.14422815 = fieldWeight in 4871, product of:
            2.828427 = tf(freq=8.0), with freq of:
              8.0 = termFreq=8.0
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.015625 = fieldNorm(doc=4871)
      0.028827896 = weight(_text_:seite in 4871) [ClassicSimilarity], result of:
        0.028827896 = score(doc=4871,freq=4.0), product of:
          0.16469958 = queryWeight, product of:
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.02940506 = queryNorm
          0.17503321 = fieldWeight in 4871, product of:
            2.0 = tf(freq=4.0), with freq of:
              4.0 = termFreq=4.0
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.015625 = fieldNorm(doc=4871)
    0.0039839796 = product of:
      0.007967959 = sum of:
        0.007967959 = weight(_text_:22 in 4871) [ClassicSimilarity], result of:
          0.007967959 = score(doc=4871,freq=2.0), product of:
            0.10297151 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.02940506 = queryNorm
            0.07738023 = fieldWeight in 4871, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.015625 = fieldNorm(doc=4871)
      0.5 = coord(1/2)
  0.22222222 = coord(2/9)
```
Content

An der Wurzel des Indexbaums Im ersten Schritt werden potenziell interessante Inhalte identifiziert und fortlaufend gesammelt. Spezielle Programme vom Typ so genannter Webtrawler können im Internet publizierte Seiten ausfindig machen, durchsuchen (inklusive darauf befindlicher Links) und die Seiten an einem Ort gesammelt speichern. Im zweiten Schritt erfasst das System die relevanten Wörter auf diesen Seiten und bestimmt mit statistischen Methoden deren Wichtigkeit. Drittens wird aus den relevanten Begriffen eine hocheffiziente baumartige Datenstruktur erzeugt, die diese Begriffe bestimmten Webseiten zuordnet. Gibt ein Nutzer eine Anfrage ein, wird nur der gesamte Baum - auch Index genannt - durchsucht und nicht jede einzelne Webseite. Die Suche beginnt an der Wurzel des Indexbaums, und bei jedem Suchschritt wird eine Verzweigung des Baums (die jeweils viele Begriffe und zugehörige Webseiten beinhaltet) entweder weiter verfolgt oder als irrelevant verworfen. Dies verkürzt die Suchzeiten dramatisch. Um die relevanten Fundstellen (oder Links) an den Anfang der Ergebnisliste zu stellen, greift der Suchalgorithmus auf verschiedene Sortierstrategien zurück. Eine verbreitete Methode - die Begriffshäufigkeit - untersucht das Vorkommen der Wörter und errechnet daraus numerische Gewichte, welche die Bedeutung der Wörter in den einzelnen Dokumenten repräsentieren. Häufige Wörter (wie »oder«, »zu«, »mit«), die in vielen Dokumenten auftauchen, erhalten deutlich niedrigere Gewichte als Wörter, die eine höhere semantische Relevanz aufweisen und nur in vergleichsweise wenigen Dokumenten zu finden sind. Webseiten können aber auch nach anderen Strategien indiziert werden. Die Linkanalyse beispielsweise untersucht Webseiten nach dem Kriterium, mit welchen anderen Seiten sie verknüpft sind. Dabei wird analysiert, wie viele Links auf eine Seite verweisen und von dieser Seite selbst ausgehen. Google etwa verwendet zur Optimierung der Suchresultate diese Linkanalyse. Sechs Jahre benötigte Google, um sich als führende Suchmaschine zu etablieren. Zum Erfolg trugen vor allem zwei Vorzüge gegenüber der Konkurrenz bei: Zum einen kann Google extrem große Weberawling-Operationen durchführen. Zum anderen liefern seine Indizierungsund Gewichtungsmethoden überragende Ergebnisse. In letzter Zeit jedoch haben andere Suchmaschinen-Entwickler einige neue, ähnlich leistungsfähige oder gar punktuell bessere Systeme entwickelt.
Viele digitale Inhalte können mit Suchmaschinen nicht erschlossen werden, weil die Systeme, die diese verwalten, Webseiten auf andere Weise speichern, als die Nutzer sie betrachten. Erst durch die Anfrage des Nutzers entsteht die jeweils aktuelle Webseite. Die typischen Webtrawler sind von solchen Seiten überfordert und können deren Inhalte nicht erschließen. Dadurch bleibt ein Großteil der Information - schätzungsweise 500-mal so viel wie das, was das konventionelle Web umfasst - für Anwender verborgen. Doch nun laufen Bemühungen, auch dieses »versteckte Web« ähnlich leicht durchsuchbar zu machen wie seinen bisher zugänglichen Teil. Zu diesem Zweck haben Programmierer eine neuartige Software entwickelt, so genannte Wrapper. Sie macht sich zu Nutze, dass online verfügbare Information standardisierte grammatikalische Strukturen enthält. Wrapper erledigen ihre Arbeit auf vielerlei Weise. Einige nutzen die gewöhnliche Syntax von Suchanfragen und die Standardformate der Online-Quellen, um auf versteckte Inhalte zuzugreifen. Andere verwenden so genannte ApplikationsprogrammSchnittstellen (APIs), die Software in die Lage versetzen, standardisierte Operationen und Befehle auszuführen. Ein Beispiel für ein Programm, das auf versteckte Netzinhalte zugreifen kann, ist der von BrightPlanet entwickelte »Deep Query Manager«. Dieser wrapperbasierte Anfragemanager stellt Portale und Suchmasken für mehr als 70 000 versteckte Webquellen bereit. Wenn ein System zur Erzeugung der Rangfolge Links oder Wörter nutzt, ohne dabei zu berücksichtigen, welche Seitentypen miteinander verglichen werden, besteht die Gefahr des Spoofing: Spaßvögel oder Übeltäter richten Webseiten mit geschickt gewählten Wörtern gezielt ein, um das Rangberechnungssystem in die Irre zu führen. Noch heute liefert die Anfrage nach »miserable failure« (»klägliches Versagen«) an erster Stelle eine offizielle Webseite des Weißen Hauses mit der Biografie von Präsident Bush.
Vorsortiert und radförmig präsentiert Statt einfach nur die gewichtete Ergebnisliste zu präsentieren (die relativ leicht durch Spoofing manipuliert werden kann), versuchen einige Suchmaschinen, unter denjenigen Webseiten, die am ehesten der Anfrage entsprechen, Ähnlichkeiten und Unterschiede zu finden und die Ergebnisse in Gruppen unterteilt darzustellen. Diese Muster können Wörter sein, Synonyme oder sogar übergeordnete Themenbereiche, die nach speziellen Regeln ermittelt werden. Solche Systeme ordnen jeder gefundenen Linkgruppe einen charakteristischen Begriff zu. Der Anwender kann die Suche dann weiter verfeinern, indem er eine Untergruppe von Ergebnissen auswählt. So liefern etwa die Suchmaschinen »Northern Light« (der Pionier auf diesem Gebiet) und »Clusty« nach Gruppen (Clustern) geordnete Ergebnisse. »Mooter«, eine innovative Suchmaschine, die ebenfalls diese Gruppiertechnik verwendet, stellt die Gruppen zudem grafisch dar (siehe Grafik links unten). Das System ordnet die UntergruppenButtons radförmig um einen zentralen Button an, der sämtliche Ergebnisse enthält. Ein Klick auf die UntergruppenButtons erzeugt Listen relevanter Links und zeigt neue, damit zusammenhängende Gruppen. Mooter erinnert sich daran, welche Untergruppen gewählt wurden. Noch genauere Ergebnisse erhält der Nutzer, wenn er die Verfeinerungsoption wählt: Sie kombiniert bei früheren Suchen ausgewählte Gruppen mit der aktuellen Anfrage. Ein ähnliches System, das ebenfalls visuelle Effekte nutzt, ist »Kartoo«. Es handelt sich dabei um eine so genannte Meta-Suchmaschine: Sie gibt die Nutzeranfragen an andere Suchmaschinen weiter und präsentiert die gesammelten Ergebnisse in grafischer Form. Kartoo liefert eine Liste von Schlüsselbegriffen von den unterschiedlichen Webseiten und generiert daraus eine »Landkarte«. Auf ihr werden wichtige Seiten als kons (Symbole) dargestellt und Bezüge zwischen den Seiten mit Labeln und Pfaden versehen. Jedes Label lässt sich zur weiteren Verfeinerung der Suche nutzen. Einige neue Computertools erweitern die Suche dadurch, dass sie nicht nur das Web durchforsten, sondern auch die Festplatte des eigenen Rechners. Zurzeit braucht man dafür noch eigenständige Programme. Aber Google hat beispielsweise kürzlich seine »Desktop Search« angekündigt, die zwei Funktionen kombiniert: Der Anwender kann angeben, ob das Internet, die Festplatte oder beides zusammen durchsucht werden soll. Die nächste Version von Microsoft Windows (Codename »Longhorn«) soll mit ähnlichen Fähigkeiten ausgestattet werden: Longhorn soll die implizite Suche beherrschen, bei der Anwender ohne Eingabe spezifischer Anfragen relevante Informationen auffinden können. (Dabei werden Techniken angewandt, die in einem anderen Microsoft-Projekt namens »Stuff I've seen« - »Sachen, die ich gesehen habe« - entwickelt wurden.) Bei der impliziten Suche werden Schlüsselwörter aus der Textinformation gewonnen, die der Anwender in jüngster Zeit auf dem Rechner verarbeitet oder verändert hat - etwa E-Mails oder Word-Dokumente -, um damit auf der Festplatte gespeicherte Informationen wiederzufinden. Möglicherweise wird Microsoft diese Suchfunktion auch auf Webseiten ausdehnen. Außerdem sollen Anwender auf dem Bildschirm gezeigte Textinhalte leichter in Suchanfragen umsetzen können." ...

Date

22. 1.2006 18:34:49
Kohkemper, R.: Studenten-Charme im Big Business : 200 Millionen Anfragen pro Tag - die erfolgreichste Suchmaschine des Internet (2004) 0.01
```
0.010058556 = product of:
  0.0452635 = sum of:
    0.038220752 = product of:
      0.076441504 = sum of:
        0.076441504 = weight(_text_:seite in 2324) [ClassicSimilarity], result of:
          0.076441504 = score(doc=2324,freq=18.0), product of:
            0.16469958 = queryWeight, product of:
              5.601063 = idf(docFreq=443, maxDocs=44218)
              0.02940506 = queryNorm
            0.46412688 = fieldWeight in 2324, product of:
              4.2426405 = tf(freq=18.0), with freq of:
                18.0 = termFreq=18.0
              5.601063 = idf(docFreq=443, maxDocs=44218)
              0.01953125 = fieldNorm(doc=2324)
      0.5 = coord(1/2)
    0.0070427475 = product of:
      0.014085495 = sum of:
        0.014085495 = weight(_text_:22 in 2324) [ClassicSimilarity], result of:
          0.014085495 = score(doc=2324,freq=4.0), product of:
            0.10297151 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.02940506 = queryNorm
            0.13679022 = fieldWeight in 2324, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.01953125 = fieldNorm(doc=2324)
      0.5 = coord(1/2)
  0.22222222 = coord(2/9)
```
Content

In ihrer Garage also bauten die zwei ihre ersten Rechner auf, gebrauchte, die sie bei Frys, dem großen ElektronikDiscounter im Silicon Valley, billig gekauft hatten. Und sie luden die Maschinen mit kostenloser Software wie dem Betriebssystem Linux. Hinzu kam die von Page und Brins ausgetüftelte Google-Suchtechnik. Ihr zugrunde liegt die Überlegung, dass gute und wichtige Webseiten die sind, auf die oft verwiesen wird. Also schaffen es nur solche unter die Top Ten, die von möglichst vielen Links empfohlen worden sind (siehe Stichwort Suchmethode). Natürlich lädt auch dieses Systems zu Tricksereien ein. Allein in Deutschland, so schätzen Kenner der Szene, gibt es rund 100 Profis, die sich darauf spezialisiert haben, die Google-Ergebnisse zu fälschen: Suchmaschinenoptimierer nennen sie sich. Schon wenn 50 Internetseiten sich gezenseitig empfehlen, so heißt es, steige man bei den Google-Suchlisten weit nach oben. Die Garagen-Zeiten sind bei Google längst vorbei, der lässig studentische Charme soll geblieben sein, berichten Besucher von Mountain View, dem Gewerbegebiet eine Autostunde von San Francisco entfernt, besser bekannt als Silicon Valley. Dort, hinter der hellgelben Fassade eines zweitstöckigen Fabrikgebäudes, arbeiten mittlerweile 1000 Mitarbeiter aus 34 Ländern. Darunter auch Informatiker, die ausschließlich versuchen, den Suchmaschinenoptimierern immer neue Hürden zu bauen. Die beiden Zentralrechner allerdings, zusammengesetzt aus 10 000 Einzelrechnern, befinden sich woanders. Einer an der Ost-, derandere an der Westküste der USA. Die genauen Standorte werden nicht verraten. Aus Angst vor Sabotageakten. Einen dritten soll es demnächstin Irland geben. Alles schön und gut. Aber an Kreativltät hatte es Internet-Firmen meist nicht gefehlt, sondern an Einnahmen. Auch bei Google lief es zunächst schleppend. Doch Brin und Page konnten wenigstens ihre Suchtechnik verkaufen. Dann verfielen sie auf eine weitere Idee. Statt irgendwelcher Werbebotschaften, bemüht sich Google die zum Inhalt der Seite passenden zu platzieren. Wer also "Neuwagen" eintippt, soll eben auch Neuwagenwerbung auf seinem Schirm finden. Klickt er die auch noch an, verdient Google Geld. Die meisten Anzeigen bringen pro Klick zwar zuweilen nur 0,05 Cent, doch das läppert sich.
SUCHMETHODE PageRank Technologie nennen die Google-Gründer ihre Such-Methode. Nach der Eingabe eines Suchbegriffes werden die 3 Milliarden Webseiten, die Google erreichen kann, damit verglichen. Der Kern der Such-Methode ist dabei, dass Google einen Link von der Seite A zu Seite B als ein "Votum" von der Seite A zu Seite B wertet. Wer also auf seiner Webseite mit einem Link eine andere Seite empfiehlt bzw. darauf verweist, verändert den Stellenwert einer Seite in der Google-Liste. Allerdings verlässt sich Google nicht allein auf die Voten anderer Seiten. Mitarbeiter des Anbieters schätzen die Wichtigkeit einer Seite über dieses Votum ein. Außerdem wird von Google die Seite bewertet, von der das Votum stammt. Ein Beispiel für die Manipulierbarkeit von Google: Wer im weltweiten Netz "miserable failure" ("erbärmlicher Versager") eingibt, landet bei der Biografie von George W. Bush. Zahlreiche Webmaster haben also einen Link zum Weißen Haus gesetzt und und mit dem Suchnamen "miserable failure" unterlegt.

Date

3. 5.1997 8:44:22
13. 6.2004 14:34:22
Henzinger, M.; Pöppe, C.: "Qualität der Suchergebnisse ist unser höchstes Ziel" : Suchmaschine Google (2002) 0.01
```
0.009903597 = product of:
  0.08913237 = sum of:
    0.08913237 = sum of:
      0.020761002 = weight(_text_:web in 851) [ClassicSimilarity], result of:
        0.020761002 = score(doc=851,freq=8.0), product of:
          0.09596372 = queryWeight, product of:
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.02940506 = queryNorm
          0.21634221 = fieldWeight in 851, product of:
            2.828427 = tf(freq=8.0), with freq of:
              8.0 = termFreq=8.0
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.0234375 = fieldNorm(doc=851)
      0.06837136 = weight(_text_:seite in 851) [ClassicSimilarity], result of:
        0.06837136 = score(doc=851,freq=10.0), product of:
          0.16469958 = queryWeight, product of:
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.02940506 = queryNorm
          0.41512772 = fieldWeight in 851, product of:
            3.1622777 = tf(freq=10.0), with freq of:
              10.0 = termFreq=10.0
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.0234375 = fieldNorm(doc=851)
  0.11111111 = coord(1/9)
```
Content

Spektrum der Wissenschaft: Frau Henzinger, wie viele Seiten des World Wide Web erschließt Google heute? Monika Henzinger: Wir haben über zwei Milliarden Webseiten in unserer Datenbank. Hinzu kommen 700 Millionen Newsgroup-Beiträge, die weit in die Vergangenheit reichen, und 300 Millionen Bilder. - Spektrum: Und diese Inhalte haben Sie komplett gespeichert? - Henzinger: In komprimierter Form, ja. Spektrum: Ist das nicht schon das gesamte Web? - Henzinger: Bei weitem nicht! Eigentlich ist das Web unendlich. Es gibt Datenbanken, die beliebig viele Webseiten auf Anfrage erzeugen können. Natürlich macht es keinen Sinn, die alle in der Suchmaschine zu haben. Wir beschränken uns auf Seiten hoher Qualität. - Spektrum: Wie wählen Sie die aus? - Henzinger: Nach dem so genannten PageRank. Das ist eine Note, die wir jeder Seite geben, unabhängig von irgendeiner Anfrage, für die diese Seite relevant sein könnte. Und zwar ist die Qualität einer Seite - oder anders gesagt: die Hochachtung, die sie innerhalb des Web genießt - umso größer, je mehr andere Seiten auf sie verweisen und je höher die Qualität der verweisenden Seite ist. Der PageRank bestimmt auch wesentlich die Reihenfolge, in der Google dem Anfrager die Ergebnisse präsentiert. - Spektrum: Ist der PageRank manipulierbar, etwa durch ein Zitierkartell? - Henzinger: Es wird zumindest immer wieder versucht. Zum Beispiel ist "Britney Spears" ein sehr häufiger Suchbegriff. Deswegen versuchen viele, ihren PageRank hochzutreiben, um unter den Antworten auf "Britney Spears" auf den vordersten Plätzen zu landen, auch wenn sie bloß Turnschuhe verkaufen. - Spektrum: Und was tun Sie dagegen? - Henzinger: Wenn wir offensichtlichen Missbrauch sehen, nehmen wir die entsprechenden Seiten gezielt heraus - im Interesse unserer Benutzer, für die wir die Qualität wahren wollen. - Spektrum: Gibt es auch andere Maßnahmen als diese Einzelkorrekturen? - Henzinger: Ja. Aber die diskutieren wir nicht öffentlich, um den "Rüstungswettlauf" nicht anzuheizen. - Spektrum: Seit wann gibt es Google? - Henzinger: Die Firma existiert seit dreieinhalb Jahren. Seit reichlich zwei Jahren sind wir auf dem Markt. Die Kunde von uns hat sich durch Mundpropaganda verbreitet, und inzwischen kommt die Hälfte der Anfragen von außerhalb der USA, zwölf Prozent allein aus dem deutschsprachigen Raum. Wir beantworten über 150 Millionen Anfragen am Tag, und zwar direkt oder über unsere Partner. Wenn zum Beispiel die Suchmaschine Yahoo ein Stichwort nicht im eigenen Verzeichnis findet, reicht sie die Anfrage an uns weiter und gibt dem Benutzer unsere Antwort. - Spektrum: Mit welcher Hardware läuft das System? - Henzinger: Mit über zehntausend PCs, verteilt auf vier Datenzentren. Betriebssystem ist Linux. - Spektrum: Wie prüfen Sie, ob die aufgeftihrten Webseiten noch existieren? - Henzinger: Besonders ereignisreiche Webseiten besuchen wir täglich. Alle 28 Tage aktualisieren wir den Index - das ist die Liste, die zu jedem Wort die Seiten aufführt, auf denen es vorkommt. - Spektrum: Wie aufwendig ist dieses Indizieren? - Henzinger: Sehr aufwendig. Etwa eine Woche. - Spektrum: Wie viele Leute hat die Firma? - Henzinger: Ungefähr 300. Bisher haben wir unsere Belegschaft in jedem Jahr ungefähr verdoppelt. -
Spektrum: Wie finanziert sich Google? - Henzinger: Überwiegend durch gewöhnliche Reklame: einzeilige Anzeigen, die nur aus durchlaufendem Text bestehen. Diese Werbung erscheint nur auf solche Fragewörter, die mit dem Produkt in Verbindung stehen, wir nennen das "keyword targeting". Auch kann jeder online eine Anzeige kaufen. Wenn Sie Ihrer Frau über Google zum Geburtstag gratulieren wollen, können Sie eine Anzeige schalten, die nur auf deren Namen hin erscheint. Zweitens durch Search Services. Zum Beispiel bezahlt uns Yahoo dafür, dass unsere Ergebnisse auf deren Seite erscheinen. Manche Firmen wollen auf ihrer Webseite eine Suchfunktion einrichten, aber nicht selbst programmieren. Für diese Unternehmen bauen wir dann einen eigenen Index und beantworten damit die Suchanfragen, die an sie gestellt werden. Schließlich verkaufen wir neuerdings unsere Produkte zur firmeninternen Nutzung in Intranets. Mit diesem Konzept sind wir eine der wenigen neuen Internet-Firmen, die ihr Geld verdienen. - Spektrum: Gibt es neue Projekte? - Henzinger: Zum Beispiel Spracheingabe. Der Benutzer spricht seine Frage in ein Mikrofon und bekommt die Antworten auf den Bildschirm, später vielleicht auch gesprochen. Oder unser News Search. Unsere Maschinen lesen Tageszeitungen und stellen Artikel zum gleichen Thema aus verschiedenen Ländern zusammen. Das ist interessant, weil die Berichterstattung zumeist national gefärbt ist. Ein regelmäßiger Vergleich kann den Horizont erweitern. Klicken Sie unter google.com auf "News and Resources" und dann "Check out the Google news search". Oder User Interfaces. Wie bringt man den Benutzer dazu, mehr als zwei Wörter einzutippen? Je mehr Wörter er ansagt, desto besser können wir ihn bedienen.
epd: Kaiserslauterer Forscher untersuchen Google-Suche (2017) 0.01
```
0.009415684 = product of:
  0.08474116 = sum of:
    0.08474116 = sum of:
      0.06482126 = weight(_text_:bewertung in 3815) [ClassicSimilarity], result of:
        0.06482126 = score(doc=3815,freq=2.0), product of:
          0.18575147 = queryWeight, product of:
            6.31699 = idf(docFreq=216, maxDocs=44218)
            0.02940506 = queryNorm
          0.34896767 = fieldWeight in 3815, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            6.31699 = idf(docFreq=216, maxDocs=44218)
            0.0390625 = fieldNorm(doc=3815)
      0.019919898 = weight(_text_:22 in 3815) [ClassicSimilarity], result of:
        0.019919898 = score(doc=3815,freq=2.0), product of:
          0.10297151 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.02940506 = queryNorm
          0.19345059 = fieldWeight in 3815, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.0390625 = fieldNorm(doc=3815)
  0.11111111 = coord(1/9)
```
Content

"Bei der Suche nach Politikern und Parteien über Suchmaschinen wie Google spielt Personalisierung einem Forschungsprojekt zufolge eine geringere Rolle als bisher angenommen. Bei der Eingabe von Politikernamen erhalten verschiedene Nutzer größtenteils die gleichen Ergebnisse angezeigt, lautet ein gestern veröffentlichtes Zwischenergebnis einer Analyse im Auftrag der Landesmedienanstalten. Die Ergebnisse stammen aus dem Forschungsprojekt "#Datenspende: Google und die Bundestagswahl2017" der Initiative AIgorithmWatch und der Technischen Universität Kaiserslautern. Im Durchschnitt erhalten zwei unterschiedliche Nutzer demnach bei insgesamt neun Suchergebnissen sieben bis acht identische Treffer, wenn sie mit Google nach Spitzenkandidaten der Parteien im Bundestagswahlkampf suchen. Die Suchergebnisse zu Parteien unterscheiden sich allerdings stärker. Bei neun Suchanfragen gebe es hier nur fünf bis sechs gemeinsame Suchergebnisse, fanden die Wissenschaftler heraus. Die Informatikprofessorin Katharina Zweig von der TU Kaiserslautern zeigte sich überrascht, dass die Suchergebisse verschiedener Nutzer sich so wenig unterscheiden. "Das könnte allerdings morgen schon wieder anders aussehen", warnte sie, Die Studie beweise erstmals, dass es grundsätzlich möglich sei, Algorithmen von Intermediären wie Suchmaschinen im Verdachtsfall nachvollziehbar zu machen. Den Ergebnissen zufolge gibt es immer wieder kleine Nutzergruppen mit stark abweichenden Ergebnislisten. Eine abschließende, inhaltliche Bewertung stehe noch aus. Für das Projekt haben nach Angaben der Medienanstalt bisher fast 4000 freiwillige Nutzer ein von den Forschern programmiertes Plug-ln auf ihrem Computer- installiert. Bisher seien damitdrei Millionen gespendete Datensätze gespeichert worden. Das Projekt wird finanziert von den Landesmedienanstalten Bayern, Berlin-Brandenburg, Hessen, Rheinland-Pfalz, Saarland und Sachsen." Vgl. auch: https://www.swr.de/swraktuell/rp/kaiserslautern/forschung-in-kaiserslautern-beeinflusst-google-die-bundestagswahl/-/id=1632/did=20110680/nid=1632/1mohmie/index.html. https://www.uni-kl.de/aktuelles/news/news/detail/News/aufruf-zur-datenspende-welche-nachrichten-zeigt-die-suchmaschine-google-zur-bundestagswahl-an/.

Date

22. 7.2004 9:42:33
Lewandowski, D.: Suchmaschinen verstehen (2015) 0.01
```
0.009101578 = product of:
  0.0819142 = sum of:
    0.0819142 = sum of:
      0.020761002 = weight(_text_:web in 337) [ClassicSimilarity], result of:
        0.020761002 = score(doc=337,freq=2.0), product of:
          0.09596372 = queryWeight, product of:
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.02940506 = queryNorm
          0.21634221 = fieldWeight in 337, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.046875 = fieldNorm(doc=337)
      0.061153203 = weight(_text_:seite in 337) [ClassicSimilarity], result of:
        0.061153203 = score(doc=337,freq=2.0), product of:
          0.16469958 = queryWeight, product of:
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.02940506 = queryNorm
          0.3713015 = fieldWeight in 337, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.046875 = fieldNorm(doc=337)
  0.11111111 = coord(1/9)
```
Abstract

Das Buch betrachtet das Thema Suchmaschinen ausgehend von der täglichen Recherche und führt in die technischen Grundlagen, in Recherchetechniken sowie die gesellschaftlichen und wirtschaftlichen Bedingungen der Recherche im Web ein. Suchmaschinen sind heute die wichtigsten Werkzeuge, um an Informationen zu gelangen. Wir verwenden Suchmaschinen täglich, meist ohne weiter darüber nachzudenken. Doch wie funktionieren diese Suchwerkzeuge eigentlich genau? Neben einer ausführlichen Darstellung der in den bekannten Suchmaschinen verwendeten Rankingverfahren wird auch ausführlich auf das Nutzerverhalten eingegangen, das wiederum die Ergebnisdarstellung prägt. Dazu kommen grundlegende Betrachtungen des Suchmaschinenmarkts, der Bedeutung der Suchmaschinenoptimierung und der Rolle der Suchmaschinen als technische Informationsvermittler. Nicht zuletzt wird auch die Seite der Recherche betrachtet und gezeigt, wie man mit den bekannten Suchmaschinen effizient recherchieren kann. Das Buch verhilft allen, die mit Suchmaschinen recherchieren oder sich beruflich mit der Optimierung, Aufbereitung und Sichtbarmachung von Inhalten beschäftigen, zu einem umfassenden Verständnis der Ansätze, Stärken und Schwächen verschiedener Suchmaschinen und der ihnen zugrunde liegenden Technologien.
Lewandowski, D.: Web Information Retrieval (2005) 0.01
```
0.0085986415 = product of:
  0.07738777 = sum of:
    0.07738777 = sum of:
      0.03661897 = weight(_text_:web in 4028) [ClassicSimilarity], result of:
        0.03661897 = score(doc=4028,freq=14.0), product of:
          0.09596372 = queryWeight, product of:
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.02940506 = queryNorm
          0.38159183 = fieldWeight in 4028, product of:
            3.7416575 = tf(freq=14.0), with freq of:
              14.0 = termFreq=14.0
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.03125 = fieldNorm(doc=4028)
      0.040768802 = weight(_text_:seite in 4028) [ClassicSimilarity], result of:
        0.040768802 = score(doc=4028,freq=2.0), product of:
          0.16469958 = queryWeight, product of:
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.02940506 = queryNorm
          0.24753433 = fieldWeight in 4028, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.03125 = fieldNorm(doc=4028)
  0.11111111 = coord(1/9)
```
Abstract

WebInformationRetrieval hat sich als gesonderter Forschungsbereich herausgebildet. Neben den im klassischen Information Retrieval behandelten Fragen ergeben sich durch die Eigenheiten des Web neue und zusätzliche Forschungsfragen. Die Unterschiede zwischen Information Retrieval und Web Information Retrieval werden diskutiert. Derzweite Teil des Aufsatzes gibt einen Überblick über die Forschungsliteratur der letzten zwei Jahre. Dieser Aufsatz gibt einen Überblick über den Stand der Forschung im Bereich Web Information Retrieval. Im ersten Teil werden die besonderen Probleme, die sich in diesem Bereich ergeben, anhand einer Gegenüberstellung mit dem "klassischen" Information Retrieval erläutert. Der weitere Text diskutiert die wichtigste in den letzten Jahren erschienene Literatur zum Thema, wobei ein Schwerpunkt auf die - so vorhanden-deutschsprachige Literatur gelegt wird. Der Schwerpunkt liegt auf Literatur aus den Jahren 2003 und 2004. Zum einen zeigt sich in dem betrachteten Forschungsfeld eine schnelle Entwicklung, so dass viele ältere Untersuchungen nur noch einen historischen bzw. methodischen Wert haben; andererseits existieren umfassende ältere Reviewartikel (s. v.a. Rasmussen 2003). Schon bei der Durchsicht der Literatur wird allerdings deutlich, dass zu einigen Themenfeldern keine oder nur wenig deutschsprachige Literatur vorhanden ist. Leider ist dies aber nicht nur darauf zurückzuführen, dass die Autoren aus den deutschsprachigen Ländern ihre Ergebnisse in englischer Sprache publizieren. Vielmehr wird deutlich, dass in diesen Ländern nur wenig Forschung im Suchmaschinen-Bereich stattfindet. Insbesondere zu sprachspezifischen Problemen von Web-Suchmaschinen fehlen Untersuchungen. Ein weiteres Problem der Forschung im Suchmaschinen-Bereich liegt in der Tatsache begründet, dass diese zu einem großen Teil innerhalb von Unternehmen stattfindet, welche sich scheuen, die Ergebnisse in großem Umfang zu publizieren, da sie fürchten, die Konkurrenz könnte von solchen Veröffentlichungen profitieren. So finden sich etwa auch Vergleichszahlen über einzelne Suchmaschinen oft nur innerhalb von Vorträgen oder Präsentationen von Firmenvertretern (z.B. Singhal 2004; Dean 2004). Das Hauptaugenmerk dieses Artikels liegt auf der Frage, inwieweit Suchmaschinen in der Lage sind, die im Web vorhanden Inhalte zu indexieren, mit welchen Methoden sie dies tun und ob bzw. wie sie ihre Ziele erreichen. Ausgenommen bleiben damit explizit Fragen der Effizienz bei der Erschließung des Web und der Skalierbarkeit von Suchmaschinen. Anders formuliert: Diese Übersicht orientiert sich an klassisch informationswissenschaftlichen Fragen und spart die eher im Bereich der Informatik diskutierten Fragen weitgehend aus.
Eine regelmäßige Übersicht neuer US-Patente und US-Patentanmeldungen im Bereich Information Retrieval bietet die News-Seite Resourceshelf (www.resourceshelf.com).
Schwacher Start der lokalen Suche in Deutschland (2005) 0.01
```
0.008581051 = product of:
  0.077229455 = sum of:
    0.077229455 = sum of:
      0.019573662 = weight(_text_:web in 3380) [ClassicSimilarity], result of:
        0.019573662 = score(doc=3380,freq=4.0), product of:
          0.09596372 = queryWeight, product of:
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.02940506 = queryNorm
          0.2039694 = fieldWeight in 3380, product of:
            2.0 = tf(freq=4.0), with freq of:
              4.0 = termFreq=4.0
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.03125 = fieldNorm(doc=3380)
      0.057655793 = weight(_text_:seite in 3380) [ClassicSimilarity], result of:
        0.057655793 = score(doc=3380,freq=4.0), product of:
          0.16469958 = queryWeight, product of:
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.02940506 = queryNorm
          0.35006642 = fieldWeight in 3380, product of:
            2.0 = tf(freq=4.0), with freq of:
              4.0 = termFreq=4.0
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.03125 = fieldNorm(doc=3380)
  0.11111111 = coord(1/9)
```
Abstract

Yahoo bietet auf seiner Suchseite (de.search.yahoo.com) neu eine lokale Suche für Deutschland an. Die Daten der lokalen Einträge kommen von Das Örtliche. Erweiterte Funktionen wie eine direkte Stadtplanansicht oder ergänzende Angaben, die aus dem Web extrahiert wurden, werden nicht angeboten.

Content

"Der Markt der lokalen Suche gilt für den Wettbewerb um Kunden als besonders bedeutsam (siehe Password 11/2003). Mittlerweile haben alle großen Suchmaschinen in den USA eine eigene lokale Suche laufen; die Angebote werden wohl noch in diesem Jahr für die größeren nationalen Märkte adaptiert. Yahoo kann sich rühmen, als erste der großen Suchmaschinen auch den deutschen Markt zu bedienen. Das Angebot selbst lässt allerdings zu wünschen übrig. Gegenüber dem Webangebot von Das Örtliche bestehen keinerlei Mehrwerte; vielmehr wird beim Anklicken eines Eintrags aus der Trefferliste schlicht auf die Original-Seite von Das Örtliche weitergeleitet, wo man sich dann auch einen Stadtplan anzeigen lassen und sich von einem Routenplaner die Anfahrt berechnen lassen kann. Das Yahoo-Angebot ist ausgesprochen schwach - zumal, wenn man es mit den Konkurrenzangeboten und dem US-Angebot von Yahoo vergleicht. In Deutschland bietet meinestadt.de seit Langem lokale Angebote inklusiv Branchenbuch und weitere Dienste wie Veranstaltungskalender und lokaler Stellensuche. Und für die privaten Telefonnummern lässt sich entweder das gedruckte Telefonbuch oder ein Angebot wie eben das Örtliche verwenden. Wirft man einen Blick in die USA, zeigt sich, in welche Richtung das Angebot von Yahoo eigentlich hätte gehen sollen. Die US-Seite von Yahoo bietet neben den Angaben aus Telefon- und Branchenbuch auch Fotos, eine Direktanzeige auf dem Stadtplan, Besprechungen (die von Partnerangeboten und YahooNutzern kommen), eine Verbindung zum Routenplaner und bei Restaurants teilweise sogar die Speisekarte. All dies wird übersichtlich auf einer Ergebnisseite präsentiert. Die Daten können in das von Yahoo angebotene Adressbuch übernommen oder per SMS auf ein Handy übertragen werden. Google bietet bei seiner lokalen Suche in den USA neben den Brachenbuch-Einträgen und Karten ergänzende Informationen aus dem Web-Index an. Auch hier werden alle Informationen direkt auf den Google-Seiten angezeigt, die von Partnern kommenden Informationen wie das Kartenmaterial werden entsprechend eingebunden. Vor dem Hintergrund der bereits bestehenden Angebote und vor allem dem eigenen US-Angebot von Yahoo bleibt völlig unklar, warum Yahoo für den deutschen Markt eine so schwache Lösung vorstellt. Zwar handelt es sich auch hier wieder um ein Beta-Angebot (so wie so ziemlich jede Neuerung auf dem Suchmaschinen-Markt, die noch jünger als ein paar Jahre ist), dies ist allerdings keine Entschuldigung für einen so schwachen Service."
Lehmkuhl, F.: Suchmaschinen : Griff in die Ideenkiste (2003) 0.01
```
0.008463527 = product of:
  0.07617174 = sum of:
    0.07617174 = sum of:
      0.023211509 = weight(_text_:web in 4558) [ClassicSimilarity], result of:
        0.023211509 = score(doc=4558,freq=10.0), product of:
          0.09596372 = queryWeight, product of:
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.02940506 = queryNorm
          0.24187797 = fieldWeight in 4558, product of:
            3.1622777 = tf(freq=10.0), with freq of:
              10.0 = termFreq=10.0
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.0234375 = fieldNorm(doc=4558)
      0.052960232 = weight(_text_:seite in 4558) [ClassicSimilarity], result of:
        0.052960232 = score(doc=4558,freq=6.0), product of:
          0.16469958 = queryWeight, product of:
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.02940506 = queryNorm
          0.32155657 = fieldWeight in 4558, product of:
            2.4494898 = tf(freq=6.0), with freq of:
              6.0 = termFreq=6.0
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.0234375 = fieldNorm(doc=4558)
  0.11111111 = coord(1/9)
```
Content

"Die Macher der Suchmaschine Fireball wissen, was Surfer glücklich macht. Fakten, na klar, aber auch feminine Formen, vorzugsweise in Großaufnahme. Deshalb versprechen sie auf ihrer Website reichlich Detailansichten der Latinoschönheit Jennifer Lopez. Über 4000 Hingucker wirft die Software der Suchspezialisten auf Wunsch auf den Monitor: die Sängerin, knapp bekleidet, auf einem Motorrad; beim Filmkuss oder halb nackt im Strandsand. Wer will, kann gleich per Klick CDs mit Hits der Popdiva in Web-Shops bestellen. Mit frivolen Promi-Fotos, direkten Verbindungen zum Internet-Handel oder verbesserter Technik versuchen Fireball & Co., ihre leeren Kassen zu füllen und die Vorherrschaft von Google zu brechen. Das Spähprogramm der US-Firma gilt seit Jahren als effektivster Helfer beim Fahnden nach Wissen im Web. Google hat sich weltweit zum Marktführer entwickelt und hilft in Europa etwa 30 Prozent der Internet-Nutzer schnell bei der Suche", weiß Stefan Karzauninkat, Autor von suchfibel.de, einer Seite mit Erklärungen zu Suchdiensten aller Art. Die Pole-Position sichert sich das Unternehmen aus Kalifornien mit der Page-Rank-Technologie: In den Rankings landen nur Websites vorn, auf die möglichst viele Homepages verweisen. Hingegen durchforsten die Programme anderer Anbieter das Internet meist nach Schlagworten und kehren von ihren Touren oft mit kümmerlichen Ergebnissen oder gleich ganz erfolglos zurück. "Google hat mit Innovationen den Markt umgekrempelt", meint Suchmaschinenexperte Karzauninkat. Die Konkurrenz kopiert jetzt das Erfolgsmodell - in der Hoffnung, mit aufgefüllten Trefferlisten Nutzer zu gewinnen. "Wir haben von Google gelernt", gesteht Detlev Kalb, der beim Internet-Portal Lycos die europaweite Suche der Marken Fireball und Hotbot sowie auf der Lycos-Homepage verantwortet. Die überarbeitete Fireball-Seite, die noch in diesem Sommer online gehen soll, wird das Page-Rank-Popularitätskriterium integrieren und mit der eigenen aufgepeppten Technik verschmelzen. Viel versprechende Neulinge wie Teoma gehen noch einen Schritt weiter: Die Amerikaner haben das Popularitäts- um ein Expertenkriterium bereichert. Sie platzieren nur Homepages an der Spitze ihrer Link-Übersichten, die besonders viele Fachleute und Fachseiten empfehlen. "Wenn jemand etwas zum Thema Tennis wissen will, fragt er doch nicht wahllos seine ganzen Freunde", erklärt Sprecherin Alexa Rudin, "sondern solche, die etwas von dem Sport verstehen." Technische Innovationen allein freilich polieren die rot gefärbten Bilanzen nicht auf, über die fast alle Suchhelfer klagen. Viele von ihnen lassen deshalb Teile ihrer Rankings sponsern. Ganz oben finden sich die Unternehmen wieder, die am meisten zahlen. Auch Google setzt auf diese Finanzspritze. "Wir kooperieren mit 100 000 Werbetreibenden weltweit", sagt Mitgründer Sergey Brin.
Erfolgreichster Verfechter dieses Geschäftsmodells ist Overture. Die weltweit agierende Firma mit Stammsitz im kalifornischen Pasadena erwirtschaftet das Gros ihres Umsatzes mit bezahlten Ergebnislisten. "Durchschnittlich 37 Cent bekommen wir von Firmen, wenn wir über einen Link einen unserer Nutzer an sie weiterleiten", erklärt Deutschland-Chef Manfred Klaus. Das Prinzip ist so lukrativ, dass sich Overture mit schwarzen Zahlen und kräftigen Investitionen zu einem der Hauptkonkurrenten von Google mausern konnte. So kaufte der Konzern den Daten-Guide Altavista. Für den norwegischen Suchtechnikanbieter Fast legten die Amerikaner 30 Millionen US-Dollar auf den Tisch - eine wichtige Akquisition, denn Tausende von Suchdiensten im Web arbeiten lediglich mit drei Techniken: Google, Yahoos Inktomi und Overtures Fast. Der Newcomer aus den USA sucht nun in Deutschland etwa für Seitenbesucher von T -Online, Freenet oder AOL. In die Tiefen des Web dringt jedoch keines der Systeme vor. "Auch Google kennt nur 25 Prozent des Netzes", erklärt Fachmann Karzauninkat. Weil beispielsweise viele Datenbanken ihre Türen für die großen Web-Fahnder nicht öffnen, schwenken viele Surfer auf Spezial-Suchmaschinen, etwa für Medizin oder Online-Shopping, um (siehe Kasten Seite 87). Als größte Gefahr, die exponierte Marktstellung einzubüßen, entpuppt sich für Google allerdings kein aufstrebender Widersacher, sondern neuerdings der eigene hohe Bekanntheitsgrad. Er reizt Verbreiter unerwünschter Massenwerbung. Ideales Einfallstor für sie ist die Page-Rank-Technik. "Spammer bauen Internet-Seiten, die möglichst oft aufeinander verweisen. Damit kommen sie ganz weit oben in die Trefferlisten", erklärt Stefan Karzauninkat. So stoßen Suchende bei Google nach Eingabe des gewünschten Begriffs zunehmend auf seitenweise WebsiteTipps. Gefüllt mit Marketingmüll."

Eggeling, T.; Kroschel, A.: Alles finden im Web (2000) 0.01

0.008271274 = product of:
  0.037220735 = sum of:
    0.017300837 = product of:
      0.034601673 = sum of:
        0.034601673 = weight(_text_:web in 4884) [ClassicSimilarity], result of:
          0.034601673 = score(doc=4884,freq=2.0), product of:
            0.09596372 = queryWeight, product of:
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.02940506 = queryNorm
            0.36057037 = fieldWeight in 4884, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.078125 = fieldNorm(doc=4884)
      0.5 = coord(1/2)
    0.019919898 = product of:
      0.039839797 = sum of:
        0.039839797 = weight(_text_:22 in 4884) [ClassicSimilarity], result of:
          0.039839797 = score(doc=4884,freq=2.0), product of:
            0.10297151 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.02940506 = queryNorm
            0.38690117 = fieldWeight in 4884, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.078125 = fieldNorm(doc=4884)
      0.5 = coord(1/2)
  0.22222222 = coord(2/9)

Date: 9. 7.2000 14:06:22

Langville, A.N.; Meyer, C.D.: Google's PageRank and beyond : the science of search engine rankings (2006) 0.01
```
0.008264816 = product of:
  0.07438335 = sum of:
    0.07438335 = sum of:
      0.031141505 = weight(_text_:web in 6) [ClassicSimilarity], result of:
        0.031141505 = score(doc=6,freq=18.0), product of:
          0.09596372 = queryWeight, product of:
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.02940506 = queryNorm
          0.32451332 = fieldWeight in 6, product of:
            4.2426405 = tf(freq=18.0), with freq of:
              18.0 = termFreq=18.0
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.0234375 = fieldNorm(doc=6)
      0.043241847 = weight(_text_:seite in 6) [ClassicSimilarity], result of:
        0.043241847 = score(doc=6,freq=4.0), product of:
          0.16469958 = queryWeight, product of:
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.02940506 = queryNorm
          0.26254982 = fieldWeight in 6, product of:
            2.0 = tf(freq=4.0), with freq of:
              4.0 = termFreq=4.0
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.0234375 = fieldNorm(doc=6)
  0.11111111 = coord(1/9)
```
Abstract

Why doesn't your home page appear on the first page of search results, even when you query your own name? How do other Web pages always appear at the top? What creates these powerful rankings? And how? The first book ever about the science of Web page rankings, "Google's PageRank and Beyond" supplies the answers to these and other questions and more. The book serves two very different audiences: the curious science reader and the technical computational reader. The chapters build in mathematical sophistication, so that the first five are accessible to the general academic reader. While other chapters are much more mathematical in nature, each one contains something for both audiences. For example, the authors include entertaining asides such as how search engines make money and how the Great Firewall of China influences research. The book includes an extensive background chapter designed to help readers learn more about the mathematics of search engines, and it contains several MATLAB codes and links to sample Web data sets. The philosophy throughout is to encourage readers to experiment with the ideas and algorithms in the text. Any business seriously interested in improving its rankings in the major search engines can benefit from the clear examples, sample code, and list of resources provided. It includes: many illustrative examples and entertaining asides; MATLAB code; accessible and informal style; and complete and self-contained section for mathematics review.

Content

Inhalt: Chapter 1. Introduction to Web Search Engines: 1.1 A Short History of Information Retrieval - 1.2 An Overview of Traditional Information Retrieval - 1.3 Web Information Retrieval Chapter 2. Crawling, Indexing, and Query Processing: 2.1 Crawling - 2.2 The Content Index - 2.3 Query Processing Chapter 3. Ranking Webpages by Popularity: 3.1 The Scene in 1998 - 3.2 Two Theses - 3.3 Query-Independence Chapter 4. The Mathematics of Google's PageRank: 4.1 The Original Summation Formula for PageRank - 4.2 Matrix Representation of the Summation Equations - 4.3 Problems with the Iterative Process - 4.4 A Little Markov Chain Theory - 4.5 Early Adjustments to the Basic Model - 4.6 Computation of the PageRank Vector - 4.7 Theorem and Proof for Spectrum of the Google Matrix Chapter 5. Parameters in the PageRank Model: 5.1 The a Factor - 5.2 The Hyperlink Matrix H - 5.3 The Teleportation Matrix E Chapter 6. The Sensitivity of PageRank; 6.1 Sensitivity with respect to alpha - 6.2 Sensitivity with respect to H - 6.3 Sensitivity with respect to vT - 6.4 Other Analyses of Sensitivity - 6.5 Sensitivity Theorems and Proofs Chapter 7. The PageRank Problem as a Linear System: 7.1 Properties of (I - alphaS) - 7.2 Properties of (I - alphaH) - 7.3 Proof of the PageRank Sparse Linear System Chapter 8. Issues in Large-Scale Implementation of PageRank: 8.1 Storage Issues - 8.2 Convergence Criterion - 8.3 Accuracy - 8.4 Dangling Nodes - 8.5 Back Button Modeling
Chapter 9. Accelerating the Computation of PageRank: 9.1 An Adaptive Power Method - 9.2 Extrapolation - 9.3 Aggregation - 9.4 Other Numerical Methods Chapter 10. Updating the PageRank Vector: 10.1 The Two Updating Problems and their History - 10.2 Restarting the Power Method - 10.3 Approximate Updating Using Approximate Aggregation - 10.4 Exact Aggregation - 10.5 Exact vs. Approximate Aggregation - 10.6 Updating with Iterative Aggregation - 10.7 Determining the Partition - 10.8 Conclusions Chapter 11. The HITS Method for Ranking Webpages: 11.1 The HITS Algorithm - 11.2 HITS Implementation - 11.3 HITS Convergence - 11.4 HITS Example - 11.5 Strengths and Weaknesses of HITS - 11.6 HITS's Relationship to Bibliometrics - 11.7 Query-Independent HITS - 11.8 Accelerating HITS - 11.9 HITS Sensitivity Chapter 12. Other Link Methods for Ranking Webpages: 12.1 SALSA - 12.2 Hybrid Ranking Methods - 12.3 Rankings based on Traffic Flow Chapter 13. The Future of Web Information Retrieval: 13.1 Spam - 13.2 Personalization - 13.3 Clustering - 13.4 Intelligent Agents - 13.5 Trends and Time-Sensitive Search - 13.6 Privacy and Censorship - 13.7 Library Classification Schemes - 13.8 Data Fusion Chapter 14. Resources for Web Information Retrieval: 14.1 Resources for Getting Started - 14.2 Resources for Serious Study Chapter 15. The Mathematics Guide: 15.1 Linear Algebra - 15.2 Perron-Frobenius Theory - 15.3 Markov Chains - 15.4 Perron Complementation - 15.5 Stochastic Complementation - 15.6 Censoring - 15.7 Aggregation - 15.8 Disaggregation

RSWK

Google / Web-Seite / Rangstatistik (HEBIS)

Subject

Google / Web-Seite / Rangstatistik (HEBIS)

Hock, R.E.: How to do field searching in Web search engines : a field trip (1998) 0.01

0.00808388 = product of:
  0.03637746 = sum of:
    0.013840669 = product of:
      0.027681338 = sum of:
        0.027681338 = weight(_text_:web in 3601) [ClassicSimilarity], result of:
          0.027681338 = score(doc=3601,freq=2.0), product of:
            0.09596372 = queryWeight, product of:
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.02940506 = queryNorm
            0.2884563 = fieldWeight in 3601, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.0625 = fieldNorm(doc=3601)
      0.5 = coord(1/2)
    0.022536792 = product of:
      0.045073584 = sum of:
        0.045073584 = weight(_text_:22 in 3601) [ClassicSimilarity], result of:
          0.045073584 = score(doc=3601,freq=4.0), product of:
            0.10297151 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.02940506 = queryNorm
            0.4377287 = fieldWeight in 3601, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=3601)
      0.5 = coord(1/2)
  0.22222222 = coord(2/9)

Source: Online. 22(1998) no.3, S.18-22

James, M.: Suchmaschine mit Mehrwert : Mirago (2004) 0.01
```
0.007944052 = product of:
  0.071496464 = sum of:
    0.071496464 = sum of:
      0.013840669 = weight(_text_:web in 2317) [ClassicSimilarity], result of:
        0.013840669 = score(doc=2317,freq=2.0), product of:
          0.09596372 = queryWeight, product of:
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.02940506 = queryNorm
          0.14422815 = fieldWeight in 2317, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.03125 = fieldNorm(doc=2317)
      0.057655793 = weight(_text_:seite in 2317) [ClassicSimilarity], result of:
        0.057655793 = score(doc=2317,freq=4.0), product of:
          0.16469958 = queryWeight, product of:
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.02940506 = queryNorm
          0.35006642 = fieldWeight in 2317, product of:
            2.0 = tf(freq=4.0), with freq of:
              4.0 = termFreq=4.0
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.03125 = fieldNorm(doc=2317)
  0.11111111 = coord(1/9)
```
Abstract

Derzeit tummelt sich eine Vielzahl von Anbietern auf dem Markt für kommerzielle Suchdienste im Internet. Dieser scheint unter den Schwergewichten wie Google, Overture und Espotting aufgeteilt. Doch auch kleinere Unternehmen können sich gegen die Big Player behaupten. Voraussetzung ist ein deutlich erkennbarer Mehrwert. Zu diesen Anbietern zählt das englische Technologieunternehmen Mirago. Das Unternehmen hat sich darauf spezialisiert, riesige Datenmengen zu indexieren und hat dazu eine Reihe von Softwarelösungen entwickelt, die tiefe, organische Webindexe generieren. Attraktive Lösungen für effizientes Online-Marketing runden das Unternehmensportfolio ab. Mirago ist in Großbritannien mit einer Robot-Datenbank von mehr als 100 Millionen britischen Webseiten der größte Suchindex. Mit annähernd zwei Million Suchanfragen täglich zählt das Technologieunternehmen dort zu den zehn größten Suchmaschinen. Seit Mai 2003 betreibt Mirago auch eine Suchmaschine für Deutschland mit einem Suchindex von mehr als 100 Millionen Webseiten. Dank einer eigenen Lösung liefert Mirago in Großbritannien auch Suchergebnisse mit regionaler Eingrenzung. Dieser Service wird in naher Zukunft auch in Deutschland angeboten. Um seinen Index bereitzustellen, nutzt Mirago in seinem Operation Center Zoo Oueryserver mit 400 Gigabytes RAM. Die Systeme sind über eine 100 mbps Glasfaserkabelverbindung an das World Wide Web angeschlossen. Eine Cluster Software Architektur ist die Grundlage für die Mirago Suchmaschine und ermöglicht die parallele Arbeit mit mehreren Workstations in hoher Geschwindigkeit. Zudem wird das System äußerst skalierbar und robust.
Basis der Indexierung ist Miragos Robot "Heinrich". Heinrichs Aufgabe ist es, sich wie ein Webbrowser zu verhalten und Webseiten zu lesen. Bei der Indexierung wird der Inhalt der Seiten analysiert, das Thema bestimmt und der Text mit Links entnommen. Anschließend werden die so gesammelten Informationen in durchsuchbare Indexe umgewandelt. Dabei beachtet Heinrich sowohl das robot.txt-Protokoll als auch die Robot "noindex" und "nofollow" Meta Commands. Sobald die Indexe erstellt sind werden sie an Q3, das Mirago Ouery System, weitergegeben. Wie auch andere führende Suchmaschinen indexiert Mirago dabei mehr als nur die Worte auf einer Seite. Beinahe ohne Ausnahme benutzen die großen Suchmaschinen die Links zwischen Seiten wie auch den Text auf diesen Links, um die Wichtigkeit einer Webseite und ihre Rankingposition zu bestimmen. Mirago geht einen Schritt weiter, indem weiterführende Links der jeweiligen Seiten zur Bestimmung der Relevanz hinzugezogen werden. Sind die weiterführenden Seiten themenverwandt, so wird die Relevanz der Ursprungsseite automatisch höher eingestuft. Auch rechnet Miragos Technologie die Aktualisierungsfrequenz der Seiten mit ein und berücksichtigt, wie tief die relevanten Informationen in der Seite verborgen sind. Q3 ermöglicht es außerdem, Informationen zu suchen, die aus Datenbanksystemen stammen. Diese enthalten dynamische Inhalte, die von herkömmlichen Robots wie Heinrich nicht gelesen und damit nicht in den Webindex aufgenommen werden können. Über ein Trusted Feeds Programm, das von ausgesuchten Resellern verwaltet wird, können Sites mit dynamischen Inhalten wie Jobbörsen oder Auktionen, ihre Daten zur automatischen Aufnahme in Miragos durchsuchbaren Index übermitteln. Durch einen separaten Robot werden diese Feeds indexiert und unabhängig vom normalen Webindex tagtäglich aktualisiert.
Hähle, S.: Verborgenes Entdecken (2005) 0.01
```
0.007943173 = product of:
  0.07148855 = sum of:
    0.07148855 = sum of:
      0.027355025 = weight(_text_:web in 34) [ClassicSimilarity], result of:
        0.027355025 = score(doc=34,freq=20.0), product of:
          0.09596372 = queryWeight, product of:
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.02940506 = queryNorm
          0.2850559 = fieldWeight in 34, product of:
            4.472136 = tf(freq=20.0), with freq of:
              20.0 = termFreq=20.0
            3.2635105 = idf(docFreq=4597, maxDocs=44218)
            0.01953125 = fieldNorm(doc=34)
      0.044133525 = weight(_text_:seite in 34) [ClassicSimilarity], result of:
        0.044133525 = score(doc=34,freq=6.0), product of:
          0.16469958 = queryWeight, product of:
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.02940506 = queryNorm
          0.2679638 = fieldWeight in 34, product of:
            2.4494898 = tf(freq=6.0), with freq of:
              6.0 = termFreq=6.0
            5.601063 = idf(docFreq=443, maxDocs=44218)
            0.01953125 = fieldNorm(doc=34)
  0.11111111 = coord(1/9)
```
Abstract

Die interessantesten Infos im Web herauszufiltern, ist gar nicht so einfach. Doch mit den folgenden Tipps entdecken Sie vielleicht sogar das eine oder andere Geheimnis.

Content

"Oft hört man: "Suchen im Web - das kann doch jeder." Doch immer wieder erreichen uns Zuschriften, in denen uns Leser ihr Leid darüber klagen, dass sie im Datendschungel des Internets nicht die Informationen erhielten, die sie eigentlich interessieren würden. Wenn es Ihnen auch so geht, helfen ihnen hoffentlich die folgenden Tipps und Tricks. Wie Suchmaschinen denken Die meisten Suchmaschinen bestehen aus drei Teilen. Der erste ist der Informationssammler, Robot, Spider oder auch Crawler genannt. Er surft automatisch auf Webseiten und schickt die gesammelten Daten an den Index. Dieser ist das Verzeichnis aller Webseiten, die die Suchmaschine kennt. Der zweite Teil ist die Indizierungs-Software, die die Daten strukturiert und durchsuchbar macht. Eine dritte Software wertet die Suchanfrage aus. Sie schickt die Anfrage an den Index-Rechner, der die Ergebnisse präsentiert. Hierbei berücksichtigt sie meist auch, an welcher Stelle der Suchbegriff im Dokument steht. Wenn das Suchwort in der Beschreibung der Webseite vorkommt, wird es höher gewichtet, als wenn es im Text der Seite steht. Eine Besonderheit ist das PageRank-System von Google. Je mehr Links auf eine Seite verweisen, umso wichtiger ist sie. Je wichtiger wiederum die verweisenden Seiten sind, umso größer der positive Effekt für ein Suchergebnis. Suchanfragen richtig stellen Es macht wenig Sinn, nach einem häufigen Begriff wie "Musik" zu suchen. Sie müssen schon genauer angeben, nach was Sie suchen, etwa "achtziger Jahre" oder "MP3 Download". Überlegen Sie außerdem, welche Begriffe Sie von der Suche explizit ausschließen können. Eine Suche sollte dennoch nicht mit zu vielen verknüpften Begriffen beginnen. Ein schrittweises Eingrenzen bietet sich an. Oft ist es auch hilfreich, die Wörter leicht zu variieren. Spezielle Suchdienste Wenn Sie wissen, in welchem Fachgebiet Sie Information suchen, sollten Sie eine Spezial-Suchmaschine probieren. Die Portalseite Klug Suchen (www.klug-suchende) und das Suchlexikon (www.suchlexikon.de) verzeichnen eine große Menge besonderer Suchdienste für das deutschsprachige Internet. Weitere Spezialisten, vor allem im amerikanischen Raum, listet The Big Hub (www.thebighub.com) auf. Metasuchmaschinen Metasuchmaschinen suchen in mehreren Suchmaschinen auf einmal, um mehr oder gezieltere Ergebnisse zu erhalten. Ob sich der Einsatz lohnt, müssen Sie von Fall zu Fall entscheiden. Die bekanntesten Metasuchmaschinen für das deutschsprachige Netz sind Metacrawler (www.metacrawler.de) sowie MetaGer (www.metager.de).
In anderen Ländern suchen Die Yahoo-Suche (http://suche.yahoo.de) verfügt über eine Möglichkeit, fremdsprachige Websites ohne Kenntnisse der Fremdsprache zu durchsuchen. Wenn die Option "Suche Translator" aktiviert ist, übersetzt Yahoo deutsche Suchbegriffe automatisch ins Englische und Französische, um die Suche mit den fremdsprachigen Begriffen zu erweitern. Anschließend zeigt es alle Ergebnisse in deutscher Sprache an. Übersetzte Seiten sind mit einem Globus gekennzeichnet. Lesezeichen online ordnen Ein praktisches Tool, um gesammelte Informationen im Web zu organisieren, ist Yahoo Mein Web. Dabei handelt es sich um eine kostenlose Online-Lesezeichenverwaltung, die mit allen aktuellen Browsern funktioniert. Ergebnisse der Yahoo-Suche können in Ordnern abgelegt und mit privaten Notizen versehen werden. Der Zugang zu den Bookmarks ist über die Yahoo-ID und das zugehörige Passwort geschützt. Da der Dienst Kopien der gemerkten Webseiten anlegt, sind diese auch dann erreichbar, wenn sie nicht mehr im Web existieren. Über eine Volltextsuche lassen sich alle Ordner durchsuchen. Mein Web finden Sie unter der Webadresse: http://meinweb.yahoo.de. MP3s im Web finden Musikdateien gibt's nicht nur in Internet-Tauschbörsen. Ganz legal kann man Sie bei Webdiensten wie AOL Musik Downloads (http://mu sikdownloads.aol.de), Apple iTunes (www. appie.com/de/itunes) oder T-Online Musicload (www.musicload.de) herunterladen -allerdings nicht kostenlos. Insider nutzen noch eine andere Variante: Wenn Anwender ihre MP3s online-Sicherheitsvorkehrungen im Web ablegen, schlagen sie zu. Mit Google lassen sich die Musikdateien sehr schnell aufspüren. Dazu geben die Experten "index of /mp3" ins Suchfeld ein. Die Suchanfrage lässt sich um Künstler, Liedtitel oder Album ergänzen, um noch bessere Ergebnisse zu erzielen. Bedenken Sie dabei, dass es verboten ist, urheberrechtlich geschütztes Material aus dem Internet herunterzuladen!
Private Bilder aufspüren Wo ungeschützte Musikverzeichnisse liegen, gibt es auch Bildarchive, auf die eigentlich niemand zugreifen soll. Doch Google hilft dabei. Wer beispielsweise "index of /images/girls" eingibt, findet so manche Privatsachen. Die Kombination von "index of /images/" mit anderen Begriffen fördert noch mehr geheime Bilder zu Tage. Zwar bietet heute fast jede Suchmaschine eine Bildersuche an, doch es gibt eine, die sehr schnell ist und besonders viele Ergebnisse liefert: www.alltheweb.com. Über "customize preferences" auf der Startseite können Sie den "Offensive content filter" abschalten, um noch mehr Suchergebnisse zu erhalten. Gesperrte Seiten anzeigen Die Betreiber von Websites können Suchmaschinen dazu bringen, bestimmte Seiten ganz einfach von der Indizierung auszunehmen. In der Datei "robots.txt", die zu jeder Website gehört, steht dann "Disallow:", gefolgt von der Seite, die nicht gefunden werden soll. Mit der Suchanfrage robots ext:txt suchen Profis nach "robots.txt"-Dateien. Dann kopieren sie die Webadressen gesperrter Webseiten ("Strg + C"), um sie in die Adresszeile des Browsers einzufügen ("Strg + V"). Und schon erscheint die Webseite, die niemand finden soll. Geheimnisse entdecken Wer Word- und Excel-Dokumente (".doc", ".xls") oder PowerPoint-Präsentationen (".ppt") ungeschützt ins Internet legt, der ermöglicht jedermann den Diebstahl der Daten. Dass dieser mit Google ganz einfach ist, überrascht dennoch. So genügen Eingaben wie ext:doc vertraulich ext:ppt confidential [Suchbegriff] ext:xls umsatz um interessante Firmendokumente aufzuspüren, die nicht für die Öffentlichkeit bestimmt sind. Suchen ohne Suchmaschinen Nicht immer sind Suchmaschinen die beste Möglichkeit, um Informationen im Web aufzuspüren. Suchen Sie etwa eine Begriffserklärung, ist es sinnvoll, erst einmal in einem Online-Lexikon wie Wikipedia (www.wikipedia.de) nachzuschlagen oder bei www.wissen.de nachzusehen. Wollen Sie wissen, ob ein Zug oder ein Flug pünktlich ankommt, weil Sie jemanden abholen müssen, sehen Sie unter http://reiseauskunft.bahn.de/bin/bhftafel.exe/ dn? oder www.flugplandaten.de nach. Übrigens: Eine gepflegte Link-Sammlung ist meistens besser, als ständig aufs Neue zu suchen. Und oftmals genügt es, einen Begriff als Webadresse auszuprobieren, um an die gewünschten Informationen zu kommen, etwa: www.fahrplanauskunft.de, www.nachrichten.de oder www.sport.de."

Series

Online: Geheime Web-Tricks
Drabenstott, K.M.: Web search strategies (2000) 0.01
```
0.007922065 = product of:
  0.035649296 = sum of:
    0.027681338 = product of:
      0.055362675 = sum of:
        0.055362675 = weight(_text_:web in 1188) [ClassicSimilarity], result of:
          0.055362675 = score(doc=1188,freq=32.0), product of:
            0.09596372 = queryWeight, product of:
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.02940506 = queryNorm
            0.5769126 = fieldWeight in 1188, product of:
              5.656854 = tf(freq=32.0), with freq of:
                32.0 = termFreq=32.0
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.03125 = fieldNorm(doc=1188)
      0.5 = coord(1/2)
    0.007967959 = product of:
      0.015935918 = sum of:
        0.015935918 = weight(_text_:22 in 1188) [ClassicSimilarity], result of:
          0.015935918 = score(doc=1188,freq=2.0), product of:
            0.10297151 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.02940506 = queryNorm
            0.15476047 = fieldWeight in 1188, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.03125 = fieldNorm(doc=1188)
      0.5 = coord(1/2)
  0.22222222 = coord(2/9)
```
Abstract

Surfing the World Wide Web used to be cool, dude, real cool. But things have gotten hot - so hot that finding something useful an the Web is no longer cool. It is suffocating Web searchers in the smoke and debris of mountain-sized lists of hits, decisions about which search engines they should use, whether they will get lost in the dizzying maze of a subject directory, use the right syntax for the search engine at hand, enter keywords that are likely to retrieve hits an the topics they have in mind, or enlist a browser that has sufficient functionality to display the most promising hits. When it comes to Web searching, in a few short years we have gone from the cool image of surfing the Web into the frying pan of searching the Web. We can turn down the heat by rethinking what Web searchers are doing and introduce some order into the chaos. Web search strategies that are tool-based-oriented to specific Web searching tools such as search en gines, subject directories, and meta search engines-have been widely promoted, and these strategies are just not working. It is time to dissect what Web searching tools expect from searchers and adjust our search strategies to these new tools. This discussion offers Web searchers help in the form of search strategies that are based an strategies that librarians have been using for a long time to search commercial information retrieval systems like Dialog, NEXIS, Wilsonline, FirstSearch, and Data-Star.

Content

"Web searching is different from searching commercial IR systems. We can learn from search strategies recommended for searching IR systems, but most won't be effective for Web searching. Web searchers need strate gies that let search engines do the job they were designed to do. This article presents six new Web searching strategies that do just that."

Date

22. 9.1997 19:16:05

Fong, W.W.: Searching the World Wide Web (1996) 0.01

0.007891018 = product of:
  0.03550958 = sum of:
    0.019573662 = product of:
      0.039147325 = sum of:
        0.039147325 = weight(_text_:web in 6597) [ClassicSimilarity], result of:
          0.039147325 = score(doc=6597,freq=4.0), product of:
            0.09596372 = queryWeight, product of:
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.02940506 = queryNorm
            0.4079388 = fieldWeight in 6597, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.0625 = fieldNorm(doc=6597)
      0.5 = coord(1/2)
    0.015935918 = product of:
      0.031871837 = sum of:
        0.031871837 = weight(_text_:22 in 6597) [ClassicSimilarity], result of:
          0.031871837 = score(doc=6597,freq=2.0), product of:
            0.10297151 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.02940506 = queryNorm
            0.30952093 = fieldWeight in 6597, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=6597)
      0.5 = coord(1/2)
  0.22222222 = coord(2/9)

Abstract: Reviews the availability on the WWW, of search engines designed to organize various web information sources. Discusses the differences and similarities of each search engine and their advantages and disadvantages. Search engines included in the study were: AltaVista, CUI W3 Catalog, InfoSeek, Lycos, Magellan, Yahoo
Source: Journal of library and information science. 22(1996) no.1, S.15-36

Duval, B.K.; Main, L.: Searching on the Net : general overview (1996) 0.01

0.007891018 = product of:
  0.03550958 = sum of:
    0.019573662 = product of:
      0.039147325 = sum of:
        0.039147325 = weight(_text_:web in 7268) [ClassicSimilarity], result of:
          0.039147325 = score(doc=7268,freq=4.0), product of:
            0.09596372 = queryWeight, product of:
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.02940506 = queryNorm
            0.4079388 = fieldWeight in 7268, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.0625 = fieldNorm(doc=7268)
      0.5 = coord(1/2)
    0.015935918 = product of:
      0.031871837 = sum of:
        0.031871837 = weight(_text_:22 in 7268) [ClassicSimilarity], result of:
          0.031871837 = score(doc=7268,freq=2.0), product of:
            0.10297151 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.02940506 = queryNorm
            0.30952093 = fieldWeight in 7268, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=7268)
      0.5 = coord(1/2)
  0.22222222 = coord(2/9)

Abstract: First of a 3 part series discussing how to access and use Web search engines on the Internet. Distinguishes between FTP sites, Gopher sites, Usenet News sites and Web sites. Considers subject searching versus keyword; how to improve search strategies and success rates; bookmarks; Yahoo!, Lycos; InfoSeek; Magellan; Excite; Inktomi; HotBot and AltaVista
Date: 6. 3.1997 16:22:15

Search (704 results, page 2 of 36)

Authors

Years

Languages

Types

Themes

Subjects

Classifications