Search (168 results, page 1 of 9)

Hosbach, W.: ¬Die Suche denkt mit : Moderne Suchtechnologien (2006) 0.01
```
0.012683173 = product of:
  0.088782206 = sum of:
    0.04538781 = weight(_text_:bedeutung in 4885) [ClassicSimilarity], result of:
      0.04538781 = score(doc=4885,freq=14.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.36758357 = fieldWeight in 4885, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.01953125 = fieldNorm(doc=4885)
    0.043394394 = weight(_text_:semantik in 4885) [ClassicSimilarity], result of:
      0.043394394 = score(doc=4885,freq=4.0), product of:
        0.16513813 = queryWeight, product of:
          6.727074 = idf(docFreq=143, maxDocs=44218)
          0.024548283 = queryNorm
        0.26277635 = fieldWeight in 4885, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          6.727074 = idf(docFreq=143, maxDocs=44218)
          0.01953125 = fieldNorm(doc=4885)
  0.14285715 = coord(2/14)
```
Abstract

Google und Co. sind auf dem Weg in die Sackgasse. Die Zukunft gehört der Suche mit Intelligenz und Bedeutung. Denn dann hat die Suche Sinn und Verstand

Content

"Stellen Sie sich vor, ein Fremder bittet Sie in seiner Sprache um Hilfe. Sie verstehen: "Drink" und "Bier". Wenn Sie in München leben, schicken Sie den Mann auf dem schnellsten Weg ins Hofbräuhaus. Google würde ebenso handeln: Die meisten Suchenden, die "Drink Bier" von sich geben, suchen das Hofbräuhaus (Popularitätsprinzip). Aber vielleicht wollte er wissen, wo er eine Flasche Bier kaufen kann oder ob Sie ein Bier mit ihm trinken möchten? Sie haben ihn Schlichtweg nichtverstanden. So geht es den Suchmaschinen auch. Umso erstaunlicher ist es, wie präzise deren Antworten oft sind. Wenn man aber etwas sucht, was nicht dem Popularitätsprinzip entspricht, was also vom Suchen der Vielen abweicht, so steht man vor Zehntausenden von Treffern. Besser wäre es, wenn die Suchmaschine versteht, was man sucht. Wenn sie etwas von der Bedeutung der Sucheingabe und der Bedeutung der Webseiten wüsste. Aber die steht in den Seiten nicht drin. Eine komplette Bedeutungshierarchie müsste dem jetzigen Web hinzugefügt werden. Im Kleinen gibt es Ansätze dazu unter dem Namen Semantic Web (www w3. org/2001/sw; in der Sprachwissenschaft beschäftigt sich die Semantik mit der Bedeutung). Der Autor fügt HTML-Dokumenten die Bedeutung in Form von XML-Metatags zu. Ein Beispiel für RDF ist RDF Site Summary (RSS). Eine RSS-Webseite (z.B. www.pc-magazin .de) bietet Nachrichten. Im Gegensatz zu einer normalen Nachrichtenseite sind über XML-Tags Bedeutungen zugefügt. <title> bedeutet: Hier folgt eine Überschrift, <description>: Hier folgt die Inhaltsangabe. Ein RSS Reader (z.B. Thunderbird) kann nun ganz klar erkennen, was eine Überschrift ist, und muss sie nicht über Standardelemente (<b>, <h1>) erraten. Eine andere semantische Anwendung könnte ein Musiker-Netz sein mit Bedeutungs-Tags für Instrumente, Konzerte, Terminen, Downloads etc. Hier könnte man mit entsprechenden Programmen (Browser-Extensions) sehr viel präziser suchen. Eine Besonderheit ist, das RSS auch über Hyperlinks arbeitet. Metainformationen müssen sich nicht auf der Seite selbst finden, sondern eine andere Seite kann sie aufführen. So erschließt sich eine Interessensgruppe fremde Ressourcen und bringt sie in einen eigenen Bedeutungszusammenhang, der vom Autor einer Seite vielleicht nicht gesehen oder nicht einmal gewollt wurde.
Mehr Intelligenz Semantik bedeutet bislang Handarbeit. Das ist lästig und kostspielig. Der Computer soll die Bedeutung bitte selbst verstehen! Im Forschungsbereich der Künstlichen Intelligenz (KI) arbeiten Wissenschaftler auch an derVerbesserung der Suche. Die Forscher vom Fraunhofer Institut für Integrierte Publikations- und Informationssysteme unter der Leitung von Prof. Thomas Hofmann haben ein Verfahren vorgestellt, das Konzepte von Texten extrahiert. "Konzepte bilden eine Brücke zwischen der Ausdrucksweise in einem Dokument und der in der Anfrage", erläutert Hofmann seinen Ansatz. So findet der Suchende alle relevanten Dokumente, selbst wenn die Suchbegriffe nicht direkt vorkommen. Das funktioniert derzeit nur in einem thematisch begrenzten Raum, z.B. einem Webauftritt über Medizin, Handel, Hardware... Bevor die Suchmaschine die Dokumente indiziert, errechnet sie die Konzepte aus einer begrenzten Sammlung an Dokumenten. Diese hat der Betreuer des Systems so ausgewählt, dass sie für das Themengebiet und den Webauftritt charakteristisch sind. Mit Methoden der Statistik und Wahrscheinlichkeitsrechnung (Probabilistic Latent Semantic Analysis; kurz pLSA) extrahiert der Roboter einige hundert bis tausend Konzepte. Die bestehen aus Begriffen und deren Art, gemeinsam in Dokumenten aufzutreten (Häufigkeit, Ort, Beziehung etc.) Für das Beispiel Handel gibt es etwa ein Konzept für Import oder eines für Buchhaltung. Stehen die Konzepte fest, erstellt die Suchmaschine den Index, indem sie alle Dokumente der Domäne den Konzepten zuordnet. Wenn der Anwender nun sucht, so versucht die Suchmaschine, die Anfrage ebenfalls Konzepten zuzuordnen, und wählt dementsprechend die Ergebnisse aus. Hoffmanns System ist auf der Webseite www.medlineplus.com im Einsatz. Gibt der Anwender z.B. +bird +flu ein, so sucht die Suchmaschine genau die Worte - ohne +, jedoch mit Konzept. Die Frage, ob eine konzeptbasierte Suchmaschine für das ganze Web möglich ist, bezweifelt Hofmann derzeit: "Das ist eine Frage der Skalierbarkeit. Die statistische Analyse ist nicht ganz trivial und braucht eine entsprechende Rechenleistung. Auf lange Sicht wird das aber kommen.
Im Web müsste die KI-Suchmaschine Hunderttausende von Konzepten bewältigen. Das ist kostspielig. Eine intelligente Suche wäre pro Anfrage vielleicht zehnmal teuerer als eine jetzige, bei vielen Millionen täglichen Anfragen ist das ein erheblicher Kostenfaktor. Dennoch laufen bei Google Entwicklungen in diese Richtung. Der Marktführer muss Technologieführer bleiben, um zu überleben. Mehr Sprache Die KI arbeitet daran, die Sprache immer besser zu verstehen, bis hin zur Möglichkeit, Fakten ausSätzen zu extrahieren. Das erfordert eine genaue gramma tikalische und semantische Analyse. Auch da haben sichstatistische Verfahren durchgesetzt, die eine große Menge an Sätzen auswerten. Das öffnet auch Wege zum automatischen Übersetzen von Sprachen, was wieder für die Suche relevant ist. An die Grenzen kommt die KI dann, wenn sie Fakten aus mehreren Dokumenten zusammensetzen soll- also Bedeutung im synthetischen Schluss aus verschiedenen Quellen extrahieren. Ebenso wenig kann die KI etwas über die Glaubwürdigkeit einer Quelle sagen. Das schaffen wir als Menschen ja oft kaum. Es gibt auch Methoden, mit denen Suchmaschinen den Suchenden besser verstehen. Sucht er z.B. nach Flügel, so weiß das Tool erst einmal nicht, ob ein Instrument, ein Gebäude, ein Vogel oder ein Flugzeug gemeint ist. Das könnte die Suchmaschine aber vermuten, wenn sie den Anwender besser kennt: Ist er Musiker oder Flugzeugkonstrukteur? Mit KI könnte sie das lernen, z.B. aus seinen bisherigen Suchanfragen (Orchester oder Triebwerke?). Sie könnte auch die Festplatte des Anwenders durchsuchen, um anhand der Dokumente festzustellen, womit der Suchende sich beschäftigt und was ihn interessiert. Das interessiert aber auch das Finanzamt und Adresshändler. Viele Anwender werden Probleme mit der Vertraulichkeit ihrer Daten sehen. Bei einer Internet-Suchmaschine müssten die Informationen als Profile auf dem Server liegen. Wer will das schon?"

Koenemann, J.; Lindner, H.-G.; Thomas, C.: Unternehmensportale : Von Suchmaschinen zum Wissensmanagement (2000) 0.01

0.0075465906 = product of:
  0.052826133 = sum of:
    0.048033938 = weight(_text_:bedeutung in 5233) [ClassicSimilarity], result of:
      0.048033938 = score(doc=5233,freq=2.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.38901386 = fieldWeight in 5233, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5233)
    0.0047921934 = product of:
      0.019168774 = sum of:
        0.019168774 = weight(_text_:j in 5233) [ClassicSimilarity], result of:
          0.019168774 = score(doc=5233,freq=2.0), product of:
            0.07800208 = queryWeight, product of:
              3.1774964 = idf(docFreq=5010, maxDocs=44218)
              0.024548283 = queryNorm
            0.24574696 = fieldWeight in 5233, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.1774964 = idf(docFreq=5010, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5233)
      0.25 = coord(1/4)
  0.14285715 = coord(2/14)

Abstract: Aufgabe des Wissensmanagements ist es, den Mitarbeitern im Unternehmen entscheidungs- und handlungsrelevante Informationen bereitzustellen und die Mitarbeiter bei der intelligenten Verarbeitung dieser Informationen zu unterstützen. Ein hierzu genutztes Werkzeug von wachsender Bedeutung sind Unternehmensportale. Wir beschreiben kurz die Entwicklung von Portalen im World Wide Web (WWW), um dann Web-Portale von verschiedenen Arten von Unternehmensportalen abzugrenzen. Wir zeigen erwartete Funktionalitäten auf und stellen ein 5-Schichten Modell einer Gesamtarchitektur für Portale dar, welche die wesentlichen Komponenten umfasst. Im Anschluss werden die Besonderheiten der organisatorischen Realisierung und im Ausblick der Übergang von Portalen zum ,ubiquitous personalized information supply", der überall verfügbaren und individuellen Informationsversorgung behandelt

Gasser, U.; Thurman, J.: Themen und Herausforderungen der Regulierung von Suchmaschinen (2007) 0.01
```
0.0064685065 = product of:
  0.045279544 = sum of:
    0.04117195 = weight(_text_:bedeutung in 382) [ClassicSimilarity], result of:
      0.04117195 = score(doc=382,freq=2.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.33344045 = fieldWeight in 382, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.046875 = fieldNorm(doc=382)
    0.0041075945 = product of:
      0.016430378 = sum of:
        0.016430378 = weight(_text_:j in 382) [ClassicSimilarity], result of:
          0.016430378 = score(doc=382,freq=2.0), product of:
            0.07800208 = queryWeight, product of:
              3.1774964 = idf(docFreq=5010, maxDocs=44218)
              0.024548283 = queryNorm
            0.21064025 = fieldWeight in 382, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.1774964 = idf(docFreq=5010, maxDocs=44218)
              0.046875 = fieldNorm(doc=382)
      0.25 = coord(1/4)
  0.14285715 = coord(2/14)
```
Abstract

Mit der rasanten Entwicklung der Suchmaschinentechnologien sowie der wachsenden Marktkraft von einzelnen Suchmaschinenanbietern und deren steigender Bedeutung im Blick auf den Informationszugang verändert sich nicht nur die Anzahl, sondern auch die Qualität derjenigen Konflikte, welche die Gerichte, Gesetzgeber und Behörden in den USA und in Europa beschäftigen. Das vorliegende Kapitel zeichnet - basierend auf einer andernorts vorgelegten Detailanalyse - in groben Umrissen diese Geschichte der Entstehung eines >Rechts der Suchmaschinen< nach und diskutiert sodann ausführlicher, welche Debattenthemen in der sich entfaltenden Regulierungsdiskussion eine besonders prominente Rolle spielen und die eher punktuellen rechtlichen Interventionen aus der ersten Regulierungswelle abzulösen scheinen. Daran anschließend werden die zentralen Herausforderungen beleuchtet, welchen sich nationale Gesetzgeber bei ihren Regulierungsbemühungen gegenüber sehen. Im letzten Teil des Kapitels wird der Bedarf nach einer systematischen Evaluation von alternativen (und teilweise konkurrierenden) Ansätzen der Suchmaschinenregulierung illustriert und zum Schluss grundlegende Wertungen eines demokratisch strukturierten informationellen Ökosystems diskutiert, aus welchen normative Kriterien für die kritische Beurteilung von nunmehr in steigender Kadenz vorgelegten Vorschlägen zur >Suchmaschinen-Governance< abgeleitet werden können.

Trkulja, V.: Suche ist überall, Semantic Web setzt sich durch, Renaissance der Taxonomien (2005) 0.01

0.005881707 = product of:
  0.0823439 = sum of:
    0.0823439 = weight(_text_:bedeutung in 3295) [ClassicSimilarity], result of:
      0.0823439 = score(doc=3295,freq=2.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.6668809 = fieldWeight in 3295, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.09375 = fieldNorm(doc=3295)
  0.071428575 = coord(1/14)

Abstract: Ein Schwerpunkt der Online Information 2004 bildete das Thema "Search": Wie wird die Suche in 2005 aussehen? Welche Bedeutung haben Taxonomien? Wie verändern sich Suchfunktionen?

Sadrozinski, J.: Suchmaschinen und öffentlich-rechtlicher Onlinejournalismus am Beispiel tagesschau.de (2007) 0.01
```
0.005390422 = product of:
  0.03773295 = sum of:
    0.034309957 = weight(_text_:bedeutung in 375) [ClassicSimilarity], result of:
      0.034309957 = score(doc=375,freq=2.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.27786705 = fieldWeight in 375, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.0390625 = fieldNorm(doc=375)
    0.003422995 = product of:
      0.01369198 = sum of:
        0.01369198 = weight(_text_:j in 375) [ClassicSimilarity], result of:
          0.01369198 = score(doc=375,freq=2.0), product of:
            0.07800208 = queryWeight, product of:
              3.1774964 = idf(docFreq=5010, maxDocs=44218)
              0.024548283 = queryNorm
            0.17553353 = fieldWeight in 375, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.1774964 = idf(docFreq=5010, maxDocs=44218)
              0.0390625 = fieldNorm(doc=375)
      0.25 = coord(1/4)
  0.14285715 = coord(2/14)
```
Abstract

Während ich diese Zeilen schreibe, hat Google gerade die Videoplattform YouTube gekauft - ein weiterer Baustein auf dem Weg zum sowohl marktbeherrschenden Instrument als auch dominierenden Anbieter im Internet. Die FAZ vermutet, dass sich die Fernsehlandschaft durch den »Google-Coup« verändern wird. Doch nicht erst seit dieser Entwicklung müssten sich die öffentlich-rechtlichen Rundfunkanstalten und insbesondere die Onlineredaktionen Gedanken über ihren Umgang mit Suchmaschinen und -portalen machen. Ich habe nun gleich zu Beginn dieses Kapitels das Thema >Suchmaschinen< auf Google reduziert. Über Suchmaschinen zu schreiben heißt jedoch, sich in erster Linie mit Google auseinander zu setzen. Google ist das meistgenutzte, reichweitenstärkste, wertvollste Medienunternehmen der Welt. Und Google ist auch bei tagesschau.de, der zentralen Online-Nachrichtenredaktion der ARD, die meistgenutzte Suchmaschine. Google ist für uns einerseits Rechercheinstrument, andererseits ist es für viele Nutzer Zugangsportal zu unseren Inhalten (über die Treffer bei der Suche oder über den Service >Google News<). Google hat somit eine doppelte Bedeutung für die journalistische Arbeit bei tagesschau.de: Die Qualität und die Quantität der Suchergebnisse, die durch die Benutzung von Google als Suchinstrument erzielt werden, können unsere Berichterstattung beeinflussen. Die Treffer wiederum, die auf Inhalte bei tagesschau.de führen, sorgen dafür, dass unsere Artikel häufiger gefunden und gelesen werden.
Lewandowski, D.: Web Information Retrieval : Technologien zur Informationssuche im Internet (2005) 0.01
```
0.0053827777 = product of:
  0.03767944 = sum of:
    0.036310244 = weight(_text_:bedeutung in 3635) [ClassicSimilarity], result of:
      0.036310244 = score(doc=3635,freq=14.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.29406685 = fieldWeight in 3635, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.015625 = fieldNorm(doc=3635)
    0.0013691981 = product of:
      0.0054767923 = sum of:
        0.0054767923 = weight(_text_:j in 3635) [ClassicSimilarity], result of:
          0.0054767923 = score(doc=3635,freq=2.0), product of:
            0.07800208 = queryWeight, product of:
              3.1774964 = idf(docFreq=5010, maxDocs=44218)
              0.024548283 = queryNorm
            0.070213415 = fieldWeight in 3635, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.1774964 = idf(docFreq=5010, maxDocs=44218)
              0.015625 = fieldNorm(doc=3635)
      0.25 = coord(1/4)
  0.14285715 = coord(2/14)
```
Abstract

Verfahren des Information Retrieval haben in den letzten Jahren eine enorme Bedeutung erlangt. Während diese Verfahren jahrzehntelang nur Einsatz in spezialisierten Datenbanken fanden, haben sie durch das Aufkommen von Suchmaschinen im World Wide Web mittlerweile eine zentrale Bedeutung in der Informationsversorgung eingenommen. Verfahren des Web Information Retrieval entscheiden darüber, welche Informationen von Nutzern gefunden werden; man spricht auch von einer "Gatekeeper"-Funktion der Suchmaschinen. Diese sind zum bedeutendsten Rechercheinstrument sowohl im privaten, beruflichen als auch wissenschaftlichen Bereich avanciert. Google, die berühmteste der "Information-Retrieval-Firmen", ist fast täglich in den Schlagzeilen zu finden. Immer neue Innovationen (nicht nur dieses Anbieters) zeigen die Web-Suche als dynamisches Feld. Vor allem wird durch die zahlreichen Neuerungen der letzten Jahre, teilweise erst der letzten Monate, deutlich, dass die Suche im Web trotz ihrer mittlerweile fast zehnjährigen Geschichte erst am Anfang steht. Dass dem Web Information Retrieval eine hohe Bedeutung zugemessen wird, zeigt sich auch im wachsenden Interesse kommerzieller Unternehmen an diesem Thema. Ein Blick auf die Sponsorenliste der letztjährigen Konferenz der ACM Special Interest Group on Information Retrieval mag dies verdeutlichen: Neben den wichtigen Suchmaschinen-Anbietern Google, Microsoft, Yahoo und Ask Jeeves finden sich auch Großunternehmen wie IBM, Canon und Sharp. Auch in der gesellschaftlichen Diskussion sind die Suchmaschinen angekommen: Es findet gegenwärtig eine Diskussion um die "Google-Gesellschaft" statt, wobei gefragt wird, inwieweit ein einzelner Anbieter bzw. wenige Anbieter darüber entscheiden sollten, welche Informationen beim Nutzer angelangen. In dieser Hinsicht befassen sich inzwischen auch politische Parteien mit dem Thema. So publizierte etwa die Gründe Bundestagsfraktion ein Diskussionspapier unter dem Titel "Suchmaschinen: Tore zum Netz", in welchem unter anderem die Rolle der Suchmaschinen beim Zugang zu Informationen und Probleme des Datenschutzes bei der Suchmaschinennutzung angesprochen werden.
Die Arbeit konzentriert sich neben der Darstellung des Forschungsstands im Bereich des Web Information Retrieval auf einen nutzerzentrierten Ansatz des Aufbaus von Suchmaschinen, der sich aus dem Retrieval in klassischen Datenbanken herleitet. Als zentral für eine erfolgreiche Recherche wird dabei die Möglichkeit der gezielten Beschränkung der Recherche durch den Nutzer gesehen; die wichtigsten Faktoren sind hierbei die Einschränkung nach Aktualität, Qualität und die verbesserte Dokumentauswahl aufgrund einer erweiterten Dokumentrepräsentation. Alle drei Möglichkeiten sind in bisher verfügbaren Suchmaschinen nicht zufrieden stellend implementiert. Ein Problem bei der Bearbeitung des Themas ergab sich aus der Tatsache, dass die Forschung im Bereich Web Information Retrieval zu einem großen Teil bei den Anbietern selbst stattfindet, die darauf bedacht sind, ihre Erkenntnisse nicht zu veröffentlichen und damit der Konkurrenz zu überlassen. Viele Forschungsergebnisse können daher nur anhand der fertiggestellten Anwendungen rekonstruiert werden; hilfreich waren in manchen Fällen auch die von den Suchmaschinenbetreibern angemeldeten Patente, die für die vorliegende Arbeit ausgewertet wurden. Insgesamt zeigt sich, dass eine neue Form des Information Retrieval entstanden ist. Ziele des klassischen Information Retrieval wie die Vollständigkeit der Treffermenge verlieren ob der schieren Masse der zurückgegebenen Treffer an Bedeutung; dafür werden Faktoren der Qualitätsbewertung der Dokumente immer wichtiger. Das Web Information Retrieval setzt auf dem klassischen Information Retrieval auf und erweitert dieses wo nötig. Das Ziel bleibt aber weitgehend das gleiche: Dem Nutzer die für die Befriedigung seines Informationsbedürfnisses besten Ergebnisse zu liefern. Neben der Informationswissenschaft findet die Information-Retrieval-Forschung hauptsächlich in der Informatik statt. Der informationswissenschaftlichen Forschung kommt die Aufgabe zu, den stark technik-zentrierten Ansatz der Informatik um einen "Blick fürs Ganze" zu erweitern und insbesondere die Bedürfnisse der Nutzer in ihren Ansatz einzubinden. Aufgrund der enormen Bedeutung des Web Information Retrieval, welches in den klassischen informationswissenschaftlichen Bereich fällt, ergibt sich für die Informationswissenschaft auch die Chance, sich in diesem Thema gegenüber anderen Disziplinen zu profilieren. Zum Aufbau der Arbeit Die Arbeit lässt sich grob in zwei Hauptteile gliedern: Der erste Teil (Kap. 2-10) beschreibt den Bereich Web Information Retrieval mit allen seinen Besonderheiten in Abgrenzung zum klassischen Information Retrieval; der zweite Teil (Kap. 11-13) stellt anhand der Ergebnisse des ersten Teils einen nutzerzentrierten Ansatz der Rechercheverfeinerung in mehreren Schritten vor.

Content

7 Informationsstatistische und informationslinguistische Verfahren 7.1 Textstatistische Verfahren 7.2 Nutzungsstatistische Verfahren 7.3 Informationslinguistische Verfahren 8 Linktopologische Rankingverfahren 8.1 Grundlagen linktopologischer Rankingverfahren: Science Citation Indexing 8.2 PageRank 8.3 Kleinbergs HITS 8.4 Hilltop 8.5 Evaluierung linktopologischer Verfahren 8.6 Problembereiche linktopologischer Rankingverfahren 8.7 Fazit linktopologische Verfahren 9 Retrievaltests 9.1 Aufbau und Nutzen von Retrievaltests 9.2 Aufbau und Ergebnisse ausgewählter Retrievaltests 9.3 Kritik an Retrievaltests 10 Verfahren der intuitiven Benutzerführung 10.1 Relevance Feedback 10.2 Vorschläge zur Erweiterung und Einschränkung der Suchanfrage 10.3 Klassifikation und Thesaurus 10.4 Clusterbildung 11 Aktualität 11.1 Bedeutung der Beschränkung nach der Aktualität der Dokumente 11.2 Funktionsfähigkeit der Datumsbeschränkung in Suchmaschinen 11.3 Möglichkeiten der Ermittlung von Datumsangaben in Web-Dokumenten 11.4 Aktualitätsfaktoren im Ranking 11.5 Spezialisierte Suchmaschinen für Nachrichten 11.6 Auswahl der gewünschten Aktualität durch den Nutzer 12 Qualität 12.1 Bedeutung der Beschränkung nach der Qualität der Dokumente 12.2 Qualitätsbeschränkungen bei der Recherche in Datenbank-Hosts 12.3 Identifizierung von Top-Quellen im WWW 12.4 Manuelle Einbindung von Top-Quellen 12.5 Automatisierte Einbindung von Invisible-Web-Quellen 12.6 Einbindung von Web-Verzeichnissen in Suchmaschinen 13 Verbesserung der Dokumentrepräsentation 13.1 Beschränkung auf den Inhaltsteil der Dokumente 13.2 Erweiterungen der Dokumentrepräsentation 13.3 Ersatz für die Nicht-Verwendbarkeit generischer Top-Level-Domains 13.4 Aufbereitung der Suchergebnisse in den Trefferlisten 14 Fazit und Ausblick 15 Literaturverzeichnis

Footnote

Rez. in: Information - Wissenschaft und Praxis. 56(2005) H.7, S.393-394 (J. Griesbaum): "... , das Buch wird seinem Titel und dem formulierten Anspruch sehr gut gerecht. Die 248 Seiten umfängliche Publikation leistet eine umfassende und, für den deutschsprachigen Raum, einzigartige State-of-the-Art-Analyse der Verfahren und auch der Defizite von Suchmaschinen im Internet. Dabei beschränkt sich Lewandowski nicht auf eine technikzentrierte Beschreibung aktueller Retrievalansätze, sondern akzentuiert ebenso deutlich auch die Problemfelder bei der Nutzung von Suchmaschinen. Dieser nutzerzentrierte Ansatz kommt vor allem im konzeptionellen Teil der Arbeit zum Tragen, der das Ziel verfolgt, Suchmaschinennutzern verbesserte Rechercheoptionen zu verschaffen. Angesichts der nur in geringem Maße vorhandenen Recherchekenntnisse der Nutzer liegt die Herausforderung vor allem darin, solche verbesserten Recherchemöglichkeiten derart auszugestalten, dass sie sich in realen Suchkontexten auch tatsächlich auswirken und nicht etwa wie die meist als "Erweitere Suche" bezeichneten Anfragemasken ein kaum beachtetes Dasein fristen. Der Verfasser konzipiert in diesem wichtigen Forschungsfeld neue Ansätze, um die Oualität des Information Retrievals zu verbessern. ... "

Gernert, J.: ¬Das Superhirn : Jerry Young brachte mit Yahoo Ordnung ins Netz, jetzt wird er von Microsoft umworben (2008) 0.00

0.0042403573 = product of:
  0.029682498 = sum of:
    0.020585975 = weight(_text_:bedeutung in 2617) [ClassicSimilarity], result of:
      0.020585975 = score(doc=2617,freq=2.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.16672023 = fieldWeight in 2617, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.0234375 = fieldNorm(doc=2617)
    0.009096525 = product of:
      0.01819305 = sum of:
        0.008215189 = weight(_text_:j in 2617) [ClassicSimilarity], result of:
          0.008215189 = score(doc=2617,freq=2.0), product of:
            0.07800208 = queryWeight, product of:
              3.1774964 = idf(docFreq=5010, maxDocs=44218)
              0.024548283 = queryNorm
            0.105320126 = fieldWeight in 2617, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.1774964 = idf(docFreq=5010, maxDocs=44218)
              0.0234375 = fieldNorm(doc=2617)
        0.00997786 = weight(_text_:22 in 2617) [ClassicSimilarity], result of:
          0.00997786 = score(doc=2617,freq=2.0), product of:
            0.085963905 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.024548283 = queryNorm
            0.116070345 = fieldWeight in 2617, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0234375 = fieldNorm(doc=2617)
      0.5 = coord(2/4)
  0.14285715 = coord(2/14)

Content: Daten in China weitergegeben Erfolgsorientierung allerdings hat den Finanzriesen Yahoo ausgerechnet in China nach Ansicht eines US-Politikers zu einem "moralischen Pygmäen" gemacht. Weil Yahoo belastende Informationen an die chinesische Regierung weitergegeben hatte, standen zwei Dissidenten vor Gericht. Im feinen, dunkelblauen Nadelstreifenanzug und ohne sein übliches Lächeln trat Yang im November bei einem Gerichtstermin vor die Mutter eines Verhafteten und verbeugte sich vor ihr. Aber geholfen hat sein Auftritt den Angeklagten nicht. Am Ende des Prozesses wurden die beiden Männer zu jeweils zehn Jahren Haft verurteilt. Das Vermögen des leidenschaftlichen Golfspielers wird heute auf 2,2 Milliarden Dollar geschätzt. 75 Millionen davon hat er im vergangenen Jahr der Stanford-Universität gespendet. Wie viele andere Einwanderer mit Wurzeln in China, die in den USA zu Millionären oder Milliardären geworden sind, würde er damit die Bedeutung der Uni als Karriereleiter unterstreichen, stellte die New York Times fest. Er ist auf dieser Leiter sehr hoch geklettert. Vielleicht reicht es gemeinsam mit Microsoft noch für ein paar mehr Sprossen. In Richtung Google."
Date: 5. 1.1997 9:39:22

Lewandowski, D.: Mit welchen Kennzahlen lässt sich die Qualität von Suchmaschinen messen? (2007) 0.00
```
0.004158995 = product of:
  0.058225926 = sum of:
    0.058225926 = weight(_text_:bedeutung in 378) [ClassicSimilarity], result of:
      0.058225926 = score(doc=378,freq=4.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.471556 = fieldWeight in 378, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.046875 = fieldNorm(doc=378)
  0.071428575 = coord(1/14)
```
Abstract

Suchmaschinen bilden den bedeutendsten Zugang zu den im World Wide Web verfügbaren Informationen und haben andere Zugänge zu diesem Informationsbestand (wie etwa Internetverzeichnisse) weitgehend verdrängt. Der Suchmaschinenmarkt ist stark konzentriert; nur wenige Anbieter mit eigener Technologie bieten selbst Endnutzerlösungen an und lizenzieren ihre Technologie an die bekannten Web-Portale wie AOL oder T-Online. Die im vorliegenden Kapitel dargestellten Kennzahlen zur Messung der Qualität von Suchmaschinen basieren einerseits auf Erkenntnissen über den State of the Art der Suchmaschinentechnologie, andererseits stehen sie im Kontext eines umfassenderen Modells der Qualitätsmessung für Web-Suchmaschinen. Die besondere Bedeutung von Erkenntnissen über die Qualität der bestehenden Suchmaschinen ergibt sich einerseits aus ihrer Bedeutung für die Weiterentwicklung der Suchmaschinentechnologie. Qualitätsuntersuchungen geben Hinweise auf die Schwachstellen der Suchmaschinen im Allgemeinen und die ihrer Ranking-Algorithmen im Besonderen. Letztere sind als zentral für die Ergebnisqualität anzusehen und bilden den >Kern< der technologischen Leistungsfähigkeit einer jeden Suchmaschine.

Schlüter, C.: Kapitale Suchmaschine : Angesichts der Bedeutung von Google werden Warnungen vor einer Entdemokratisierung des Wissens laut (2006) 0.00

0.00384674 = product of:
  0.026927179 = sum of:
    0.024016969 = weight(_text_:bedeutung in 5114) [ClassicSimilarity], result of:
      0.024016969 = score(doc=5114,freq=2.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.19450693 = fieldWeight in 5114, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5114)
    0.0029102094 = product of:
      0.011640837 = sum of:
        0.011640837 = weight(_text_:22 in 5114) [ClassicSimilarity], result of:
          0.011640837 = score(doc=5114,freq=2.0), product of:
            0.085963905 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.024548283 = queryNorm
            0.1354154 = fieldWeight in 5114, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.02734375 = fieldNorm(doc=5114)
      0.25 = coord(1/4)
  0.14285715 = coord(2/14)

Date: 12. 2.1996 22:34:46

Back, J.: ¬An evaluation of relevancy ranking techniques used by Internet search engines (2000) 0.00

0.0030321751 = product of:
  0.04245045 = sum of:
    0.04245045 = product of:
      0.0849009 = sum of:
        0.038337547 = weight(_text_:j in 3445) [ClassicSimilarity], result of:
          0.038337547 = score(doc=3445,freq=2.0), product of:
            0.07800208 = queryWeight, product of:
              3.1774964 = idf(docFreq=5010, maxDocs=44218)
              0.024548283 = queryNorm
            0.4914939 = fieldWeight in 3445, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.1774964 = idf(docFreq=5010, maxDocs=44218)
              0.109375 = fieldNorm(doc=3445)
        0.04656335 = weight(_text_:22 in 3445) [ClassicSimilarity], result of:
          0.04656335 = score(doc=3445,freq=2.0), product of:
            0.085963905 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.024548283 = queryNorm
            0.5416616 = fieldWeight in 3445, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.109375 = fieldNorm(doc=3445)
      0.5 = coord(2/4)
  0.071428575 = coord(1/14)

Date: 25. 8.2005 17:42:22

Lewandowski, D.: Bewertung von linktopologischen Verfahren als bestimmender Ranking-Faktor bei WWW Suchmaschinen (2006) 0.00
```
0.0029408536 = product of:
  0.04117195 = sum of:
    0.04117195 = weight(_text_:bedeutung in 5892) [ClassicSimilarity], result of:
      0.04117195 = score(doc=5892,freq=2.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.33344045 = fieldWeight in 5892, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.046875 = fieldNorm(doc=5892)
  0.071428575 = coord(1/14)
```
Abstract

Nutzerstudien haben gezeigt, dass in der Regel nur die erste Seite der von WWW Suchmaschinen ausgegebenen Trefferlisten Beachtung findet. Dies unterstreicht die Bedeutung des automatischen Rankings durch die Suchmaschinen: Dokumente, die es nicht auf eine Top-Position der Trefferliste schaffen, finden keine oder wenigstens nur eine geringe Beachtung. Alle bedeutenden Suchmaschinen setzen deshalb als einen wesentlichen Faktor des Rankings linktopologische Verfahren ein. Diese bewerten die Qualität von Webseiten anhand ihrer Verlinkungsstruktur, wobei nicht nur die Zahl der eingehenden Links als Votum gewertet wird, sondern auch die Reputation der verweisenden Seite. Die wichtigsten linktopologischen Ansätze werden erläutert. Dabei wird insbesondere auf die Frage eingegangen, ob bestimmte Arten von Webseiten bevorzugt werden bzw. welche das sind.
Wyss, V.; Keel, G.: Google als Trojanisches Pferd? : Konsequenzen der Internet-Recherche von Journalisten für die journalistische Qualität (2007) 0.00
```
0.0029408536 = product of:
  0.04117195 = sum of:
    0.04117195 = weight(_text_:bedeutung in 385) [ClassicSimilarity], result of:
      0.04117195 = score(doc=385,freq=2.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.33344045 = fieldWeight in 385, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.046875 = fieldNorm(doc=385)
  0.071428575 = coord(1/14)
```
Abstract

Ohne Suchmaschinen bliebe das Internet ein ungeordneter Datenfriedhof mit all den bekannten Mängeln zufällig aufgehäufter Informationshalden, insbesondere ohne Relevanzstruktur. Auch für Journalisten wird das Internet erst durch Suchmaschinen zum brauchbaren Netz. Suchmaschinen haben eine wesentliche Bedeutung für die Recherchepraktiken und sie haben das Potenzial, die soziale Struktur des Journalismus wesentlich mitzuprägen oder gar zu verändern. Offensichtlich wird nämlich, dass der Suchmaschine nicht nur eine suchende, sondern auch eine ordnende Funktion zukommt - sie ist eben Selektionsmaschine. Die Selektionsleistung der technischen Gatekeeper löst aber nicht nur Probleme, weil beispielsweise das gezielte Suchen von Informationen rasch und kostengünstig erfolgen kann; Suchmaschinen schaffen auch neue Probleme, mit denen der Journalismus konfrontiert ist. Das vorliegende Kapitel diskutiert die Frage, inwiefern sich die Internetrecherche von Journalisten auf die journalistische Qualität auswirkt. Im Zentrum des vorliegenden Kapitels steht die theoretische Sichtweise auf den möglichen Einfluss der Anwendung von Suchmaschinen auf die soziale Praxis bzw. auf die Struktur des Journalismus, und damit auch auf die Produktion der journalistischen Qualität.
Web-2.0-Dienste als Ergänzung zu algorithmischen Suchmaschinen (2008) 0.00
```
0.0029408536 = product of:
  0.04117195 = sum of:
    0.04117195 = weight(_text_:bedeutung in 4323) [ClassicSimilarity], result of:
      0.04117195 = score(doc=4323,freq=2.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.33344045 = fieldWeight in 4323, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.046875 = fieldNorm(doc=4323)
  0.071428575 = coord(1/14)
```
Abstract

Mit sozialen Suchdiensten - wie z. B. Yahoo Clever, Lycos iQ oder Mister Wong - ist eine Ergänzung und teilweise sogar eine Konkurrenz zu den bisherigen Ansätzen in der Web-Suche entstanden. Während Google und Co. automatisch generierte Trefferlisten bieten, binden soziale Suchdienste die Anwender zu Generierung der Suchergebnisse in den Suchprozess ein. Vor diesem Hintergrund wird in diesem Buch der Frage nachgegangen, inwieweit soziale Suchdienste mit traditionellen Suchmaschinen konkurrieren oder diese qualitativ ergänzen können. Der vorliegende Band beleuchtet die hier aufgeworfene Fragestellung aus verschiedenen Perspektiven, um auf die Bedeutung von sozialen Suchdiensten zu schließen.
Mostafa, J.: Bessere Suchmaschinen für das Web (2006) 0.00
```
0.0028269046 = product of:
  0.019788332 = sum of:
    0.0137239825 = weight(_text_:bedeutung in 4871) [ClassicSimilarity], result of:
      0.0137239825 = score(doc=4871,freq=2.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.111146815 = fieldWeight in 4871, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.015625 = fieldNorm(doc=4871)
    0.00606435 = product of:
      0.0121287 = sum of:
        0.0054767923 = weight(_text_:j in 4871) [ClassicSimilarity], result of:
          0.0054767923 = score(doc=4871,freq=2.0), product of:
            0.07800208 = queryWeight, product of:
              3.1774964 = idf(docFreq=5010, maxDocs=44218)
              0.024548283 = queryNorm
            0.070213415 = fieldWeight in 4871, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.1774964 = idf(docFreq=5010, maxDocs=44218)
              0.015625 = fieldNorm(doc=4871)
        0.0066519068 = weight(_text_:22 in 4871) [ClassicSimilarity], result of:
          0.0066519068 = score(doc=4871,freq=2.0), product of:
            0.085963905 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.024548283 = queryNorm
            0.07738023 = fieldWeight in 4871, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.015625 = fieldNorm(doc=4871)
      0.5 = coord(2/4)
  0.14285715 = coord(2/14)
```
Content

An der Wurzel des Indexbaums Im ersten Schritt werden potenziell interessante Inhalte identifiziert und fortlaufend gesammelt. Spezielle Programme vom Typ so genannter Webtrawler können im Internet publizierte Seiten ausfindig machen, durchsuchen (inklusive darauf befindlicher Links) und die Seiten an einem Ort gesammelt speichern. Im zweiten Schritt erfasst das System die relevanten Wörter auf diesen Seiten und bestimmt mit statistischen Methoden deren Wichtigkeit. Drittens wird aus den relevanten Begriffen eine hocheffiziente baumartige Datenstruktur erzeugt, die diese Begriffe bestimmten Webseiten zuordnet. Gibt ein Nutzer eine Anfrage ein, wird nur der gesamte Baum - auch Index genannt - durchsucht und nicht jede einzelne Webseite. Die Suche beginnt an der Wurzel des Indexbaums, und bei jedem Suchschritt wird eine Verzweigung des Baums (die jeweils viele Begriffe und zugehörige Webseiten beinhaltet) entweder weiter verfolgt oder als irrelevant verworfen. Dies verkürzt die Suchzeiten dramatisch. Um die relevanten Fundstellen (oder Links) an den Anfang der Ergebnisliste zu stellen, greift der Suchalgorithmus auf verschiedene Sortierstrategien zurück. Eine verbreitete Methode - die Begriffshäufigkeit - untersucht das Vorkommen der Wörter und errechnet daraus numerische Gewichte, welche die Bedeutung der Wörter in den einzelnen Dokumenten repräsentieren. Häufige Wörter (wie »oder«, »zu«, »mit«), die in vielen Dokumenten auftauchen, erhalten deutlich niedrigere Gewichte als Wörter, die eine höhere semantische Relevanz aufweisen und nur in vergleichsweise wenigen Dokumenten zu finden sind. Webseiten können aber auch nach anderen Strategien indiziert werden. Die Linkanalyse beispielsweise untersucht Webseiten nach dem Kriterium, mit welchen anderen Seiten sie verknüpft sind. Dabei wird analysiert, wie viele Links auf eine Seite verweisen und von dieser Seite selbst ausgehen. Google etwa verwendet zur Optimierung der Suchresultate diese Linkanalyse. Sechs Jahre benötigte Google, um sich als führende Suchmaschine zu etablieren. Zum Erfolg trugen vor allem zwei Vorzüge gegenüber der Konkurrenz bei: Zum einen kann Google extrem große Weberawling-Operationen durchführen. Zum anderen liefern seine Indizierungsund Gewichtungsmethoden überragende Ergebnisse. In letzter Zeit jedoch haben andere Suchmaschinen-Entwickler einige neue, ähnlich leistungsfähige oder gar punktuell bessere Systeme entwickelt.

Date

22. 1.2006 18:34:49
Schetsche, M.; Lehmann, K.; Krug, T.: ¬Die Google-Gesellschaft : Zehn Prinzipien der neuen Wissensordnung (2005) 0.00
```
0.0027726633 = product of:
  0.038817283 = sum of:
    0.038817283 = weight(_text_:bedeutung in 3488) [ClassicSimilarity], result of:
      0.038817283 = score(doc=3488,freq=4.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.31437066 = fieldWeight in 3488, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.03125 = fieldNorm(doc=3488)
  0.071428575 = coord(1/14)
```
Abstract

Suchmaschinen gelten bei Reisen durch den Datendschungel als nützliche Gefährten und können sogar Leben retten: Wie der Sender BBC im August 2004 berichtete, wurde der im Irak entführte Journalist John Martinkus auf Grund von Internet-Recherchen freigelassen. Die Entführer überprüften Martinkus' Aussagen per Google-Suche und stellten so sicher, dass dieser weder für ein US-Unternehmen oder den CIA arbeitet noch US-Amerikaner ist. Der australische Journalist kam mit einem gehörigen Schrecken davon; dass seine journalistischen Berichte online gelesen werden konnten, rettete ihm das Leben. Auf den ersten Blick irritiert und verwundert diese Episode zwar, beim zweiten Blick wird jedoch deutlich, dass das Internet inzwischen die Rolle ausfüllt, die Experten immer wieder prophezeit hatten: die eines globalen Gedächtnisses, einer Bibliothek menschlichen Wissens; zugänglich in allen Winkeln der Erde, gewinnt es in stets neuen - oft unvorhergesehenen - Zusammenhängen an Bedeutung. Die Internet-Recherche, da sind sich alle einig, ist heute zu einer zentralen Kulturtechnik geworden. Sie stellt ein Werkzeug dar, über das immer größere Erfahrungsbereiche des wissensgesellschaftlichen Alltags erschlossen werden. Dies verweist auf zwei andere Aspekte von Suchmaschinen: Wer das Internet mit seinen enormen Potenzialen nutzen will, kommt ohne sie nicht aus. Und das spiegelt sich zunehmend auch in ihrer wirtschaftlichen Bedeutung wider. Als börsennotierte Unternehmen besitzen sie einen enormen Wert - ohne ein anfassbares Produkt herzustellen, geschweige denn für ihre wichtigste Dienstleistung, das Suchen nach Informationen, Geld zu verlangen.
Leyh, M.: ¬Das Google File System (2005) 0.00
```
0.0027726633 = product of:
  0.038817283 = sum of:
    0.038817283 = weight(_text_:bedeutung in 863) [ClassicSimilarity], result of:
      0.038817283 = score(doc=863,freq=4.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.31437066 = fieldWeight in 863, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.03125 = fieldNorm(doc=863)
  0.071428575 = coord(1/14)
```
Abstract

Die Bedeutung der Suchmaschine Google hat in den letzten Jahren sehr stark zuge-nommen. Durch die immer komplexer werdenden Googleapplikationen sowie die im-mer stärkere Nutzung der Suchmaschine ist die zu verwaltende Datenmenge in den letzten Jahren stark angewachsen. Dies war die Ursache für die Entwicklung neuer Konzepte, um eine konsistente Datenhaltung und -verwaltung sowie eine schnelle Da-tenrettung zu ermöglichen. Im Mittelpunkt dieser Entwicklung steht die Sicherung der Performance des Systems, das Milliarden von Dokumenten verwaltet und mehrere Tausende Treffer pro Suchanfrage nach Relevanz ordnet. Der Umfang und die Komple-xität des Systems stellen dabei sowohl besondere Herausforderungen an die einzuset-zende Hardware, als auch an die Konzepte der Datenverteilung und -sicherung. Eine neue Entwicklung ist dabei der Verzicht auf teure Spezialhardware. Alle Anwendungen laufen auf gewöhnlicher PC-Hardware und sind somit sehr wirtschaftlich im Vergleich zu teurerer Spezialhardware. Durch den Einsatz gewöhnlicher PC-Hardware sind Aus-fälle von Festplatten oder ganzer Server wesentlich wahrscheinlicher, es wird sogar mit dem Ausfall von Systemen gerechnet. Dass Anwendungen dennoch so zuverlässig und schnell funktionieren, liegt an der Struktur des von Google entwickelten Dateisystems. Das Google File Systems (kurz GFS) bietet eine hohe Fehlertoleranz, Fehler werden automatisch entdeckt und Wiederherstellungen automatisiert ausgeführt, so dass die Nachteile der Hardwarekonfiguration abgefangen werden können. Dieser Fehlertoleranz kommt bei multiplen Clustern mit Größen von bis zu 300 TB sowie mehreren hunderten Clientzugriffen sehr große Bedeutung zu. Eine weitere strukturelle Besonderheit des Google File Systems stellt die Verwaltung von Schreibzugriffen dar. Bestehende Dateien werden nicht durch schwer zu kontrollie-rende Schreiboperationen, sondern vielmehr durch leichter zu verwaltende "Append" Operationen erweitert. Es ist somit möglich, dass viele Nutzer gleichzeitig auf größere Dateien schreibend zugreifen, ohne dass eine ständige Synchronisation zwischen diesen Nutzern stattfinden muss. Die dadurch realisierten Vorteile bezüglich Performance, Verlässlichkeit und Verfüg-barkeit sowie die daraus resultierenden Anforderungen an das System sollen im Mittel-punkt dieser Arbeit stehen. Es soll ein Einblick in die Funktionsweisen und Komplexitä-ten des Google File Systems gegeben und weiterhin die strukturelle Umsetzung der Anforderungen aufgezeigt werden.
Battelle, J.: ¬Die Suche : Geschäftsleben und Kultur im Banne von Google & Co. (2006) 0.00
```
0.002695211 = product of:
  0.018866476 = sum of:
    0.017154979 = weight(_text_:bedeutung in 5956) [ClassicSimilarity], result of:
      0.017154979 = score(doc=5956,freq=2.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.13893352 = fieldWeight in 5956, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.01953125 = fieldNorm(doc=5956)
    0.0017114975 = product of:
      0.00684599 = sum of:
        0.00684599 = weight(_text_:j in 5956) [ClassicSimilarity], result of:
          0.00684599 = score(doc=5956,freq=2.0), product of:
            0.07800208 = queryWeight, product of:
              3.1774964 = idf(docFreq=5010, maxDocs=44218)
              0.024548283 = queryNorm
            0.08776677 = fieldWeight in 5956, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.1774964 = idf(docFreq=5010, maxDocs=44218)
              0.01953125 = fieldNorm(doc=5956)
      0.25 = coord(1/4)
  0.14285715 = coord(2/14)
```
Abstract

Die Internet-Suchmaschinen von Google, Yahoo, Lycos & Co. liefern längst mehr als nur eine inhaltliche Orientierung im unübersichtlichen Webseiten-Dschungel. Mit ihrem Geschäftsmodell, die gesammelten Kundendaten für Anzeigenkunden zu erschließen, haben die Suchmaschinenbetreiber der Internetwirtschaft kommerzielles Leben eingehaucht. Dass sich vor allem die Google-Gründer Brin und Page damit nicht nur Freunde geschaffen haben, beschreibt Autor John Battelle ebenso, wie er die Notwendigkeit darlegt, dem Internet geschäftlich tragfähige Strukturen zu geben. Seine Erfahrung als Insider der Internetwirtschaft - er ist Mitgründer des Magazins "Wired" - kommt der faktenreichen Analyse zugute. Wir empfehlen dieses Buch allen Internetnutzern, die wissen wollen, was hinter Google & Co. steckt und wie die Suchmaschinen unser Leben beeinflussen. --- Eine ebenso profunde wie lesbare Geschichte der Online-Suche und ihrer Erlösmodelle erzählt der Suchmaschinenexperte John Battelle. Faszinierend ist, sich wieder einmal vor Augen zu führen, * dass von den Altavistas und Excites der frühen Internettage quasi nur Yahoo überlebt hat. * dass Google, 1998 gegründet, erst seit gut 5 Jahren die Internetsuche bestimmt * dass die Google Adwords als Einnahmequelle auf der Google-Seite erst seit etwa 4 Jahren existieren * dass das Google Adsense Konzept (Google-Kleinanzeigen auf beliebigen Homepages) erst vor drei Jahren eingeführt wurde. John Battelle geht davon aus, dass sich bei der Internetsuche noch so viel tun wird, dass er sich nicht auf die Google-Geschichte beschränken wollte. So macht er aus der Not eine Tugend und beschreibt die Wellen der Internetsuche. Er macht deutlich, warum sich bestimmte Konzepte und Ideen durchgesetzt haben und kehrt immer wieder zur Kernidee zurück: Die perfekte Suche erkennt die Absicht des Suchenden. Die Relevanz der Ergebnisse ist das A und O. Sie zu erhöhen, daran arbeiten sämtliche bekannten und noch unbekannten Anbieter. Fazit: Ein Buch, das für Google-Fans genauso interessant ist wie für die, die sich über die Bedeutung und den Einfluss der Suche auf unser Leben klar werden wollen. Suchalgorithmen sind ein hochtechnisches Gebiet. Battelle gelingt es jedoch, auch die technischen Ansätze allgemein verständlich zu beschreiben.
Röhle, T.: Machtkonzepte in der Suchmaschinenforschung (2007) 0.00
```
0.0024507113 = product of:
  0.034309957 = sum of:
    0.034309957 = weight(_text_:bedeutung in 388) [ClassicSimilarity], result of:
      0.034309957 = score(doc=388,freq=2.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.27786705 = fieldWeight in 388, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.0390625 = fieldNorm(doc=388)
  0.071428575 = coord(1/14)
```
Abstract

Suchmaschinen und Macht - nicht nur in der Wissenschaft, sondern auch in der Presse werden diese Begriffe immer häufiger in einem Atemzug genannt. Angesichts Googles Dominanz des Suchmaschinenmarkts mehren sich Bedenken über Monopolbildung, Datenschutz, Zensur und Manipulation, die sich in Artikeln mit so illustrativen Überschriften wie »Der Datenkrake«, »Das Imperium« oder »The Evil Thing« äußern. Die Verbindung zwischen Suchmaschinen und Macht erschließt sich intuitiv ohne Weiteres: »Sie lenken die Aufmerksamkeit der Nutzer und haben damit Macht«. Die Frage aber, wie sich diese Macht genauer konzeptualisieren und verorten lässt und inwiefern frühere Vorstellungen von Medienmacht und Medieneffekten in diesem neuen Feld relevant sind, ist in der Suchmaschinenforschung bisher nur sehr schematisch beantwortet worden. Ein grundlegendes Problem ist darin zu sehen, dass Suchmaschinen eine in vielen Aspekten neue und machttheoretisch ungeklärte Nutzungssituation schaffen. Technikhistorisch lassen sich Suchmaschinen zwar eindeutig als Nachfolger früherer Information-Retrieval-Systeme einordnen. Da diese jedoch hauptsächlich von kompetenten Nutzern für spezifische Recherchen in homogenen und vollständigen Datenbeständen eingesetzt wurden, kam der Frage der Macht hier keine größere Bedeutung zu. Völlig anders stellt sich die Situation bei den Suchmaschinen dar: Als integraler Bestandteil der Internetnutzung betreffen ihre Relevanzkriterien einen wesentlich größeren Kreis von Nutzern, die mit sehr unterschiedlichen Motivationen eine Auswahl des Datenbestands durchsuchen.
Bayer, M.: Ungewollt reiche Ernte (2006) 0.00
```
0.0024507113 = product of:
  0.034309957 = sum of:
    0.034309957 = weight(_text_:bedeutung in 4418) [ClassicSimilarity], result of:
      0.034309957 = score(doc=4418,freq=2.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.27786705 = fieldWeight in 4418, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4418)
  0.071428575 = coord(1/14)
```
Content

"Lange hatte Google überlegt, und das Ergebnis schien so viel versprechend: "Gu Ge" nennt sich die Suchmaschine in China. Die Bezeichnung ist ein lautmalerisches Kunstwort, das ein wenig an das internationale Original erinnert - und dessen Bedeutung sich nur in Annäherungen beschreiben lässt. Manche übersetzen nüchtern "Tal" und "Lied", andere deuten freier und sprechen vom "Lied der reichen Ernte". So in etwa hat sich das Google-Chef Eric Schmidt auch vorgestellt: Man habe sich von 1800 lautähnlichen. Wörtern für "Gu Ge" entschieden, weil es die reiche Ernte symbolisiere, die eine Suche mit Google einfahren könne. Klar: Poetischer als "lange Ergebnislisten" klingt "Gu Ge" allemal. Aber vielen Chinesen gefällt die Konstruktion trotzdem nicht. Vor allem jungen Surfern kommt der Name zu altbacken daher: Zwei Wochen nach der Präsentation von "Gu Ge" lassen mehr als 10 000 Nutzer in einem Diskussionsforum ihren Unmut über den Namen aus. Chinesische Namen für Google Die Diskussion verläuft freilich nicht immer sachlich. Viele Chinesen sind bitter enttäuscht darüber, dass das USUnternehmen - das gerne seine "transparente, gleichberechtigte und offene" Kultur herauskehrt - mit den staatlichen Zensurbehörden zusammenarbeitet. Kritik an Menschenrechtsverletzungen oder an der kommunistischen Führung etwa können Surfer im Reich der Mitte nicht mit Google ernten. Dafür ernten die Suchmaschinenmacher nun gehässige Alternativvorschläge für den Namen ihres chinesischen Ablegers. "Ge Ge" ist dabei und steht für älterer Bruder oder "Gu Gu" für die Tante, die alles beaufsichtigt. Auch "Gou Gou" wird genannt - was so viel wie Hündchen bedeutet; manche fordern auch "Good Gou" - ein englisch-chinesischer "guter Hund". Nicht wenige wollen schließlich "Gou Le" - und sagen damit: "Es reicht uns.""
Metahaven: Periphere Kräfte : zur Relevanz von Marginalität in Netzwerken (2009) 0.00
```
0.0024507113 = product of:
  0.034309957 = sum of:
    0.034309957 = weight(_text_:bedeutung in 28) [ClassicSimilarity], result of:
      0.034309957 = score(doc=28,freq=2.0), product of:
        0.12347616 = queryWeight, product of:
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.024548283 = queryNorm
        0.27786705 = fieldWeight in 28, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0299306 = idf(docFreq=785, maxDocs=44218)
          0.0390625 = fieldNorm(doc=28)
  0.071428575 = coord(1/14)
```
Abstract

Gegenstand dieses Beitrags ist das Ranking. Das Ranking ist der schwer greifbare, komplizierte, im Inneren der Suchmaschine verborgene Mechanismus, der unsere Interaktion mit den Informationen im Web strukturiert. Trotz der Komplexität des Ranking sieht die Suche bei den meisten Suchmaschinen täuschend einfach aus: man schreibt ein Wort in das leere Textfeld, in dem der Cursor blinkt, klickt auf "Suche" und erhält eine Liste mit Resultaten. Je nachdem, was man eingegeben hat, ist diese Liste kurz oder lang. Doch keine Suchmaschine zeigt die Resultate, ohne sie in Form einer Hierarchie zu strukturieren. Dies sieht zunächst wie ein gewöhnlicher, alltäglicher Vorgang aus, vergleichbar mit der Art, wie wir im Alltag zwischen relevanter und irrelevanter, zwischen Vordergrund- und Hintergrundinformation unterscheiden. Schließlich richten sich auch unsere eigenen Hierarchien der Sichtbarkeit nach bestimmten Bedürfnissen, Glaubensgrundsätzen und Begrenzungen. Oft belohnt die Hierarchie des Ranking das, was bereits beliebt ist. Wie ein Echo scheint die Suche schon zu wissen, was wir "wollen", bevor wir überhaupt fragen. Die Schwelle des Ranking neigt auch dazu, weniger verbreitete Richtungen oder Meinungen über große, öffentliche Themen zu unterdrücken. Jeder Versuch, die Suchmaschine neu zu denken, beginnt mit einer Infragestellung der Prinzipien der Relevanz und Beliebtheit, die dem Ranking innewohnen. In diesem Essay beschäftigen wir uns damit, wie Ranking-Mechanismen sich als gesellschaftliche Phänomene äußern, und wie eine andere Sicht auf die gesellschaftliche Bedeutung von "schwachen Bindungen". zu einer größeren Wertschätzung ihrer Relevanz in Netzwerken führen kann.

Search (168 results, page 1 of 9)

Authors

Languages

Types

Themes

Subjects

Classifications