Search (914 results, page 1 of 46)

Li, L.; Shang, Y.; Zhang, W.: Improvement of HITS-based algorithms on Web documents 0.27

0.2666493 = product of:
  0.8532778 = sum of:
    0.047481976 = product of:
      0.14244592 = sum of:
        0.14244592 = weight(_text_:3a in 2514) [ClassicSimilarity], result of:
          0.14244592 = score(doc=2514,freq=2.0), product of:
            0.25345436 = queryWeight, product of:
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.029895496 = queryNorm
            0.56201804 = fieldWeight in 2514, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.046875 = fieldNorm(doc=2514)
      0.33333334 = coord(1/3)
    0.20144895 = weight(_text_:2f in 2514) [ClassicSimilarity], result of:
      0.20144895 = score(doc=2514,freq=4.0), product of:
        0.25345436 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.029895496 = queryNorm
        0.7948135 = fieldWeight in 2514, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=2514)
    0.20144895 = weight(_text_:2f in 2514) [ClassicSimilarity], result of:
      0.20144895 = score(doc=2514,freq=4.0), product of:
        0.25345436 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.029895496 = queryNorm
        0.7948135 = fieldWeight in 2514, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=2514)
    0.20144895 = weight(_text_:2f in 2514) [ClassicSimilarity], result of:
      0.20144895 = score(doc=2514,freq=4.0), product of:
        0.25345436 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.029895496 = queryNorm
        0.7948135 = fieldWeight in 2514, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=2514)
    0.20144895 = weight(_text_:2f in 2514) [ClassicSimilarity], result of:
      0.20144895 = score(doc=2514,freq=4.0), product of:
        0.25345436 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.029895496 = queryNorm
        0.7948135 = fieldWeight in 2514, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=2514)
  0.3125 = coord(5/16)

Content: Vgl.: http%3A%2F%2Fdelab.csd.auth.gr%2F~dimitris%2Fcourses%2Fir_spring06%2Fpage_rank_computing%2Fp527-li.pdf. Vgl. auch: http://www2002.org/CDROM/refereed/643/.

Berry, M.W.; Browne, M.: Understanding search engines : mathematical modeling and text retrieval (1999) 0.08

0.083412096 = product of:
  0.26691872 = sum of:
    0.072969034 = weight(_text_:informatik in 5777) [ClassicSimilarity], result of:
      0.072969034 = score(doc=5777,freq=4.0), product of:
        0.15254098 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.029895496 = queryNorm
        0.4783569 = fieldWeight in 5777, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.046875 = fieldNorm(doc=5777)
    0.12455644 = weight(_text_:monographien in 5777) [ClassicSimilarity], result of:
      0.12455644 = score(doc=5777,freq=4.0), product of:
        0.1992968 = queryWeight, product of:
          6.666449 = idf(docFreq=152, maxDocs=44218)
          0.029895496 = queryNorm
        0.6249796 = fieldWeight in 5777, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          6.666449 = idf(docFreq=152, maxDocs=44218)
          0.046875 = fieldNorm(doc=5777)
    0.013984687 = weight(_text_:der in 5777) [ClassicSimilarity], result of:
      0.013984687 = score(doc=5777,freq=4.0), product of:
        0.06677957 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.029895496 = queryNorm
        0.20941564 = fieldWeight in 5777, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=5777)
    0.01495989 = weight(_text_:information in 5777) [ClassicSimilarity], result of:
      0.01495989 = score(doc=5777,freq=12.0), product of:
        0.052480884 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.029895496 = queryNorm
        0.2850541 = fieldWeight in 5777, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.046875 = fieldNorm(doc=5777)
    0.040448684 = product of:
      0.08089737 = sum of:
        0.08089737 = weight(_text_:engineering in 5777) [ClassicSimilarity], result of:
          0.08089737 = score(doc=5777,freq=4.0), product of:
            0.16061439 = queryWeight, product of:
              5.372528 = idf(docFreq=557, maxDocs=44218)
              0.029895496 = queryNorm
            0.5036745 = fieldWeight in 5777, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.372528 = idf(docFreq=557, maxDocs=44218)
              0.046875 = fieldNorm(doc=5777)
      0.5 = coord(1/2)
  0.3125 = coord(5/16)

Abstract: This book discusses many of the key design issues for building search engines and emphazises the important role that applied mathematics can play in improving information retrieval. The authors discuss not only important data structures, algorithms, and software but also user-centered issues such as interfaces, manual indexing, and document preparation. They also present some of the current problems in information retrieval that many not be familiar to applied mathematicians and computer scientists and some of the driving computational methods (SVD, SDD) for automated conceptual indexing
Classification: ST 230 [Informatik # Monographien # Software und -entwicklung # Software allgemein, (Einführung, Lehrbücher, Methoden der Programmierung) Software engineering, Programmentwicklungssysteme, Softwarewerkzeuge]
RSWK: Suchmaschine / Information Retrieval
Suchmaschine / Information Retrieval / Mathematisches Modell (HEBIS)
RVK: ST 230 [Informatik # Monographien # Software und -entwicklung # Software allgemein, (Einführung, Lehrbücher, Methoden der Programmierung) Software engineering, Programmentwicklungssysteme, Softwarewerkzeuge]
Subject: Suchmaschine / Information Retrieval
Suchmaschine / Information Retrieval / Mathematisches Modell (HEBIS)

Lehrke, C.: Architektur von Suchmaschinen : Googles Architektur, insb. Crawler und Indizierer (2005) 0.07

0.06663053 = product of:
  0.21321768 = sum of:
    0.042997412 = weight(_text_:informatik in 867) [ClassicSimilarity], result of:
      0.042997412 = score(doc=867,freq=2.0), product of:
        0.15254098 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.029895496 = queryNorm
        0.2818745 = fieldWeight in 867, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.0390625 = fieldNorm(doc=867)
    0.020185156 = weight(_text_:der in 867) [ClassicSimilarity], result of:
      0.020185156 = score(doc=867,freq=12.0), product of:
        0.06677957 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.029895496 = queryNorm
        0.30226544 = fieldWeight in 867, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=867)
    0.13271147 = weight(_text_:wirtschaftsinformatik in 867) [ClassicSimilarity], result of:
      0.13271147 = score(doc=867,freq=4.0), product of:
        0.22535236 = queryWeight, product of:
          7.538004 = idf(docFreq=63, maxDocs=44218)
          0.029895496 = queryNorm
        0.5889065 = fieldWeight in 867, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          7.538004 = idf(docFreq=63, maxDocs=44218)
          0.0390625 = fieldNorm(doc=867)
    0.0071975808 = weight(_text_:information in 867) [ClassicSimilarity], result of:
      0.0071975808 = score(doc=867,freq=4.0), product of:
        0.052480884 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.029895496 = queryNorm
        0.13714671 = fieldWeight in 867, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.0390625 = fieldNorm(doc=867)
    0.010126068 = product of:
      0.020252137 = sum of:
        0.020252137 = weight(_text_:22 in 867) [ClassicSimilarity], result of:
          0.020252137 = score(doc=867,freq=2.0), product of:
            0.104688935 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.029895496 = queryNorm
            0.19345059 = fieldWeight in 867, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0390625 = fieldNorm(doc=867)
      0.5 = coord(1/2)
  0.3125 = coord(5/16)

Abstract: Das Internet mit seinen ständig neuen Usern und seinem extremen Wachstum bringt viele neue Herausforderungen mit sich. Aufgrund dieses Wachstums bedienen sich die meisten Leute der Hilfe von Suchmaschinen um Inhalte innerhalb des Internet zu finden. Suchmaschinen nutzen für die Beantwortung der User-Anfragen Information Retrieval Techniken. Problematisch ist nur, dass traditionelle Information Retrieval (IR) Systeme für eine relativ kleine und zusammenhängende Sammlung von Dokumenten entwickelt wurden. Das Internet hingegen unterliegt einem ständigen Wachstum, schnellen Änderungsraten und es ist über geographisch verteilte Computer verteilt. Aufgrund dieser Tatsachen müssen die alten Techniken erweitert oder sogar neue IRTechniken entwickelt werden. Eine Suchmaschine die diesen Herausforderungen vergleichsweise erfolgreich entgegnet ist Google. Ziel dieser Arbeit ist es aufzuzeigen, wie Suchmaschinen funktionieren. Der Fokus liegt dabei auf der Suchmaschine Google. Kapitel 2 wird sich zuerst mit dem Aufbau von Suchmaschinen im Allgemeinen beschäftigen, wodurch ein grundlegendes Verständnis für die einzelnen Komponenten geschaffen werden soll. Im zweiten Teil des Kapitels wird darauf aufbauend ein Überblick über die Architektur von Google gegeben. Kapitel 3 und 4 dienen dazu, näher auf die beiden Komponenten Crawler und Indexer einzugehen, bei denen es sich um zentrale Elemente im Rahmen von Suchmaschinen handelt.
Content: Ausarbeitung im Rahmen des Seminars Suchmaschinen und Suchalgorithmen, Institut für Wirtschaftsinformatik Praktische Informatik in der Wirtschaft, Westfälische Wilhelms-Universität Münster. - Vgl.: http://www-wi.uni-muenster.de/pi/lehre/ss05/seminarSuchen/Ausarbeitungen/ChristophLehrke.pdf
Imprint: Münster : Institut für Wirtschaftsinformatik der Westfälische Wilhelms-Universität Münster
Pages: 22 S

Alby, T.; Karzauninkat, S.: Suchmaschinenoptimierung : professionelles Website-Marketing für besseres Ranking ; [berücksichtigt Google Analytics] (2007) 0.06
```
0.0559761 = product of:
  0.2239044 = sum of:
    0.04864602 = weight(_text_:informatik in 35) [ClassicSimilarity], result of:
      0.04864602 = score(doc=35,freq=4.0), product of:
        0.15254098 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.029895496 = queryNorm
        0.3189046 = fieldWeight in 35, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.03125 = fieldNorm(doc=35)
    0.08303762 = weight(_text_:monographien in 35) [ClassicSimilarity], result of:
      0.08303762 = score(doc=35,freq=4.0), product of:
        0.1992968 = queryWeight, product of:
          6.666449 = idf(docFreq=152, maxDocs=44218)
          0.029895496 = queryNorm
        0.41665307 = fieldWeight in 35, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          6.666449 = idf(docFreq=152, maxDocs=44218)
          0.03125 = fieldNorm(doc=35)
    0.017441968 = weight(_text_:der in 35) [ClassicSimilarity], result of:
      0.017441968 = score(doc=35,freq=14.0), product of:
        0.06677957 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.029895496 = queryNorm
        0.2611872 = fieldWeight in 35, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=35)
    0.07477878 = weight(_text_:datenverarbeitung in 35) [ClassicSimilarity], result of:
      0.07477878 = score(doc=35,freq=4.0), product of:
        0.18912636 = queryWeight, product of:
          6.326249 = idf(docFreq=214, maxDocs=44218)
          0.029895496 = queryNorm
        0.39539057 = fieldWeight in 35, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          6.326249 = idf(docFreq=214, maxDocs=44218)
          0.03125 = fieldNorm(doc=35)
  0.25 = coord(4/16)
```
Abstract

Mit Suchmaschinenoptimierung. Professionelles Website-Marketing für besseres Ranking liefern Stefan Karzauninkat und Tom Alby einen sauberen Überblick über Grundlagen, Gründe, Maßnahmen und Zielsetzungen von suchmaschinenoptierten Websites. Essentielles Internet-Wissen auf dem aktuellen Stand. Karzauninkat und Alby widmen ihr Buch Entscheidern, Konzeptionern, Designern und Webmastern, die ihre Website, ob neu oder alt, im Gesamtzusammenhang des Internet sehen und verstehen wollen. Suchmaschinen sind und waren dabei schon immer ein wesentlicher Faktor, denn sie sind die Instanz, die eine Website und deren Informationen findet, wenn sie gesucht wird. Die Sucharbeit der Maschinen kann man ignorieren, behindern oder unterstützen -- wenn man weiß wie. Karzauninkat und Alby haben ihr Wissen praktisch erworben. Vor allem Karzauninkat kann zahlreiche Internetprojekt vorweisen, zu denen auch die bekannte und viel besuchte Suchmaschinen-Website www.suchfibel.de gehört. Ziel der beiden Autoren ist es, ein allgemeines Verständnis für die Such- und Gefundenwelt des Internet und dauerhafte und anhaltende Maßnahmen für die gefunden-werden-Bilanz sowie die Platzierung innerhalb der Liste der gefundenen Suchergebnisse zu vermitteln. Überzeugen, erklären und zeigen lautet die Devise: Am Anfang steht eine Einführung mit dem Titel "Wozu das Ganze". Argumentationsstoff und Fakten für den folgenden Aufwand. Darauf folgt die Website-Optimierung als Teil der Unternehmenskommunikation und dieses Kapitel zeigt auch einen Fokus der beiden: Verkaufen. Nun gut, welcher Zweck auch immer, die Mittel sind immer die gleichen. Als nächstes stellen sie Suchmaschinen und ihre Funktionsweise vor, bevor sie sich dann dem Kern ihres Buches widmen: die Optimierung zur Positionsverbesserung. Hier entschlüsseln sie die Bedeutung von Inhalt, erklären kurz die technischen Belange und zeigen wo es Probleme und Widerstände geben kann. Auch professionelle Dienstleister für die Website-Optimierung nehmen sie unter die Lupe. Zuletzt dann Suchmaschinenmarketing, laufende Maßnahmen zur Erfolgskontrolle und dann noch sechs kurze Fallbeispiele. Ebenso bieten sie ein Glossar und einen Anhang mit Server-Response-Codes, Agents und Meta-Tags sowie weiterführende Literatur und Weblinks. Übrigens steht den Druck-Käufern das gesamte Buch auch als eBook zur Verfügung! Suchmaschinenoptimierung ist ein guter, locker geschriebener und leicht zu lesender, vor allem aktueller Überblick mit einem Gespür für die Fragen und Bedürfnisse der Zielgruppe von Entscheider bis Webmaster. Wer Suchmaschinen-Verständnis ohne technische Überlastung sucht, liest hier zufrieden.

Classification

ST 252 Informatik / Monographien / Software und -entwicklung / Web-Programmierung, allgemein
QP 650 Wirtschaftswissenschaften / Allgemeine Betriebswirtschaftslehre / Aufbauelemente des Unternehmens / Absatz / Werbung und Public Relations / Datenverarbeitung im Marketing

RVK

ST 252 Informatik / Monographien / Software und -entwicklung / Web-Programmierung, allgemein
QP 650 Wirtschaftswissenschaften / Allgemeine Betriebswirtschaftslehre / Aufbauelemente des Unternehmens / Absatz / Werbung und Public Relations / Datenverarbeitung im Marketing
Leyh, M.: ¬Das Google File System (2005) 0.06
```
0.055169 = product of:
  0.220676 = sum of:
    0.03439793 = weight(_text_:informatik in 863) [ClassicSimilarity], result of:
      0.03439793 = score(doc=863,freq=2.0), product of:
        0.15254098 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.029895496 = queryNorm
        0.2254996 = fieldWeight in 863, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.03125 = fieldNorm(doc=863)
    0.058244236 = weight(_text_:anwendungen in 863) [ClassicSimilarity], result of:
      0.058244236 = score(doc=863,freq=4.0), product of:
        0.16691269 = queryWeight, product of:
          5.583205 = idf(docFreq=451, maxDocs=44218)
          0.029895496 = queryNorm
        0.34895033 = fieldWeight in 863, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.583205 = idf(docFreq=451, maxDocs=44218)
          0.03125 = fieldNorm(doc=863)
    0.021864664 = weight(_text_:der in 863) [ClassicSimilarity], result of:
      0.021864664 = score(doc=863,freq=22.0), product of:
        0.06677957 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.029895496 = queryNorm
        0.32741547 = fieldWeight in 863, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=863)
    0.10616919 = weight(_text_:wirtschaftsinformatik in 863) [ClassicSimilarity], result of:
      0.10616919 = score(doc=863,freq=4.0), product of:
        0.22535236 = queryWeight, product of:
          7.538004 = idf(docFreq=63, maxDocs=44218)
          0.029895496 = queryNorm
        0.47112525 = fieldWeight in 863, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          7.538004 = idf(docFreq=63, maxDocs=44218)
          0.03125 = fieldNorm(doc=863)
  0.25 = coord(4/16)
```
Abstract

Die Bedeutung der Suchmaschine Google hat in den letzten Jahren sehr stark zuge-nommen. Durch die immer komplexer werdenden Googleapplikationen sowie die im-mer stärkere Nutzung der Suchmaschine ist die zu verwaltende Datenmenge in den letzten Jahren stark angewachsen. Dies war die Ursache für die Entwicklung neuer Konzepte, um eine konsistente Datenhaltung und -verwaltung sowie eine schnelle Da-tenrettung zu ermöglichen. Im Mittelpunkt dieser Entwicklung steht die Sicherung der Performance des Systems, das Milliarden von Dokumenten verwaltet und mehrere Tausende Treffer pro Suchanfrage nach Relevanz ordnet. Der Umfang und die Komple-xität des Systems stellen dabei sowohl besondere Herausforderungen an die einzuset-zende Hardware, als auch an die Konzepte der Datenverteilung und -sicherung. Eine neue Entwicklung ist dabei der Verzicht auf teure Spezialhardware. Alle Anwendungen laufen auf gewöhnlicher PC-Hardware und sind somit sehr wirtschaftlich im Vergleich zu teurerer Spezialhardware. Durch den Einsatz gewöhnlicher PC-Hardware sind Aus-fälle von Festplatten oder ganzer Server wesentlich wahrscheinlicher, es wird sogar mit dem Ausfall von Systemen gerechnet. Dass Anwendungen dennoch so zuverlässig und schnell funktionieren, liegt an der Struktur des von Google entwickelten Dateisystems. Das Google File Systems (kurz GFS) bietet eine hohe Fehlertoleranz, Fehler werden automatisch entdeckt und Wiederherstellungen automatisiert ausgeführt, so dass die Nachteile der Hardwarekonfiguration abgefangen werden können. Dieser Fehlertoleranz kommt bei multiplen Clustern mit Größen von bis zu 300 TB sowie mehreren hunderten Clientzugriffen sehr große Bedeutung zu. Eine weitere strukturelle Besonderheit des Google File Systems stellt die Verwaltung von Schreibzugriffen dar. Bestehende Dateien werden nicht durch schwer zu kontrollie-rende Schreiboperationen, sondern vielmehr durch leichter zu verwaltende "Append" Operationen erweitert. Es ist somit möglich, dass viele Nutzer gleichzeitig auf größere Dateien schreibend zugreifen, ohne dass eine ständige Synchronisation zwischen diesen Nutzern stattfinden muss. Die dadurch realisierten Vorteile bezüglich Performance, Verlässlichkeit und Verfüg-barkeit sowie die daraus resultierenden Anforderungen an das System sollen im Mittel-punkt dieser Arbeit stehen. Es soll ein Einblick in die Funktionsweisen und Komplexitä-ten des Google File Systems gegeben und weiterhin die strukturelle Umsetzung der Anforderungen aufgezeigt werden.

Content

Ausarbeitung im Rahmen des Seminars Suchmaschinen und Suchalgorithmen, Institut für Wirtschaftsinformatik Praktische Informatik in der Wirtschaft, Westfälische Wilhelms-Universität Münster. - Vgl.: http://www-wi.uni-muenster.de/pi/lehre/ss05/seminarSuchen/Ausarbeitungen/MichaelLeyh.pdf

Imprint

Münster : Institut für Wirtschaftsinformatik der Westfälische Wilhelms-Universität Münster

Westermeyer, D.: Adaptive Techniken zur Informationsgewinnung : der Webcrawler InfoSpiders (2005) 0.05

0.052973468 = product of:
  0.21189387 = sum of:
    0.042997412 = weight(_text_:informatik in 4333) [ClassicSimilarity], result of:
      0.042997412 = score(doc=4333,freq=2.0), product of:
        0.15254098 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.029895496 = queryNorm
        0.2818745 = fieldWeight in 4333, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4333)
    0.026058923 = weight(_text_:der in 4333) [ClassicSimilarity], result of:
      0.026058923 = score(doc=4333,freq=20.0), product of:
        0.06677957 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.029895496 = queryNorm
        0.390223 = fieldWeight in 4333, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4333)
    0.13271147 = weight(_text_:wirtschaftsinformatik in 4333) [ClassicSimilarity], result of:
      0.13271147 = score(doc=4333,freq=4.0), product of:
        0.22535236 = queryWeight, product of:
          7.538004 = idf(docFreq=63, maxDocs=44218)
          0.029895496 = queryNorm
        0.5889065 = fieldWeight in 4333, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          7.538004 = idf(docFreq=63, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4333)
    0.010126068 = product of:
      0.020252137 = sum of:
        0.020252137 = weight(_text_:22 in 4333) [ClassicSimilarity], result of:
          0.020252137 = score(doc=4333,freq=2.0), product of:
            0.104688935 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.029895496 = queryNorm
            0.19345059 = fieldWeight in 4333, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0390625 = fieldNorm(doc=4333)
      0.5 = coord(1/2)
  0.25 = coord(4/16)

Abstract: Die Suche nach Informationen im Internet führt den Nutzer meistens direkt zu einer Suchmaschine. Teile der gelieferten Ergebnisse enthalten aber manchmal nicht das, was der Nutzer gesucht hat. Hier setzen sog. adaptive Agenten an, welche die Gewohnheiten ihres Nutzers zu erlernen versuchen, um später auf Basis dessen selbstständig Entscheidungen zu treffen, ohne dass der Nutzer dazu befragt werden muss. Zunächst werden im Grundlagenteil adaptive Techniken zur Informationsgewinnung sowie die grundlegenden Eigenschaften von Webcrawlern besprochen. Im Hauptteil wird daraufhin der Webcrawler InfoSpiders erläutert. Dieses Programm arbeitet mit mehreren adaptiven Agenten, die parallel basierend auf einem Satz von Startlinks das Internet nach Informationen durchsuchen. Dabei bedienen sich die Agenten verschiedenster Techniken. Darunter fallen beispielsweise statistische Methoden, die den Inhalt von Webseiten untersuchen sowie neuronale Netze, mit denen der Inhalt bewertet wird. Eine andere Technik implementiert der genetische Algorithmus mit Hilfe dessen die Agenten Nachkommen mit neuen Mutationen erzeugen können. Danach wird eine konkrete Implementierung des InfoSpiders-Algorithmus' anhand von MySpiders verdeutlicht. Im Anschluss daran wird der InfoSpiders-Algorithmus sowie MySpiders einer Evaluation bezüglich des zusätzlichen Nutzens gegenüber herkömmlichen Suchmaschinen unterzogen. Eine Zusammenfassung mit Ausblick zu weiteren Entwicklungen in dem Bereich adaptiver Agenten zur Suche im Internet wird das Thema abschließen.
Content: Ausarbeitung im Rahmen des Seminars Suchmaschinen und Suchalgorithmen, Institut für Wirtschaftsinformatik Praktische Informatik in der Wirtschaft, Westfälische Wilhelms-Universität Münster. - Vgl.: http://www-wi.uni-muenster.de/pi/lehre/ss05/seminarSuchen/Ausarbeitungen/DenisWestermeyer.pdf
Imprint: Münster : Institut für Wirtschaftsinformatik der Westfälische Wilhelms-Universität Münster
Pages: 22 S

Weiß, B.: Verwandte Seiten finden : "Ähnliche Seiten" oder "What's Related" (2005) 0.04
```
0.03731563 = product of:
  0.19901669 = sum of:
    0.042997412 = weight(_text_:informatik in 868) [ClassicSimilarity], result of:
      0.042997412 = score(doc=868,freq=2.0), product of:
        0.15254098 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.029895496 = queryNorm
        0.2818745 = fieldWeight in 868, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.0390625 = fieldNorm(doc=868)
    0.02330781 = weight(_text_:der in 868) [ClassicSimilarity], result of:
      0.02330781 = score(doc=868,freq=16.0), product of:
        0.06677957 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.029895496 = queryNorm
        0.34902605 = fieldWeight in 868, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=868)
    0.13271147 = weight(_text_:wirtschaftsinformatik in 868) [ClassicSimilarity], result of:
      0.13271147 = score(doc=868,freq=4.0), product of:
        0.22535236 = queryWeight, product of:
          7.538004 = idf(docFreq=63, maxDocs=44218)
          0.029895496 = queryNorm
        0.5889065 = fieldWeight in 868, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          7.538004 = idf(docFreq=63, maxDocs=44218)
          0.0390625 = fieldNorm(doc=868)
  0.1875 = coord(3/16)
```
Abstract

Die Link-Struktur-Analyse (LSA) ist nicht nur beim Crawling, dem Webseitenranking, der Abgrenzung geographischer Bereiche, der Vorhersage von Linkverwendungen, dem Auffinden von "Mirror"-Seiten, dem Kategorisieren von Webseiten und beim Generieren von Webseitenstatistiken eines der wichtigsten Analyseverfahren, sondern auch bei der Suche nach verwandten Seiten. Um qualitativ hochwertige verwandte Seiten zu finden, bildet sie nach herrschender Meinung den Hauptbestandteil bei der Identifizierung von ähnlichen Seiten innerhalb themenspezifischer Graphen vernetzter Dokumente. Dabei wird stets von zwei Annahmen ausgegangen: Links zwischen zwei Dokumenten implizieren einen verwandten Inhalt beider Dokumente und wenn die Dokumente aus unterschiedlichen Quellen (von unterschiedlichen Autoren, Hosts, Domänen, .) stammen, so bedeutet dies das eine Quelle die andere über einen Link empfiehlt. Aufbauend auf dieser Idee entwickelte Kleinberg 1998 den HITS Algorithmus um verwandte Seiten über die Link-Struktur-Analyse zu bestimmen. Dieser Ansatz wurde von Bharat und Henzinger weiterentwickelt und später auch in Algorithmen wie dem Companion und Cocitation Algorithmus zur Suche von verwandten Seiten basierend auf nur einer Anfrage-URL weiter verfolgt. In der vorliegenden Seminararbeit sollen dabei die Algorithmen, die hinter diesen Überlegungen stehen, näher erläutert werden und im Anschluss jeweils neuere Forschungsansätze auf diesem Themengebiet aufgezeigt werden.

Content

Ausarbeitung im Rahmen des Seminars Suchmaschinen und Suchalgorithmen, Institut für Wirtschaftsinformatik Praktische Informatik in der Wirtschaft, Westfälische Wilhelms-Universität Münster. - Vgl.: http://www-wi.uni-muenster.de/pi/lehre/ss05/seminarSuchen/Ausarbeitungen/BurkhardWei%DF.pdf

Imprint

Münster : Institut für Wirtschaftsinformatik der Westfälische Wilhelms-Universität Münster
Lewandowski, D.: Web Information Retrieval : Technologien zur Informationssuche im Internet (2005) 0.04
```
0.03555356 = product of:
  0.11377139 = sum of:
    0.02432301 = weight(_text_:informatik in 3635) [ClassicSimilarity], result of:
      0.02432301 = score(doc=3635,freq=4.0), product of:
        0.15254098 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.029895496 = queryNorm
        0.1594523 = fieldWeight in 3635, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.015625 = fieldNorm(doc=3635)
    0.029358232 = weight(_text_:monographien in 3635) [ClassicSimilarity], result of:
      0.029358232 = score(doc=3635,freq=2.0), product of:
        0.1992968 = queryWeight, product of:
          6.666449 = idf(docFreq=152, maxDocs=44218)
          0.029895496 = queryNorm
        0.1473091 = fieldWeight in 3635, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.666449 = idf(docFreq=152, maxDocs=44218)
          0.015625 = fieldNorm(doc=3635)
    0.020592447 = weight(_text_:anwendungen in 3635) [ClassicSimilarity], result of:
      0.020592447 = score(doc=3635,freq=2.0), product of:
        0.16691269 = queryWeight, product of:
          5.583205 = idf(docFreq=451, maxDocs=44218)
          0.029895496 = queryNorm
        0.12337257 = fieldWeight in 3635, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.583205 = idf(docFreq=451, maxDocs=44218)
          0.015625 = fieldNorm(doc=3635)
    0.028162934 = weight(_text_:der in 3635) [ClassicSimilarity], result of:
      0.028162934 = score(doc=3635,freq=146.0), product of:
        0.06677957 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.029895496 = queryNorm
        0.4217298 = fieldWeight in 3635, product of:
          12.083046 = tf(freq=146.0), with freq of:
            146.0 = termFreq=146.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.015625 = fieldNorm(doc=3635)
    0.011334761 = weight(_text_:information in 3635) [ClassicSimilarity], result of:
      0.011334761 = score(doc=3635,freq=62.0), product of:
        0.052480884 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.029895496 = queryNorm
        0.21597885 = fieldWeight in 3635, product of:
          7.8740077 = tf(freq=62.0), with freq of:
            62.0 = termFreq=62.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.015625 = fieldNorm(doc=3635)
  0.3125 = coord(5/16)
```
Abstract

Verfahren des Information Retrieval haben in den letzten Jahren eine enorme Bedeutung erlangt. Während diese Verfahren jahrzehntelang nur Einsatz in spezialisierten Datenbanken fanden, haben sie durch das Aufkommen von Suchmaschinen im World Wide Web mittlerweile eine zentrale Bedeutung in der Informationsversorgung eingenommen. Verfahren des Web Information Retrieval entscheiden darüber, welche Informationen von Nutzern gefunden werden; man spricht auch von einer "Gatekeeper"-Funktion der Suchmaschinen. Diese sind zum bedeutendsten Rechercheinstrument sowohl im privaten, beruflichen als auch wissenschaftlichen Bereich avanciert. Google, die berühmteste der "Information-Retrieval-Firmen", ist fast täglich in den Schlagzeilen zu finden. Immer neue Innovationen (nicht nur dieses Anbieters) zeigen die Web-Suche als dynamisches Feld. Vor allem wird durch die zahlreichen Neuerungen der letzten Jahre, teilweise erst der letzten Monate, deutlich, dass die Suche im Web trotz ihrer mittlerweile fast zehnjährigen Geschichte erst am Anfang steht. Dass dem Web Information Retrieval eine hohe Bedeutung zugemessen wird, zeigt sich auch im wachsenden Interesse kommerzieller Unternehmen an diesem Thema. Ein Blick auf die Sponsorenliste der letztjährigen Konferenz der ACM Special Interest Group on Information Retrieval mag dies verdeutlichen: Neben den wichtigen Suchmaschinen-Anbietern Google, Microsoft, Yahoo und Ask Jeeves finden sich auch Großunternehmen wie IBM, Canon und Sharp. Auch in der gesellschaftlichen Diskussion sind die Suchmaschinen angekommen: Es findet gegenwärtig eine Diskussion um die "Google-Gesellschaft" statt, wobei gefragt wird, inwieweit ein einzelner Anbieter bzw. wenige Anbieter darüber entscheiden sollten, welche Informationen beim Nutzer angelangen. In dieser Hinsicht befassen sich inzwischen auch politische Parteien mit dem Thema. So publizierte etwa die Gründe Bundestagsfraktion ein Diskussionspapier unter dem Titel "Suchmaschinen: Tore zum Netz", in welchem unter anderem die Rolle der Suchmaschinen beim Zugang zu Informationen und Probleme des Datenschutzes bei der Suchmaschinennutzung angesprochen werden.
Die vorliegende Arbeit setzt auf einer eher technischen Ebene an und bietet die Grundlagen für das Verständnis der Funktionsweise und der Defizite von Web-Suchmaschinen. Während zum klassischen Information Retrieval eine breite Auswahl an Literatur vorliegt, gibt es bisher kein Werk, welches eine umfassende Darstellung des Web Information Retrieval mit seinen Unterscheidungen und Besonderheiten gegenüber dem "klassischen" Information Retrieval bietet. Monographien zum Thema Suchmaschinen behandeln vor allem deren Suchfunktionen oder konzentrieren sich allein auf algorithmische Aspekte des Web Information Retrieval. Die Forschungslitertaur liegt zum überwältigenden Teil nur in englischer Sprache vor; die Forschung selbst findet zu einem großen Teil in den USA statt. Aus diesem Grund werden Spezifika anderer Sprachen als des Englischen sowie Besonderheiten auf nationaler oder gar kontinentaler Ebene vernachlässigt. Die Konsequenzen, die sich aus den Besonderheiten des Web Information Re¬trieval ergeben, wurden bisher nur unzureichend erkannt. Suchmaschinen orientieren sich noch stark am klassischen Information Retrieval, wenn auch teils eigene Rankingkriterien gefunden wurden, vor allem die Ergänzung der klassischen Faktoren durch eine Art der Qualitätsbewertung der indexierten Dokumente. Die Arbeit soll aufzeigen, welche Schritte nötig sind, um Web Information Retrieval vor allem auch in Hinblick auf die Charakteristika der Suchmaschinen-Nutzer effektiv zu gestalten. Die Verfahren des klassischen Information Retrieval versagen hier, da sie einerseits von einer gepflegten Dokumentenkollektion, andererseits von einem geschulten Nutzer ausgehen. Suchmaschinen haben mit Problemen des sog. Index-Spamming zu kämpfen: Hierbei werden (oft in kommerziellem Interesse) inhaltlich wertlose Dokumente erstellt, die in den Trefferlisten der Suchmaschinen auf den vorderen Rängen angezeigt werden sollen, um Nutzer auf eine bestimmte Webseite zu lenken. Zwar existieren Verfahren, die ein solches Spamming verhindern sollen, allerdings können auch diese das Problem lediglich eindämmen, nicht aber verhindern. Das Problem ließe sich wenigstens zum Teil durch die Nutzer lösen, wenn diese gezielte Suchanfragen stellen würden, die solche irrelevanten Treffer ausschließen würden. Allerdings zeigt die Nutzerforschung einheitlich, dass das Wissen der Nutzer über die von ihnen verwendeten Suchmaschinen ausgesprochen gering ist; dies gilt sowohl für ihre Kenntnisse der Funktionsweise der Suchmaschinen als auch die Kenntnis der Suchfunktionen.
Die Arbeit konzentriert sich neben der Darstellung des Forschungsstands im Bereich des Web Information Retrieval auf einen nutzerzentrierten Ansatz des Aufbaus von Suchmaschinen, der sich aus dem Retrieval in klassischen Datenbanken herleitet. Als zentral für eine erfolgreiche Recherche wird dabei die Möglichkeit der gezielten Beschränkung der Recherche durch den Nutzer gesehen; die wichtigsten Faktoren sind hierbei die Einschränkung nach Aktualität, Qualität und die verbesserte Dokumentauswahl aufgrund einer erweiterten Dokumentrepräsentation. Alle drei Möglichkeiten sind in bisher verfügbaren Suchmaschinen nicht zufrieden stellend implementiert. Ein Problem bei der Bearbeitung des Themas ergab sich aus der Tatsache, dass die Forschung im Bereich Web Information Retrieval zu einem großen Teil bei den Anbietern selbst stattfindet, die darauf bedacht sind, ihre Erkenntnisse nicht zu veröffentlichen und damit der Konkurrenz zu überlassen. Viele Forschungsergebnisse können daher nur anhand der fertiggestellten Anwendungen rekonstruiert werden; hilfreich waren in manchen Fällen auch die von den Suchmaschinenbetreibern angemeldeten Patente, die für die vorliegende Arbeit ausgewertet wurden. Insgesamt zeigt sich, dass eine neue Form des Information Retrieval entstanden ist. Ziele des klassischen Information Retrieval wie die Vollständigkeit der Treffermenge verlieren ob der schieren Masse der zurückgegebenen Treffer an Bedeutung; dafür werden Faktoren der Qualitätsbewertung der Dokumente immer wichtiger. Das Web Information Retrieval setzt auf dem klassischen Information Retrieval auf und erweitert dieses wo nötig. Das Ziel bleibt aber weitgehend das gleiche: Dem Nutzer die für die Befriedigung seines Informationsbedürfnisses besten Ergebnisse zu liefern. Neben der Informationswissenschaft findet die Information-Retrieval-Forschung hauptsächlich in der Informatik statt. Der informationswissenschaftlichen Forschung kommt die Aufgabe zu, den stark technik-zentrierten Ansatz der Informatik um einen "Blick fürs Ganze" zu erweitern und insbesondere die Bedürfnisse der Nutzer in ihren Ansatz einzubinden. Aufgrund der enormen Bedeutung des Web Information Retrieval, welches in den klassischen informationswissenschaftlichen Bereich fällt, ergibt sich für die Informationswissenschaft auch die Chance, sich in diesem Thema gegenüber anderen Disziplinen zu profilieren. Zum Aufbau der Arbeit Die Arbeit lässt sich grob in zwei Hauptteile gliedern: Der erste Teil (Kap. 2-10) beschreibt den Bereich Web Information Retrieval mit allen seinen Besonderheiten in Abgrenzung zum klassischen Information Retrieval; der zweite Teil (Kap. 11-13) stellt anhand der Ergebnisse des ersten Teils einen nutzerzentrierten Ansatz der Rechercheverfeinerung in mehreren Schritten vor.

Content

Inhalt: 1 Einleitung 2 Forschungsumfeld 2.1 Suchmaschinen-Markt 2.2 Formen der Suche im WWW 2.3 Aufbau algorithmischer Suchmaschinen 2.4 Abfragesprachen 2.5 Arten von Suchanfragen 2.6 Nutzerstudien 2.7 Forschungsbereiche 3 Die Größe des Web und seine Abdeckung durch Suchmaschinen 3.1 Die Größe des indexierbaren Web 3.2 Die Struktur des Web 3.3 Crawling 3.4 Aktualität der Suchmaschinen 3.5 Das Invisible Web 4 Strukturinformationen 4.1 Strukturierungsgrad von Dokumenten 4.2 Strukturinformationen in den im Web gängigen Dokumenten 4.3 Trennung von Navigation, Layout und Inhalt 4.4 Repräsentation der Dokumente in den Datenbanken der Suchmaschinen 5 Klassische Verfahren des Information Retrieval und ihre Anwendung bei WWW-Suchmaschinen 5.1 Unterschiede zwischen klassischem Information Retrieval und Web Information Retrieval 5.2 Kontrolliertes Vokabular 5.3 Kriterien für die Aufnahme in den Datenbestand 5.4 Modelle des Information Retrieval 6 Ranking 6.1 Rankingfaktoren 6.2 Messbarkeit von Relevanz 6.3 Grundsätzliche Probleme des Relevance Ranking in Suchmaschinen
7 Informationsstatistische und informationslinguistische Verfahren 7.1 Textstatistische Verfahren 7.2 Nutzungsstatistische Verfahren 7.3 Informationslinguistische Verfahren 8 Linktopologische Rankingverfahren 8.1 Grundlagen linktopologischer Rankingverfahren: Science Citation Indexing 8.2 PageRank 8.3 Kleinbergs HITS 8.4 Hilltop 8.5 Evaluierung linktopologischer Verfahren 8.6 Problembereiche linktopologischer Rankingverfahren 8.7 Fazit linktopologische Verfahren 9 Retrievaltests 9.1 Aufbau und Nutzen von Retrievaltests 9.2 Aufbau und Ergebnisse ausgewählter Retrievaltests 9.3 Kritik an Retrievaltests 10 Verfahren der intuitiven Benutzerführung 10.1 Relevance Feedback 10.2 Vorschläge zur Erweiterung und Einschränkung der Suchanfrage 10.3 Klassifikation und Thesaurus 10.4 Clusterbildung 11 Aktualität 11.1 Bedeutung der Beschränkung nach der Aktualität der Dokumente 11.2 Funktionsfähigkeit der Datumsbeschränkung in Suchmaschinen 11.3 Möglichkeiten der Ermittlung von Datumsangaben in Web-Dokumenten 11.4 Aktualitätsfaktoren im Ranking 11.5 Spezialisierte Suchmaschinen für Nachrichten 11.6 Auswahl der gewünschten Aktualität durch den Nutzer 12 Qualität 12.1 Bedeutung der Beschränkung nach der Qualität der Dokumente 12.2 Qualitätsbeschränkungen bei der Recherche in Datenbank-Hosts 12.3 Identifizierung von Top-Quellen im WWW 12.4 Manuelle Einbindung von Top-Quellen 12.5 Automatisierte Einbindung von Invisible-Web-Quellen 12.6 Einbindung von Web-Verzeichnissen in Suchmaschinen 13 Verbesserung der Dokumentrepräsentation 13.1 Beschränkung auf den Inhaltsteil der Dokumente 13.2 Erweiterungen der Dokumentrepräsentation 13.3 Ersatz für die Nicht-Verwendbarkeit generischer Top-Level-Domains 13.4 Aufbereitung der Suchergebnisse in den Trefferlisten 14 Fazit und Ausblick 15 Literaturverzeichnis

Footnote

Zugl. Diss. Univ. Düsseldorf, Inst. für Sprache und Information, Abt. Informationswissenschaft
Rez. in: Information - Wissenschaft und Praxis. 56(2005) H.7, S.393-394 (J. Griesbaum): "... , das Buch wird seinem Titel und dem formulierten Anspruch sehr gut gerecht. Die 248 Seiten umfängliche Publikation leistet eine umfassende und, für den deutschsprachigen Raum, einzigartige State-of-the-Art-Analyse der Verfahren und auch der Defizite von Suchmaschinen im Internet. Dabei beschränkt sich Lewandowski nicht auf eine technikzentrierte Beschreibung aktueller Retrievalansätze, sondern akzentuiert ebenso deutlich auch die Problemfelder bei der Nutzung von Suchmaschinen. Dieser nutzerzentrierte Ansatz kommt vor allem im konzeptionellen Teil der Arbeit zum Tragen, der das Ziel verfolgt, Suchmaschinennutzern verbesserte Rechercheoptionen zu verschaffen. Angesichts der nur in geringem Maße vorhandenen Recherchekenntnisse der Nutzer liegt die Herausforderung vor allem darin, solche verbesserten Recherchemöglichkeiten derart auszugestalten, dass sie sich in realen Suchkontexten auch tatsächlich auswirken und nicht etwa wie die meist als "Erweitere Suche" bezeichneten Anfragemasken ein kaum beachtetes Dasein fristen. Der Verfasser konzipiert in diesem wichtigen Forschungsfeld neue Ansätze, um die Oualität des Information Retrievals zu verbessern. ... "

Horch, A.; Kett, H.; Weisbecker, A.: Semantische Suchsysteme für das Internet : Architekturen und Komponenten semantischer Suchmaschinen (2013) 0.03

0.034764186 = product of:
  0.13905674 = sum of:
    0.057211563 = weight(_text_:einzelne in 4063) [ClassicSimilarity], result of:
      0.057211563 = score(doc=4063,freq=2.0), product of:
        0.17595729 = queryWeight, product of:
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.029895496 = queryNorm
        0.3251446 = fieldWeight in 4063, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4063)
    0.051481117 = weight(_text_:anwendungen in 4063) [ClassicSimilarity], result of:
      0.051481117 = score(doc=4063,freq=2.0), product of:
        0.16691269 = queryWeight, product of:
          5.583205 = idf(docFreq=451, maxDocs=44218)
          0.029895496 = queryNorm
        0.30843142 = fieldWeight in 4063, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.583205 = idf(docFreq=451, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4063)
    0.020185156 = weight(_text_:der in 4063) [ClassicSimilarity], result of:
      0.020185156 = score(doc=4063,freq=12.0), product of:
        0.06677957 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.029895496 = queryNorm
        0.30226544 = fieldWeight in 4063, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4063)
    0.010178916 = weight(_text_:information in 4063) [ClassicSimilarity], result of:
      0.010178916 = score(doc=4063,freq=8.0), product of:
        0.052480884 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.029895496 = queryNorm
        0.19395474 = fieldWeight in 4063, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4063)
  0.25 = coord(4/16)

Abstract: In der heutigen Zeit nimmt die Flut an Informationen exponentiell zu. In dieser »Informationsexplosion« entsteht täglich eine unüberschaubare Menge an neuen Informationen im Web: Beispielsweise 430 deutschsprachige Artikel bei Wikipedia, 2,4 Mio. Tweets bei Twitter und 12,2 Mio. Kommentare bei Facebook. Während in Deutschland vor einigen Jahren noch Google als nahezu einzige Suchmaschine beim Zugriff auf Informationen im Web genutzt wurde, nehmen heute die u.a. in Social Media veröffentlichten Meinungen und damit die Vorauswahl sowie Bewertung von Informationen einzelner Experten und Meinungsführer an Bedeutung zu. Aber wie können themenspezifische Informationen nun effizient für konkrete Fragestellungen identifiziert und bedarfsgerecht aufbereitet und visualisiert werden? Diese Studie gibt einen Überblick über semantische Standards und Formate, die Prozesse der semantischen Suche, Methoden und Techniken semantischer Suchsysteme, Komponenten zur Entwicklung semantischer Suchmaschinen sowie den Aufbau bestehender Anwendungen. Die Studie erläutert den prinzipiellen Aufbau semantischer Suchsysteme und stellt Methoden der semantischen Suche vor. Zudem werden Softwarewerkzeuge vorgestellt, mithilfe derer einzelne Funktionalitäten von semantischen Suchmaschinen realisiert werden können. Abschließend erfolgt die Betrachtung bestehender semantischer Suchmaschinen zur Veranschaulichung der Unterschiede der Systeme im Aufbau sowie in der Funktionalität.
RSWK: Suchmaschine / Semantic Web / Information Retrieval
Suchmaschine / Information Retrieval / Ranking / Datenstruktur / Kontextbezogenes System
Subject: Suchmaschine / Semantic Web / Information Retrieval
Suchmaschine / Information Retrieval / Ranking / Datenstruktur / Kontextbezogenes System

Korves, J.: Seiten bewerten : Googles PageRank (2005) 0.03
```
0.03160059 = product of:
  0.16853648 = sum of:
    0.03439793 = weight(_text_:informatik in 866) [ClassicSimilarity], result of:
      0.03439793 = score(doc=866,freq=2.0), product of:
        0.15254098 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.029895496 = queryNorm
        0.2254996 = fieldWeight in 866, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.03125 = fieldNorm(doc=866)
    0.027969373 = weight(_text_:der in 866) [ClassicSimilarity], result of:
      0.027969373 = score(doc=866,freq=36.0), product of:
        0.06677957 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.029895496 = queryNorm
        0.4188313 = fieldWeight in 866, product of:
          6.0 = tf(freq=36.0), with freq of:
            36.0 = termFreq=36.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=866)
    0.10616919 = weight(_text_:wirtschaftsinformatik in 866) [ClassicSimilarity], result of:
      0.10616919 = score(doc=866,freq=4.0), product of:
        0.22535236 = queryWeight, product of:
          7.538004 = idf(docFreq=63, maxDocs=44218)
          0.029895496 = queryNorm
        0.47112525 = fieldWeight in 866, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          7.538004 = idf(docFreq=63, maxDocs=44218)
          0.03125 = fieldNorm(doc=866)
  0.1875 = coord(3/16)
```
Abstract

Mit der Entstehung des World Wide Web im Jahre 1989 und dem darauf folgenden rasanten Anstieg der Zahl an Webseiten, kam es sehr schnell zu der Notwendigkeit, eine gewisse Ordnung in die Vielzahl von Inhalten zu bringen. So wurde schon im Jahre 1991 ein erster Vorläufer der heutigen Websuchmaschinen namens Gopher entwickelt. Die Struktur von Gopher, bei der zunächst alle Webseiten katalogisiert wurden, um anschließend komplett durchsucht werden zu können, war damals richtungweisend und wird auch heute noch in den meisten anderen Websuchmaschinen verwendet. Von damals bis heute hat sich sehr viel am Markt der Suchmaschinen verändert. Seit dem Jahre 2004 gibt es nur mehr drei große Websuchmaschinen, bezogen auf die Anzahl erfasster Dokumente. Neben Yahoo! Search und Microsofts MSN Search ist Google die bisher erfolgreichste Suchmaschine der Welt. Dargestellt werden die Suchergebnisse, indem sie der Relevanz nach sortiert werden. Jede Suchmaschine hat ihre eigenen geheimen Kriterien, welche für die Bewertung der Relevanz herangezogen werden. Googles Suchergebnisse werden aus einer Kombination zweier Verfahren angeordnet. Neben der Hypertext-Matching-Analyse ist dies die PageRank-Technologie. Der so genannte PageRank-Algorithmus, benannt nach seinem Erfinder Lawrence Page, ist die wesentliche Komponente, die Google auf seinen Erfolgsweg gebracht hat. Über die genaue Funktionsweise dieses Algorithmus hat Google, insbesondere nach einigen Verbesserungen in den letzten Jahren, nicht alle Details preisgegeben. Fest steht jedoch, dass der PageRank-Algorithmus die Relevanz einer Webseite auf Basis der Hyperlinkstruktur des Webs berechnet, wobei die Relevanz einer Webseite danach gewichtet wird, wie viele Links auf sie zeigen und Verweise von ihrerseits stark verlinkten Seiten stärker ins Gewicht fallen.
Diese Seminararbeit widmet sich der Darstellung des PageRank-Algorithmus sowie der Erläuterung von Verbesserungen, durch die der Algorithmus schneller und effizienter wird. Hierzu werden dem Leser in Kapitel 2 zunächst einige Grundlagen nahe gebracht. Anschließend wird im Hauptteil dieser Ausarbeitung in Kapitel 3 detailliert auf den PageRank-Algorithmus sowie auf drei Weiterentwicklungen eingegangen, welche die Verarbeitungseffizienz des Grundalgorithmus so erhöhen, dass dadurch ein themenspezifisches Ranking ermöglicht werden könnte. Abschließend werden die Ergebnisse in Kapitel 4 zusammengefasst und ein Ausblick auf die Zukunft gegeben.

Content

Ausarbeitung im Rahmen des Seminars Suchmaschinen und Suchalgorithmen, Institut für Wirtschaftsinformatik Praktische Informatik in der Wirtschaft, Westfälische Wilhelms-Universität Münster. - Vgl.: http://www-wi.uni-muenster.de/pi/lehre/ss05/seminarSuchen/Ausarbeitungen/JanKorves.pdf

Imprint

Münster : Institut für Wirtschaftsinformatik der Westfälische Wilhelms-Universität Münster

Altmann, O.; Pöhl, S.: Information Retrieval im Internet : bekannte Suchdienste und ihre Eigenschaften (1997) 0.03

0.03134022 = product of:
  0.12536088 = sum of:
    0.08236979 = weight(_text_:anwendungen in 205) [ClassicSimilarity], result of:
      0.08236979 = score(doc=205,freq=2.0), product of:
        0.16691269 = queryWeight, product of:
          5.583205 = idf(docFreq=451, maxDocs=44218)
          0.029895496 = queryNorm
        0.49349028 = fieldWeight in 205, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.583205 = idf(docFreq=451, maxDocs=44218)
          0.0625 = fieldNorm(doc=205)
    0.018646248 = weight(_text_:der in 205) [ClassicSimilarity], result of:
      0.018646248 = score(doc=205,freq=4.0), product of:
        0.06677957 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.029895496 = queryNorm
        0.27922085 = fieldWeight in 205, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=205)
    0.0081431335 = weight(_text_:information in 205) [ClassicSimilarity], result of:
      0.0081431335 = score(doc=205,freq=2.0), product of:
        0.052480884 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.029895496 = queryNorm
        0.1551638 = fieldWeight in 205, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.0625 = fieldNorm(doc=205)
    0.016201708 = product of:
      0.032403417 = sum of:
        0.032403417 = weight(_text_:22 in 205) [ClassicSimilarity], result of:
          0.032403417 = score(doc=205,freq=2.0), product of:
            0.104688935 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.029895496 = queryNorm
            0.30952093 = fieldWeight in 205, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=205)
      0.5 = coord(1/2)
  0.25 = coord(4/16)

Abstract: Wie einige wichtige Suchmaschinen arbeiten und wie der Benutzer die Suche effektivieren kann, ist für den Erfolg nicht unerheblich. Wenn darüber hinaus auch die Suchwerkzeuge für bestimmte Arten von Protokollen bekannt sind sowie solche für bestimmte Regionen, hat der Suchende gute Aussichten auf reiche Ausbeute
Pages: S.18-22
Source: Internet: Grundlagen, Technik, Anwendungen. Hrsg.: M. Rothe u.a

Lewandowski, D.: Web Information Retrieval (2005) 0.03
```
0.029262137 = product of:
  0.11704855 = sum of:
    0.03439793 = weight(_text_:informatik in 4028) [ClassicSimilarity], result of:
      0.03439793 = score(doc=4028,freq=2.0), product of:
        0.15254098 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.029895496 = queryNorm
        0.2254996 = fieldWeight in 4028, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.03125 = fieldNorm(doc=4028)
    0.045769252 = weight(_text_:einzelne in 4028) [ClassicSimilarity], result of:
      0.045769252 = score(doc=4028,freq=2.0), product of:
        0.17595729 = queryWeight, product of:
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.029895496 = queryNorm
        0.26011568 = fieldWeight in 4028, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.03125 = fieldNorm(doc=4028)
    0.024666667 = weight(_text_:der in 4028) [ClassicSimilarity], result of:
      0.024666667 = score(doc=4028,freq=28.0), product of:
        0.06677957 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.029895496 = queryNorm
        0.36937445 = fieldWeight in 4028, product of:
          5.2915025 = tf(freq=28.0), with freq of:
            28.0 = termFreq=28.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=4028)
    0.012214699 = weight(_text_:information in 4028) [ClassicSimilarity], result of:
      0.012214699 = score(doc=4028,freq=18.0), product of:
        0.052480884 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.029895496 = queryNorm
        0.23274568 = fieldWeight in 4028, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.03125 = fieldNorm(doc=4028)
  0.25 = coord(4/16)
```
Abstract

WebInformationRetrieval hat sich als gesonderter Forschungsbereich herausgebildet. Neben den im klassischen Information Retrieval behandelten Fragen ergeben sich durch die Eigenheiten des Web neue und zusätzliche Forschungsfragen. Die Unterschiede zwischen Information Retrieval und Web Information Retrieval werden diskutiert. Derzweite Teil des Aufsatzes gibt einen Überblick über die Forschungsliteratur der letzten zwei Jahre. Dieser Aufsatz gibt einen Überblick über den Stand der Forschung im Bereich Web Information Retrieval. Im ersten Teil werden die besonderen Probleme, die sich in diesem Bereich ergeben, anhand einer Gegenüberstellung mit dem "klassischen" Information Retrieval erläutert. Der weitere Text diskutiert die wichtigste in den letzten Jahren erschienene Literatur zum Thema, wobei ein Schwerpunkt auf die - so vorhanden-deutschsprachige Literatur gelegt wird. Der Schwerpunkt liegt auf Literatur aus den Jahren 2003 und 2004. Zum einen zeigt sich in dem betrachteten Forschungsfeld eine schnelle Entwicklung, so dass viele ältere Untersuchungen nur noch einen historischen bzw. methodischen Wert haben; andererseits existieren umfassende ältere Reviewartikel (s. v.a. Rasmussen 2003). Schon bei der Durchsicht der Literatur wird allerdings deutlich, dass zu einigen Themenfeldern keine oder nur wenig deutschsprachige Literatur vorhanden ist. Leider ist dies aber nicht nur darauf zurückzuführen, dass die Autoren aus den deutschsprachigen Ländern ihre Ergebnisse in englischer Sprache publizieren. Vielmehr wird deutlich, dass in diesen Ländern nur wenig Forschung im Suchmaschinen-Bereich stattfindet. Insbesondere zu sprachspezifischen Problemen von Web-Suchmaschinen fehlen Untersuchungen. Ein weiteres Problem der Forschung im Suchmaschinen-Bereich liegt in der Tatsache begründet, dass diese zu einem großen Teil innerhalb von Unternehmen stattfindet, welche sich scheuen, die Ergebnisse in großem Umfang zu publizieren, da sie fürchten, die Konkurrenz könnte von solchen Veröffentlichungen profitieren. So finden sich etwa auch Vergleichszahlen über einzelne Suchmaschinen oft nur innerhalb von Vorträgen oder Präsentationen von Firmenvertretern (z.B. Singhal 2004; Dean 2004). Das Hauptaugenmerk dieses Artikels liegt auf der Frage, inwieweit Suchmaschinen in der Lage sind, die im Web vorhanden Inhalte zu indexieren, mit welchen Methoden sie dies tun und ob bzw. wie sie ihre Ziele erreichen. Ausgenommen bleiben damit explizit Fragen der Effizienz bei der Erschließung des Web und der Skalierbarkeit von Suchmaschinen. Anders formuliert: Diese Übersicht orientiert sich an klassisch informationswissenschaftlichen Fragen und spart die eher im Bereich der Informatik diskutierten Fragen weitgehend aus.
Eine regelmäßige Übersicht neuer US-Patente und US-Patentanmeldungen im Bereich Information Retrieval bietet die News-Seite Resourceshelf (www.resourceshelf.com).

Content

Mit einer Tabelle, die eine Gegenüberstellung des WebRetrieval zum 'klassischen' Information Retrieval anbietet

Source

Information - Wissenschaft und Praxis. 56(2005) H.1, S.5-12
Handbuch Internet-Suchmaschinen [1] : Nutzerorientierung in Wissenschaft und Praxis (2009) 0.03
```
0.025793262 = product of:
  0.13756406 = sum of:
    0.042565268 = weight(_text_:informatik in 329) [ClassicSimilarity], result of:
      0.042565268 = score(doc=329,freq=4.0), product of:
        0.15254098 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.029895496 = queryNorm
        0.27904153 = fieldWeight in 329, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.02734375 = fieldNorm(doc=329)
    0.07265792 = weight(_text_:monographien in 329) [ClassicSimilarity], result of:
      0.07265792 = score(doc=329,freq=4.0), product of:
        0.1992968 = queryWeight, product of:
          6.666449 = idf(docFreq=152, maxDocs=44218)
          0.029895496 = queryNorm
        0.36457142 = fieldWeight in 329, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          6.666449 = idf(docFreq=152, maxDocs=44218)
          0.02734375 = fieldNorm(doc=329)
    0.022340873 = weight(_text_:der in 329) [ClassicSimilarity], result of:
      0.022340873 = score(doc=329,freq=30.0), product of:
        0.06677957 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.029895496 = queryNorm
        0.33454654 = fieldWeight in 329, product of:
          5.477226 = tf(freq=30.0), with freq of:
            30.0 = termFreq=30.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02734375 = fieldNorm(doc=329)
  0.1875 = coord(3/16)
```
Abstract

In diesem Handbuch steht die Nutzerorientierung im Vordergrund. Namhafte Autoren aus Wissenschaft und Praxis beschäftigen sich in 16 Kapiteln mit Web-Suchmaschinen, die die Vorreiter hinsichtlich des sich verändernden Nutzerverhaltens sind. Das bei Google und Co. erlernte Verhalten wird auf andere Suchsysteme übertragen: die Website-Suche, die Intranet-Suche und die Suche in Spezialsuchmaschinen und Fachdatenbanken. Für alle Anbieter von Informationssystemen wird es zunehmend wichtig, einerseits die Arbeitsweise von Suchmaschinen zu kennen, andererseits mit dem Verhalten Ihrer Nutzer vertraut zu sein. Auf der Seite der Wissenschaftler werden Informatiker, Informationswissenschaftler, Medienwissenschaftler und Bibliothekswissenschaftler angesprochen. Für Entwickler bietet dieses Handbuch einen Überblick über Möglichkeiten für Suchsysteme, gibt Anregungen für Umsetzung und zeigt anhand von bestehenden Lösungen, wie eine Umsetzung aussehen kann. Für Entscheider, Rechercheure und Informationsvermittler bietet das Buch lesbare Überblicksartikel zu relevanten Themenbereichen, auf deren Basis eine Strategie für individuelle Suchlösungen erarbeitet werden kann. Als dritte Praktiker gruppe sind u.a. Berater, Lehrer, Journalisten und Politiker zu nennen, die sich zu den wichtigsten Themen rund um die Suche informieren möchten.

Classification

ST 205 Informatik / Monographien / Vernetzung, verteilte Systeme / Internet allgemein

Content

I. Suchmaschinenlandschaft Der Markt für Internet-Suchmaschinen - Christian Maaß, Andre Skusa, Andreas Heß und Gotthard Pietsch Typologie der Suchdienste im Internet - Joachim Griesbaum, Bernard Bekavac und Marc Rittberger Spezialsuchmaschinen - Dirk Lewandowski Suchmaschinenmarketing - Carsten D. Schultz II. Suchmaschinentechnologie Ranking-Verfahren für Web-Suchmaschinen - Philipp Dopichaj Programmierschnittstellen der kommerziellen Suchmaschinen - Fabio Tosques und Philipp Mayr Personalisierung der Internetsuche - Lösungstechniken und Marktüberblick - Kai Riemer und Fabian Brüggemann III. Nutzeraspekte Methoden der Erhebung von Nutzerdaten und ihre Anwendung in der Suchmaschinenforschung - Nadine Höchstötter Standards der Ergebnispräsentation - Dirk Lewandowski und Nadine Höchstötter Universal Search - Kontextuelle Einbindung von Ergebnissen unterschiedlicher Quellen und Auswirkungen auf das User Interface - Sonja Quirmbach Visualisierungen bei Internetsuchdiensten - Thomas Weinhold, Bernard Bekavac, Sonja Hierl, Sonja Öttl und Josef Herget IV. Recht und Ethik Datenschutz bei Suchmaschinen - Thilo Weichert Moral und Suchmaschinen - Karsten Weber V. Vertikale Suche Enterprise Search - Suchmaschinen für Inhalte im Unternehmen - Julian Bahrs Wissenschaftliche Dokumente in Suchmaschinen - Dirk Pieper und Sebastian Wolf Suchmaschinen für Kinder - Maria Zens, Friederike Silier und Otto Vollmers

Footnote

Vgl. auch: http://www.bui.haw-hamburg.de/164.html (Elektronische Ressource) Rez. in: IWP 60(2009) H.3, S.177-178 (L. Weisel): "Mit dem vorliegenden Handbuch will der Herausgeber, Prof. Dr. Dirk Lewandowksi von der Hochschule für Angewandte Wissenschaften Hamburg, nach eigenen Worten eine Lücke füllen. Er hat renommierte Autoren aus unterschiedlichen Fachcommunities aufgerufen, zu dem Thema "Suchmaschinen im Internet" ihre unterschiedlichen Perspektiven in Form von Übersichtsartikeln zusammenzuführen. So möchte er mit diesem Band den Austausch zwischen den Communities sowie zwischen Wissenschaftlern und Praktikern fördern. . . . Empfehlung Dem Handbuch "Internet-Suchmaschinen" wird eine breite Leserschaft aus Wissenschaft und Praxis des Suchens und Findens im Web gewünscht, es sollte bei allen Einrichtungen für die Ausbildung des Fachnachwuchses zum Repertoire gehören, um diesen kritisch an die Thematik heranzuführen. Das gedruckte Werk wird der Aktualität und dem Wandel in diesem sehr dynamischen Fachgebiet Tribut zollen müssen. Statt einer zeitnahen Zweitausgabe sei dem Herausgeber und dem Verlag hier der Weg der kontinuierlichen Ergänzung empfohlen: um die oben genannten fehlenden Beiträge, aber auch sich neu ententwickelnde Inhalte - in Form eines lebendigen Lehrbuches -auf der geeigneten elektronischen Plattform."

RVK

ST 205 Informatik / Monographien / Vernetzung, verteilte Systeme / Internet allgemein
Lewandowski, D.: Suchmaschinen - ein Thema für die Informationswissenschaft (2005) 0.02
```
0.024101935 = product of:
  0.09640774 = sum of:
    0.034326937 = weight(_text_:einzelne in 3183) [ClassicSimilarity], result of:
      0.034326937 = score(doc=3183,freq=2.0), product of:
        0.17595729 = queryWeight, product of:
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.029895496 = queryNorm
        0.19508676 = fieldWeight in 3183, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.0234375 = fieldNorm(doc=3183)
    0.030888673 = weight(_text_:anwendungen in 3183) [ClassicSimilarity], result of:
      0.030888673 = score(doc=3183,freq=2.0), product of:
        0.16691269 = queryWeight, product of:
          5.583205 = idf(docFreq=451, maxDocs=44218)
          0.029895496 = queryNorm
        0.18505886 = fieldWeight in 3183, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.583205 = idf(docFreq=451, maxDocs=44218)
          0.0234375 = fieldNorm(doc=3183)
    0.02371219 = weight(_text_:der in 3183) [ClassicSimilarity], result of:
      0.02371219 = score(doc=3183,freq=46.0), product of:
        0.06677957 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.029895496 = queryNorm
        0.3550815 = fieldWeight in 3183, product of:
          6.78233 = tf(freq=46.0), with freq of:
            46.0 = termFreq=46.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0234375 = fieldNorm(doc=3183)
    0.007479945 = weight(_text_:information in 3183) [ClassicSimilarity], result of:
      0.007479945 = score(doc=3183,freq=12.0), product of:
        0.052480884 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.029895496 = queryNorm
        0.14252704 = fieldWeight in 3183, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.0234375 = fieldNorm(doc=3183)
  0.25 = coord(4/16)
```
Content

"Web-Suchmaschinen gibt es seit mittlerweile etwa zehn Jahren. Mit ihnen ist die Informationsrecherche, welche lange Zeit eine Sache für (uns) Experten war, bei Otto Normalverbraucher angekommen. Suchmaschinen haben sich an die Bedürfnisse dieser Nutzerschaft angepasst, was von Expertenseite zu vielerlei Klagen über ihre "Primitivität` geführt hat. Als Chance kann hier aber die Erkenntnis gesehen werden, dass die Nutzer einfache Interfaces und ein gutes Ranking der Suchergebnisse benötigen - auch in fachlichen Anwendungen. Der Durchbruch des Information Retrieval und seiner Bedeutung zeigt sich aber nicht nur durch die breite Nutzerschaft. Das Kernstück von erfolgreichen Suchmaschinen-Unternehmen wie Google und Yahoo! bilden Information-Retrieval-Verfahren - von besonderem Interesse sind dabei stets die von den Firmen geheim gehaltenen Ranking-Algorithmen. Die Forschung im IR-Bereich findet inzwischen zahlreiche namhafte Sponsoren - bei der letzten Jahrestagung der Special Interest Group an Information Retrieval (SIGIR) waren unter anderem Microsoft, IBM und Google mit im Boot. Suchmaschinen-Forschung findet in Deutschland in zahlreichen Hochschulen und Unternehmen statt, dabei ist sie allerdings verstreut und wenig koordiniert. Die zahlreichen auf das Call for Papers für dieses Themenheft der IWP eingegangenen Beiträge zeigen erfreulicherweise ein großes Potenzial für die informationswissenschaftliche Forschung in diesem Bereich. Der erste Beitrag befasst sich mit den Eigenheiten des Web und arbeitet die Unterschiede zwischen klassischem Information Retrieval und Web Information Retrieval heraus. Damit werden die Grundlagen für die Diskussion über Suchmaschinen gelegt. Der zweite Teil des Beitrags gibt einen Überblick der aktuellen Forschungsliteratur mit informationswissenschaftlichem Schwerpunkt und hat zum Ziel, weitere Forschung anzuregen. Thomas Mandl beschreibt in der Darstellung seines AOUAINT-Projekts die unterschiedlichen Ansätze, (Web-)Dokumente nach ihrer Oualität zu beurteilen. Solche Verfahren werden bereits von den bisher bestehenden Suchmaschinen eingesetzt; man denke etwa an das Kernstück von Google, das so genannte PageRank-Verfahren. Allerdings beschränken sich die bisherigen Verfahren nur auf einzelne Aspekte von Qualität. AOUAINT erweitert die Qualitätsbewertung um weitere Faktoren und kann so das Retrieval verbessern.
Neben den "harten Faktoren" der Oualität der Suchergebnisse spielt auch die Gestaltung von Suchinterfaces eine wichtige Rolle für die Akzeptanz bzw. Nicht-Akzeptanz von Suchwerkzeugen. Die Untersuchung von Jens Fauldrath und Arne Kunisch vergleicht die Interfaces der wichtigsten in Deutschland vertretenen Suchmaschinen und Portale und gibt Empfehlungen für deren Gestaltung und Funktionsumfang. Neue Wege in der Gestaltung von Ergebnismengen beschreibt der Beitrag von Fridolin Wild. Anhand des Vergleichs von bestehenden Visualisierungslösungen werden best practices für die Ergebnispräsentation herausgearbeitet. Für die Zukunft rechnet Wild mit einem zunehmenden Einsatz solcher Systeme, da er in ihnen die Möglichkeit sieht, nicht nur die Benutzeroberflächen zu verändern, sondern auch das Retrivalverfahren an sich zu verbessern. Die Internationalität des Web hat es mit sich gebracht, dass Suchmaschinen in der Regel für den weltweiten Markt entwickelt werden. Wie sie mit einzelnen Sprachen umgehen, ist bisher weitgehend un geklärt. Eine Untersuchung über den Umgang von Suchmaschinen mit den Eigenheiten der deutschen Sprache legen Esther Guggenheim und Judith Bar-Ilan vor. Sie kommen zu dem Schluss, dass die populären Suchmaschinen zunehmend besser mit deutschsprachigen Anfragen umgehen können, sehen allerdings weitere Verbesserungsmöglichkeiten. Dem noch relativ neuen Forschungsgebiet der Webometrie ist der Beitrag von Philipp Mayr und Fabio Tosques zuzuordnen. Webometrie wendet die aus der Bibliometrie bzw. Informetrie bekannten Verfahren auf den Web-Korpus an. Im vorliegenden Beitrag wird das Application Programming Interface (API) von Google auf seine Tauglichkeit für webometrische Untersuchungen getestet. Die Autoren kommen zu dem Schluss, dass kleinere Einschränkungen und Probleme nicht die zahlreichen Möglichkeiten, die das API bietet, mindern. Ein Beispiel für den Einsatz von Suchmaschinen-Technologie in der Praxis beschreibt schließlich der letzte Beitrag des Hefts. Friedrich Summann und Sebastian Wolf stellen eine Suchmaschine für wissenschaftliche Inhalte vor, die die Oualität von Fachdatenbanken mit der Benutzerfreundlichkeit von Web-Suchmaschinen verbinden soll. Im Aufsatz werden die eingesetzten Technologien und die möglichen Einsatzgebiete beschrieben. Der Gastherausgeber wünscht sich von diesem Themenheft, dass es Anregungen für weitere Forschungs- und Anwendungsprojekte geben möge, sei dies an Hochschulen oder in Unternehmen."

Source

Information - Wissenschaft und Praxis. 56(2005) H.1, S.1

Croft, W.B.; Metzler, D.; Strohman, T.: Search engines : information retrieval in practice (2010) 0.02

0.022842444 = product of:
  0.121826366 = sum of:
    0.072969034 = weight(_text_:informatik in 2605) [ClassicSimilarity], result of:
      0.072969034 = score(doc=2605,freq=4.0), product of:
        0.15254098 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.029895496 = queryNorm
        0.4783569 = fieldWeight in 2605, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.046875 = fieldNorm(doc=2605)
    0.020255787 = weight(_text_:information in 2605) [ClassicSimilarity], result of:
      0.020255787 = score(doc=2605,freq=22.0), product of:
        0.052480884 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.029895496 = queryNorm
        0.38596505 = fieldWeight in 2605, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.046875 = fieldNorm(doc=2605)
    0.028601538 = product of:
      0.057203077 = sum of:
        0.057203077 = weight(_text_:engineering in 2605) [ClassicSimilarity], result of:
          0.057203077 = score(doc=2605,freq=2.0), product of:
            0.16061439 = queryWeight, product of:
              5.372528 = idf(docFreq=557, maxDocs=44218)
              0.029895496 = queryNorm
            0.35615164 = fieldWeight in 2605, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.372528 = idf(docFreq=557, maxDocs=44218)
              0.046875 = fieldNorm(doc=2605)
      0.5 = coord(1/2)
  0.1875 = coord(3/16)

Abstract: For introductory information retrieval courses at the undergraduate and graduate level in computer science, information science and computer engineering departments. Written by a leader in the field of information retrieval, Search Engines: Information Retrieval in Practice, is designed to give undergraduate students the understanding and tools they need to evaluate, compare and modify search engines. Coverage of the underlying IR and mathematical models reinforce key concepts. The book's numerous programming exercises make extensive use of Galago, a Java-based open source search engine. SUPPLEMENTS / Extensive lecture slides (in PDF and PPT format) / Solutions to selected end of chapter problems (Instructors only) / Test collections for exercises / Galago search engine
BK: 54.75 / Sprachverarbeitung <Informatik>
Classification: 54.75 / Sprachverarbeitung <Informatik>
LCSH: Information retrieval
Information Storage and Retrieval
RSWK: Suchmaschine / Information Retrieval
Subject: Suchmaschine / Information Retrieval
Information retrieval
Information Storage and Retrieval

Loia, V.; Pedrycz, W.; Senatore, S.; Sessa, M.I.: Web navigation support by means of proximity-driven assistant agents (2006) 0.02

0.02108212 = product of:
  0.11243797 = sum of:
    0.09093153 = weight(_text_:515 in 5283) [ClassicSimilarity], result of:
      0.09093153 = score(doc=5283,freq=2.0), product of:
        0.22183119 = queryWeight, product of:
          7.4202213 = idf(docFreq=71, maxDocs=44218)
          0.029895496 = queryNorm
        0.40991318 = fieldWeight in 5283, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          7.4202213 = idf(docFreq=71, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5283)
    0.011380374 = weight(_text_:information in 5283) [ClassicSimilarity], result of:
      0.011380374 = score(doc=5283,freq=10.0), product of:
        0.052480884 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.029895496 = queryNorm
        0.21684799 = fieldWeight in 5283, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5283)
    0.010126068 = product of:
      0.020252137 = sum of:
        0.020252137 = weight(_text_:22 in 5283) [ClassicSimilarity], result of:
          0.020252137 = score(doc=5283,freq=2.0), product of:
            0.104688935 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.029895496 = queryNorm
            0.19345059 = fieldWeight in 5283, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0390625 = fieldNorm(doc=5283)
      0.5 = coord(1/2)
  0.1875 = coord(3/16)

Abstract: The explosive growth of the Web and the consequent exigency of the Web personalization domain have gained a key position in the direction of customization of the Web information to the needs of specific users, taking advantage of the knowledge acquired from the analysis of the user's navigational behavior (usage data) in correlation with other information collected in the Web context, namely, structure, content, and user profile data. This work presents an agent-based framework designed to help a user in achieving personalized navigation, by recommending related documents according to the user's responses in similar-pages searching mode. Our agent-based approach is grounded in the integration of different techniques and methodologies into a unique platform featuring user profiling, fuzzy multisets, proximity-oriented fuzzy clustering, and knowledge-based discovery technologies. Each of these methodologies serves to solve one facet of the general problem (discovering documents relevant to the user by searching the Web) and is treated by specialized agents that ultimately achieve the final functionality through cooperation and task distribution.
Date: 22. 7.2006 16:59:13
Footnote: Beitrag in einer Special Topic Section on Soft Approaches to Information Retrieval and Information Access on the Web
Source: Journal of the American Society for Information Science and Technology. 57(2006) no.4, S.515-527

MacLeod, R.: Promoting a subject gateway : a case study from EEVL (Edinburgh Engineering Virtual Library) (2000) 0.02

0.020876914 = product of:
  0.16701531 = sum of:
    0.0143951615 = weight(_text_:information in 4872) [ClassicSimilarity], result of:
      0.0143951615 = score(doc=4872,freq=4.0), product of:
        0.052480884 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.029895496 = queryNorm
        0.27429342 = fieldWeight in 4872, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.078125 = fieldNorm(doc=4872)
    0.15262015 = sum of:
      0.095338464 = weight(_text_:engineering in 4872) [ClassicSimilarity], result of:
        0.095338464 = score(doc=4872,freq=2.0), product of:
          0.16061439 = queryWeight, product of:
            5.372528 = idf(docFreq=557, maxDocs=44218)
            0.029895496 = queryNorm
          0.5935861 = fieldWeight in 4872, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            5.372528 = idf(docFreq=557, maxDocs=44218)
            0.078125 = fieldNorm(doc=4872)
      0.057281688 = weight(_text_:22 in 4872) [ClassicSimilarity], result of:
        0.057281688 = score(doc=4872,freq=4.0), product of:
          0.104688935 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.029895496 = queryNorm
          0.54716086 = fieldWeight in 4872, product of:
            2.0 = tf(freq=4.0), with freq of:
              4.0 = termFreq=4.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.078125 = fieldNorm(doc=4872)
  0.125 = coord(2/16)

Date: 22. 6.2002 19:40:22
Source: Online information review. 24(2000) no.1, S.59-63
Theme: Information Gateway

Bertelmann, R.; Rusch-Feja, D.: Informationsretrieval im Internet : Surfen, Browsen, Suchen - mit einem Überblick über strukturierte Informationsangebote (1997) 0.02

0.020498177 = product of:
  0.10932361 = sum of:
    0.072073564 = weight(_text_:anwendungen in 217) [ClassicSimilarity], result of:
      0.072073564 = score(doc=217,freq=2.0), product of:
        0.16691269 = queryWeight, product of:
          5.583205 = idf(docFreq=451, maxDocs=44218)
          0.029895496 = queryNorm
        0.431804 = fieldWeight in 217, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.583205 = idf(docFreq=451, maxDocs=44218)
          0.0546875 = fieldNorm(doc=217)
    0.023073554 = weight(_text_:der in 217) [ClassicSimilarity], result of:
      0.023073554 = score(doc=217,freq=8.0), product of:
        0.06677957 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.029895496 = queryNorm
        0.34551817 = fieldWeight in 217, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=217)
    0.014176494 = product of:
      0.028352989 = sum of:
        0.028352989 = weight(_text_:22 in 217) [ClassicSimilarity], result of:
          0.028352989 = score(doc=217,freq=2.0), product of:
            0.104688935 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.029895496 = queryNorm
            0.2708308 = fieldWeight in 217, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=217)
      0.5 = coord(1/2)
  0.1875 = coord(3/16)

Abstract: Das gezielte Suchen im Internet findet in erster Linie mit Hilfe der Suchmaschinen statt. Daneben gibt es aber bereits eine Fülle von strukturierten Informationsangeboten, aufbereiteten Listen und Sammelstellen, die als Clearinghouse, Subject Gateway, Subject Tree oder Resource Pages bezeichnet werden. Solche intellektuell erstellten Übersichten geben in der Regel bereits Hinweise zu Inhalt und fachlichem Niveau der Quelle. Da die Art und Weise der Aufbereitung bei den Sammelstellen sehr unterschiedlich funktioniert, ist die Kenntnis ihrer Erschließungskriterien für ein erfolgreiches Retrieval unverzichtbar
Date: 9. 7.2000 11:31:22
Source: Internet: Grundlagen, Technik, Anwendungen. Hrsg.: M. Rothe u.a

Schmidt, W.: ¬Die Erfolgreiche : Wie die Suchmaschine wurde, was sie ist (2006) 0.02
```
0.01932509 = product of:
  0.07730036 = sum of:
    0.021498706 = weight(_text_:informatik in 5938) [ClassicSimilarity], result of:
      0.021498706 = score(doc=5938,freq=2.0), product of:
        0.15254098 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.029895496 = queryNorm
        0.14093725 = fieldWeight in 5938, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.01953125 = fieldNorm(doc=5938)
    0.028605781 = weight(_text_:einzelne in 5938) [ClassicSimilarity], result of:
      0.028605781 = score(doc=5938,freq=2.0), product of:
        0.17595729 = queryWeight, product of:
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.029895496 = queryNorm
        0.1625723 = fieldWeight in 5938, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.01953125 = fieldNorm(doc=5938)
    0.018426443 = weight(_text_:der in 5938) [ClassicSimilarity], result of:
      0.018426443 = score(doc=5938,freq=40.0), product of:
        0.06677957 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.029895496 = queryNorm
        0.27592933 = fieldWeight in 5938, product of:
          6.3245554 = tf(freq=40.0), with freq of:
            40.0 = termFreq=40.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.01953125 = fieldNorm(doc=5938)
    0.008769432 = product of:
      0.017538864 = sum of:
        0.017538864 = weight(_text_:22 in 5938) [ClassicSimilarity], result of:
          0.017538864 = score(doc=5938,freq=6.0), product of:
            0.104688935 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.029895496 = queryNorm
            0.16753313 = fieldWeight in 5938, product of:
              2.4494898 = tf(freq=6.0), with freq of:
                6.0 = termFreq=6.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.01953125 = fieldNorm(doc=5938)
      0.5 = coord(1/2)
  0.25 = coord(4/16)
```
Content

"Wer Google googelt, sieht zuallererst Google. Das klingt wie ein plattes Witzchen - ist aber schon das wesentliche Geheimnis des unheimlichen Erfolgs einer Suchmaschine, der es gelungen ist, binnen weniger Jahre das Internet, die Suche nach Informationen und die Werbewelt zu verändern und sich unentbehrlich zu machen. Googeln wurde buchstäblich zum Begriff. "Keine andere Marke hat je so schnell globale Anerkennung gefunden wie Google", schreiben David A. Vise, ein Reporter der "Washington Post", und sein Kollege Mark Malseed in ihrem Buch über den sagenhaften Aufstieg des Unternehmens, das Suchergebnisse in 35 Sprachen liefert. Allein in Deutschland nutzen heute über 22 Millionen Menschen die Suchmaschine mit den bunten Buchstaben regelmäßig - unter den Internet-Surfern hierzulande ein Marktanteil von 65 Prozent. Sie suchen nach Neuigkeiten über ihre Filmhelden, prüfen die Schreibweise von Fremdwörtern oder forschen wie Detektive nach Wissenswertem über die Frau oder den Mann, mit dem sie sich abends treffen werden - zum Rendezvous oder Geschäftsessen. Längst gelten in manchen Kreisen Menschen als Langweiler, über die selbst Google nichts weiß. Wie dieser Erfolg möglich war, beschreiben Vise und Malseed auf rund 300 Seiten. Man kann es mit dem Dichter Victor Hugo (1802-1885) aber auch kürzer sagen: "Nichts ist so mächtig wie eine Idee, deren Zeit gekommen ist." Noch mächtiger freilich ist eine Idee, die von der Konkurrenz übernommen wird - in totaler Verkennung der Bedürfnisse von Internet-Nutzern. Eine solche Idee brachte 1997 Google hervor - und hat längst Wirtschafts- und Kulturgeschichte geschrieben. Der zentrale Gedanke der beiden damals 22-jährigen Google-Gründer Larry Page und Sergey Brin ist simpel: Wenn die Lawine der im Internet abrufbaren Informationen weiter derart anschwillt, dann brauchen die Nutzer des weltweiten Netzes einen exzellenten Suchhund. Nicht umsonst ist der Name der Suchmaschine abgeleitet von dem Wort Googol, womit in der Mathematik eine absurd große Zahl mit hundert Nullen bezeichnet wird - eine Anspielung auf die unermessliche und längst unüberschaubare Weite des Internets.
Hilfe beim Finden tut also Not. Nur reicht es eben nicht, wenn ein Recherche-Programm für einen Begriff wie "Klimawandel" möglichst viele Fundstellen auflistet, durch die man sich dann erst einmal mühsam klicken und lesen muss. Das verbesserte Betriebsklima in der Firma XY ist für die meisten eher unwichtig. Page und Brin, Informatik-Studenten an der kalifornischen Universität Stanford, erkannten schnell, dass sie eine sinnvolle Rangfolge innerhalb der Suchergebnisse zustande bringen mussten, um Google zum Erfolg zu verhelfen Ihr erster Geldgeber Andy Bechtolsheim, der 1998 hilfreiche 100 000 Dollar beisteuerte, begründete seine Investition mit den Mängeln marktüblicher Suchmaschinen: "Damals benutzte ich das Internet fast ausschließlich für Suchanfragen, und ein Teil meiner Frustration rührte daher, dass AltaVista - die Standard-Suchmaschine - nicht sehr gut war." Viele der zahlreichen Ergebnisse waren unbrauchbar. Die 1995 in den USA ebenfalls gängige Suchmaschine Inktomi fand sich damals nicht einmal selber, wenn man ihren Namen in die Suchmaske eintippte. Google hingegen findet Relevantes meist zielsicher in Bruchteilen einer Sekunde - und sich selbst natürlich zuerst. Genial war auch die bis heute konsequent umgesetzte Idee, die Google-Startseite frei von Reklame und vor allem von Fotos und albernen Mätzchen zu halten. Derartiges verursacht nicht nur zusätzliche Ladezeit - gerade auf älteren Rechnern und bei langsamen Netz-Zugängen. Es wirkt auch unseriös und vermittelt den Eindruck, dass einem auf solchen Seiten vor allem etwas angedreht werden soll. Während die Konkurrenz ihre wichtigste Seite überluden, hielten Brin und Page an ihrem asketischen Portal fest. Dieses besteht bis heute praktisch nur aus dem Namen Google, kleinen Schaltflächen für die einzelnen Dienste und dem Suchfeld. Allenfalls werden zu besonderen Anlässen wie weltweit relevanten Jubiläen, Jahrestagen oder Sport-Ereignissen einzelne Buchstaben des Namenszuges meist witzig verändert.
Im Rückblick klingt es unglaublich, dass viele Insider noch Ende der 90er Jahre sträflich das Potenzial einer zielführenden Suchmaschine unterschätzten - darunter auch die Verantwortlichen des großen Such-Dienstes AltaVista und des redaktionell betreuten Netzverzeichnisses Yahoo, das seine Kunden mit allerlei Diensten an sich zu binden suchte. Beide lehnten es früh ab, bei Google einzusteigen - später indes kooperierte Yahoo dann doch. "Niemand konnte sich für die Finanzierung von Suchanfragen begeistern", berichtet Buchautor David Wise. Getrieben von ihrer Idee, möglichst vielen Menschen möglichst alle Informationen des globalen Datennetzes zugänglich zu machen, wussten Brin und Page hingegen genau, dass sie auf dem richtigen Weg waren - und sie verfolgten ihn so unbeirrt wie Lenkraketen. Dabei behielten sie auch finanziell immer das Steuer in der Hand - keineswegs selbstverständlich gegen Ende der 90er Jahre, als die Internet-Euphorie und der Boom so genannter Dotcom-Unternehmen dazu führten, dass nahezu jedem großmäuligen Jung-Unternehmer Millionen Dollar, Pfund oder Mark an Risiko-Kapital in den Rachen gestopft wurden. Doch Brin und Page waren nicht nur standhaft und sparsam. Sie haben von Anfang an versucht, ihrer Belegschaft das Arbeiten bei Google möglichst angenehm zu machen, indem sie ihre Mitarbeiter so unentgeltlich wie exquisit verköstigten und ihr diverse Dienste bereitstellten - vom Kindergarten über Friseur und Wäscherei bis zum FitnessStudio. Obendrein erwarten sie bis heute, dass jeder Programmierer mindestens ein Fünftel seiner Arbeitszeit komplett darauf verwendet, eigenen Einfällen nachzuspüren und Neues auszuprobieren. Die so ermunterten Mitarbeiter haben nützliche Neuerungen hervorgebracht: von der - auf die USA beschränkten - Telefonnummern-Suche durch Eingabe von Namen und Postleitzahl ins Suchfeld über die automatische Korrektur von Eingabefehlern ("Meinten Sie:... ") bis hin zum Nachrichten-Service "Google News oder zum opulenten Foto-Archiv: Die Bildersuche hält heute rund 1,2 Milliarden Stück bereit. Auch Google Earth, das Satelliten-Aufnahmen auf den heimischen PC bringt, hat Aufsehen erregt.

Date

3. 5.1997 8:44:22
Mandl, T.: Qualität als neue Dimension im Information Retrieval : Das AQUAINT Projekt (2005) 0.02
```
0.01900197 = product of:
  0.10134384 = sum of:
    0.068653874 = weight(_text_:einzelne in 3184) [ClassicSimilarity], result of:
      0.068653874 = score(doc=3184,freq=2.0), product of:
        0.17595729 = queryWeight, product of:
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.029895496 = queryNorm
        0.39017352 = fieldWeight in 3184, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.046875 = fieldNorm(doc=3184)
    0.022111729 = weight(_text_:der in 3184) [ClassicSimilarity], result of:
      0.022111729 = score(doc=3184,freq=10.0), product of:
        0.06677957 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.029895496 = queryNorm
        0.3311152 = fieldWeight in 3184, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=3184)
    0.01057824 = weight(_text_:information in 3184) [ClassicSimilarity], result of:
      0.01057824 = score(doc=3184,freq=6.0), product of:
        0.052480884 = queryWeight, product of:
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.029895496 = queryNorm
        0.20156369 = fieldWeight in 3184, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.7554779 = idf(docFreq=20772, maxDocs=44218)
          0.046875 = fieldNorm(doc=3184)
  0.1875 = coord(3/16)
```
Abstract

Die Bewertung von Internet-Dokumenten nach ihrer Qualität wird im Zeitalter verteilten und in großen Mengen vorliegenden Wissens zunehmend an Software delegiert. Dies gilt besonders bei der Suche nach Informationen etwa mit Internet-Suchmaschinen, bei der Qualitätsbewertungssysteme als Filter einsetzbar sind. Die starke Heterogenität der Qua-lität von Internet-Dokumenten lässt hier einen besonderen Mehrwert erwarten. Experimentelle Systeme behandeln verschiedeneAspekte und nutzen unterschiedliche Definitionen von Oualität. Im Einsatz befindliche Systeme greifen zur Zeit auf einzelne und begrenzte Aspekte von Qualität zu. Insbesondere die Analyse der Verlinkungsstruktur des Internets bietet einen Ansatzpunkt für existierende Systeme. Die Komplexität des Qualitätskonzepts und der Dokumente erfordert jedoch auf mehreren Aspekten beruhende Definitionen. Im Projekt AQUAINT (Automatische Qualitätsabschätzung für Internet Ressourcen) werden Oualitätsdefinitionen aus menschlichen Urteilen abgeleitet. Formale Eigenschaften von Internet-Seiten werden automatisch extrahiert. Menschliche Oualitätsurteile unterschiedlichster Art bilden die Grundlage für Verfahren des maschinellen Lernens. So entstehen Klassifikationssysteme, welche die menschlichen Urteile so weit wie möglich simulieren. Diese werden in prototypischen Such- und Filtersystemen integriert.

Content

Mit einer Abbildung zu Qualitätsmodellen im Information Retrieval Prozess

Source

Information - Wissenschaft und Praxis. 56(2005) H.1, S.13-20

Search (914 results, page 1 of 46)

Authors

Years

Languages

Types

Themes

Subjects

Classifications