Search (357 results, page 1 of 18)

Li, L.; Shang, Y.; Zhang, W.: Improvement of HITS-based algorithms on Web documents 0.14

0.14282833 = product of:
  0.3570708 = sum of:
    0.06810896 = product of:
      0.20432688 = sum of:
        0.20432688 = weight(_text_:3a in 2514) [ClassicSimilarity], result of:
          0.20432688 = score(doc=2514,freq=2.0), product of:
            0.3635593 = queryWeight, product of:
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.042882618 = queryNorm
            0.56201804 = fieldWeight in 2514, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.046875 = fieldNorm(doc=2514)
      0.33333334 = coord(1/3)
    0.28896186 = weight(_text_:2f in 2514) [ClassicSimilarity], result of:
      0.28896186 = score(doc=2514,freq=4.0), product of:
        0.3635593 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.042882618 = queryNorm
        0.7948135 = fieldWeight in 2514, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=2514)
  0.4 = coord(2/5)

Content: Vgl.: http%3A%2F%2Fdelab.csd.auth.gr%2F~dimitris%2Fcourses%2Fir_spring06%2Fpage_rank_computing%2Fp527-li.pdf. Vgl. auch: http://www2002.org/CDROM/refereed/643/.

Loeper, D. von: Sherlock Holmes im Netz (1997) 0.04

0.037623893 = product of:
  0.18811947 = sum of:
    0.18811947 = sum of:
      0.13001944 = weight(_text_:netz in 6566) [ClassicSimilarity], result of:
        0.13001944 = score(doc=6566,freq=2.0), product of:
          0.22464268 = queryWeight, product of:
            5.2385488 = idf(docFreq=637, maxDocs=44218)
            0.042882618 = queryNorm
          0.57878333 = fieldWeight in 6566, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            5.2385488 = idf(docFreq=637, maxDocs=44218)
            0.078125 = fieldNorm(doc=6566)
      0.058100026 = weight(_text_:22 in 6566) [ClassicSimilarity], result of:
        0.058100026 = score(doc=6566,freq=2.0), product of:
          0.15016761 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.042882618 = queryNorm
          0.38690117 = fieldWeight in 6566, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.078125 = fieldNorm(doc=6566)
  0.2 = coord(1/5)

Date: 22. 2.1997 19:50:29

Sauer, D.: Alles schneller finden (2001) 0.04

0.037623893 = product of:
  0.18811947 = sum of:
    0.18811947 = sum of:
      0.13001944 = weight(_text_:netz in 6835) [ClassicSimilarity], result of:
        0.13001944 = score(doc=6835,freq=2.0), product of:
          0.22464268 = queryWeight, product of:
            5.2385488 = idf(docFreq=637, maxDocs=44218)
            0.042882618 = queryNorm
          0.57878333 = fieldWeight in 6835, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            5.2385488 = idf(docFreq=637, maxDocs=44218)
            0.078125 = fieldNorm(doc=6835)
      0.058100026 = weight(_text_:22 in 6835) [ClassicSimilarity], result of:
        0.058100026 = score(doc=6835,freq=2.0), product of:
          0.15016761 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.042882618 = queryNorm
          0.38690117 = fieldWeight in 6835, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.078125 = fieldNorm(doc=6835)
  0.2 = coord(1/5)

Abstract: Tips zur Suche nach: Aktuellen Nachrichten (www.paperball.de, www.paperazzi.de, www.genios.de) - Filmen und Musik (www.vdfkino.de, www.kino.de, www.cdnow.com, www.billboard.com) - Kids im Netz (www.blindekuh.de, www.safetykid.de, www.kindercampus.de) - Jobs - VIPs, Promis und normale Leute - Urlaub (www.ferien.de, www.travel24.de, www.abenteuerreisen.de) - Software (www.moreover.com, www.completeplanet.com) - Bücher (www.amazon.de, www.libri.de, www.zvab.com. www.ubka.uni-karlsruhe.de/kvk.html)
Date: 11.11.2001 17:25:22

Hülsmann, M.: Profi-Suche : Suchdienste richtig nutzen (2001) 0.03

0.030099114 = product of:
  0.15049557 = sum of:
    0.15049557 = sum of:
      0.10401555 = weight(_text_:netz in 6422) [ClassicSimilarity], result of:
        0.10401555 = score(doc=6422,freq=2.0), product of:
          0.22464268 = queryWeight, product of:
            5.2385488 = idf(docFreq=637, maxDocs=44218)
            0.042882618 = queryNorm
          0.46302667 = fieldWeight in 6422, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            5.2385488 = idf(docFreq=637, maxDocs=44218)
            0.0625 = fieldNorm(doc=6422)
      0.04648002 = weight(_text_:22 in 6422) [ClassicSimilarity], result of:
        0.04648002 = score(doc=6422,freq=2.0), product of:
          0.15016761 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.042882618 = queryNorm
          0.30952093 = fieldWeight in 6422, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.0625 = fieldNorm(doc=6422)
  0.2 = coord(1/5)

Abstract: Detaillierte Informationen aller Art schnell aus den Milliarden Seiten des Webs abrufen; dazu bedarf es mehr als die Eingabe eines einfachen Stichwortes bei Yahoo. Mit unserem Crash-Kurs erschließen Sie sich das Netz auf neue Art
Date: 11. 8.2001 14:19:22

dpa: Froogle sucht nach Produkten (2004) 0.03

0.030099114 = product of:
  0.15049557 = sum of:
    0.15049557 = sum of:
      0.10401555 = weight(_text_:netz in 2865) [ClassicSimilarity], result of:
        0.10401555 = score(doc=2865,freq=2.0), product of:
          0.22464268 = queryWeight, product of:
            5.2385488 = idf(docFreq=637, maxDocs=44218)
            0.042882618 = queryNorm
          0.46302667 = fieldWeight in 2865, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            5.2385488 = idf(docFreq=637, maxDocs=44218)
            0.0625 = fieldNorm(doc=2865)
      0.04648002 = weight(_text_:22 in 2865) [ClassicSimilarity], result of:
        0.04648002 = score(doc=2865,freq=2.0), product of:
          0.15016761 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.042882618 = queryNorm
          0.30952093 = fieldWeight in 2865, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.0625 = fieldNorm(doc=2865)
  0.2 = coord(1/5)

Content: "Ab sofort bietet Google als neuen Service auch in Deutschland die Produkt-Suchmaschine Froogle an. Froogle Deutschland sucht im Netz mit Hilfe der gleichen Technologie wie Google nach Informationen über Produkt-Angebote. Die Treffer können nach dem Preis sortiert und mit Bild gezeigt werden. Google, der führende Internet-Suchmaschinenbetreiber, erwartet nach jüngsten Studien, dass dieses Jahr 23 Millionen Deutsche online einkaufen und dabei über 7,6 Milliarden Euro ausgeben werden. Wie viele Einträge die Produktdatenbank zum Start bereit hält, teilte das Uriternehmen nicht mit. In den USA ist Froogle bereits seit rund zwei Jahren verfügbar."
Date: 3. 5.1997 8:44:22

Peereboom, M.: DutchESS : Dutch Electronic Subject Service - a Dutch national collaborative effort (2000) 0.03

0.028915038 = product of:
  0.0722876 = sum of:
    0.04904759 = weight(_text_:retrieval in 4869) [ClassicSimilarity], result of:
      0.04904759 = score(doc=4869,freq=4.0), product of:
        0.12971628 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.042882618 = queryNorm
        0.37811437 = fieldWeight in 4869, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0625 = fieldNorm(doc=4869)
    0.02324001 = product of:
      0.04648002 = sum of:
        0.04648002 = weight(_text_:22 in 4869) [ClassicSimilarity], result of:
          0.04648002 = score(doc=4869,freq=2.0), product of:
            0.15016761 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042882618 = queryNorm
            0.30952093 = fieldWeight in 4869, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=4869)
      0.5 = coord(1/2)
  0.4 = coord(2/5)

Abstract: This article gives an overview of the design and organisation of DutchESS, a Dutch information subject gateway created as a national collaborative effort of the National Library and a number of academic libraries. The combined centralised and distributed model of DutchESS is discussed, as well as its selection policy, its metadata format, classification scheme and retrieval options. Also some options for future collaboration on an international level are explored
Date: 22. 6.2002 19:39:23
Theme: Klassifikationssysteme im Online-Retrieval

Bouidghaghen, O.; Tamine, L.: Spatio-temporal based personalization for mobile search (2012) 0.03
```
0.027781134 = product of:
  0.06945284 = sum of:
    0.052022826 = weight(_text_:retrieval in 108) [ClassicSimilarity], result of:
      0.052022826 = score(doc=108,freq=8.0), product of:
        0.12971628 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.042882618 = queryNorm
        0.40105087 = fieldWeight in 108, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.046875 = fieldNorm(doc=108)
    0.017430007 = product of:
      0.034860015 = sum of:
        0.034860015 = weight(_text_:22 in 108) [ClassicSimilarity], result of:
          0.034860015 = score(doc=108,freq=2.0), product of:
            0.15016761 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042882618 = queryNorm
            0.23214069 = fieldWeight in 108, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=108)
      0.5 = coord(1/2)
  0.4 = coord(2/5)
```
Abstract

The explosion of the information available on the Internet has made traditional information retrieval systems, characterized by one size fits all approaches, less effective. Indeed, users are overwhelmed by the information delivered by such systems in response to their queries, particularly when the latter are ambiguous. In order to tackle this problem, the state-of-the-art reveals that there is a growing interest towards contextual information retrieval (CIR) which relies on various sources of evidence issued from the user's search background and environment, in order to improve the retrieval accuracy. This chapter focuses on mobile context, highlights challenges they present for IR, and gives an overview of CIR approaches applied in this environment. Then, the authors present an approach to personalize search results for mobile users by exploiting both cognitive and spatio-temporal contexts. The experimental evaluation undertaken in front of Yahoo search shows that the approach improves the quality of top search result lists and enhances search result precision.

Date

20. 4.2012 13:19:22

Source

Next generation search engines: advanced models for information retrieval. Eds.: C. Jouis, u.a

Hsieh-Yee, I.: ¬The retrieval power of selected search engines : how well do they address general reference questions and subject questions? (1998) 0.03

0.025300657 = product of:
  0.063251644 = sum of:
    0.042916637 = weight(_text_:retrieval in 2186) [ClassicSimilarity], result of:
      0.042916637 = score(doc=2186,freq=4.0), product of:
        0.12971628 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.042882618 = queryNorm
        0.33085006 = fieldWeight in 2186, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0546875 = fieldNorm(doc=2186)
    0.020335007 = product of:
      0.040670015 = sum of:
        0.040670015 = weight(_text_:22 in 2186) [ClassicSimilarity], result of:
          0.040670015 = score(doc=2186,freq=2.0), product of:
            0.15016761 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042882618 = queryNorm
            0.2708308 = fieldWeight in 2186, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=2186)
      0.5 = coord(1/2)
  0.4 = coord(2/5)

Abstract: Evaluates the performance of 8 major Internet search engines in answering 21 real reference questions and 5 made up subject questions. Reports on the retrieval and relevancy ranking abilities of the search engines. Concludes that the search engines did not produce good results for the reference questions unlike for the subject questions. The best engines are identified by type of questions, with Infoseek best for the subject questions, and OpenText best for refrence questions
Date: 25.12.1998 19:22:51

Wiley, D.L.: Beyond information retrieval : ways to provide content in context (1998) 0.03

0.025300657 = product of:
  0.063251644 = sum of:
    0.042916637 = weight(_text_:retrieval in 3647) [ClassicSimilarity], result of:
      0.042916637 = score(doc=3647,freq=4.0), product of:
        0.12971628 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.042882618 = queryNorm
        0.33085006 = fieldWeight in 3647, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3647)
    0.020335007 = product of:
      0.040670015 = sum of:
        0.040670015 = weight(_text_:22 in 3647) [ClassicSimilarity], result of:
          0.040670015 = score(doc=3647,freq=2.0), product of:
            0.15016761 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042882618 = queryNorm
            0.2708308 = fieldWeight in 3647, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3647)
      0.5 = coord(1/2)
  0.4 = coord(2/5)

Abstract: The days of the traditional abstracting and indexing services are waning, as abstracts and bibliographic data become commodities. However, there are tremedous opportunities for those organizations willing to look beyond the status quo to the new possibilities enabled by the latest wave of advanced technologies. Those who own content need to focus on the delivery mechanisms and new markets that technology can provide. Features like automatic extraction of key concepts or names, collaborative filtering to help with trend analysis, and visualization techniques can take information past the retrieval stage and into the management area
Source: Database. 21(1998) no.4, S.18-22

Machill, M.; Neuberger, C.; Schweiger, W.; Wirth, W.: Wegweiser im Netz : Qualität und Nutzung von Suchmaschinen (2004) 0.02
```
0.024519539 = product of:
  0.061298847 = sum of:
    0.024523795 = weight(_text_:retrieval in 4093) [ClassicSimilarity], result of:
      0.024523795 = score(doc=4093,freq=4.0), product of:
        0.12971628 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.042882618 = queryNorm
        0.18905719 = fieldWeight in 4093, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.03125 = fieldNorm(doc=4093)
    0.036775053 = product of:
      0.073550105 = sum of:
        0.073550105 = weight(_text_:netz in 4093) [ClassicSimilarity], result of:
          0.073550105 = score(doc=4093,freq=4.0), product of:
            0.22464268 = queryWeight, product of:
              5.2385488 = idf(docFreq=637, maxDocs=44218)
              0.042882618 = queryNorm
            0.3274093 = fieldWeight in 4093, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.2385488 = idf(docFreq=637, maxDocs=44218)
              0.03125 = fieldNorm(doc=4093)
      0.5 = coord(1/2)
  0.4 = coord(2/5)
```
Abstract

Das Internet ist ein Kosmos an Informationen aller Art. Zwar sind die Antworten auf Abermillionen Fragen vorhanden, doch stehen Nutzer vor der Aufgabe, diese auch zu finden. Eine zentrale Rolle spielen dabei Suchmaschinen. Beim Wiederauffinden von Informationen, dem so genannten Information Retrieval, handelt es sich um ein relativ gut erforschtes Feld. Die Forschung konzentrierte sich allerdings lange auf die Frage nach dem Wiederauffinden von Informationen in gut strukturierten Datenbanken. Bis zum Aufkommen des World Wide Web war kaum an eine große Datenkollektion zu denken, die höchst unterschiedlich strukturierte Dokumente enthielt. Hinsichtlich ihrer Strukturierung lassen sich Dokumente in drei Klassen ordnen: strukturiert, unstrukturiert und schwach strukturiert. Im Bereich der professionellen Datenbanken liegen die Informationen in strukturierter Form vor: Dokumente sind in Felder geteilt, die sich gezielt durchsuchen lassen. Zusätzliche Felder enthalten in der Regel Informationen über das Dokument wie beispielsweise den Namen des Autors, das Publikationsdatum oder die Namen von im Text behandelten Personen. So lässt sich beispielsweise die Anfrage nach allen Artikeln eines bestimmten Autors in einer Zeitungsdatenbank einfach und klar beantworten. Bei Web-Dokumenten kann die Suche nicht klar eingeschränkt werden, da nicht unterschieden werden kann, ob es sich bei dem Vorkommen des eingegebenen Namens um den Autor oder eine im Text behandelte Person handelt. Bei unstrukturierten Dokumenten handelt es sich schlicht um Fließtext, dessen formale Gestaltung keinerlei Rückschlüsse auf Meta-Informationen oder Textstellen von besonderer Bedeutung zulässt.
Bei HTML-Dokumenten im World Wide Web handelt es sich um schwach strukturierte Dokumente. Zwar findet keine Trennung in Feldinhalte statt, jedoch lassen sich aus Struktur- und Gestaltungsinformationen, die dem Dokument mittels der HTMLTags beigegeben werden, Rückschlüsse auf bedeutende und weniger bedeutende Textstellen ziehen. Eine zweite Herausforderung an die Information-RetrievalForschung ist schilicht die Größe des World Wide Web. Im Umfeld der professionellen Informationsvermittlung ist es von besonderem Interesse, die Informationen eines bestimmten Bereichs in einer Datenbank zu kumulieren. Natürlich wachsen diese themenbezogenen Datenbanken auch stetig an, das Volumen bleibt jedoch bei einigen Millionen Dokumenten noch »überschaubar«. Im Gegensatz dazu steht das World Wide Web. Zwar kann seine Größe nicht genau ermittelt werden, Schätzungen gehen jedoch inklusive der Invisible-Web-Inhalte von etwa zwölf Milliarden Dokumenten bis 550 Milliarden Dokumenten aus (vgl. Bergman 2001). Der dritte wichtige Punkt, der Information Retrieval in Datenbanken von dem im Internet unterscheidet, ist die Frage nach der Zuverlässigkeit der angebotenen Informationen. Während bei Datenbanken die Auswahl der aufgenommenen Informationen oft noch durch einen menschlichen Indexierer erfolgt, nehmen Suchmaschinen potenziell alle von ihnen aufgefundenen Dokumente in ihren Datenbestand auf.

Source

Wegweiser im Netz: Qualität und Nutzung von Suchmaschinen. 3. Aufl. Hrsg.: M. Machill u. C. Welp
Lewandowski, D.: Web Information Retrieval : Technologien zur Informationssuche im Internet (2005) 0.02
```
0.023552706 = product of:
  0.058881763 = sum of:
    0.04587982 = weight(_text_:retrieval in 3635) [ClassicSimilarity], result of:
      0.04587982 = score(doc=3635,freq=56.0), product of:
        0.12971628 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.042882618 = queryNorm
        0.3536936 = fieldWeight in 3635, product of:
          7.483315 = tf(freq=56.0), with freq of:
            56.0 = termFreq=56.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.015625 = fieldNorm(doc=3635)
    0.013001944 = product of:
      0.026003888 = sum of:
        0.026003888 = weight(_text_:netz in 3635) [ClassicSimilarity], result of:
          0.026003888 = score(doc=3635,freq=2.0), product of:
            0.22464268 = queryWeight, product of:
              5.2385488 = idf(docFreq=637, maxDocs=44218)
              0.042882618 = queryNorm
            0.11575667 = fieldWeight in 3635, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.2385488 = idf(docFreq=637, maxDocs=44218)
              0.015625 = fieldNorm(doc=3635)
      0.5 = coord(1/2)
  0.4 = coord(2/5)
```
Abstract

Verfahren des Information Retrieval haben in den letzten Jahren eine enorme Bedeutung erlangt. Während diese Verfahren jahrzehntelang nur Einsatz in spezialisierten Datenbanken fanden, haben sie durch das Aufkommen von Suchmaschinen im World Wide Web mittlerweile eine zentrale Bedeutung in der Informationsversorgung eingenommen. Verfahren des Web Information Retrieval entscheiden darüber, welche Informationen von Nutzern gefunden werden; man spricht auch von einer "Gatekeeper"-Funktion der Suchmaschinen. Diese sind zum bedeutendsten Rechercheinstrument sowohl im privaten, beruflichen als auch wissenschaftlichen Bereich avanciert. Google, die berühmteste der "Information-Retrieval-Firmen", ist fast täglich in den Schlagzeilen zu finden. Immer neue Innovationen (nicht nur dieses Anbieters) zeigen die Web-Suche als dynamisches Feld. Vor allem wird durch die zahlreichen Neuerungen der letzten Jahre, teilweise erst der letzten Monate, deutlich, dass die Suche im Web trotz ihrer mittlerweile fast zehnjährigen Geschichte erst am Anfang steht. Dass dem Web Information Retrieval eine hohe Bedeutung zugemessen wird, zeigt sich auch im wachsenden Interesse kommerzieller Unternehmen an diesem Thema. Ein Blick auf die Sponsorenliste der letztjährigen Konferenz der ACM Special Interest Group on Information Retrieval mag dies verdeutlichen: Neben den wichtigen Suchmaschinen-Anbietern Google, Microsoft, Yahoo und Ask Jeeves finden sich auch Großunternehmen wie IBM, Canon und Sharp. Auch in der gesellschaftlichen Diskussion sind die Suchmaschinen angekommen: Es findet gegenwärtig eine Diskussion um die "Google-Gesellschaft" statt, wobei gefragt wird, inwieweit ein einzelner Anbieter bzw. wenige Anbieter darüber entscheiden sollten, welche Informationen beim Nutzer angelangen. In dieser Hinsicht befassen sich inzwischen auch politische Parteien mit dem Thema. So publizierte etwa die Gründe Bundestagsfraktion ein Diskussionspapier unter dem Titel "Suchmaschinen: Tore zum Netz", in welchem unter anderem die Rolle der Suchmaschinen beim Zugang zu Informationen und Probleme des Datenschutzes bei der Suchmaschinennutzung angesprochen werden.
Die vorliegende Arbeit setzt auf einer eher technischen Ebene an und bietet die Grundlagen für das Verständnis der Funktionsweise und der Defizite von Web-Suchmaschinen. Während zum klassischen Information Retrieval eine breite Auswahl an Literatur vorliegt, gibt es bisher kein Werk, welches eine umfassende Darstellung des Web Information Retrieval mit seinen Unterscheidungen und Besonderheiten gegenüber dem "klassischen" Information Retrieval bietet. Monographien zum Thema Suchmaschinen behandeln vor allem deren Suchfunktionen oder konzentrieren sich allein auf algorithmische Aspekte des Web Information Retrieval. Die Forschungslitertaur liegt zum überwältigenden Teil nur in englischer Sprache vor; die Forschung selbst findet zu einem großen Teil in den USA statt. Aus diesem Grund werden Spezifika anderer Sprachen als des Englischen sowie Besonderheiten auf nationaler oder gar kontinentaler Ebene vernachlässigt. Die Konsequenzen, die sich aus den Besonderheiten des Web Information Re¬trieval ergeben, wurden bisher nur unzureichend erkannt. Suchmaschinen orientieren sich noch stark am klassischen Information Retrieval, wenn auch teils eigene Rankingkriterien gefunden wurden, vor allem die Ergänzung der klassischen Faktoren durch eine Art der Qualitätsbewertung der indexierten Dokumente. Die Arbeit soll aufzeigen, welche Schritte nötig sind, um Web Information Retrieval vor allem auch in Hinblick auf die Charakteristika der Suchmaschinen-Nutzer effektiv zu gestalten. Die Verfahren des klassischen Information Retrieval versagen hier, da sie einerseits von einer gepflegten Dokumentenkollektion, andererseits von einem geschulten Nutzer ausgehen. Suchmaschinen haben mit Problemen des sog. Index-Spamming zu kämpfen: Hierbei werden (oft in kommerziellem Interesse) inhaltlich wertlose Dokumente erstellt, die in den Trefferlisten der Suchmaschinen auf den vorderen Rängen angezeigt werden sollen, um Nutzer auf eine bestimmte Webseite zu lenken. Zwar existieren Verfahren, die ein solches Spamming verhindern sollen, allerdings können auch diese das Problem lediglich eindämmen, nicht aber verhindern. Das Problem ließe sich wenigstens zum Teil durch die Nutzer lösen, wenn diese gezielte Suchanfragen stellen würden, die solche irrelevanten Treffer ausschließen würden. Allerdings zeigt die Nutzerforschung einheitlich, dass das Wissen der Nutzer über die von ihnen verwendeten Suchmaschinen ausgesprochen gering ist; dies gilt sowohl für ihre Kenntnisse der Funktionsweise der Suchmaschinen als auch die Kenntnis der Suchfunktionen.
Die Arbeit konzentriert sich neben der Darstellung des Forschungsstands im Bereich des Web Information Retrieval auf einen nutzerzentrierten Ansatz des Aufbaus von Suchmaschinen, der sich aus dem Retrieval in klassischen Datenbanken herleitet. Als zentral für eine erfolgreiche Recherche wird dabei die Möglichkeit der gezielten Beschränkung der Recherche durch den Nutzer gesehen; die wichtigsten Faktoren sind hierbei die Einschränkung nach Aktualität, Qualität und die verbesserte Dokumentauswahl aufgrund einer erweiterten Dokumentrepräsentation. Alle drei Möglichkeiten sind in bisher verfügbaren Suchmaschinen nicht zufrieden stellend implementiert. Ein Problem bei der Bearbeitung des Themas ergab sich aus der Tatsache, dass die Forschung im Bereich Web Information Retrieval zu einem großen Teil bei den Anbietern selbst stattfindet, die darauf bedacht sind, ihre Erkenntnisse nicht zu veröffentlichen und damit der Konkurrenz zu überlassen. Viele Forschungsergebnisse können daher nur anhand der fertiggestellten Anwendungen rekonstruiert werden; hilfreich waren in manchen Fällen auch die von den Suchmaschinenbetreibern angemeldeten Patente, die für die vorliegende Arbeit ausgewertet wurden. Insgesamt zeigt sich, dass eine neue Form des Information Retrieval entstanden ist. Ziele des klassischen Information Retrieval wie die Vollständigkeit der Treffermenge verlieren ob der schieren Masse der zurückgegebenen Treffer an Bedeutung; dafür werden Faktoren der Qualitätsbewertung der Dokumente immer wichtiger. Das Web Information Retrieval setzt auf dem klassischen Information Retrieval auf und erweitert dieses wo nötig. Das Ziel bleibt aber weitgehend das gleiche: Dem Nutzer die für die Befriedigung seines Informationsbedürfnisses besten Ergebnisse zu liefern. Neben der Informationswissenschaft findet die Information-Retrieval-Forschung hauptsächlich in der Informatik statt. Der informationswissenschaftlichen Forschung kommt die Aufgabe zu, den stark technik-zentrierten Ansatz der Informatik um einen "Blick fürs Ganze" zu erweitern und insbesondere die Bedürfnisse der Nutzer in ihren Ansatz einzubinden. Aufgrund der enormen Bedeutung des Web Information Retrieval, welches in den klassischen informationswissenschaftlichen Bereich fällt, ergibt sich für die Informationswissenschaft auch die Chance, sich in diesem Thema gegenüber anderen Disziplinen zu profilieren. Zum Aufbau der Arbeit Die Arbeit lässt sich grob in zwei Hauptteile gliedern: Der erste Teil (Kap. 2-10) beschreibt den Bereich Web Information Retrieval mit allen seinen Besonderheiten in Abgrenzung zum klassischen Information Retrieval; der zweite Teil (Kap. 11-13) stellt anhand der Ergebnisse des ersten Teils einen nutzerzentrierten Ansatz der Rechercheverfeinerung in mehreren Schritten vor.

Content

Inhalt: 1 Einleitung 2 Forschungsumfeld 2.1 Suchmaschinen-Markt 2.2 Formen der Suche im WWW 2.3 Aufbau algorithmischer Suchmaschinen 2.4 Abfragesprachen 2.5 Arten von Suchanfragen 2.6 Nutzerstudien 2.7 Forschungsbereiche 3 Die Größe des Web und seine Abdeckung durch Suchmaschinen 3.1 Die Größe des indexierbaren Web 3.2 Die Struktur des Web 3.3 Crawling 3.4 Aktualität der Suchmaschinen 3.5 Das Invisible Web 4 Strukturinformationen 4.1 Strukturierungsgrad von Dokumenten 4.2 Strukturinformationen in den im Web gängigen Dokumenten 4.3 Trennung von Navigation, Layout und Inhalt 4.4 Repräsentation der Dokumente in den Datenbanken der Suchmaschinen 5 Klassische Verfahren des Information Retrieval und ihre Anwendung bei WWW-Suchmaschinen 5.1 Unterschiede zwischen klassischem Information Retrieval und Web Information Retrieval 5.2 Kontrolliertes Vokabular 5.3 Kriterien für die Aufnahme in den Datenbestand 5.4 Modelle des Information Retrieval 6 Ranking 6.1 Rankingfaktoren 6.2 Messbarkeit von Relevanz 6.3 Grundsätzliche Probleme des Relevance Ranking in Suchmaschinen

Altmann, O.; Pöhl, S.: Information Retrieval im Internet : bekannte Suchdienste und ihre Eigenschaften (1997) 0.02

0.023168758 = product of:
  0.057921894 = sum of:
    0.034681883 = weight(_text_:retrieval in 205) [ClassicSimilarity], result of:
      0.034681883 = score(doc=205,freq=2.0), product of:
        0.12971628 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.042882618 = queryNorm
        0.26736724 = fieldWeight in 205, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0625 = fieldNorm(doc=205)
    0.02324001 = product of:
      0.04648002 = sum of:
        0.04648002 = weight(_text_:22 in 205) [ClassicSimilarity], result of:
          0.04648002 = score(doc=205,freq=2.0), product of:
            0.15016761 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042882618 = queryNorm
            0.30952093 = fieldWeight in 205, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=205)
      0.5 = coord(1/2)
  0.4 = coord(2/5)

Pages: S.18-22

Amato, G.; Rabitti, F.; Savino, P.: Multimedia document search on the Web (1998) 0.02

0.023168758 = product of:
  0.057921894 = sum of:
    0.034681883 = weight(_text_:retrieval in 3605) [ClassicSimilarity], result of:
      0.034681883 = score(doc=3605,freq=2.0), product of:
        0.12971628 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.042882618 = queryNorm
        0.26736724 = fieldWeight in 3605, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0625 = fieldNorm(doc=3605)
    0.02324001 = product of:
      0.04648002 = sum of:
        0.04648002 = weight(_text_:22 in 3605) [ClassicSimilarity], result of:
          0.04648002 = score(doc=3605,freq=2.0), product of:
            0.15016761 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042882618 = queryNorm
            0.30952093 = fieldWeight in 3605, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=3605)
      0.5 = coord(1/2)
  0.4 = coord(2/5)

Abstract: Presents a multimedia model which describes the various multimedia components, their structure and their relationships with a pre-defined taxonomy of concepts, in order to support search engine information retrieval process
Date: 1. 8.1996 22:08:06

Gardner, T.; Iannella, R.: Architecture and software solutions (2000) 0.02

0.023168758 = product of:
  0.057921894 = sum of:
    0.034681883 = weight(_text_:retrieval in 4867) [ClassicSimilarity], result of:
      0.034681883 = score(doc=4867,freq=2.0), product of:
        0.12971628 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.042882618 = queryNorm
        0.26736724 = fieldWeight in 4867, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0625 = fieldNorm(doc=4867)
    0.02324001 = product of:
      0.04648002 = sum of:
        0.04648002 = weight(_text_:22 in 4867) [ClassicSimilarity], result of:
          0.04648002 = score(doc=4867,freq=2.0), product of:
            0.15016761 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042882618 = queryNorm
            0.30952093 = fieldWeight in 4867, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=4867)
      0.5 = coord(1/2)
  0.4 = coord(2/5)

Abstract: The current subject gateways have evolved over time when the discipline of Internet resource discovery was in its infancy. This is reflected by the lack of well-established, light-weight, deployable, easy-to-use, standards for metadata and information retrieval. We provide an introduction to the architecture, standards and software solutions in use by subject gateways, and to the issues that must be addressed to support future subject gateways
Date: 22. 6.2002 19:38:24

Schüler, P.: Wertes Wissen : Knowledge Management vermeidet Datenfriedhöfe (2001) 0.02

0.023168758 = product of:
  0.057921894 = sum of:
    0.034681883 = weight(_text_:retrieval in 6815) [ClassicSimilarity], result of:
      0.034681883 = score(doc=6815,freq=2.0), product of:
        0.12971628 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.042882618 = queryNorm
        0.26736724 = fieldWeight in 6815, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0625 = fieldNorm(doc=6815)
    0.02324001 = product of:
      0.04648002 = sum of:
        0.04648002 = weight(_text_:22 in 6815) [ClassicSimilarity], result of:
          0.04648002 = score(doc=6815,freq=2.0), product of:
            0.15016761 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042882618 = queryNorm
            0.30952093 = fieldWeight in 6815, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=6815)
      0.5 = coord(1/2)
  0.4 = coord(2/5)

Abstract: Wer ohne spezielle Vorkenntnisse schnell in einem Thema Fuß fassen will, ist auf intelligente Recherchierhilfen angewiesen. Gurus der künstlichen Intelligenz kennen schon langm Wege, die Datenwelt besser als mit Schlagwort-Suchmaschinen nach Inhalten zu durchforsten - nur in der Praxis war davon wenig zu sehen. Aktuelle Software zum Content-Retrieval will die scheinbare Utopie verwirklichen
Date: 8.11.2001 19:58:22

Mukherjea, S.; Hirata, K.; Hara, Y.: Towards a multimedia World-Wide Web information retrieval engine (1997) 0.02

0.02168628 = product of:
  0.0542157 = sum of:
    0.036785692 = weight(_text_:retrieval in 2678) [ClassicSimilarity], result of:
      0.036785692 = score(doc=2678,freq=4.0), product of:
        0.12971628 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.042882618 = queryNorm
        0.2835858 = fieldWeight in 2678, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.046875 = fieldNorm(doc=2678)
    0.017430007 = product of:
      0.034860015 = sum of:
        0.034860015 = weight(_text_:22 in 2678) [ClassicSimilarity], result of:
          0.034860015 = score(doc=2678,freq=2.0), product of:
            0.15016761 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042882618 = queryNorm
            0.23214069 = fieldWeight in 2678, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=2678)
      0.5 = coord(1/2)
  0.4 = coord(2/5)

Abstract: Describes a search engine that integrate text and image search. 1 or more Web site can be indexed for both textual and image information, allowing the user to search based on keywords or images or both. Another problem with the current search engines is that they show the results as pages of scrolled lists; this is not very user-friendly. The search engine allows the user to visualise to results in various ways. Explains the indexing and searching techniques of the search engine and highlights several features of the querying interface to make the retrieval process more efficient. Use examples to show the usefulness of the technology
Date: 1. 8.1996 22:08:06

Herrera-Viedma, E.; Pasi, G.: Soft approaches to information retrieval and information access on the Web : an introduction to the special topic section (2006) 0.02
```
0.021638585 = product of:
  0.05409646 = sum of:
    0.042476457 = weight(_text_:retrieval in 5285) [ClassicSimilarity], result of:
      0.042476457 = score(doc=5285,freq=12.0), product of:
        0.12971628 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.042882618 = queryNorm
        0.32745665 = fieldWeight in 5285, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.03125 = fieldNorm(doc=5285)
    0.011620005 = product of:
      0.02324001 = sum of:
        0.02324001 = weight(_text_:22 in 5285) [ClassicSimilarity], result of:
          0.02324001 = score(doc=5285,freq=2.0), product of:
            0.15016761 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042882618 = queryNorm
            0.15476047 = fieldWeight in 5285, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.03125 = fieldNorm(doc=5285)
      0.5 = coord(1/2)
  0.4 = coord(2/5)
```
Abstract

The World Wide Web is a popular and interactive medium used to collect, disseminate, and access an increasingly huge amount of information, which constitutes the mainstay of the so-called information and knowledge society. Because of its spectacular growth, related to both Web resources (pages, sites, and services) and number of users, the Web is nowadays the main information repository and provides some automatic systems for locating, accessing, and retrieving information. However, an open and crucial question remains: how to provide fast and effective retrieval of the information relevant to specific users' needs. This is a very hard and complex task, since it is pervaded with subjectivity, vagueness, and uncertainty. The expression soft computing refers to techniques and methodologies that work synergistically with the aim of providing flexible information processing tolerant of imprecision, vagueness, partial truth, and approximation. So, soft computing represents a good candidate to design effective systems for information access and retrieval on the Web. One of the most representative tools of soft computing is fuzzy set theory. This special topic section collects research articles witnessing some recent advances in improving the processes of information access and retrieval on the Web by using soft computing tools, and in particular, by using fuzzy sets and/or integrating them with other soft computing tools. In this introductory article, we first review the problem of Web retrieval and the concept of soft computing technology. We then briefly introduce the articles in this section and conclude by highlighting some future research directions that could benefit from the use of soft computing technologies.

Date

22. 7.2006 16:59:33

Footnote

Beitrag in einer Special Topic Section on Soft Approaches to Information Retrieval and Information Access on the Web
Puschwadt, O.: Wer suchet, der findet : Suchmaschinen - Es müssen nicht immer nur Google und Yahoo sein (2005) 0.02
```
0.02128329 = product of:
  0.10641644 = sum of:
    0.10641644 = sum of:
      0.073550105 = weight(_text_:netz in 3731) [ClassicSimilarity], result of:
        0.073550105 = score(doc=3731,freq=4.0), product of:
          0.22464268 = queryWeight, product of:
            5.2385488 = idf(docFreq=637, maxDocs=44218)
            0.042882618 = queryNorm
          0.3274093 = fieldWeight in 3731, product of:
            2.0 = tf(freq=4.0), with freq of:
              4.0 = termFreq=4.0
            5.2385488 = idf(docFreq=637, maxDocs=44218)
            0.03125 = fieldNorm(doc=3731)
      0.032866336 = weight(_text_:22 in 3731) [ClassicSimilarity], result of:
        0.032866336 = score(doc=3731,freq=4.0), product of:
          0.15016761 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.042882618 = queryNorm
          0.21886435 = fieldWeight in 3731, product of:
            2.0 = tf(freq=4.0), with freq of:
              4.0 = termFreq=4.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.03125 = fieldNorm(doc=3731)
  0.2 = coord(1/5)
```
Content

"Nobody is perfect - diese Weisheit trifft auch auf Suchmaschinen zu. Google, Yahoo und Co. finden zwar viel, aber nicht alles. Insbesondere bei Spezialthemen ist es ratsam, eine Meta-Suchmaschine wie Metacrawler (www.metacrawler.de), MetaGer (meta.rrzn.uni-hannover.de) oder Ixquick (www.eu.ixquick.com) zu Rate zu ziehen. Sie fragen gleichzeitig mehrere Suchmaschinen ab. Bei Metacrawler sind dies beispielsweise 22 internationale und 15 nationale Suchdienste. Ixquick durchstöbert gleichzeitig mindestens zehn der populärsten Suchmaschinen und dies in 17 Sprachen. Dadurch verbessert sich die Trefferquote natürlich erheblich. Eine weitere gute Möglichkeit, die spezielle Suche im Internet spürbar zu erleichtern, ist die Benutzung eines Webkataloges. Zu empfehlen sind Excite (www.excite.de), das Suchlexikon (www.suchlexikon.de) oder auch das englischsprachige Angebot iTools (www.itools.com). Diese Webkataloge können als "Verzeichnisse von Suchmaschinen" bezeichnet werden. Sie bündeln verschiedene Suchmaschinen zu bestimmten Themengebieten wie Wirtschaft, Freizeit, Computer oder Sport. Keine Suchmaschine im eigentlichen Sinne, aber dennoch sehr nützlich, um an Informationen oder auch Ratschläge im Netz zu kommen, ist Wikipedia (de.wikipedia.org). Das Internet-Lexikon hat sich den Beinamen "die freie Enzyklopädie" gegeben und dient als Sammelpunkt für Informationen und Wissen der User. Dies ist allerdings auch die Schwäche der Seite, denn um eine hundertprozentig verlässliche Antwort zu bekommen, sind die Angaben oft zu ungenau. Eine interessante Variante ist die News-Suchmaschine Paperball (www.paperball.de). Hierbei werden die Online-Ausgaben deutscher und internationaler, Tagesund Wochenzeitungen durchforstet. Man kann die Suche auch auf bestimmte Rubriken beschränken. Auf der Suche nach ehemaligen Mitschülern? Dann sind Sie bei StayFriends (www.stayfriends.de) genau richtig. Nach einer kostenlosen Anmeldung kann man nach verloren gegangenen Freunden aus der Schulzeit fahnden. Fast 1,8 Millionen Einträge sollen laut Anbieter bereits auf der Seite eingegangen sein. Der Nachteil: Wer sich nicht eingetragen hat, wird auch nicht gefunden. Wer gezielt nach Bildern sucht, wird bei Bomis (www.bomis.com) fündig. Hierbei werden nur Seiten durchstöbert, auf denen sich Bilder zu bestimmten Themen oder Personen befinden. Abschließend sei allen Internetnutzern noch eine ganz spezielle Seite ans Herz gelegt. Die Suchfibel (www.suchfibel.de) gibt wichtige Tipps für das richtige Suchen im Netz. Zum einen werden hier Ratschläge gegeben, die das Finden von Informationen im Web einfacher machen, zum anderen listet die Seite auch 2700 verschiedene Suchmaschinen - nach Stichwörtern geordnet - auf."

Date

3. 5.1997 8:44:22
Garcés, P.J.; Olivas, J.A.; Romero, F.P.: Concept-matching IR systems versus word-matching information retrieval systems : considering fuzzy interrelations for indexing Web pages (2006) 0.02
```
0.0208277 = product of:
  0.052069247 = sum of:
    0.03754424 = weight(_text_:retrieval in 5288) [ClassicSimilarity], result of:
      0.03754424 = score(doc=5288,freq=6.0), product of:
        0.12971628 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.042882618 = queryNorm
        0.28943354 = fieldWeight in 5288, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5288)
    0.0145250065 = product of:
      0.029050013 = sum of:
        0.029050013 = weight(_text_:22 in 5288) [ClassicSimilarity], result of:
          0.029050013 = score(doc=5288,freq=2.0), product of:
            0.15016761 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042882618 = queryNorm
            0.19345059 = fieldWeight in 5288, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0390625 = fieldNorm(doc=5288)
      0.5 = coord(1/2)
  0.4 = coord(2/5)
```
Abstract

This article presents a semantic-based Web retrieval system that is capable of retrieving the Web pages that are conceptually related to the implicit concepts of the query. The concept of concept is managed from a fuzzy point of view by means of semantic areas. In this context, the proposed system improves most search engines that are based on matching words. The key of the system is to use a new version of the Fuzzy Interrelations and Synonymy-Based Concept Representation Model (FIS-CRM) to extract and represent the concepts contained in both the Web pages and the user query. This model, which was integrated into other tools such as the Fuzzy Interrelations and Synonymy based Searcher (FISS) metasearcher and the fz-mail system, considers the fuzzy synonymy and the fuzzy generality interrelations as a means of representing word interrelations (stored in a fuzzy synonymy dictionary and ontologies). The new version of the model, which is based on the study of the cooccurrences of synonyms, integrates a soft method for disambiguating word senses. This method also considers the context of the word to be disambiguated and the thematic ontologies and sets of synonyms stored in the dictionary.

Date

22. 7.2006 17:14:12

Footnote

Beitrag in einer Special Topic Section on Soft Approaches to Information Retrieval and Information Access on the Web

Bertelmann, R.; Rusch-Feja, D.: Informationsretrieval im Internet : Surfen, Browsen, Suchen - mit einem Überblick über strukturierte Informationsangebote (1997) 0.02

0.020272663 = product of:
  0.050681658 = sum of:
    0.030346649 = weight(_text_:retrieval in 217) [ClassicSimilarity], result of:
      0.030346649 = score(doc=217,freq=2.0), product of:
        0.12971628 = queryWeight, product of:
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.042882618 = queryNorm
        0.23394634 = fieldWeight in 217, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.024915 = idf(docFreq=5836, maxDocs=44218)
          0.0546875 = fieldNorm(doc=217)
    0.020335007 = product of:
      0.040670015 = sum of:
        0.040670015 = weight(_text_:22 in 217) [ClassicSimilarity], result of:
          0.040670015 = score(doc=217,freq=2.0), product of:
            0.15016761 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042882618 = queryNorm
            0.2708308 = fieldWeight in 217, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=217)
      0.5 = coord(1/2)
  0.4 = coord(2/5)

Abstract: Das gezielte Suchen im Internet findet in erster Linie mit Hilfe der Suchmaschinen statt. Daneben gibt es aber bereits eine Fülle von strukturierten Informationsangeboten, aufbereiteten Listen und Sammelstellen, die als Clearinghouse, Subject Gateway, Subject Tree oder Resource Pages bezeichnet werden. Solche intellektuell erstellten Übersichten geben in der Regel bereits Hinweise zu Inhalt und fachlichem Niveau der Quelle. Da die Art und Weise der Aufbereitung bei den Sammelstellen sehr unterschiedlich funktioniert, ist die Kenntnis ihrer Erschließungskriterien für ein erfolgreiches Retrieval unverzichtbar
Date: 9. 7.2000 11:31:22

Search (357 results, page 1 of 18)

Authors

Years

Languages

Types

Themes

Subjects

Classifications