Search (6 results, page 1 of 1)

Spink, A.; Jansen, B.J.: Web searching : public searching of the Web (2004) 0.02
```
0.020445846 = product of:
  0.040891692 = sum of:
    0.040891692 = product of:
      0.081783384 = sum of:
        0.081783384 = weight(_text_:dokumente in 1443) [ClassicSimilarity], result of:
          0.081783384 = score(doc=1443,freq=10.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.31455666 = fieldWeight in 1443, product of:
              3.1622777 = tf(freq=10.0), with freq of:
                10.0 = termFreq=10.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.01953125 = fieldNorm(doc=1443)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Footnote

Rez. in: Information - Wissenschaft und Praxis 56(2004) H.1, S.61-62 (D. Lewandowski): "Die Autoren des vorliegenden Bandes haben sich in den letzten Jahren durch ihre zahlreichen Veröffentlichungen zum Verhalten von Suchmaschinen-Nutzern einen guten Namen gemacht. Das nun erschienene Buch bietet eine Zusammenfassung der verstreut publizierten Aufsätze und stellt deren Ergebnisse in den Kontext eines umfassenderen Forschungsansatzes. Spink und Jansen verwenden zur Analyse des Nutzungsverhaltens query logs von Suchmaschinen. In diesen werden vom Server Informationen protokolliert, die die Anfragen an diesen Server betreffen. Daten, die aus diesen Dateien gewonnen werden können, sind unter anderem die gestellten Suchanfragen, die Adresse des Rechners, von dem aus die Anfrage gestellt wurde, sowie die aus den Trefferlisten ausgewählten Dokumente. Der klare Vorteil der Analyse von Logfiles liegt in der Möglichkeit, große Datenmengen ohne hohen personellen Aufwand erheben zu können. Die Daten einer Vielzahl anonymer Nutzer können analysiert werden; ohne dass dabei die Datenerhebung das Nutzerverhalten beeinflusst. Dies ist bei Suchmaschinen von besonderer Bedeutung, weil sie im Gegensatz zu den meisten anderen professionellen Information-Retrieval-Systemen nicht nur im beruflichen Kontext, sondern auch (und vor allem) privat genutzt werden. Das Bild des Nutzungsverhaltens wird in Umfragen und Laboruntersuchungen verfälscht, weil Nutzer ihr Anfrageverhalten falsch einschätzen oder aber die Themen ihrer Anfragen nicht nennen möchten. Hier ist vor allem an Suchanfragen, die auf medizinische oder pornographische Inhalte gerichtet sind, zu denken. Die Analyse von Logfiles ist allerdings auch mit Problemen behaftet: So sind nicht alle gewünschten Daten überhaupt in den Logfiles enthalten (es fehlen alle Informationen über den einzelnen Nutzer), es werden keine qualitativen Informationen wie etwa der Grund einer Suche erfasst und die Logfiles sind aufgrund technischer Gegebenheiten teils unvollständig. Die Autoren schließen aus den genannten Vor- und Nachteilen, dass sich Logfiles gut für die Auswertung des Nutzerverhaltens eignen, bei der Auswertung jedoch die Ergebnisse von Untersuchungen, welche andere Methoden verwenden, berücksichtigt werden sollten.
Den Autoren wurden von den kommerziellen Suchmaschinen AltaVista, Excite und All the Web größere Datenbestände zur Verfügung gestellt. Die ausgewerteten Files umfassten jeweils alle an die jeweilige Suchmaschine an einem bestimmten Tag gestellten Anfragen. Die Daten wurden zwischen 199'] und 2002 erhoben; allerdings liegen nicht von allen Jahren Daten von allen Suchmaschinen vor, so dass einige der festgestellten Unterschiede im Nutzerverhalten sich wohl auf die unterschiedlichen Nutzergruppen der einzelnen Suchmaschinen zurückführen lassen. In einem Fall werden die Nutzergruppen sogar explizit nach den Suchmaschinen getrennt, so dass das Nutzerverhalten der europäischen Nutzer der Suchmaschine All the Web mit dem Verhalten der US-amerikanischen Nutzer verglichen wird. Die Analyse der Logfiles erfolgt auf unterschiedlichen Ebenen: Es werden sowohl die eingegebenen Suchbegriffe, die kompletten Suchanfragen, die Such-Sessions und die Anzahl der angesehenen Ergebnisseiten ermittelt. Bei den Suchbegriffen ist besonders interessant, dass die Spannbreite der Informationsbedürfnisse im Lauf der Jahre deutlich zugenommen hat. Zwar werden 20 Prozent aller eingegebenen Suchbegriffe regelmäßig verwendet, zehn Prozent kamen hingegen nur ein einziges Mal vor. Die thematischen Interessen der Suchmaschinen-Nutzer haben sich im Lauf der letzten Jahre ebenfalls gewandelt. Während in den Anfangsjahren viele Anfragen aus den beiden Themenfeldern Sex und Technologie stammten, gehen diese mittlerweile zurück. Dafür nehmen Anfragen im Bereich E-Commerce zu. Weiterhin zugenommen haben nicht-englischsprachige Begriffe sowie Zahlen und Akronyme. Die Popularität von Suchbegriffen ist auch saisonabhängig und wird durch aktuelle Nachrichten beeinflusst. Auf der Ebene der Suchanfragen zeigt sich weiterhin die vielfach belegte Tatsache, dass Suchanfragen in Web-Suchmaschinen extrem kurz sind. Die durchschnittliche Suchanfrage enthält je nach Suchmaschine zwischen 2,3 und 2,9 Terme. Dies deckt sich mit anderen Untersuchungen zu diesem Thema. Die Länge der Suchanfragen ist in den letzten Jahren leicht steigend; größere Sprünge hin zu längeren Anfragen sind jedoch nicht zu erwarten. Ebenso verhält es sich mit dem Einsatz von Operatoren: Nur etwa in jeder zehnten Anfrage kommen diese vor, wobei die Phrasensuche am häufigsten verwendet wird. Dass die SuchmaschinenNutzer noch weitgehend als Anfänger angesehen werden müssen, zeigt sich auch daran, dass sie pro Suchanfrage nur drei oder vier Dokumente aus der Trefferliste tatsächlich sichten.
In Hinblick auf die Informationsbedürfnisse ergibt sich eine weitere Besonderheit dadurch, dass Suchmaschinen nicht nur für eine Anfrageform genutzt werden. Eine "Spezialität" der Suchmaschinen ist die Beantwortung von navigationsorientierten Anfragen, beispielsweise nach der Homepage eines Unternehmens. Hier wird keine Menge von Dokumenten oder Fakteninformation verlangt; vielmehr ist eine Navigationshilfe gefragt. Solche Anfragen nehmen weiter zu. Die Untersuchung der Such-Sessions bringt Ergebnisse über die Formulierung und Bearbeitung der Suchanfragen zu einem Informationsbedürfnis zutage. Die Sessions dauern weit überwiegend weniger als 15 Minuten (dies inklusive Sichtung der Dokumente!), wobei etwa fünf Dokumente angesehen werden. Die Anzahl der angesehenen Ergebnisseiten hat im Lauf der Zeit abgenommen; dies könnte darauf zurückzuführen sein, dass es den Suchmaschinen im Lauf der Zeit gelungen ist, die Suchanfragen besser zu beantworten, so dass sich brauchbare Ergebnisse öfter bereits auf der ersten Ergebnisseite finden. Insgesamt bestätigt sich auch hier das Bild vom wenig fortgeschrittenen Suchmaschinen-Nutzer, der nach Eingabe einer unspezifischen Suchanfrage schnelle und gute Ergebnisse erwartet. Der zweite Teil des Buchs widmet sich einigen der bei den Suchmaschinen-Nutzern populären Themen und analysiert das Nutzerverhalten bei solchen Suchen. Dabei werden die eingegebenen Suchbegriffe und Anfragen untersucht. Die Bereiche sind E-Commerce, medizinische Themen, Sex und Multimedia. Anfragen aus dem Bereich E-Commerce sind in der Regel länger als allgemeine Anfragen. Sie werden seltener modifiziert und pro Anfrage werden weniger Dokumente angesehen. Einige generische Ausdrücke wie "shopping" werden sehr häufig verwendet. Der Anteil der E-Commerce-Anfragen ist hoch und die Autoren sehen die Notwendigkeit, spezielle Suchfunktionen für die Suche nach Unternehmenshomepages und Produkten zu erstellen bzw. zu verbessern. Nur zwischen drei und neun Prozent der Anfragen beziehen sich auf medizinische Themen, der Anteil dieser Anfragen nimmt tendenziell ab. Auch der Anteil der Anfragen nach sexuellen Inhalten dürfte mit einem Wert zwischen drei und knapp 1'7 Prozent geringer ausfallen als allgemein angenommen.
Lohmann, H.: KASCADE: Dokumentanreicherung und automatische Inhaltserschließung : Projektbericht und Ergebnisse des Retrievaltests (2000) 0.02
```
0.018103525 = product of:
  0.03620705 = sum of:
    0.03620705 = product of:
      0.0724141 = sum of:
        0.0724141 = weight(_text_:dokumente in 494) [ClassicSimilarity], result of:
          0.0724141 = score(doc=494,freq=4.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.27852035 = fieldWeight in 494, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.02734375 = fieldNorm(doc=494)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Verbesserungen des Gewichtungsverfahrens sollten schließlich unterstützt werden durch Maßnahmen zur Optimierung der Retrievalumgebung, etwa durch - den Einsatz von Hypertextwerkzeugen; - die Integration der THEAS-Komponente, mit der die automatische Mehrwortgruppengewinnung mit Hilfe eines Mehrwortgruppen-Parsers möglich ist; dies könnte im Rahmen der Dialogführung mit dem Nutzer eingesetzt werden, wenn dieser Teilkomponenten solcher Mehrwortgruppen im Retrieval verwendet. Mit THEAS wäre daneben der Einstieg in das Retrieval über das Register mit kanonischen Formen möglich; - die Integration von Wörterbuchfunktionen zur Benutzerunterstützung. Eine Weiterentwicklung des SELIX-Verfahrens könnte daneben in diese Richtungen erfolgen: - Bildung von Dokument-Clustern. Dabei werden Dokumente in einem Dokumenten-Raum einander in dem Maße zugeordnet, in dem ihre selektierten Grundformen übereinstimmen. - Errichtung von statistisch basierten semantischen Netzen, in denen Grundformen einander in einem Begriffs-Raum in dem Maße zugeordnet werden, in dem sie "gemeinsam" in Dokumenten auftreten.
Da sich mit jedem Dokument, das zu dem im Gewichtungsverfahren befindlichen Gesamtbestand hinzukommt, die Werte aller bereits gewichteten Deskriptoren ändern können, müsste die Berechnung der Häufigkeitsverteilung jeder Grundform im Prinzip nach jeder Änderung im Dokumentbestand neu berechnet werden. Eine Online-Aktualisierung des Bestandes erscheint daher wenig sinnvoll. In der Praxis könnte eine Neuberechnung in bestimmten zeitlichen Abständen mit einem Abzug des OPAC-Bestandes unabhängig vom eigentlichen Betrieb des OPAC erfolgen, was auch insofern genügen würde, als die zugrunde liegenden Maße auf relativen Häufigkeiten basieren. Dadurch würde nur ein geringer Verzug in der Bereitstellung der aktuellen Gewichte eintreten. Außerdem würde der Zeitfaktor eine nur untergeordnete Rolle spielen, da ein offline ablaufender Gewichtungslauf erst bis zum nächsten Aktualisierungszeitpunkt abgeschlossen sein müsste. Denkbar wäre zusätzlich, für die Zeit zwischen zwei Aktualisierungen des OPACs für die in den Neuzugängen enthaltenen Begriffe Standardgewichte einzusetzen, soweit diese Begriffe bereits in dem Bestand auftreten. Bei entsprechender Optimierung und Rationalisierung der SELIX-Verfahrensabläufe, Nutzung der Gewichte auf der Retrievalseite für ein Ranking der auszugebenden Dokumente und Integration der THEAS-Komponente kann das Verfahren zu einem wirkungsvollen Instrument zur Verbesserung der Retrievaleffektivität weiterentwickelt werden.
Long, J.: Google hacking (2008) 0.01
```
0.014629857 = product of:
  0.029259713 = sum of:
    0.029259713 = product of:
      0.058519427 = sum of:
        0.058519427 = weight(_text_:dokumente in 2925) [ClassicSimilarity], result of:
          0.058519427 = score(doc=2925,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.22507842 = fieldWeight in 2925, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.03125 = fieldNorm(doc=2925)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Johnny Long zeigt mit vielen Beispielabfragen, dass Google zigtausende brisante Dokumente indexiert hat. Der Grund hierfür liegt oft in der Unwissenheit der Anwender, in Fehlkonfigurationen oder schlicht in der Faulheit des Administrators (...) Administratoren lernen in dem Buch viel übder die Kreativität von Angreifern und können anhand der unzähligen Beispiele abchecken, ob ihre Server nicht vielleicht doch zu viele Informationen preisgeben. Aber auch Otto Normalanwender kann von dem Buch profitieren, denn Long beschreibt sehr detailliert die Funktionsweise der Google-Operatoren, welche Operatoren sich wie kombinieren lassen und von welchen man zur Sicherheit am besten die Finger lässt.
Stock, W.G.: Information Retrieval : Informationen suchen und finden (2007) 0.01
```
0.010972393 = product of:
  0.021944785 = sum of:
    0.021944785 = product of:
      0.04388957 = sum of:
        0.04388957 = weight(_text_:dokumente in 1851) [ClassicSimilarity], result of:
          0.04388957 = score(doc=1851,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.16880882 = fieldWeight in 1851, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.0234375 = fieldNorm(doc=1851)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Content

Enthält die Kapitel: - Grundlagen der Informationswissenschaft Ziel der Buchreihe - Informationswissenschaft - Information und Wissen - Propädeutik des Information Retrieval Geschichte des Information Retrieval - Grundbegriffe des Information Retrieval - Relevanz und Pertinenz - Dokumente - Typologie von Retrievalsystemen - Architektur eines Retrievalsystems - Boolesche Retrievalsysteme Boolesches Retrieval - Informetrische Analysen - Erweitertes Boolesches Retrieval - Informationslinguistik - Natural Language Processing n-Gramme - Worte - Phrasen, Eigennamen, Komposita - Begriffe - Anaphora - Fehlertolerantes Retrieval - Klassische Retrievalmodelle Textstatistik - Vektorraummodell - Probabilistisches Modell - Web Information Retrieval Linktopologie - Strukturinformationen in Dokumenten - Nutzer und Nutzung - Themenentdeckung und -verfolgung - Spezialprobleme des Information Retrieval Soziale Netzwerke und "small worlds" - Kontrolliertes Vokabular - Sprachübergreifendes Retrieval - Anfragedialog - Retrieval von Textstellen - Bild- und Tonretrieval

Conner-Sax, K.; Krol, E.: ¬The whole Internet : the next generation (1999) 0.01

0.006916596 = product of:
  0.013833192 = sum of:
    0.013833192 = product of:
      0.027666384 = sum of:
        0.027666384 = weight(_text_:22 in 1448) [ClassicSimilarity], result of:
          0.027666384 = score(doc=1448,freq=2.0), product of:
            0.17876907 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.05105019 = queryNorm
            0.15476047 = fieldWeight in 1448, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.03125 = fieldNorm(doc=1448)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Footnote: Rez. in: Internet Professionell. 2000, H.2, S.22

Wissensorganisation und Edutainment : Wissen im Spannungsfeld von Gesellschaft, Gestaltung und Industrie. Proceedings der 7. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation, Berlin, 21.-23.3.2001 (2004) 0.01
```
0.0051874467 = product of:
  0.010374893 = sum of:
    0.010374893 = product of:
      0.020749787 = sum of:
        0.020749787 = weight(_text_:22 in 1442) [ClassicSimilarity], result of:
          0.020749787 = score(doc=1442,freq=2.0), product of:
            0.17876907 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.05105019 = queryNorm
            0.116070345 = fieldWeight in 1442, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0234375 = fieldNorm(doc=1442)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Content

Enthält die Beiträge: 1. Wissensgesellschaft Michael NIEHAUS: Durch ein Meer von Unwägbarkeiten - Metaphorik in der Wissensgesellschaft S.3 Karsten WEBER: Aufgaben für eine (globale) Wissensgesellschaft oder "Welcome to the new IT? S.9 Katy TEUBENER: Chronos & Kairos. Inhaltsorganisation und Zeitkultur im Internet S.22 Klaus KRAEMER: Wissen und Nachhaltigkeit. Wissensasymmetrien als Problem einer nachhaltigen Entwicklung S.30 2. Lehre und Lernen Gehard BUDIN: Wissensorganisation als Gestaltungsprinzip virtuellen Lernens - epistemische, kommunikative und methodische Anforderungen S.39 Christan SWERTZ: Webdidaktik: Effiziente Inhaltsproduktion für netzbasierte Trainings S.49 Ingrid LOHMANN: Cognitive Mapping im Cyberpunk - Uber Postmoderne und die Transformation eines für so gut wie tot erklärten Literaturgenres zum Bildungstitel S.54 Rudolf W. KECK, Stefanie KOLLMANN, Christian RITZI: Pictura Paedagogica Online - Konzeption und Verwirklichung S.65 Jadranka LASIC-LASIC, Aida SLAVIC, Mihaela BANEK: Gemeinsame Ausbildung der IT Spezialisten an der Universität Zagreb: Vorteile und Probleme S.76 3. Informationsdesign und Visualisierung Maximilian EIBL, Thomas MANDL: Die Qualität von Visualisierungen: Eine Methode zum Vergleich zweidimensionaler Karten S.89 Udo L. FIGGE: Technische Anleitungen und der Erwerb kohärenten Wissens S.116 Monika WITSCH: Ästhetische Zeichenanalyse - eine Methode zur Analyse fundamentalistischer Agitation im Internet S.123 Oliver GERSTHEIMER, Christian LUPP: Systemdesign - Wissen um den Menschen: Bedürfnisorientierte Produktentwicklung im Mobile Business S.135 Philip ZERWECK: Mehrdimensionale Ordnungssysteme im virtuellen Raum anhand eines Desktops S.141

Search (6 results, page 1 of 1)

Authors

Years

Languages

Types

Themes

Subjects

Classifications