Search (369 results, page 1 of 19)

Effektive Information Retrieval Verfahren in Theorie und Praxis : ausgewählte und erweiterte Beiträge des Vierten Hildesheimer Evaluierungs- und Retrievalworkshop (HIER 2005), Hildesheim, 20.7.2005 (2006) 0.07
```
0.074139945 = product of:
  0.18534985 = sum of:
    0.014570824 = weight(_text_:buch in 5973) [ClassicSimilarity], result of:
      0.014570824 = score(doc=5973,freq=4.0), product of:
        0.10028592 = queryWeight, product of:
          4.64937 = idf(docFreq=1149, maxDocs=44218)
          0.021569785 = queryNorm
        0.14529282 = fieldWeight in 5973, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.64937 = idf(docFreq=1149, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    0.018135931 = weight(_text_:und in 5973) [ClassicSimilarity], result of:
      0.018135931 = score(doc=5973,freq=120.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.3793607 = fieldWeight in 5973, product of:
          10.954452 = tf(freq=120.0), with freq of:
            120.0 = termFreq=120.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    0.030585356 = weight(_text_:informationswissenschaft in 5973) [ClassicSimilarity], result of:
      0.030585356 = score(doc=5973,freq=20.0), product of:
        0.09716552 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.021569785 = queryNorm
        0.31477582 = fieldWeight in 5973, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    0.004988801 = weight(_text_:in in 5973) [ClassicSimilarity], result of:
      0.004988801 = score(doc=5973,freq=64.0), product of:
        0.029340398 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.021569785 = queryNorm
        0.17003182 = fieldWeight in 5973, product of:
          8.0 = tf(freq=64.0), with freq of:
            64.0 = termFreq=64.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    0.0297692 = weight(_text_:einzelnen in 5973) [ClassicSimilarity], result of:
      0.0297692 = score(doc=5973,freq=10.0), product of:
        0.1139978 = queryWeight, product of:
          5.285069 = idf(docFreq=608, maxDocs=44218)
          0.021569785 = queryNorm
        0.26113838 = fieldWeight in 5973, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          5.285069 = idf(docFreq=608, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    0.018135931 = weight(_text_:und in 5973) [ClassicSimilarity], result of:
      0.018135931 = score(doc=5973,freq=120.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.3793607 = fieldWeight in 5973, product of:
          10.954452 = tf(freq=120.0), with freq of:
            120.0 = termFreq=120.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    0.0165114 = weight(_text_:einzelne in 5973) [ClassicSimilarity], result of:
      0.0165114 = score(doc=5973,freq=2.0), product of:
        0.12695427 = queryWeight, product of:
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.021569785 = queryNorm
        0.13005784 = fieldWeight in 5973, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    0.011721714 = weight(_text_:bibliotheken in 5973) [ClassicSimilarity], result of:
      0.011721714 = score(doc=5973,freq=6.0), product of:
        0.08127756 = queryWeight, product of:
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.021569785 = queryNorm
        0.14421834 = fieldWeight in 5973, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    0.0165114 = weight(_text_:einzelne in 5973) [ClassicSimilarity], result of:
      0.0165114 = score(doc=5973,freq=2.0), product of:
        0.12695427 = queryWeight, product of:
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.021569785 = queryNorm
        0.13005784 = fieldWeight in 5973, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    0.011721714 = weight(_text_:bibliotheken in 5973) [ClassicSimilarity], result of:
      0.011721714 = score(doc=5973,freq=6.0), product of:
        0.08127756 = queryWeight, product of:
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.021569785 = queryNorm
        0.14421834 = fieldWeight in 5973, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    0.011721714 = weight(_text_:bibliotheken in 5973) [ClassicSimilarity], result of:
      0.011721714 = score(doc=5973,freq=6.0), product of:
        0.08127756 = queryWeight, product of:
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.021569785 = queryNorm
        0.14421834 = fieldWeight in 5973, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    9.758665E-4 = weight(_text_:s in 5973) [ClassicSimilarity], result of:
      9.758665E-4 = score(doc=5973,freq=6.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.04161215 = fieldWeight in 5973, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
  0.4 = coord(12/30)
```
Abstract

Information Retrieval hat sich zu einer Schlüsseltechnologie in der Wissensgesellschaft entwickelt. Die Anzahl der täglichen Anfragen an Internet-Suchmaschinen bildet nur einen Indikator für die große Bedeutung dieses Themas. Der Sammelbandband informiert über Themen wie Information Retrieval-Grundlagen, Retrieval Systeme, Digitale Bibliotheken, Evaluierung und Multilinguale Systeme, beschreibt Anwendungsszenarien und setzt sich mit neuen Herausforderungen an das Information Retrieval auseinander. Die Beiträge behandeln aktuelle Themen und neue Herausforderungen an das Information Retrieval. Die intensive Beteiligung der Informationswissenschaft der Universität Hildesheim am Cross Language Evaluation Forum (CLEF), einer europäischen Evaluierungsinitiative zur Erforschung mehrsprachiger Retrieval Systeme, berührt mehrere der Beiträge. Ebenso spielen Anwendungsszenarien und die Auseinandersetzung mit aktuellen und praktischen Fragestellungen eine große Rolle.

Content

Inhalt: Jan-Hendrik Scheufen: RECOIN: Modell offener Schnittstellen für Information-Retrieval-Systeme und -Komponenten Markus Nick, Klaus-Dieter Althoff: Designing Maintainable Experience-based Information Systems Gesine Quint, Steffen Weichert: Die benutzerzentrierte Entwicklung des Produkt- Retrieval-Systems EIKON der Blaupunkt GmbH Claus-Peter Klas, Sascha Kriewel, André Schaefer, Gudrun Fischer: Das DAFFODIL System - Strategische Literaturrecherche in Digitalen Bibliotheken Matthias Meiert: Entwicklung eines Modells zur Integration digitaler Dokumente in die Universitätsbibliothek Hildesheim Daniel Harbig, René Schneider: Ontology Learning im Rahmen von MyShelf Michael Kluck, Marco Winter: Topic-Entwicklung und Relevanzbewertung bei GIRT: ein Werkstattbericht Thomas Mandl: Neue Entwicklungen bei den Evaluierungsinitiativen im Information Retrieval Joachim Pfister: Clustering von Patent-Dokumenten am Beispiel der Datenbanken des Fachinformationszentrums Karlsruhe Ralph Kölle, Glenn Langemeier, Wolfgang Semar: Programmieren lernen in kollaborativen Lernumgebungen Olga Tartakovski, Margaryta Shramko: Implementierung eines Werkzeugs zur Sprachidentifikation in mono- und multilingualen Texten Nina Kummer: Indexierungstechniken für das japanische Retrieval Suriya Na Nhongkai, Hans-Joachim Bentz: Bilinguale Suche mittels Konzeptnetzen Robert Strötgen, Thomas Mandl, René Schneider: Entwicklung und Evaluierung eines Question Answering Systems im Rahmen des Cross Language Evaluation Forum (CLEF) Niels Jensen: Evaluierung von mehrsprachigem Web-Retrieval: Experimente mit dem EuroGOV-Korpus im Rahmen des Cross Language Evaluation Forum (CLEF)

Footnote

Rez. in: Information - Wissenschaft und Praxis 57(2006) H.5, S.290-291 (C. Schindler): "Weniger als ein Jahr nach dem "Vierten Hildesheimer Evaluierungs- und Retrievalworkshop" (HIER 2005) im Juli 2005 ist der dazugehörige Tagungsband erschienen. Eingeladen hatte die Hildesheimer Informationswissenschaft um ihre Forschungsergebnisse und die einiger externer Experten zum Thema Information Retrieval einem Fachpublikum zu präsentieren und zur Diskussion zu stellen. Unter dem Titel "Effektive Information Retrieval Verfahren in Theorie und Praxis" sind nahezu sämtliche Beiträge des Workshops in dem nun erschienenen, 15 Beiträge umfassenden Band gesammelt. Mit dem Schwerpunkt Information Retrieval (IR) wird ein Teilgebiet der Informationswissenschaft vorgestellt, das schon immer im Zentrum informationswissenschaftlicher Forschung steht. Ob durch den Leistungsanstieg von Prozessoren und Speichermedien, durch die Verbreitung des Internet über nationale Grenzen hinweg oder durch den stetigen Anstieg der Wissensproduktion, festzuhalten ist, dass in einer zunehmend wechselseitig vernetzten Welt die Orientierung und das Auffinden von Dokumenten in großen Wissensbeständen zu einer zentralen Herausforderung geworden sind. Aktuelle Verfahrensweisen zu diesem Thema, dem Information Retrieval, präsentiert der neue Band anhand von praxisbezogenen Projekten und theoretischen Diskussionen. Das Kernthema Information Retrieval wird in dem Sammelband in die Bereiche Retrieval-Systeme, Digitale Bibliothek, Evaluierung und Multilinguale Systeme untergliedert. Die Artikel der einzelnen Sektionen sind insgesamt recht heterogen und bieten daher keine Überschneidungen inhaltlicher Art. Jedoch ist eine vollkommene thematische Abdeckung der unterschiedlichen Bereiche ebenfalls nicht gegeben, was bei der Präsentation von Forschungsergebnissen eines Institutes und seiner Kooperationspartner auch nur bedingt erwartet werden kann. So lässt sich sowohl in der Gliederung als auch in den einzelnen Beiträgen eine thematische Verdichtung erkennen, die das spezielle Profil und die Besonderheit der Hildesheimer Informationswissenschaft im Feld des Information Retrieval wiedergibt. Teil davon ist die mehrsprachige und interdisziplinäre Ausrichtung, die die Schnittstellen zwischen Informationswissenschaft, Sprachwissenschaft und Informatik in ihrer praxisbezogenen und internationalen Forschung fokussiert.
Im ersten Kapitel "Retrieval-Systeme" werden verschiedene Information RetrievalSysteme präsentiert und Verfahren zu deren Gestaltung diskutiert. Jan-Hendrik Scheufen stellt das Meta-Framework RECOIN zur Information Retrieval Forschung vor, das sich durch eine flexible Handhabung unterschiedlichster Applikationen auszeichnet und dadurch eine zentrierte Protokollierung und Steuerung von Retrieval-Prozessen ermöglicht. Dieses Konzept eines offenen, komponentenbasierten Systems wurde in Form eines Plug-Ins für die javabasierte Open-Source-Plattform Eclipse realisiert. Markus Nick und Klaus-Dieter Althoff erläutern in ihrem Beitrag, der übrigens der einzige englischsprachige Text im Buch ist, das Verfahren DILLEBIS zur Erhaltung und Pflege (Maintenance) von erfahrungsbasierten Informationssystemen. Sie bezeichnen dieses Verfahren als Maintainable Experience-based Information System und plädieren für eine Ausrichtung von erfahrungsbasierten Systemen entsprechend diesem Modell. Gesine Quint und Steffen Weichert stellen dagegen in ihrem Beitrag die benutzerzentrierte Entwicklung des Produkt-Retrieval-Systems EIKON vor, das in Kooperation mit der Blaupunkt GmbH realisiert wurde. In einem iterativen Designzyklus erfolgte die Gestaltung von gruppenspezifischen Interaktionsmöglichkeiten für ein Car-Multimedia-Zubehör-System. Im zweiten Kapitel setzen sich mehrere Autoren dezidierter mit dem Anwendungsgebiet "Digitale Bibliothek" auseinander. Claus-Peter Klas, Sascha Kriewel, Andre Schaefer und Gudrun Fischer von der Universität Duisburg-Essen stellen das System DAFFODIL vor, das durch eine Vielzahl an Werkzeugen zur strategischen Unterstützung bei Literaturrecherchen in digitalen Bibliotheken dient. Zusätzlich ermöglicht die Protokollierung sämtlicher Ereignisse den Einsatz des Systems als Evaluationsplattform. Der Aufsatz von Matthias Meiert erläutert die Implementierung von elektronischen Publikationsprozessen an Hochschulen am Beispiel von Abschlussarbeiten des Studienganges Internationales Informationsmanagement der Universität Hildesheim. Neben Rahmenbedingungen werden sowohl der Ist-Zustand als auch der Soll-Zustand des wissenschaftlichen elektronischen Publizierens in Form von gruppenspezifischen Empfehlungen dargestellt. Daniel Harbig und Rene Schneider beschreiben in ihrem Aufsatz zwei Verfahrensweisen zum maschinellen Erlernen von Ontologien, angewandt am virtuellen Bibliotheksregal MyShelf. Nach der Evaluation dieser beiden Ansätze plädieren die Autoren für ein semi-automatisiertes Verfahren zur Erstellung von Ontologien.
"Evaluierung", das Thema des dritten Kapitels, ist in seiner Breite nicht auf das Information Retrieval beschränkt sondern beinhaltet ebenso einzelne Aspekte der Bereiche Mensch-Maschine-Interaktion sowie des E-Learning. Michael Muck und Marco Winter von der Stiftung Wissenschaft und Politik sowie dem Informationszentrum Sozialwissenschaften thematisieren in ihrem Beitrag den Einfluss der Fragestellung (Topic) auf die Bewertung von Relevanz und zeigen Verfahrensweisen für die Topic-Erstellung auf, die beim Cross Language Evaluation Forum (CLEF) Anwendung finden. Im darauf folgenden Aufsatz stellt Thomas Mandl verschiedene Evaluierungsinitiativen im Information Retrieval und aktuelle Entwicklungen dar. Joachim Pfister erläutert in seinem Beitrag das automatisierte Gruppieren, das sogenannte Clustering, von Patent-Dokumenten in den Datenbanken des Fachinformationszentrums Karlsruhe und evaluiert unterschiedliche Clusterverfahren auf Basis von Nutzerbewertungen. Ralph Kölle, Glenn Langemeier und Wolfgang Semar widmen sich dem kollaborativen Lernen unter den speziellen Bedingungen des Programmierens. Dabei werden das System VitaminL zur synchronen Bearbeitung von Programmieraufgaben und das Kennzahlensystem K-3 für die Bewertung kollaborativer Zusammenarbeit in einer Lehrveranstaltung angewendet. Der aktuelle Forschungsschwerpunkt der Hildesheimer Informationswissenschaft zeichnet sich im vierten Kapitel unter dem Thema "Multilinguale Systeme" ab. Hier finden sich die meisten Beiträge des Tagungsbandes wieder. Olga Tartakovski und Margaryta Shramko beschreiben und prüfen das System Langldent, das die Sprache von mono- und multilingualen Texten identifiziert. Die Eigenheiten der japanischen Schriftzeichen stellt Nina Kummer dar und vergleicht experimentell die unterschiedlichen Techniken der Indexierung. Suriya Na Nhongkai und Hans-Joachim Bentz präsentieren und prüfen eine bilinguale Suche auf Basis von Konzeptnetzen, wobei die Konzeptstruktur das verbindende Elemente der beiden Textsammlungen darstellt. Das Entwickeln und Evaluieren eines mehrsprachigen Question-Answering-Systems im Rahmen des Cross Language Evaluation Forum (CLEF), das die alltagssprachliche Formulierung von konkreten Fragestellungen ermöglicht, wird im Beitrag von Robert Strötgen, Thomas Mandl und Rene Schneider thematisiert. Den Schluss bildet der Aufsatz von Niels Jensen, der ein mehrsprachiges Web-Retrieval-System ebenfalls im Zusammenhang mit dem CLEF anhand des multilingualen EuroGOVKorpus evaluiert.
Abschließend lässt sich sagen, dass der Tagungsband einen gelungenen Überblick über die Information Retrieval Projekte der Hildesheimer Informationswissenschaft und ihrer Kooperationspartner gibt. Die einzelnen Beiträge sind sehr anregend und auf einem hohen Niveau angesiedelt. Ein kleines Hindernis für den Leser stellt die inhaltliche und strukturelle Orientierung innerhalb des Bandes dar. Der Bezug der einzelnen Artikel zum Thema des Kapitels wird zwar im Vorwort kurz erläutert. Erschwert wird die Orientierung im Buch jedoch durch fehlende Kapitelüberschriften am Anfang der einzelnen Sektionen. Außerdem ist zu erwähnen, dass einer der Artikel einen anderen Titel als im Inhaltsverzeichnis angekündigt trägt. Sieht der Leser von diesen formalen Mängeln ab, wird er reichlich mit praxisbezogenen und theoretisch fundierten Projektdarstellungen und Forschungsergebnissen belohnt. Dies insbesondere, da nicht nur aktuelle Themen der Informationswissenschaft aufgegriffen, sondern ebenso weiterentwickelt und durch die speziellen interdisziplinären und internationalen Bedingungen in Hildesheim geformt werden. Dabei zeigt sich anhand der verschiedenen Projekte, wie gut die Hildesheimer Informationswissenschaft in die Community überregionaler Informationseinrichtungen und anderer deutscher informationswissenschaftlicher Forschungsgruppen eingebunden ist. Damit hat der Workshop bei einer weiteren Öffnung der Expertengruppe das Potential zu einer eigenständigen Institution im Bereich des Information Retrieval zu werden. In diesem Sinne lässt sich auf weitere fruchtbare Workshops und deren Veröffentlichungen hoffen. Ein nächster Workshop der Universität Hildesheim zum Thema Information Retrieval, organisiert mit der Fachgruppe Information Retrieval der Gesellschaft für Informatik, kündigt sich bereits für den 9. bis 13- Oktober 2006 an."

Pages

VIII, 244 S

Series

Schriften zur Informationswissenschaft; Bd.45

Type

s

Nagelschmidt, M.: Verfahren zur Anfragemodifikation im Information Retrieval (2008) 0.03

0.034104593 = product of:
  0.14616254 = sum of:
    0.022211887 = weight(_text_:und in 2774) [ClassicSimilarity], result of:
      0.022211887 = score(doc=2774,freq=20.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.46462005 = fieldWeight in 2774, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=2774)
    0.014206541 = product of:
      0.028413082 = sum of:
        0.028413082 = weight(_text_:bibliothekswesen in 2774) [ClassicSimilarity], result of:
          0.028413082 = score(doc=2774,freq=2.0), product of:
            0.09615103 = queryWeight, product of:
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.021569785 = queryNorm
            0.2955047 = fieldWeight in 2774, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.457672 = idf(docFreq=1392, maxDocs=44218)
              0.046875 = fieldNorm(doc=2774)
      0.5 = coord(1/2)
    0.029015815 = weight(_text_:informationswissenschaft in 2774) [ClassicSimilarity], result of:
      0.029015815 = score(doc=2774,freq=2.0), product of:
        0.09716552 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.021569785 = queryNorm
        0.29862255 = fieldWeight in 2774, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.046875 = fieldNorm(doc=2774)
    0.028413082 = weight(_text_:bibliothekswesen in 2774) [ClassicSimilarity], result of:
      0.028413082 = score(doc=2774,freq=2.0), product of:
        0.09615103 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.021569785 = queryNorm
        0.2955047 = fieldWeight in 2774, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.046875 = fieldNorm(doc=2774)
    0.028413082 = weight(_text_:bibliothekswesen in 2774) [ClassicSimilarity], result of:
      0.028413082 = score(doc=2774,freq=2.0), product of:
        0.09615103 = queryWeight, product of:
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.021569785 = queryNorm
        0.2955047 = fieldWeight in 2774, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.457672 = idf(docFreq=1392, maxDocs=44218)
          0.046875 = fieldNorm(doc=2774)
    0.022211887 = weight(_text_:und in 2774) [ClassicSimilarity], result of:
      0.022211887 = score(doc=2774,freq=20.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.46462005 = fieldWeight in 2774, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=2774)
    0.0016902501 = weight(_text_:s in 2774) [ClassicSimilarity], result of:
      0.0016902501 = score(doc=2774,freq=2.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.072074346 = fieldWeight in 2774, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.046875 = fieldNorm(doc=2774)
  0.23333333 = coord(7/30)

Abstract: Für das Modifizieren von Suchanfragen kennt das Information Retrieval vielfältige Möglichkeiten. Nach einer einleitenden Darstellung der Wechselwirkung zwischen Informationsbedarf und Suchanfrage wird eine konzeptuelle und typologische Annäherung an Verfahren zur Anfragemodifikation gegeben. Im Anschluss an eine kurze Charakterisierung des Fakten- und des Information Retrieval, sowie des Vektorraum- und des probabilistischen Modells, werden intellektuelle, automatische und interaktive Modifikationsverfahren vorgestellt. Neben klassischen intellektuellen Verfahren, wie der Blockstrategie und der "Citation Pearl Growing"-Strategie, umfasst die Darstellung der automatischen und interaktiven Verfahren Modifikationsmöglichkeiten auf den Ebenen der Morphologie, der Syntax und der Semantik von Suchtermen. Darüber hinaus werden das Relevance Feedback, der Nutzen informetrischer Analysen und die Idee eines assoziativen Retrievals auf der Basis von Clustering- und terminologischen Techniken, sowie zitationsanalytischen Verfahren verfolgt. Ein Eindruck für die praktischen Gestaltungsmöglichkeiten der behandelten Verfahren soll abschließend durch fünf Anwendungsbeispiele vermittelt werden.
Footnote: Diplomarbeit im Studiengang Bibliothekswesen
Imprint: Köln : Fachhochschule, Institut für Informationswissenschaft
Pages: V, 110 S. + CD

Mayr, P.: Re-Ranking auf Basis von Bradfordizing für die verteilte Suche in Digitalen Bibliotheken (2009) 0.03

0.026343247 = product of:
  0.09878717 = sum of:
    0.016883632 = weight(_text_:und in 4302) [ClassicSimilarity], result of:
      0.016883632 = score(doc=4302,freq=26.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.3531656 = fieldWeight in 4302, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=4302)
    0.019343877 = weight(_text_:informationswissenschaft in 4302) [ClassicSimilarity], result of:
      0.019343877 = score(doc=4302,freq=2.0), product of:
        0.09716552 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.021569785 = queryNorm
        0.1990817 = fieldWeight in 4302, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.03125 = fieldNorm(doc=4302)
    0.0039439937 = weight(_text_:in in 4302) [ClassicSimilarity], result of:
      0.0039439937 = score(doc=4302,freq=10.0), product of:
        0.029340398 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.021569785 = queryNorm
        0.13442196 = fieldWeight in 4302, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.03125 = fieldNorm(doc=4302)
    0.016883632 = weight(_text_:und in 4302) [ClassicSimilarity], result of:
      0.016883632 = score(doc=4302,freq=26.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.3531656 = fieldWeight in 4302, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=4302)
    0.013535069 = weight(_text_:bibliotheken in 4302) [ClassicSimilarity], result of:
      0.013535069 = score(doc=4302,freq=2.0), product of:
        0.08127756 = queryWeight, product of:
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.021569785 = queryNorm
        0.16652898 = fieldWeight in 4302, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.03125 = fieldNorm(doc=4302)
    0.013535069 = weight(_text_:bibliotheken in 4302) [ClassicSimilarity], result of:
      0.013535069 = score(doc=4302,freq=2.0), product of:
        0.08127756 = queryWeight, product of:
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.021569785 = queryNorm
        0.16652898 = fieldWeight in 4302, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.03125 = fieldNorm(doc=4302)
    0.013535069 = weight(_text_:bibliotheken in 4302) [ClassicSimilarity], result of:
      0.013535069 = score(doc=4302,freq=2.0), product of:
        0.08127756 = queryWeight, product of:
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.021569785 = queryNorm
        0.16652898 = fieldWeight in 4302, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.03125 = fieldNorm(doc=4302)
    0.0011268335 = weight(_text_:s in 4302) [ClassicSimilarity], result of:
      0.0011268335 = score(doc=4302,freq=2.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.048049565 = fieldWeight in 4302, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.03125 = fieldNorm(doc=4302)
  0.26666668 = coord(8/30)

Abstract: Trotz großer Dokumentmengen für datenbankübergreifende Literaturrecherchen erwarten akademische Nutzer einen möglichst hohen Anteil an relevanten und qualitativen Dokumenten in den Trefferergebnissen. Insbesondere die Reihenfolge und Struktur der gelisteten Ergebnisse (Ranking) spielt, neben dem direkten Volltextzugriff auf die Dokumente, inzwischen eine entscheidende Rolle beim Design von Suchsystemen. Nutzer erwarten weiterhin flexible Informationssysteme, die es unter anderem zulassen, Einfluss auf das Ranking der Dokumente zu nehmen bzw. alternative Rankingverfahren zu verwenden. In dieser Arbeit werden zwei Mehrwertverfahren für Suchsysteme vorgestellt, die die typischen Probleme bei der Recherche nach wissenschaftlicher Literatur behandeln und damit die Recherchesituation messbar verbessern können. Die beiden Mehrwertdienste semantische Heterogenitätsbehandlung am Beispiel Crosskonkordanzen und Re-Ranking auf Basis von Bradfordizing, die in unterschiedlichen Phasen der Suche zum Einsatz kommen, werden hier ausführlich beschrieben und im empirischen Teil der Arbeit bzgl. der Effektivität für typische fachbezogene Recherchen evaluiert. Vorrangiges Ziel der Promotion ist es, zu untersuchen, ob das hier vorgestellte alternative Re-Rankingverfahren Bradfordizing im Anwendungsbereich bibliographischer Datenbanken zum einen operabel ist und zum anderen voraussichtlich gewinnbringend in Informationssystemen eingesetzt und dem Nutzer angeboten werden kann. Für die Tests wurden Fragestellungen und Daten aus zwei Evaluationsprojekten (CLEF und KoMoHe) verwendet. Die intellektuell bewerteten Dokumente stammen aus insgesamt sieben wissenschaftlichen Fachdatenbanken der Fächer Sozialwissenschaften, Politikwissenschaft, Wirtschaftswissenschaften, Psychologie und Medizin. Die Evaluation der Crosskonkordanzen (insgesamt 82 Fragestellungen) zeigt, dass sich die Retrievalergebnisse signifikant für alle Crosskonkordanzen verbessern; es zeigt sich zudem, dass interdisziplinäre Crosskonkordanzen den stärksten (positiven) Effekt auf die Suchergebnisse haben. Die Evaluation des Re-Ranking nach Bradfordizing (insgesamt 164 Fragestellungen) zeigt, dass die Dokumente der Kernzone (Kernzeitschriften) für die meisten Testreihen eine signifikant höhere Precision als Dokumente der Zone 2 und Zone 3 (Peripheriezeitschriften) ergeben. Sowohl für Zeitschriften als auch für Monographien kann dieser Relevanzvorteil nach Bradfordizing auf einer sehr breiten Basis von Themen und Fragestellungen an zwei unabhängigen Dokumentkorpora empirisch nachgewiesen werden.
Imprint: Berlin : Humboldt-Universität zu Berlin / Institut für Bibliotheks- und Informationswissenschaft
Pages: 236 S

Hora, M.: Methoden für das Ranking in Discovery-Systemen (2018) 0.03

0.025936415 = product of:
  0.11115607 = sum of:
    0.01638937 = weight(_text_:und in 4968) [ClassicSimilarity], result of:
      0.01638937 = score(doc=4968,freq=8.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.34282678 = fieldWeight in 4968, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4968)
    0.0053462577 = weight(_text_:in in 4968) [ClassicSimilarity], result of:
      0.0053462577 = score(doc=4968,freq=6.0), product of:
        0.029340398 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.021569785 = queryNorm
        0.1822149 = fieldWeight in 4968, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4968)
    0.01638937 = weight(_text_:und in 4968) [ClassicSimilarity], result of:
      0.01638937 = score(doc=4968,freq=8.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.34282678 = fieldWeight in 4968, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4968)
    0.023686372 = weight(_text_:bibliotheken in 4968) [ClassicSimilarity], result of:
      0.023686372 = score(doc=4968,freq=2.0), product of:
        0.08127756 = queryWeight, product of:
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.021569785 = queryNorm
        0.29142573 = fieldWeight in 4968, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4968)
    0.023686372 = weight(_text_:bibliotheken in 4968) [ClassicSimilarity], result of:
      0.023686372 = score(doc=4968,freq=2.0), product of:
        0.08127756 = queryWeight, product of:
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.021569785 = queryNorm
        0.29142573 = fieldWeight in 4968, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4968)
    0.023686372 = weight(_text_:bibliotheken in 4968) [ClassicSimilarity], result of:
      0.023686372 = score(doc=4968,freq=2.0), product of:
        0.08127756 = queryWeight, product of:
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.021569785 = queryNorm
        0.29142573 = fieldWeight in 4968, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4968)
    0.0019719584 = weight(_text_:s in 4968) [ClassicSimilarity], result of:
      0.0019719584 = score(doc=4968,freq=2.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.08408674 = fieldWeight in 4968, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4968)
  0.23333333 = coord(7/30)

Abstract: Discovery-Systeme bieten meist als Standardeinstellung eine Sortierung nach Relevanz an. Wie die Relevanz ermittelt wird, ist häufig intransparent. Dabei wären Kenntnisse darüber aus Nutzersicht ein wichtiger Faktor in der Informationskompetenz, während Bibliotheken sicherstellen sollten, dass das Ranking zum eigenen Bestand und Publikum passt. In diesem Aufsatz wird dargestellt, wie Discovery-Systeme Treffer auswählen und bewerten. Dazu gehören Indexierung, Prozessierung, Text-Matching und weitere Relevanzkriterien, z. B. Popularität oder Verfügbarkeit. Schließlich müssen alle betrachteten Kriterien zu einem zentralen Score zusammengefasst werden. Ein besonderer Fokus wird auf das Ranking von EBSCO Discovery Service, Primo und Summon gelegt.
Source: Perspektive Bibliothek. 7(2018) H.2, S.2-23

Mayr, P.: Bradfordizing mit Katalogdaten : Alternative Sicht auf Suchergebnisse und Publikationsquellen durch Re-Ranking (2010) 0.02

0.02401573 = product of:
  0.102924556 = sum of:
    0.017205253 = weight(_text_:und in 4301) [ClassicSimilarity], result of:
      0.017205253 = score(doc=4301,freq=12.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.35989314 = fieldWeight in 4301, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=4301)
    0.005915991 = weight(_text_:in in 4301) [ClassicSimilarity], result of:
      0.005915991 = score(doc=4301,freq=10.0), product of:
        0.029340398 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.021569785 = queryNorm
        0.20163295 = fieldWeight in 4301, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=4301)
    0.017205253 = weight(_text_:und in 4301) [ClassicSimilarity], result of:
      0.017205253 = score(doc=4301,freq=12.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.35989314 = fieldWeight in 4301, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=4301)
    0.020302603 = weight(_text_:bibliotheken in 4301) [ClassicSimilarity], result of:
      0.020302603 = score(doc=4301,freq=2.0), product of:
        0.08127756 = queryWeight, product of:
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.021569785 = queryNorm
        0.24979347 = fieldWeight in 4301, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.046875 = fieldNorm(doc=4301)
    0.020302603 = weight(_text_:bibliotheken in 4301) [ClassicSimilarity], result of:
      0.020302603 = score(doc=4301,freq=2.0), product of:
        0.08127756 = queryWeight, product of:
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.021569785 = queryNorm
        0.24979347 = fieldWeight in 4301, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.046875 = fieldNorm(doc=4301)
    0.020302603 = weight(_text_:bibliotheken in 4301) [ClassicSimilarity], result of:
      0.020302603 = score(doc=4301,freq=2.0), product of:
        0.08127756 = queryWeight, product of:
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.021569785 = queryNorm
        0.24979347 = fieldWeight in 4301, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.046875 = fieldNorm(doc=4301)
    0.0016902501 = weight(_text_:s in 4301) [ClassicSimilarity], result of:
      0.0016902501 = score(doc=4301,freq=2.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.072074346 = fieldWeight in 4301, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.046875 = fieldNorm(doc=4301)
  0.23333333 = coord(7/30)

Abstract: Nutzer erwarten für Literaturrecherchen in wissenschaftlichen Suchsystemen einen möglichst hohen Anteil an relevanten und qualitativen Dokumenten in den Trefferergebnissen. Insbesondere die Reihenfolge und Struktur der gelisteten Ergebnisse (Ranking) spielt, neben dem direkten Volltextzugriff auf die Dokumente, für viele Nutzer inzwischen eine entscheidende Rolle. Abgegrenzt wird Ranking oder Relevance Ranking von sogenannten Sortierungen zum Beispiel nach dem Erscheinungsjahr der Publikation, obwohl hier die Grenze zu »nach inhaltlicher Relevanz« gerankten Listen konzeptuell nicht sauber zu ziehen ist. Das Ranking von Dokumenten führt letztlich dazu, dass sich die Benutzer fokussiert mit den oberen Treffermengen eines Suchergebnisses beschäftigen. Der mittlere und untere Bereich eines Suchergebnisses wird häufig nicht mehr in Betracht gezogen. Aufgrund der Vielzahl an relevanten und verfügbaren Informationsquellen ist es daher notwendig, Kernbereiche in den Suchräumen zu identifizieren und diese anschließend dem Nutzer hervorgehoben zu präsentieren. Phillipp Mayr fasst hier die Ergebnisse seiner Dissertation zum Thema »Re-Ranking auf Basis von Bradfordizing für die verteilte Suche in Digitalen Bibliotheken« zusammen.
Source: BuB. 62(2010) H.1, S.61-63

Mutschke, P.: Autorennetzwerke : Verfahren zur Netzwerkanalyse als Mehrwertdienste für Informationssysteme (2004) 0.02

0.023447912 = product of:
  0.100491054 = sum of:
    0.015706176 = weight(_text_:und in 4050) [ClassicSimilarity], result of:
      0.015706176 = score(doc=4050,freq=10.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.328536 = fieldWeight in 4050, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=4050)
    0.0064806426 = weight(_text_:in in 4050) [ClassicSimilarity], result of:
      0.0064806426 = score(doc=4050,freq=12.0), product of:
        0.029340398 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.021569785 = queryNorm
        0.22087781 = fieldWeight in 4050, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=4050)
    0.015706176 = weight(_text_:und in 4050) [ClassicSimilarity], result of:
      0.015706176 = score(doc=4050,freq=10.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.328536 = fieldWeight in 4050, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=4050)
    0.020302603 = weight(_text_:bibliotheken in 4050) [ClassicSimilarity], result of:
      0.020302603 = score(doc=4050,freq=2.0), product of:
        0.08127756 = queryWeight, product of:
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.021569785 = queryNorm
        0.24979347 = fieldWeight in 4050, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.046875 = fieldNorm(doc=4050)
    0.020302603 = weight(_text_:bibliotheken in 4050) [ClassicSimilarity], result of:
      0.020302603 = score(doc=4050,freq=2.0), product of:
        0.08127756 = queryWeight, product of:
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.021569785 = queryNorm
        0.24979347 = fieldWeight in 4050, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.046875 = fieldNorm(doc=4050)
    0.020302603 = weight(_text_:bibliotheken in 4050) [ClassicSimilarity], result of:
      0.020302603 = score(doc=4050,freq=2.0), product of:
        0.08127756 = queryWeight, product of:
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.021569785 = queryNorm
        0.24979347 = fieldWeight in 4050, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.046875 = fieldNorm(doc=4050)
    0.0016902501 = weight(_text_:s in 4050) [ClassicSimilarity], result of:
      0.0016902501 = score(doc=4050,freq=2.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.072074346 = fieldWeight in 4050, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.046875 = fieldNorm(doc=4050)
  0.23333333 = coord(7/30)

Abstract: Virtuelle Bibliotheken enthalten eine Fülle an Informationen, die in ihrer Vielfalt und Tiefe von Standardsuchmaschinen nicht erschöpfend erfasst wird. Der Arbeitsbericht informiert über Entwicklungen am IZ, die darauf abzielen, Wissen über das Interaktionsgeschehen in wissenschaftlichen Communities und den sozialen Status ihrer Akteure für das Retrieval auszunutzen. Grundlage hierfür sind soziale Netzwerke, die sich durch Kooperation der wissenschaftlichen Akteure konstituieren und in den Dokumenten der Datenbasis z.B. als Koautorbeziehungen repräsentiert sind (Autorennetzwerke). Die in dem Bericht beschriebenen Studien zur Small-World-Topologie von Autorennetzwerken zeigen, dass diese Netzwerke ein erhebliches Potential für Informationssysteme haben. Der Bericht diskutiert Szenarios, die beschreiben, wie Autorennetzwerke und hier insbesondere das Konzept der Akteurszentralität für die Informationssuche in Datenbanken sinnvoll genutzt werden können. Kernansatz dieser Retrievalmodelle ist die Suche nach Experten und das Ranking von Dokumenten auf der Basis der Zentralität von Autoren in Autorennetzwerken.
Pages: 49 S

Wilhelmy, A.: Phonetische Ähnlichkeitssuche in Datenbanken (1991) 0.02

0.02333379 = product of:
  0.10000195 = sum of:
    0.015706176 = weight(_text_:und in 5684) [ClassicSimilarity], result of:
      0.015706176 = score(doc=5684,freq=10.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.328536 = fieldWeight in 5684, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5684)
    0.0052914224 = weight(_text_:in in 5684) [ClassicSimilarity], result of:
      0.0052914224 = score(doc=5684,freq=8.0), product of:
        0.029340398 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.021569785 = queryNorm
        0.18034597 = fieldWeight in 5684, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=5684)
    0.015706176 = weight(_text_:und in 5684) [ClassicSimilarity], result of:
      0.015706176 = score(doc=5684,freq=10.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.328536 = fieldWeight in 5684, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5684)
    0.020302603 = weight(_text_:bibliotheken in 5684) [ClassicSimilarity], result of:
      0.020302603 = score(doc=5684,freq=2.0), product of:
        0.08127756 = queryWeight, product of:
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.021569785 = queryNorm
        0.24979347 = fieldWeight in 5684, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.046875 = fieldNorm(doc=5684)
    0.020302603 = weight(_text_:bibliotheken in 5684) [ClassicSimilarity], result of:
      0.020302603 = score(doc=5684,freq=2.0), product of:
        0.08127756 = queryWeight, product of:
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.021569785 = queryNorm
        0.24979347 = fieldWeight in 5684, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.046875 = fieldNorm(doc=5684)
    0.020302603 = weight(_text_:bibliotheken in 5684) [ClassicSimilarity], result of:
      0.020302603 = score(doc=5684,freq=2.0), product of:
        0.08127756 = queryWeight, product of:
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.021569785 = queryNorm
        0.24979347 = fieldWeight in 5684, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.768121 = idf(docFreq=2775, maxDocs=44218)
          0.046875 = fieldNorm(doc=5684)
    0.002390375 = weight(_text_:s in 5684) [ClassicSimilarity], result of:
      0.002390375 = score(doc=5684,freq=4.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.101928525 = fieldWeight in 5684, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.046875 = fieldNorm(doc=5684)
  0.23333333 = coord(7/30)

Abstract: In dialoggesteuerten Systemen zur Informationswiedergewinnung (Information Retrieval Systems, IRS) kann man - vergröbernd - das Wechselspiel zwischen Mensch und Computer als iterativen Prozess zur Erhöhung von Genauigkeit (Precision) auf der einen und Vollständigkeit (Recall) der Nachweise auf der anderen Seite verstehen. Vorgestellt wird ein maschinell anwendbares Verfahren, das auf phonologische Untersuchungen des Sprachwissenschaftlers Nikolaj S. Trubetzkoy (1890-1938) zurückgeht. In den Grundzügen kann es erheblich zur Verbesserung der Nachweisvollständigkeit beitragen. Dadurch, daß es die 'Ähnlichkeitsumgebungen' von Suchbegriffen in die Recherche mit einbezieht, zeigt es sich vor allem für Systeme mit koordinativer maschineller Indexierung als vorteilhaft. Bei alphabetischen Begriffen erweist sich die Einführung eines solchen zunächst nur auf den Benutzer hin orientierten Verfahrens auch aus technischer Sicht als günstig, da damit die Anzahl der Zugriffe bei den Suchvorgängen auch für große Datenvolumina niedrig gehalten werden kann
Pages: S.329-338
Source: Bibliotheken mit und ohne Grenzen: Informationsgesellschaft und Bibliothek. Der österreichische Bibliothekartag 1990, Bregenz, 4.-8.9.1990, Vorträge und Kommissionssitzungen

Fuhr, N.: Theorie des Information Retrieval I : Modelle (2004) 0.02

0.022035733 = product of:
  0.110178664 = sum of:
    0.016555762 = weight(_text_:und in 2912) [ClassicSimilarity], result of:
      0.016555762 = score(doc=2912,freq=16.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.34630734 = fieldWeight in 2912, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2912)
    0.024179846 = weight(_text_:informationswissenschaft in 2912) [ClassicSimilarity], result of:
      0.024179846 = score(doc=2912,freq=2.0), product of:
        0.09716552 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.021569785 = queryNorm
        0.24885213 = fieldWeight in 2912, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2912)
    0.004409519 = weight(_text_:in in 2912) [ClassicSimilarity], result of:
      0.004409519 = score(doc=2912,freq=8.0), product of:
        0.029340398 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.021569785 = queryNorm
        0.15028831 = fieldWeight in 2912, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2912)
    0.047069237 = weight(_text_:einzelnen in 2912) [ClassicSimilarity], result of:
      0.047069237 = score(doc=2912,freq=4.0), product of:
        0.1139978 = queryWeight, product of:
          5.285069 = idf(docFreq=608, maxDocs=44218)
          0.021569785 = queryNorm
        0.412896 = fieldWeight in 2912, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.285069 = idf(docFreq=608, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2912)
    0.016555762 = weight(_text_:und in 2912) [ClassicSimilarity], result of:
      0.016555762 = score(doc=2912,freq=16.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.34630734 = fieldWeight in 2912, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2912)
    0.0014085418 = weight(_text_:s in 2912) [ClassicSimilarity], result of:
      0.0014085418 = score(doc=2912,freq=2.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.060061958 = fieldWeight in 2912, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2912)
  0.2 = coord(6/30)

Abstract: Information-Retrieval-(IR-)Modelle spezifizieren, wie zur einer gegebenen Anfrage die Antwortdokumente aus einer Dokumentenkollektion bestimmt werden. Dabei macht jedes Modell bestimmte Annahmen über die Struktur von Dokumenten und Anfragen und definiert dann die so genannte Retrievalfunktion, die das Retrievalgewicht eines Dokumentes bezüglich einer Anfrage bestimmt - im Falle des Booleschen Retrieval etwa eines der Gewichte 0 oder 1. Die Dokumente werden dann nach fallenden Gewichten sortiert und dem Benutzer präsentiert. Zunächst sollen hier einige grundlegende Charakteristika von Retrievalmodellen beschrieben werden, bevor auf die einzelnen Modelle näher eingegangen wird. Wie eingangs erwähnt, macht jedes Modell Annahmen über die Struktur von Dokumenten und Fragen. Ein Dokument kann entweder als Menge oder Multimenge von so genannten Termen aufgefasst werden, wobei im zweiten Fall das Mehrfachvorkommen berücksichtigt wird. Dabei subsummiert 'Term' einen Suchbegriff, der ein einzelnes Wort, ein mehrgliedriger Begriff oder auch ein komplexes Freitextmuster sein kann. Diese Dokumentrepräsentation wird wiederum auf eine so genannte Dokumentbeschreibung abgebildet, in der die einzelnen Terme gewichtet sein können; dies ist Aufgabe der in Kapitel B 5 beschriebenen Indexierungsmodelle. Im Folgenden unterscheiden wir nur zwischen ungewichteter (Gewicht eines Terms ist entweder 0 oderl) und gewichteter Indexierung (das Gewicht ist eine nichtnegative reelle Zahl). Ebenso wie bei Dokumenten können auch die Terme in der Frage entweder ungewichtet oder gewichtet sein. Daneben unterscheidet man zwischen linearen (Frage als Menge von Termen, ungewichtet oder gewichtet) und Booleschen Anfragen.
Pages: S.207-214
Source: Grundlagen der praktischen Information und Dokumentation. 5., völlig neu gefaßte Ausgabe. 2 Bde. Hrsg. von R. Kuhlen, Th. Seeger u. D. Strauch. Begründet von Klaus Laisiepen, Ernst Lutterbeck, Karl-Heinrich Meyer-Uhlenried. Bd.1: Handbuch zur Einführung in die Informationswissenschaft und -praxis

Marcus, S.: Textvergleich mit mehreren Mustern (2005) 0.02

0.01794207 = product of:
  0.08971034 = sum of:
    0.008110635 = weight(_text_:und in 862) [ClassicSimilarity], result of:
      0.008110635 = score(doc=862,freq=6.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.16965526 = fieldWeight in 862, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=862)
    0.005849888 = weight(_text_:in in 862) [ClassicSimilarity], result of:
      0.005849888 = score(doc=862,freq=22.0), product of:
        0.029340398 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.021569785 = queryNorm
        0.19937998 = fieldWeight in 862, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.03125 = fieldNorm(doc=862)
    0.008110635 = weight(_text_:und in 862) [ClassicSimilarity], result of:
      0.008110635 = score(doc=862,freq=6.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.16965526 = fieldWeight in 862, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=862)
    0.0330228 = weight(_text_:einzelne in 862) [ClassicSimilarity], result of:
      0.0330228 = score(doc=862,freq=2.0), product of:
        0.12695427 = queryWeight, product of:
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.021569785 = queryNorm
        0.26011568 = fieldWeight in 862, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.03125 = fieldNorm(doc=862)
    0.0330228 = weight(_text_:einzelne in 862) [ClassicSimilarity], result of:
      0.0330228 = score(doc=862,freq=2.0), product of:
        0.12695427 = queryWeight, product of:
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.021569785 = queryNorm
        0.26011568 = fieldWeight in 862, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.03125 = fieldNorm(doc=862)
    0.0015935833 = weight(_text_:s in 862) [ClassicSimilarity], result of:
      0.0015935833 = score(doc=862,freq=4.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.06795235 = fieldWeight in 862, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.03125 = fieldNorm(doc=862)
  0.2 = coord(6/30)

Abstract: Das Gebiet des Pattern-Matching besitzt in vielen wissenschaftlichen Bereichen eine hohe Relevanz. Aufgrund unterschiedlicher Einsatzgebiete sind auch Umsetzung und Anwendung des Pattern-Matching sehr verschieden. Die allen Anwendungen des Pattern-Matching inhärente Aufgabe besteht darin, in einer Vielzahl von Eingabedaten bestimmte Muster wieder zu erkennen. Dies ist auch der deutschen Bezeichnung Mustererkennung zu entnehmen. In der Medizin findet Pattern-Matching zum Beispiel bei der Untersuchung von Chromosomensträngen auf bestimmte Folgen von Chromosomen Verwendung. Auf dem Gebiet der Bildverarbeitung können mit Hilfe des Pattern-Matching ganze Bilder verglichen oder einzelne Bildpunkte betrachtet werden, die durch ein Muster identifizierbar sind. Ein weiteres Einsatzgebiet des Pattern-Matching ist das Information-Retrieval, bei dem in gespeicherten Daten nach relevanten Informationen gesucht wird. Die Relevanz der zu suchenden Daten wird auch hier anhand eines Musters, zum Beispiel einem bestimmten Schlagwort, beurteilt. Ein vergleichbares Verfahren findet auch im Internet Anwendung. Internet-Benutzer, die mittels einer Suchmaschine nach bedeutsamen Informationen suchen, erhalten diese durch den Einsatz eines Pattern-Matching-Automaten. Die in diesem Zusammenhang an den Pattern-Matching-Automaten gestellten Anforderungen variieren mit der Suchanfrage, die an eine Suchmaschine gestellt wird. Eine solche Suchanfrage kann im einfachsten Fall aus genau einem Schlüsselwort bestehen. Im komplexeren Fall enthält die Anfrage mehrere Schlüsselwörter. Dabei muss für eine erfolgreiche Suche eine Konkatenation der in der Anfrage enthaltenen Wörter erfolgen. Zu Beginn dieser Arbeit wird in Kapitel 2 eine umfassende Einführung in die Thematik des Textvergleichs gegeben, wobei die Definition einiger grundlegender Begriffe vorgenommen wird. Anschließend werden in Kapitel 3 Verfahren zum Textvergleich mit mehreren Mustern vorgestellt. Dabei wird zunächst ein einfaches Vorgehen erläutert, um einen Einsteig in das Thema des Textvergleichs mit mehreren Mustern zu erleichtern. Danach wird eine komplexe Methode des Textvergleichs vorgestellt und anhand von Beispielen verdeutlicht.
Content: Ausarbeitung im Rahmen des Seminars Suchmaschinen und Suchalgorithmen, Institut für Wirtschaftsinformatik Praktische Informatik in der Wirtschaft, Westfälische Wilhelms-Universität Münster. - Vgl.: http://www-wi.uni-muenster.de/pi/lehre/ss05/seminarSuchen/Ausarbeitungen/SandraMarcus.pdf
Pages: 25 S

Fuhr, N.: Modelle im Information Retrieval (2023) 0.02

0.017749952 = product of:
  0.08874976 = sum of:
    0.01308848 = weight(_text_:und in 800) [ClassicSimilarity], result of:
      0.01308848 = score(doc=800,freq=10.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.27378 = fieldWeight in 800, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=800)
    0.024179846 = weight(_text_:informationswissenschaft in 800) [ClassicSimilarity], result of:
      0.024179846 = score(doc=800,freq=2.0), product of:
        0.09716552 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.021569785 = queryNorm
        0.24885213 = fieldWeight in 800, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0390625 = fieldNorm(doc=800)
    0.0031180005 = weight(_text_:in in 800) [ClassicSimilarity], result of:
      0.0031180005 = score(doc=800,freq=4.0), product of:
        0.029340398 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.021569785 = queryNorm
        0.10626988 = fieldWeight in 800, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=800)
    0.033282977 = weight(_text_:einzelnen in 800) [ClassicSimilarity], result of:
      0.033282977 = score(doc=800,freq=2.0), product of:
        0.1139978 = queryWeight, product of:
          5.285069 = idf(docFreq=608, maxDocs=44218)
          0.021569785 = queryNorm
        0.29196155 = fieldWeight in 800, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.285069 = idf(docFreq=608, maxDocs=44218)
          0.0390625 = fieldNorm(doc=800)
    0.01308848 = weight(_text_:und in 800) [ClassicSimilarity], result of:
      0.01308848 = score(doc=800,freq=10.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.27378 = fieldWeight in 800, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=800)
    0.001991979 = weight(_text_:s in 800) [ClassicSimilarity], result of:
      0.001991979 = score(doc=800,freq=4.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.08494043 = fieldWeight in 800, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.0390625 = fieldNorm(doc=800)
  0.2 = coord(6/30)

Abstract: Information-Retrieval-Modelle -(IR-Modelle) spezifizieren, wie zu einer gegebenen Anfrage die Antwortdokumente aus einer Dokumentenkollektion bestimmt werden. Ausgangsbasis jedes Modells sind dabei zunächst bestimmte Annahmen über die Wissensrepräsentation (s. Teil B Methoden und Systeme der Inhaltserschließung) von Fragen und Dokumenten. Hier bezeichnen wir die Elemente dieser Repräsentationen als Terme, wobei es aus der Sicht des Modells egal ist, wie diese Terme aus dem Dokument (und analog aus der von Benutzenden eingegebenen Anfrage) abgeleitet werden: Bei Texten werden hierzu häufig computerlinguistische Methoden eingesetzt, aber auch komplexere automatische oder manuelle Erschließungsverfahren können zur Anwendung kommen. Repräsentationen besitzen ferner eine bestimmte Struktur. Ein Dokument wird meist als Menge oder Multimenge von Termen aufgefasst, wobei im zweiten Fall das Mehrfachvorkommen berücksichtigt wird. Diese Dokumentrepräsentation wird wiederum auf eine sogenannte Dokumentbeschreibung abgebildet, in der die einzelnen Terme gewichtet sein können. Im Folgenden unterscheiden wir nur zwischen ungewichteter (Gewicht eines Terms ist entweder 0 oder 1) und gewichteter Indexierung (das Gewicht ist eine nichtnegative reelle Zahl). Analog dazu gibt es eine Fragerepräsentation; legt man eine natürlichsprachige Anfrage zugrunde, so kann man die o. g. Verfahren für Dokumenttexte anwenden. Alternativ werden auch grafische oder formale Anfragesprachen verwendet, wobei aus Sicht der Modelle insbesondere deren logische Struktur (etwa beim Booleschen Retrieval) relevant ist. Die Fragerepräsentation wird dann in eine Fragebeschreibung überführt.
Pages: S.379-398
Source: Grundlagen der Informationswissenschaft. Hrsg.: Rainer Kuhlen, Dirk Lewandowski, Wolfgang Semar und Christa Womser-Hacker. 7., völlig neu gefasste Ausg

Behnert, C.; Borst, T.: Neue Formen der Relevanz-Sortierung in bibliothekarischen Informationssystemen : das DFG-Projekt LibRank (2015) 0.02

0.01724993 = product of:
  0.10349958 = sum of:
    0.020941569 = weight(_text_:und in 5392) [ClassicSimilarity], result of:
      0.020941569 = score(doc=5392,freq=10.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.438048 = fieldWeight in 5392, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=5392)
    0.006110009 = weight(_text_:in in 5392) [ClassicSimilarity], result of:
      0.006110009 = score(doc=5392,freq=6.0), product of:
        0.029340398 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.021569785 = queryNorm
        0.2082456 = fieldWeight in 5392, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0625 = fieldNorm(doc=5392)
    0.05325276 = weight(_text_:einzelnen in 5392) [ClassicSimilarity], result of:
      0.05325276 = score(doc=5392,freq=2.0), product of:
        0.1139978 = queryWeight, product of:
          5.285069 = idf(docFreq=608, maxDocs=44218)
          0.021569785 = queryNorm
        0.4671385 = fieldWeight in 5392, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.285069 = idf(docFreq=608, maxDocs=44218)
          0.0625 = fieldNorm(doc=5392)
    0.020941569 = weight(_text_:und in 5392) [ClassicSimilarity], result of:
      0.020941569 = score(doc=5392,freq=10.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.438048 = fieldWeight in 5392, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=5392)
    0.002253667 = weight(_text_:s in 5392) [ClassicSimilarity], result of:
      0.002253667 = score(doc=5392,freq=2.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.09609913 = fieldWeight in 5392, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.0625 = fieldNorm(doc=5392)
  0.16666667 = coord(5/30)

Abstract: Das von der DFG geförderte Projekt LibRank erforscht neue Rankingverfahren für bibliothekarische Informationssysteme, die aufbauend auf Erkenntnissen aus dem Bereich Websuche qualitätsinduzierende Faktoren wie z. B. Aktualität, Popularität und Verfügbarkeit von einzelnen Medien berücksichtigen. Die konzipierten Verfahren werden im Kontext eines in den Wirtschaftswissenschaften häufig genutzten Rechercheportals (EconBiz) entwickelt und in einem Testsystem systematisch evaluiert. Es werden Rankingfaktoren, die für den Bibliotheksbereich von besonderem Interesse sind, vorgestellt und exemplarisch Probleme und Herausforderungen aufgezeigt.
Source: Bibliothek: Forschung und Praxis. 39(2015) H.3, S.384-393

Hüther, H.: Selix im DFG-Projekt Kascade (1998) 0.02

0.016393315 = product of:
  0.12294986 = sum of:
    0.011706693 = weight(_text_:und in 5151) [ClassicSimilarity], result of:
      0.011706693 = score(doc=5151,freq=2.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.24487628 = fieldWeight in 5151, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=5151)
    0.096719384 = weight(_text_:informationswissenschaft in 5151) [ClassicSimilarity], result of:
      0.096719384 = score(doc=5151,freq=8.0), product of:
        0.09716552 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.021569785 = queryNorm
        0.99540854 = fieldWeight in 5151, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.078125 = fieldNorm(doc=5151)
    0.011706693 = weight(_text_:und in 5151) [ClassicSimilarity], result of:
      0.011706693 = score(doc=5151,freq=2.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.24487628 = fieldWeight in 5151, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=5151)
    0.0028170836 = weight(_text_:s in 5151) [ClassicSimilarity], result of:
      0.0028170836 = score(doc=5151,freq=2.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.120123915 = fieldWeight in 5151, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.078125 = fieldNorm(doc=5151)
  0.13333334 = coord(4/30)

Pages: S.397-403
Series: Schriften zur Informationswissenschaft; Bd.34
Source: Knowledge Management und Kommunikationssysteme: Proceedings des 6. Internationalen Symposiums für Informationswissenschaft (ISI '98) Prag, 3.-7. November 1998 / Hochschulverband für Informationswissenschaft (HI) e.V. Konstanz ; Fachrichtung Informationswissenschaft der Universität des Saarlandes, Saarbrücken. Hrsg.: Harald H. Zimmermann u. Volker Schramm

Fuhr, N.: Modelle im Information Retrieval (2013) 0.01

0.014782972 = product of:
  0.08869783 = sum of:
    0.016555762 = weight(_text_:und in 724) [ClassicSimilarity], result of:
      0.016555762 = score(doc=724,freq=4.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.34630734 = fieldWeight in 724, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=724)
    0.048359692 = weight(_text_:informationswissenschaft in 724) [ClassicSimilarity], result of:
      0.048359692 = score(doc=724,freq=2.0), product of:
        0.09716552 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.021569785 = queryNorm
        0.49770427 = fieldWeight in 724, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.078125 = fieldNorm(doc=724)
    0.004409519 = weight(_text_:in in 724) [ClassicSimilarity], result of:
      0.004409519 = score(doc=724,freq=2.0), product of:
        0.029340398 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.021569785 = queryNorm
        0.15028831 = fieldWeight in 724, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.078125 = fieldNorm(doc=724)
    0.016555762 = weight(_text_:und in 724) [ClassicSimilarity], result of:
      0.016555762 = score(doc=724,freq=4.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.34630734 = fieldWeight in 724, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=724)
    0.0028170836 = weight(_text_:s in 724) [ClassicSimilarity], result of:
      0.0028170836 = score(doc=724,freq=2.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.120123915 = fieldWeight in 724, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.078125 = fieldNorm(doc=724)
  0.16666667 = coord(5/30)

Pages: S.322-335
Source: Grundlagen der praktischen Information und Dokumentation. Handbuch zur Einführung in die Informationswissenschaft und -praxis. 6., völlig neu gefaßte Ausgabe. Hrsg. von R. Kuhlen, W. Semar u. D. Strauch. Begründet von Klaus Laisiepen, Ernst Lutterbeck, Karl-Heinrich Meyer-Uhlenried

Mandl, T.: Tolerantes Information Retrieval : Neuronale Netze zur Erhöhung der Adaptivität und Flexibilität bei der Informationssuche (2001) 0.01
```
0.012670124 = product of:
  0.06335062 = sum of:
    0.014570824 = weight(_text_:buch in 5965) [ClassicSimilarity], result of:
      0.014570824 = score(doc=5965,freq=4.0), product of:
        0.10028592 = queryWeight, product of:
          4.64937 = idf(docFreq=1149, maxDocs=44218)
          0.021569785 = queryNorm
        0.14529282 = fieldWeight in 5965, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.64937 = idf(docFreq=1149, maxDocs=44218)
          0.015625 = fieldNorm(doc=5965)
    0.013851546 = weight(_text_:und in 5965) [ClassicSimilarity], result of:
      0.013851546 = score(doc=5965,freq=70.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.28974152 = fieldWeight in 5965, product of:
          8.3666 = tf(freq=70.0), with freq of:
            70.0 = termFreq=70.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.015625 = fieldNorm(doc=5965)
    0.016752291 = weight(_text_:informationswissenschaft in 5965) [ClassicSimilarity], result of:
      0.016752291 = score(doc=5965,freq=6.0), product of:
        0.09716552 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.021569785 = queryNorm
        0.17240983 = fieldWeight in 5965, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.015625 = fieldNorm(doc=5965)
    0.003527615 = weight(_text_:in in 5965) [ClassicSimilarity], result of:
      0.003527615 = score(doc=5965,freq=32.0), product of:
        0.029340398 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.021569785 = queryNorm
        0.120230645 = fieldWeight in 5965, product of:
          5.656854 = tf(freq=32.0), with freq of:
            32.0 = termFreq=32.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.015625 = fieldNorm(doc=5965)
    0.013851546 = weight(_text_:und in 5965) [ClassicSimilarity], result of:
      0.013851546 = score(doc=5965,freq=70.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.28974152 = fieldWeight in 5965, product of:
          8.3666 = tf(freq=70.0), with freq of:
            70.0 = termFreq=70.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.015625 = fieldNorm(doc=5965)
    7.9679163E-4 = weight(_text_:s in 5965) [ClassicSimilarity], result of:
      7.9679163E-4 = score(doc=5965,freq=4.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.033976175 = fieldWeight in 5965, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.015625 = fieldNorm(doc=5965)
  0.2 = coord(6/30)
```
Abstract

Ein wesentliches Bedürfnis im Rahmen der Mensch-Maschine-Interaktion ist die Suche nach Information. Um Information Retrieval (IR) Systeme kognitiv adäquat zu gestalten und sie an den Menschen anzupassen bieten sich Modelle des Soft Computing an. Ein umfassender state-of-the-art Bericht zu neuronalen Netzen im IR zeigt dass die meisten bestehenden Modelle das Potential neuronaler Netze nicht ausschöpfen. Das vorgestellte COSIMIR-Modell (Cognitive Similarity learning in Information Retrieval) basiert auf neuronalen Netzen und lernt, die Ähnlichkeit zwischen Anfrage und Dokument zu berechnen. Es trägt somit die kognitive Modellierung in den Kern eines IR Systems. Das Transformations-Netzwerk ist ein weiteres neuronales Netzwerk, das die Behandlung von Heterogenität anhand von Expertenurteilen lernt. Das COSIMIR-Modell und das Transformations-Netzwerk werden ausführlich diskutiert und anhand realer Datenmengen evaluiert

Content

Kapitel: 1 Einleitung - 2 Grundlagen des Information Retrieval - 3 Grundlagen neuronaler Netze - 4 Neuronale Netze im Information Retrieval - 5 Heterogenität und ihre Behandlung im Information Retrieval - 6 Das COSIMIR-Modell - 7 Experimente mit dem COSIMIR-Modell und dem Transformations-Netzwerk - 8 Fazit

Footnote

Rez. in: nfd - Information 54(2003) H.6, S.379-380 (U. Thiel): "Kannte G. Salton bei der Entwicklung des Vektorraummodells die kybernetisch orientierten Versuche mit assoziativen Speicherstrukturen? An diese und ähnliche Vermutungen, die ich vor einigen Jahren mit Reginald Ferber und anderen Kollegen diskutierte, erinnerte mich die Thematik des vorliegenden Buches. Immerhin lässt sich feststellen, dass die Vektorrepräsentation eine genial einfache Darstellung sowohl der im Information Retrieval (IR) als grundlegende Datenstruktur benutzten "inverted files" als auch der assoziativen Speichermatrizen darstellt, die sich im Laufe der Zeit Über Perzeptrons zu Neuronalen Netzen (NN) weiterentwickelten. Dieser formale Zusammenhang stimulierte in der Folge eine Reihe von Ansätzen, die Netzwerke im Retrieval zu verwenden, wobei sich, wie auch im vorliegenden Band, hybride Ansätze, die Methoden aus beiden Disziplinen kombinieren, als sehr geeignet erweisen. Aber der Reihe nach... Das Buch wurde vom Autor als Dissertation beim Fachbereich IV "Sprachen und Technik" der Universität Hildesheim eingereicht und resultiert aus einer Folge von Forschungsbeiträgen zu mehreren Projekten, an denen der Autor in der Zeit von 1995 bis 2000 an verschiedenen Standorten beteiligt war. Dies erklärt die ungewohnte Breite der Anwendungen, Szenarien und Domänen, in denen die Ergebnisse gewonnen wurden. So wird das in der Arbeit entwickelte COSIMIR Modell (COgnitive SIMilarity learning in Information Retrieval) nicht nur anhand der klassischen Cranfield-Kollektion evaluiert, sondern auch im WING-Projekt der Universität Regensburg im Faktenretrieval aus einer Werkstoffdatenbank eingesetzt. Weitere Versuche mit der als "Transformations-Netzwerk" bezeichneten Komponente, deren Aufgabe die Abbildung von Gewichtungsfunktionen zwischen zwei Termräumen ist, runden das Spektrum der Experimente ab. Aber nicht nur die vorgestellten Resultate sind vielfältig, auch der dem Leser angebotene "State-of-the-Art"-Überblick fasst in hoch informativer Breite Wesentliches aus den Gebieten IR und NN zusammen und beleuchtet die Schnittpunkte der beiden Bereiche. So werden neben den Grundlagen des Text- und Faktenretrieval die Ansätze zur Verbesserung der Adaptivität und zur Beherrschung von Heterogenität vorgestellt, während als Grundlagen Neuronaler Netze neben einer allgemeinen Einführung in die Grundbegriffe u.a. das Backpropagation-Modell, KohonenNetze und die Adaptive Resonance Theory (ART) geschildert werden. Einweiteres Kapitel stellt die bisherigen NN-orientierten Ansätze im IR vor und rundet den Abriss der relevanten Forschungslandschaft ab. Als Vorbereitung der Präsentation des COSIMIR-Modells schiebt der Autor an dieser Stelle ein diskursives Kapitel zum Thema Heterogenität im IR ein, wodurch die Ziele und Grundannahmen der Arbeit noch einmal reflektiert werden. Als Dimensionen der Heterogenität werden der Objekttyp, die Qualität der Objekte und ihrer Erschließung und die Mehrsprachigkeit genannt. Wenn auch diese Systematik im Wesentlichen die Akzente auf Probleme aus den hier tangierten Projekten legt, und weniger eine umfassende Aufbereitung z.B. der Literatur zum Problem der Relevanz anstrebt, ist sie dennoch hilfreich zum Verständnis der in den nachfolgenden Kapitel oft nur implizit angesprochenen Designentscheidungen bei der Konzeption der entwickelten Prototypen. Der Ansatz, Heterogenität durch Transformationen zu behandeln, wird im speziellen Kontext der NN konkretisiert, wobei andere Möglichkeiten, die z.B. Instrumente der Logik und Probabilistik einzusetzen, nur kurz diskutiert werden. Eine weitergehende Analyse hätte wohl auch den Rahmen der Arbeit zu weit gespannt,
da nun nach fast 200 Seiten der Hauptteil der Dissertation folgt - die Vorstellung und Bewertung des bereits erwähnten COSIMIR Modells. Das COSIMIR Modell "berechnet die Ähnlichkeit zwischen den zwei anliegenden Input-Vektoren" (P.194). Der Output des Netzwerks wird an einem einzigen Knoten abgegriffen, an dem sich ein sogenannten Relevanzwert einstellt, wenn die Berechnungen der Gewichtungen interner Knoten zum Abschluss kommen. Diese Gewichtungen hängen von den angelegten Inputvektoren, aus denen die Gewichte der ersten Knotenschicht ermittelt werden, und den im Netzwerk vorgegebenen Kantengewichten ab. Die Gewichtung von Kanten ist der Kernpunkt des neuronalen Ansatzes: In Analogie zum biologischen Urbild (Dendrit mit Synapsen) wächst das Gewicht der Kante mit jeder Aktivierung während einer Trainingsphase. Legt man in dieser Phase zwei Inputvektoren, z.B. Dokumentvektor und Ouery gleichzeitig mit dem Relevanzurteil als Wert des Outputknoten an, verteilen sich durch den BackpropagationProzess die Gewichte entlang der Pfade, die zwischen den beteiligten Knoten bestehen. Da alle Knoten miteinander verbunden sind, entstehen nach mehreren Trainingsbeispielen bereits deutlich unterschiedliche Kantengewichte, weil die aktiv beteiligten Kanten die Änderungen akkumulativ speichern. Eine Variation des Verfahrens benutzt das NN als "Transformationsnetzwerk", wobei die beiden Inputvektoren mit einer Dokumentrepräsentation und einem dazugehörigen Indexat (von einem Experten bereitgestellt) belegt werden. Neben der schon aufgezeigten Trainingsnotwendigkeit weisen die Neuronalen Netze eine weitere intrinsische Problematik auf: Je mehr äußere Knoten benötigt werden, desto mehr interne Kanten (und bei der Verwendung von Zwischenschichten auch Knoten) sind zu verwalten, deren Anzahl nicht linear wächst. Dieser algorithmische Befund setzt naiven Einsätzen der NN-Modelle in der Praxis schnell Grenzen, deshalb ist es umso verdienstvoller, dass der Autor einen innovativen Weg zur Lösung des Problems mit den Mitteln des IR vorschlagen kann. Er verwendet das Latent Semantic Indexing, welches Dokumentrepräsentationen aus einem hochdimensionalen Vektorraum in einen niederdimensionalen abbildet, um die Anzahl der Knoten deutlich zu reduzieren. Damit ist eine sehr schöne Synthese gelungen, welche die eingangs angedeuteten formalen Übereinstimmungen zwischen Vektorraummodellen im IR und den NN aufzeigt und ausnutzt.
Im abschließenden Kapitel des Buchs berichtet der Autor über eine Reihe von Experimenten, die im Kontext unterschiedlicher Anwendungen durchgeführt wurden. Die Evaluationen wurden sehr sorgfältig durchgeführt und werden kompetent kommentiert, so dass der Leser sich ein Bild von der Komplexität der Untersuchungen machen kann. Inhaltlich sind die Ergebnisse unterschiedlich, die Verwendung des NN-Ansatzes ist sehr abhängig von der Menge und Qualität des Trainingsmaterials (so sind die Ergebnisse auf der Cranfield-Kollektion wegen der geringen Anzahl von zur Verfügung stehenden Relevanzurteilen schlechter als die der traditionellen Verfahren). Das Experiment mit Werkstoffinformationen im Projekt WING ist eine eher traditionelle NN-Applikation: Aus Merkmalsvektoren soll auf die "Anwendungsähnlichkeit" von Werkstoffen geschlossen werden, was offenbar gut gelingt. Hier sind die konkurrierenden Verfahren aber weniger im IR zu vermuten, sondern eher im Gebiet des Data Mining. Die Versuche mit Textdaten sind Anregung, hier weitere, systematischere Untersuchungen vorzunehmen. So sollte z.B. nicht nur ein Vergleich mit klassischen One-shot IR-Verfahren durchgeführt werden, viel interessanter und aussagekräftiger ist die Gegenüberstellung von NN-Systemen und lernfähigen IR-Systemen, die z.B. über Relevance Feedback Wissen akkumulieren (vergleichbar den NN in der Trainingsphase). Am Ende könnte dann nicht nur ein einheitliches Modell stehen, sondern auch Erkenntnisse darüber, welches Lernverfahren wann vorzuziehen ist. Fazit: Das Buch ist ein hervorragendes Beispiel der "Schriften zur Informationswissenschaft", mit denen der HI (Hochschulverband für Informationswissenschaft) die Ergebnisse der informationswissenschaftlichen Forschung seit etlichen Jahren einem größerem Publikum vorstellt. Es bietet einen umfassenden Überblick zum dynamisch sich entwickelnden Gebiet der Neuronalen Netze im IR, die sich anschicken, ein "tolerantes Information Retrieval" zu ermöglichen."

Pages

IX, 283 S

Series

Schriften zur Informationswissenschaft; Bd.39

Pfeifer, U.; Pennekamp, S.: Incremental processing of vague queries in interactive retrieval systems (1997) 0.01

0.011119273 = product of:
  0.066715635 = sum of:
    0.009365354 = weight(_text_:und in 735) [ClassicSimilarity], result of:
      0.009365354 = score(doc=735,freq=2.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.19590102 = fieldWeight in 735, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=735)
    0.038687754 = weight(_text_:informationswissenschaft in 735) [ClassicSimilarity], result of:
      0.038687754 = score(doc=735,freq=2.0), product of:
        0.09716552 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.021569785 = queryNorm
        0.3981634 = fieldWeight in 735, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0625 = fieldNorm(doc=735)
    0.006110009 = weight(_text_:in in 735) [ClassicSimilarity], result of:
      0.006110009 = score(doc=735,freq=6.0), product of:
        0.029340398 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.021569785 = queryNorm
        0.2082456 = fieldWeight in 735, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0625 = fieldNorm(doc=735)
    0.009365354 = weight(_text_:und in 735) [ClassicSimilarity], result of:
      0.009365354 = score(doc=735,freq=2.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.19590102 = fieldWeight in 735, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=735)
    0.0031871665 = weight(_text_:s in 735) [ClassicSimilarity], result of:
      0.0031871665 = score(doc=735,freq=4.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.1359047 = fieldWeight in 735, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.0625 = fieldNorm(doc=735)
  0.16666667 = coord(5/30)

Abstract: The application of information retrieval techniques in interactive environments requires systems capable of effeciently processing vague queries. To reach reasonable response times, new data structures and algorithms have to be developed. In this paper we describe an approach taking advantage of the conditions of interactive usage and special access paths. To have a reference we investigate text queries and compared our algorithms to the well known 'Buckley/Lewit' algorithm. We achieved significant improvements for the response times
Pages: S.223-236
Series: Schriften zur Informationswissenschaft; Bd.30
Source: Hypertext - Information Retrieval - Multimedia '97: Theorien, Modelle und Implementierungen integrierter elektronischer Informationssysteme. Proceedings HIM '97. Hrsg.: N. Fuhr u.a

Tober, M.; Hennig, L.; Furch, D.: SEO Ranking-Faktoren und Rang-Korrelationen 2014 : Google Deutschland (2014) 0.01

0.010977678 = product of:
  0.06586607 = sum of:
    0.020941569 = weight(_text_:und in 1484) [ClassicSimilarity], result of:
      0.020941569 = score(doc=1484,freq=10.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.438048 = fieldWeight in 1484, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1484)
    0.010039635 = product of:
      0.030118903 = sum of:
        0.030118903 = weight(_text_:l in 1484) [ClassicSimilarity], result of:
          0.030118903 = score(doc=1484,freq=2.0), product of:
            0.0857324 = queryWeight, product of:
              3.9746525 = idf(docFreq=2257, maxDocs=44218)
              0.021569785 = queryNorm
            0.35131297 = fieldWeight in 1484, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.9746525 = idf(docFreq=2257, maxDocs=44218)
              0.0625 = fieldNorm(doc=1484)
      0.33333334 = coord(1/3)
    0.020941569 = weight(_text_:und in 1484) [ClassicSimilarity], result of:
      0.020941569 = score(doc=1484,freq=10.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.438048 = fieldWeight in 1484, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1484)
    0.002253667 = weight(_text_:s in 1484) [ClassicSimilarity], result of:
      0.002253667 = score(doc=1484,freq=2.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.09609913 = fieldWeight in 1484, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.0625 = fieldNorm(doc=1484)
    0.011689632 = product of:
      0.023379264 = sum of:
        0.023379264 = weight(_text_:22 in 1484) [ClassicSimilarity], result of:
          0.023379264 = score(doc=1484,freq=2.0), product of:
            0.07553371 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.021569785 = queryNorm
            0.30952093 = fieldWeight in 1484, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=1484)
      0.5 = coord(1/2)
  0.16666667 = coord(5/30)

Abstract: Dieses Whitepaper beschäftigt sich mit der Definition und Bewertung von Faktoren, die eine hohe Rangkorrelation-Koeffizienz mit organischen Suchergebnissen aufweisen und dient dem Zweck der tieferen Analyse von Suchmaschinen-Algorithmen. Die Datenerhebung samt Auswertung bezieht sich auf Ranking-Faktoren für Google-Deutschland im Jahr 2014. Zusätzlich wurden die Korrelationen und Faktoren unter anderem anhand von Durchschnitts- und Medianwerten sowie Entwicklungstendenzen zu den Vorjahren hinsichtlich ihrer Relevanz für vordere Suchergebnis-Positionen interpretiert.
Date: 13. 9.2014 14:45:22
Pages: 91 S

Reimer, U.: Empfehlungssysteme (2023) 0.01

0.010724679 = product of:
  0.06434807 = sum of:
    0.011589034 = weight(_text_:und in 519) [ClassicSimilarity], result of:
      0.011589034 = score(doc=519,freq=4.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.24241515 = fieldWeight in 519, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=519)
    0.033851784 = weight(_text_:informationswissenschaft in 519) [ClassicSimilarity], result of:
      0.033851784 = score(doc=519,freq=2.0), product of:
        0.09716552 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.021569785 = queryNorm
        0.348393 = fieldWeight in 519, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0546875 = fieldNorm(doc=519)
    0.0053462577 = weight(_text_:in in 519) [ClassicSimilarity], result of:
      0.0053462577 = score(doc=519,freq=6.0), product of:
        0.029340398 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.021569785 = queryNorm
        0.1822149 = fieldWeight in 519, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0546875 = fieldNorm(doc=519)
    0.011589034 = weight(_text_:und in 519) [ClassicSimilarity], result of:
      0.011589034 = score(doc=519,freq=4.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.24241515 = fieldWeight in 519, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=519)
    0.0019719584 = weight(_text_:s in 519) [ClassicSimilarity], result of:
      0.0019719584 = score(doc=519,freq=2.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.08408674 = fieldWeight in 519, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.0546875 = fieldNorm(doc=519)
  0.16666667 = coord(5/30)

Abstract: Mit der wachsenden Informationsflut steigen die Anforderungen an Informationssysteme, aus der Menge potenziell relevanter Information die in einem bestimmten Kontext relevanteste zu selektieren. Empfehlungssysteme spielen hier eine besondere Rolle, da sie personalisiert - d. h. kontextspezifisch und benutzerindividuell - relevante Information herausfiltern können. Definition: Ein Empfehlungssystem empfiehlt einem Benutzer bzw. einer Benutzerin in einem definierten Kontext aus einer gegebenen Menge von Empfehlungsobjekten eine Teilmenge als relevant. Empfehlungssysteme machen Benutzer auf Objekte aufmerksam, die sie möglicherweise nie gefunden hätten, weil sie nicht danach gesucht hätten oder sie in der schieren Menge an insgesamt relevanter Information untergegangen wären.
Pages: S.485-495
Source: Grundlagen der Informationswissenschaft. Hrsg.: Rainer Kuhlen, Dirk Lewandowski, Wolfgang Semar und Christa Womser-Hacker. 7., völlig neu gefasste Ausg

Elsweiler, D.; Kruschwitz, U.: Interaktives Information Retrieval (2023) 0.01

0.010453711 = product of:
  0.07840283 = sum of:
    0.018730707 = weight(_text_:und in 797) [ClassicSimilarity], result of:
      0.018730707 = score(doc=797,freq=8.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.39180204 = fieldWeight in 797, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=797)
    0.038687754 = weight(_text_:informationswissenschaft in 797) [ClassicSimilarity], result of:
      0.038687754 = score(doc=797,freq=2.0), product of:
        0.09716552 = queryWeight, product of:
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.021569785 = queryNorm
        0.3981634 = fieldWeight in 797, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.504705 = idf(docFreq=1328, maxDocs=44218)
          0.0625 = fieldNorm(doc=797)
    0.018730707 = weight(_text_:und in 797) [ClassicSimilarity], result of:
      0.018730707 = score(doc=797,freq=8.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.39180204 = fieldWeight in 797, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=797)
    0.002253667 = weight(_text_:s in 797) [ClassicSimilarity], result of:
      0.002253667 = score(doc=797,freq=2.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.09609913 = fieldWeight in 797, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.0625 = fieldNorm(doc=797)
  0.13333334 = coord(4/30)

Abstract: Interaktives Information Retrieval (IIR) zielt darauf ab, die komplexen Interaktionen zwischen Nutzer*innen und Systemen im IR zu verstehen. Es gibt umfangreiche Literatur zu Themen wie der formalen Modellierung des Suchverhaltens, der Simulation der Interaktion, den interaktiven Funktionen zur Unterstützung des Suchprozesses und der Evaluierung interaktiver Suchsysteme. Dabei ist die interaktive Unterstützung nicht allein auf die Suche beschränkt, sondern hat ebenso die Hilfe bei Navigation und Exploration zum Ziel.
Pages: S.403-412
Source: Grundlagen der Informationswissenschaft. Hrsg.: Rainer Kuhlen, Dirk Lewandowski, Wolfgang Semar und Christa Womser-Hacker. 7., völlig neu gefasste Ausg

Weller, K.; Stock, W.G.: Transitive meronymy : automatic concept-based query expansion using weighted transitive part-whole relations (2008) 0.01

0.00956616 = product of:
  0.07174619 = sum of:
    0.011589034 = weight(_text_:und in 1835) [ClassicSimilarity], result of:
      0.011589034 = score(doc=1835,freq=4.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.24241515 = fieldWeight in 1835, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=1835)
    0.046596166 = weight(_text_:einzelnen in 1835) [ClassicSimilarity], result of:
      0.046596166 = score(doc=1835,freq=2.0), product of:
        0.1139978 = queryWeight, product of:
          5.285069 = idf(docFreq=608, maxDocs=44218)
          0.021569785 = queryNorm
        0.40874618 = fieldWeight in 1835, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.285069 = idf(docFreq=608, maxDocs=44218)
          0.0546875 = fieldNorm(doc=1835)
    0.011589034 = weight(_text_:und in 1835) [ClassicSimilarity], result of:
      0.011589034 = score(doc=1835,freq=4.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.24241515 = fieldWeight in 1835, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=1835)
    0.0019719584 = weight(_text_:s in 1835) [ClassicSimilarity], result of:
      0.0019719584 = score(doc=1835,freq=2.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.08408674 = fieldWeight in 1835, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.0546875 = fieldNorm(doc=1835)
  0.13333334 = coord(4/30)

Abstract: Transitive Meronymie. Automatische begriffsbasierte Suchanfrageerweiterung unter Nutzung gewichteter transitiver Teil-Ganzes-Relationen. Unsere theoretisch orientierte Arbeit isoliert transitive Teil-Ganzes-Beziehungen. Wir diskutieren den Einsatz der Meronymie bei der automatischen begriffsbasierten Suchanfrageerweiterung im Information Retrieval. Aus praktischen Gründen schlagen wir vor, die Bestandsrelationen zu spezifizieren und die einzelnen Arten mit unterschiedlichen Gewichtungswerten zu versehen, die im Retrieval genutzt werden. Für das Design von Wissensordnungen ist bedeutsam, dass innerhalb der Begriffsleiter einer Abstraktionsrelation ein Begriff alle seine Teile (sowie alle transitiven Teile der Teile) an seine Unterbegriffe vererbt.
Source: Information - Wissenschaft und Praxis. 59(2008) H.3, S.165-170

Kanaeva, Z.: Ranking: Google und CiteSeer (2005) 0.01

0.007655645 = product of:
  0.04593387 = sum of:
    0.01419361 = weight(_text_:und in 3276) [ClassicSimilarity], result of:
      0.01419361 = score(doc=3276,freq=6.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.2968967 = fieldWeight in 3276, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3276)
    0.0053462577 = weight(_text_:in in 3276) [ClassicSimilarity], result of:
      0.0053462577 = score(doc=3276,freq=6.0), product of:
        0.029340398 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.021569785 = queryNorm
        0.1822149 = fieldWeight in 3276, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3276)
    0.01419361 = weight(_text_:und in 3276) [ClassicSimilarity], result of:
      0.01419361 = score(doc=3276,freq=6.0), product of:
        0.04780656 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021569785 = queryNorm
        0.2968967 = fieldWeight in 3276, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3276)
    0.0019719584 = weight(_text_:s in 3276) [ClassicSimilarity], result of:
      0.0019719584 = score(doc=3276,freq=2.0), product of:
        0.023451481 = queryWeight, product of:
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.021569785 = queryNorm
        0.08408674 = fieldWeight in 3276, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.0872376 = idf(docFreq=40523, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3276)
    0.010228428 = product of:
      0.020456856 = sum of:
        0.020456856 = weight(_text_:22 in 3276) [ClassicSimilarity], result of:
          0.020456856 = score(doc=3276,freq=2.0), product of:
            0.07553371 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.021569785 = queryNorm
            0.2708308 = fieldWeight in 3276, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3276)
      0.5 = coord(1/2)
  0.16666667 = coord(5/30)

Abstract: Im Rahmen des klassischen Information Retrieval wurden verschiedene Verfahren für das Ranking sowie die Suche in einer homogenen strukturlosen Dokumentenmenge entwickelt. Die Erfolge der Suchmaschine Google haben gezeigt dass die Suche in einer zwar inhomogenen aber zusammenhängenden Dokumentenmenge wie dem Internet unter Berücksichtigung der Dokumentenverbindungen (Links) sehr effektiv sein kann. Unter den von der Suchmaschine Google realisierten Konzepten ist ein Verfahren zum Ranking von Suchergebnissen (PageRank), das in diesem Artikel kurz erklärt wird. Darüber hinaus wird auf die Konzepte eines Systems namens CiteSeer eingegangen, welches automatisch bibliographische Angaben indexiert (engl. Autonomous Citation Indexing, ACI). Letzteres erzeugt aus einer Menge von nicht vernetzten wissenschaftlichen Dokumenten eine zusammenhängende Dokumentenmenge und ermöglicht den Einsatz von Banking-Verfahren, die auf den von Google genutzten Verfahren basieren.
Date: 20. 3.2005 16:23:22
Source: Information - Wissenschaft und Praxis. 56(2005) H.2, S.87-92

Search (369 results, page 1 of 19)

Authors

Years

Languages

Types

Themes

Subjects

Classifications