Search (157 results, page 1 of 8)

Effektive Information Retrieval Verfahren in Theorie und Praxis : ausgewählte und erweiterte Beiträge des Vierten Hildesheimer Evaluierungs- und Retrievalworkshop (HIER 2005), Hildesheim, 20.7.2005 (2006) 0.06
```
0.063516386 = product of:
  0.12703277 = sum of:
    0.021300415 = weight(_text_:grenzen in 5973) [ClassicSimilarity], result of:
      0.021300415 = score(doc=5973,freq=2.0), product of:
        0.1658893 = queryWeight, product of:
          5.8107834 = idf(docFreq=359, maxDocs=44218)
          0.028548526 = queryNorm
        0.12840138 = fieldWeight in 5973, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.8107834 = idf(docFreq=359, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    0.022257652 = weight(_text_:der in 5973) [ClassicSimilarity], result of:
      0.022257652 = score(doc=5973,freq=100.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34902605 = fieldWeight in 5973, product of:
          10.0 = tf(freq=100.0), with freq of:
            100.0 = termFreq=100.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    0.014056362 = weight(_text_:wissenschaft in 5973) [ClassicSimilarity], result of:
      0.014056362 = score(doc=5973,freq=4.0), product of:
        0.11331915 = queryWeight, product of:
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.028548526 = queryNorm
        0.12404225 = fieldWeight in 5973, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    0.021300415 = weight(_text_:grenzen in 5973) [ClassicSimilarity], result of:
      0.021300415 = score(doc=5973,freq=2.0), product of:
        0.1658893 = queryWeight, product of:
          5.8107834 = idf(docFreq=359, maxDocs=44218)
          0.028548526 = queryNorm
        0.12840138 = fieldWeight in 5973, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.8107834 = idf(docFreq=359, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    0.022257652 = weight(_text_:der in 5973) [ClassicSimilarity], result of:
      0.022257652 = score(doc=5973,freq=100.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34902605 = fieldWeight in 5973, product of:
          10.0 = tf(freq=100.0), with freq of:
            100.0 = termFreq=100.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    0.025860276 = weight(_text_:forschung in 5973) [ClassicSimilarity], result of:
      0.025860276 = score(doc=5973,freq=6.0), product of:
        0.13888668 = queryWeight, product of:
          4.8649335 = idf(docFreq=926, maxDocs=44218)
          0.028548526 = queryNorm
        0.18619695 = fieldWeight in 5973, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          4.8649335 = idf(docFreq=926, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
  0.5 = coord(6/12)
```
Abstract

Information Retrieval hat sich zu einer Schlüsseltechnologie in der Wissensgesellschaft entwickelt. Die Anzahl der täglichen Anfragen an Internet-Suchmaschinen bildet nur einen Indikator für die große Bedeutung dieses Themas. Der Sammelbandband informiert über Themen wie Information Retrieval-Grundlagen, Retrieval Systeme, Digitale Bibliotheken, Evaluierung und Multilinguale Systeme, beschreibt Anwendungsszenarien und setzt sich mit neuen Herausforderungen an das Information Retrieval auseinander. Die Beiträge behandeln aktuelle Themen und neue Herausforderungen an das Information Retrieval. Die intensive Beteiligung der Informationswissenschaft der Universität Hildesheim am Cross Language Evaluation Forum (CLEF), einer europäischen Evaluierungsinitiative zur Erforschung mehrsprachiger Retrieval Systeme, berührt mehrere der Beiträge. Ebenso spielen Anwendungsszenarien und die Auseinandersetzung mit aktuellen und praktischen Fragestellungen eine große Rolle.

Content

Inhalt: Jan-Hendrik Scheufen: RECOIN: Modell offener Schnittstellen für Information-Retrieval-Systeme und -Komponenten Markus Nick, Klaus-Dieter Althoff: Designing Maintainable Experience-based Information Systems Gesine Quint, Steffen Weichert: Die benutzerzentrierte Entwicklung des Produkt- Retrieval-Systems EIKON der Blaupunkt GmbH Claus-Peter Klas, Sascha Kriewel, André Schaefer, Gudrun Fischer: Das DAFFODIL System - Strategische Literaturrecherche in Digitalen Bibliotheken Matthias Meiert: Entwicklung eines Modells zur Integration digitaler Dokumente in die Universitätsbibliothek Hildesheim Daniel Harbig, René Schneider: Ontology Learning im Rahmen von MyShelf Michael Kluck, Marco Winter: Topic-Entwicklung und Relevanzbewertung bei GIRT: ein Werkstattbericht Thomas Mandl: Neue Entwicklungen bei den Evaluierungsinitiativen im Information Retrieval Joachim Pfister: Clustering von Patent-Dokumenten am Beispiel der Datenbanken des Fachinformationszentrums Karlsruhe Ralph Kölle, Glenn Langemeier, Wolfgang Semar: Programmieren lernen in kollaborativen Lernumgebungen Olga Tartakovski, Margaryta Shramko: Implementierung eines Werkzeugs zur Sprachidentifikation in mono- und multilingualen Texten Nina Kummer: Indexierungstechniken für das japanische Retrieval Suriya Na Nhongkai, Hans-Joachim Bentz: Bilinguale Suche mittels Konzeptnetzen Robert Strötgen, Thomas Mandl, René Schneider: Entwicklung und Evaluierung eines Question Answering Systems im Rahmen des Cross Language Evaluation Forum (CLEF) Niels Jensen: Evaluierung von mehrsprachigem Web-Retrieval: Experimente mit dem EuroGOV-Korpus im Rahmen des Cross Language Evaluation Forum (CLEF)

Footnote

Rez. in: Information - Wissenschaft und Praxis 57(2006) H.5, S.290-291 (C. Schindler): "Weniger als ein Jahr nach dem "Vierten Hildesheimer Evaluierungs- und Retrievalworkshop" (HIER 2005) im Juli 2005 ist der dazugehörige Tagungsband erschienen. Eingeladen hatte die Hildesheimer Informationswissenschaft um ihre Forschungsergebnisse und die einiger externer Experten zum Thema Information Retrieval einem Fachpublikum zu präsentieren und zur Diskussion zu stellen. Unter dem Titel "Effektive Information Retrieval Verfahren in Theorie und Praxis" sind nahezu sämtliche Beiträge des Workshops in dem nun erschienenen, 15 Beiträge umfassenden Band gesammelt. Mit dem Schwerpunkt Information Retrieval (IR) wird ein Teilgebiet der Informationswissenschaft vorgestellt, das schon immer im Zentrum informationswissenschaftlicher Forschung steht. Ob durch den Leistungsanstieg von Prozessoren und Speichermedien, durch die Verbreitung des Internet über nationale Grenzen hinweg oder durch den stetigen Anstieg der Wissensproduktion, festzuhalten ist, dass in einer zunehmend wechselseitig vernetzten Welt die Orientierung und das Auffinden von Dokumenten in großen Wissensbeständen zu einer zentralen Herausforderung geworden sind. Aktuelle Verfahrensweisen zu diesem Thema, dem Information Retrieval, präsentiert der neue Band anhand von praxisbezogenen Projekten und theoretischen Diskussionen. Das Kernthema Information Retrieval wird in dem Sammelband in die Bereiche Retrieval-Systeme, Digitale Bibliothek, Evaluierung und Multilinguale Systeme untergliedert. Die Artikel der einzelnen Sektionen sind insgesamt recht heterogen und bieten daher keine Überschneidungen inhaltlicher Art. Jedoch ist eine vollkommene thematische Abdeckung der unterschiedlichen Bereiche ebenfalls nicht gegeben, was bei der Präsentation von Forschungsergebnissen eines Institutes und seiner Kooperationspartner auch nur bedingt erwartet werden kann. So lässt sich sowohl in der Gliederung als auch in den einzelnen Beiträgen eine thematische Verdichtung erkennen, die das spezielle Profil und die Besonderheit der Hildesheimer Informationswissenschaft im Feld des Information Retrieval wiedergibt. Teil davon ist die mehrsprachige und interdisziplinäre Ausrichtung, die die Schnittstellen zwischen Informationswissenschaft, Sprachwissenschaft und Informatik in ihrer praxisbezogenen und internationalen Forschung fokussiert.
Im ersten Kapitel "Retrieval-Systeme" werden verschiedene Information RetrievalSysteme präsentiert und Verfahren zu deren Gestaltung diskutiert. Jan-Hendrik Scheufen stellt das Meta-Framework RECOIN zur Information Retrieval Forschung vor, das sich durch eine flexible Handhabung unterschiedlichster Applikationen auszeichnet und dadurch eine zentrierte Protokollierung und Steuerung von Retrieval-Prozessen ermöglicht. Dieses Konzept eines offenen, komponentenbasierten Systems wurde in Form eines Plug-Ins für die javabasierte Open-Source-Plattform Eclipse realisiert. Markus Nick und Klaus-Dieter Althoff erläutern in ihrem Beitrag, der übrigens der einzige englischsprachige Text im Buch ist, das Verfahren DILLEBIS zur Erhaltung und Pflege (Maintenance) von erfahrungsbasierten Informationssystemen. Sie bezeichnen dieses Verfahren als Maintainable Experience-based Information System und plädieren für eine Ausrichtung von erfahrungsbasierten Systemen entsprechend diesem Modell. Gesine Quint und Steffen Weichert stellen dagegen in ihrem Beitrag die benutzerzentrierte Entwicklung des Produkt-Retrieval-Systems EIKON vor, das in Kooperation mit der Blaupunkt GmbH realisiert wurde. In einem iterativen Designzyklus erfolgte die Gestaltung von gruppenspezifischen Interaktionsmöglichkeiten für ein Car-Multimedia-Zubehör-System. Im zweiten Kapitel setzen sich mehrere Autoren dezidierter mit dem Anwendungsgebiet "Digitale Bibliothek" auseinander. Claus-Peter Klas, Sascha Kriewel, Andre Schaefer und Gudrun Fischer von der Universität Duisburg-Essen stellen das System DAFFODIL vor, das durch eine Vielzahl an Werkzeugen zur strategischen Unterstützung bei Literaturrecherchen in digitalen Bibliotheken dient. Zusätzlich ermöglicht die Protokollierung sämtlicher Ereignisse den Einsatz des Systems als Evaluationsplattform. Der Aufsatz von Matthias Meiert erläutert die Implementierung von elektronischen Publikationsprozessen an Hochschulen am Beispiel von Abschlussarbeiten des Studienganges Internationales Informationsmanagement der Universität Hildesheim. Neben Rahmenbedingungen werden sowohl der Ist-Zustand als auch der Soll-Zustand des wissenschaftlichen elektronischen Publizierens in Form von gruppenspezifischen Empfehlungen dargestellt. Daniel Harbig und Rene Schneider beschreiben in ihrem Aufsatz zwei Verfahrensweisen zum maschinellen Erlernen von Ontologien, angewandt am virtuellen Bibliotheksregal MyShelf. Nach der Evaluation dieser beiden Ansätze plädieren die Autoren für ein semi-automatisiertes Verfahren zur Erstellung von Ontologien.
"Evaluierung", das Thema des dritten Kapitels, ist in seiner Breite nicht auf das Information Retrieval beschränkt sondern beinhaltet ebenso einzelne Aspekte der Bereiche Mensch-Maschine-Interaktion sowie des E-Learning. Michael Muck und Marco Winter von der Stiftung Wissenschaft und Politik sowie dem Informationszentrum Sozialwissenschaften thematisieren in ihrem Beitrag den Einfluss der Fragestellung (Topic) auf die Bewertung von Relevanz und zeigen Verfahrensweisen für die Topic-Erstellung auf, die beim Cross Language Evaluation Forum (CLEF) Anwendung finden. Im darauf folgenden Aufsatz stellt Thomas Mandl verschiedene Evaluierungsinitiativen im Information Retrieval und aktuelle Entwicklungen dar. Joachim Pfister erläutert in seinem Beitrag das automatisierte Gruppieren, das sogenannte Clustering, von Patent-Dokumenten in den Datenbanken des Fachinformationszentrums Karlsruhe und evaluiert unterschiedliche Clusterverfahren auf Basis von Nutzerbewertungen. Ralph Kölle, Glenn Langemeier und Wolfgang Semar widmen sich dem kollaborativen Lernen unter den speziellen Bedingungen des Programmierens. Dabei werden das System VitaminL zur synchronen Bearbeitung von Programmieraufgaben und das Kennzahlensystem K-3 für die Bewertung kollaborativer Zusammenarbeit in einer Lehrveranstaltung angewendet. Der aktuelle Forschungsschwerpunkt der Hildesheimer Informationswissenschaft zeichnet sich im vierten Kapitel unter dem Thema "Multilinguale Systeme" ab. Hier finden sich die meisten Beiträge des Tagungsbandes wieder. Olga Tartakovski und Margaryta Shramko beschreiben und prüfen das System Langldent, das die Sprache von mono- und multilingualen Texten identifiziert. Die Eigenheiten der japanischen Schriftzeichen stellt Nina Kummer dar und vergleicht experimentell die unterschiedlichen Techniken der Indexierung. Suriya Na Nhongkai und Hans-Joachim Bentz präsentieren und prüfen eine bilinguale Suche auf Basis von Konzeptnetzen, wobei die Konzeptstruktur das verbindende Elemente der beiden Textsammlungen darstellt. Das Entwickeln und Evaluieren eines mehrsprachigen Question-Answering-Systems im Rahmen des Cross Language Evaluation Forum (CLEF), das die alltagssprachliche Formulierung von konkreten Fragestellungen ermöglicht, wird im Beitrag von Robert Strötgen, Thomas Mandl und Rene Schneider thematisiert. Den Schluss bildet der Aufsatz von Niels Jensen, der ein mehrsprachiges Web-Retrieval-System ebenfalls im Zusammenhang mit dem CLEF anhand des multilingualen EuroGOVKorpus evaluiert.
Abschließend lässt sich sagen, dass der Tagungsband einen gelungenen Überblick über die Information Retrieval Projekte der Hildesheimer Informationswissenschaft und ihrer Kooperationspartner gibt. Die einzelnen Beiträge sind sehr anregend und auf einem hohen Niveau angesiedelt. Ein kleines Hindernis für den Leser stellt die inhaltliche und strukturelle Orientierung innerhalb des Bandes dar. Der Bezug der einzelnen Artikel zum Thema des Kapitels wird zwar im Vorwort kurz erläutert. Erschwert wird die Orientierung im Buch jedoch durch fehlende Kapitelüberschriften am Anfang der einzelnen Sektionen. Außerdem ist zu erwähnen, dass einer der Artikel einen anderen Titel als im Inhaltsverzeichnis angekündigt trägt. Sieht der Leser von diesen formalen Mängeln ab, wird er reichlich mit praxisbezogenen und theoretisch fundierten Projektdarstellungen und Forschungsergebnissen belohnt. Dies insbesondere, da nicht nur aktuelle Themen der Informationswissenschaft aufgegriffen, sondern ebenso weiterentwickelt und durch die speziellen interdisziplinären und internationalen Bedingungen in Hildesheim geformt werden. Dabei zeigt sich anhand der verschiedenen Projekte, wie gut die Hildesheimer Informationswissenschaft in die Community überregionaler Informationseinrichtungen und anderer deutscher informationswissenschaftlicher Forschungsgruppen eingebunden ist. Damit hat der Workshop bei einer weiteren Öffnung der Expertengruppe das Potential zu einer eigenständigen Institution im Bereich des Information Retrieval zu werden. In diesem Sinne lässt sich auf weitere fruchtbare Workshops und deren Veröffentlichungen hoffen. Ein nächster Workshop der Universität Hildesheim zum Thema Information Retrieval, organisiert mit der Fachgruppe Information Retrieval der Gesellschaft für Informatik, kündigt sich bereits für den 9. bis 13- Oktober 2006 an."

Mandl, T.: Evaluierung im Information Retrieval : die Hildesheimer Antwort auf aktuelle Herausforderungen der globalisierten Informationsgesellschaft (2010) 0.06

0.055944204 = product of:
  0.16783261 = sum of:
    0.021807957 = weight(_text_:der in 4011) [ClassicSimilarity], result of:
      0.021807957 = score(doc=4011,freq=6.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34197432 = fieldWeight in 4011, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=4011)
    0.039757397 = weight(_text_:wissenschaft in 4011) [ClassicSimilarity], result of:
      0.039757397 = score(doc=4011,freq=2.0), product of:
        0.11331915 = queryWeight, product of:
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.028548526 = queryNorm
        0.35084447 = fieldWeight in 4011, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.0625 = fieldNorm(doc=4011)
    0.021807957 = weight(_text_:der in 4011) [ClassicSimilarity], result of:
      0.021807957 = score(doc=4011,freq=6.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34197432 = fieldWeight in 4011, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=4011)
    0.084459305 = weight(_text_:forschung in 4011) [ClassicSimilarity], result of:
      0.084459305 = score(doc=4011,freq=4.0), product of:
        0.13888668 = queryWeight, product of:
          4.8649335 = idf(docFreq=926, maxDocs=44218)
          0.028548526 = queryNorm
        0.6081167 = fieldWeight in 4011, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.8649335 = idf(docFreq=926, maxDocs=44218)
          0.0625 = fieldNorm(doc=4011)
  0.33333334 = coord(4/12)

Abstract: Die Forschung zur Evaluierung von Information Retrieval Systemen hat in den letzten Jahren neue Richtungen eingeschlagen und interessante Ergebnisse erzielt. Während früher primär die Überlegenheit einzelner Verfahren in heterogenen Anwendungsszenarien im Fokus stand, gerät zunehmend die Validität der Evaluierungsmethodik ins Zentrum der Aufmerksamkeit. Dieser Artikel fasst die aktuelle Forschung zu innovativen Evaluierungsmaßen und zur Zuverlässigkeit des so genannten Cranfield-Paradigmas zusammen.
Source: Information - Wissenschaft und Praxis. 61(2010) H.6/7, S.341-348

Wartena, C.; Golub, K.: Evaluierung von Verschlagwortung im Kontext des Information Retrievals (2021) 0.05

0.051239233 = product of:
  0.1537177 = sum of:
    0.05325104 = weight(_text_:grenzen in 376) [ClassicSimilarity], result of:
      0.05325104 = score(doc=376,freq=2.0), product of:
        0.1658893 = queryWeight, product of:
          5.8107834 = idf(docFreq=359, maxDocs=44218)
          0.028548526 = queryNorm
        0.32100347 = fieldWeight in 376, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.8107834 = idf(docFreq=359, maxDocs=44218)
          0.0390625 = fieldNorm(doc=376)
    0.023607805 = weight(_text_:der in 376) [ClassicSimilarity], result of:
      0.023607805 = score(doc=376,freq=18.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.37019804 = fieldWeight in 376, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=376)
    0.05325104 = weight(_text_:grenzen in 376) [ClassicSimilarity], result of:
      0.05325104 = score(doc=376,freq=2.0), product of:
        0.1658893 = queryWeight, product of:
          5.8107834 = idf(docFreq=359, maxDocs=44218)
          0.028548526 = queryNorm
        0.32100347 = fieldWeight in 376, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.8107834 = idf(docFreq=359, maxDocs=44218)
          0.0390625 = fieldNorm(doc=376)
    0.023607805 = weight(_text_:der in 376) [ClassicSimilarity], result of:
      0.023607805 = score(doc=376,freq=18.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.37019804 = fieldWeight in 376, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=376)
  0.33333334 = coord(4/12)

Abstract: Dieser Beitrag möchte einen Überblick über die in der Literatur diskutierten Möglichkeiten, Herausforderungen und Grenzen geben, Retrieval als eine extrinsische Evaluierungsmethode für die Ergebnisse verbaler Sacherschließung zu nutzen. Die inhaltliche Erschließung im Allgemeinen und die Verschlagwortung im Besonderen können intrinsisch oder extrinsisch evaluiert werden. Die intrinsische Evaluierung bezieht sich auf Eigenschaften der Erschließung, von denen vermutet wird, dass sie geeignete Indikatoren für die Qualität der Erschließung sind, wie formale Einheitlichkeit (im Hinblick auf die Anzahl zugewiesener Deskriptoren pro Dokument, auf die Granularität usw.), Konsistenz oder Übereinstimmung der Ergebnisse verschiedener Erschließer:innen. Bei einer extrinsischen Evaluierung geht es darum, die Qualität der gewählten Deskriptoren daran zu messen, wie gut sie sich tatsächlich bei der Suche bewähren. Obwohl die extrinsische Evaluierung direktere Auskunft darüber gibt, ob die Erschließung ihren Zweck erfüllt, und daher den Vorzug verdienen sollte, ist sie kompliziert und oft problematisch. In einem Retrievalsystem greifen verschiedene Algorithmen und Datenquellen in vielschichtiger Weise ineinander und interagieren bei der Evaluierung darüber hinaus noch mit Nutzer:innen und Rechercheaufgaben. Die Evaluierung einer Komponente im System kann nicht einfach dadurch vorgenommen werden, dass man sie austauscht und mit einer anderen Komponente vergleicht, da die gleiche Ressource oder der gleiche Algorithmus sich in unterschiedlichen Umgebungen unterschiedlich verhalten kann. Wir werden relevante Evaluierungsansätze vorstellen und diskutieren, und zum Abschluss einige Empfehlungen für die Evaluierung von Verschlagwortung im Kontext von Retrieval geben.
Source: Qualität in der Inhaltserschließung. Hrsg.: M. Franke-Maier, u.a

Biebricher, P.; Fuhr, N.; Niewelt, B.: ¬Der AIR-Retrievaltest (1986) 0.03

0.029791873 = product of:
  0.11916749 = sum of:
    0.022257652 = weight(_text_:der in 4040) [ClassicSimilarity], result of:
      0.022257652 = score(doc=4040,freq=4.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34902605 = fieldWeight in 4040, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.078125 = fieldNorm(doc=4040)
    0.022257652 = weight(_text_:der in 4040) [ClassicSimilarity], result of:
      0.022257652 = score(doc=4040,freq=4.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34902605 = fieldWeight in 4040, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.078125 = fieldNorm(doc=4040)
    0.07465219 = weight(_text_:forschung in 4040) [ClassicSimilarity], result of:
      0.07465219 = score(doc=4040,freq=2.0), product of:
        0.13888668 = queryWeight, product of:
          4.8649335 = idf(docFreq=926, maxDocs=44218)
          0.028548526 = queryNorm
        0.5375043 = fieldWeight in 4040, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.8649335 = idf(docFreq=926, maxDocs=44218)
          0.078125 = fieldNorm(doc=4040)
  0.25 = coord(3/12)

Abstract: Der Beitrag enthält eine Darstellung zur Durchführung und zu den Ergebnissen des Retrievaltests zum AIR/PHYS-Projekt. Er zählt mit seinen 309 Fragen und 15.000 Dokumenten zu den größten Retrievaltests, die bisher zur Evaluierung automatisierter Indexierungs- oder Retrievalverfahren vorgenommen wurden.
Source: Automatische Indexierung zwischen Forschung und Anwendung, Hrsg.: G. Lustig

Reichert, S.; Mayr, P.: Untersuchung von Relevanzeigenschaften in einem kontrollierten Eyetracking-Experiment (2012) 0.03

0.026907077 = product of:
  0.08072123 = sum of:
    0.023130832 = weight(_text_:der in 328) [ClassicSimilarity], result of:
      0.023130832 = score(doc=328,freq=12.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.36271852 = fieldWeight in 328, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=328)
    0.029818047 = weight(_text_:wissenschaft in 328) [ClassicSimilarity], result of:
      0.029818047 = score(doc=328,freq=2.0), product of:
        0.11331915 = queryWeight, product of:
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.028548526 = queryNorm
        0.26313335 = fieldWeight in 328, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.046875 = fieldNorm(doc=328)
    0.023130832 = weight(_text_:der in 328) [ClassicSimilarity], result of:
      0.023130832 = score(doc=328,freq=12.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.36271852 = fieldWeight in 328, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=328)
    0.004641517 = product of:
      0.023207584 = sum of:
        0.023207584 = weight(_text_:22 in 328) [ClassicSimilarity], result of:
          0.023207584 = score(doc=328,freq=2.0), product of:
            0.09997207 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.028548526 = queryNorm
            0.23214069 = fieldWeight in 328, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=328)
      0.2 = coord(1/5)
  0.33333334 = coord(4/12)

Abstract: In diesem Artikel wird ein Eyetracking-Experiment beschrieben, bei dem untersucht wurde, wann und auf Basis welcher Informationen Relevanzentscheidungen bei der themenbezogenen Dokumentenbewertung fallen und welche Faktoren auf die Relevanzentscheidung einwirken. Nach einer kurzen Einführung werden relevante Studien aufgeführt, in denen Eyetracking als Untersuchungsmethode für Interaktionsverhalten mit Ergebnislisten (Information Seeking Behavior) verwendet wurde. Nutzerverhalten wird hierbei vor allem durch unterschiedliche Aufgaben-Typen, dargestellte Informationen und durch das Ranking eines Ergebnisses beeinflusst. Durch EyetrackingUntersuchungen lassen sich Nutzer außerdem in verschiedene Klassen von Bewertungs- und Lesetypen einordnen. Diese Informationen können als implizites Feedback genutzt werden, um so die Suche zu personalisieren und um die Relevanz von Suchergebnissen ohne aktives Zutun des Users zu erhöhen. In einem explorativen Eyetracking-Experiment mit 12 Studenten der Hochschule Darmstadt werden anhand der Länge der Gesamtbewertung, Anzahl der Fixationen, Anzahl der besuchten Metadatenelemente und Länge des Scanpfades zwei typische Bewertungstypen identifiziert. Das Metadatenfeld Abstract wird im Experiment zuverlässig als wichtigste Dokumenteigenschaft für die Zuordnung von Relevanz ermittelt.
Date: 22. 7.2012 19:25:54
Source: Information - Wissenschaft und Praxis. 63(2012) H.3, S.145-156

Mandl, T.: Neue Entwicklungen bei den Evaluierungsinitiativen im Information Retrieval (2006) 0.03

0.025834415 = product of:
  0.10333766 = sum of:
    0.021807957 = weight(_text_:der in 5975) [ClassicSimilarity], result of:
      0.021807957 = score(doc=5975,freq=6.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34197432 = fieldWeight in 5975, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=5975)
    0.021807957 = weight(_text_:der in 5975) [ClassicSimilarity], result of:
      0.021807957 = score(doc=5975,freq=6.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34197432 = fieldWeight in 5975, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=5975)
    0.059721746 = weight(_text_:forschung in 5975) [ClassicSimilarity], result of:
      0.059721746 = score(doc=5975,freq=2.0), product of:
        0.13888668 = queryWeight, product of:
          4.8649335 = idf(docFreq=926, maxDocs=44218)
          0.028548526 = queryNorm
        0.43000343 = fieldWeight in 5975, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.8649335 = idf(docFreq=926, maxDocs=44218)
          0.0625 = fieldNorm(doc=5975)
  0.25 = coord(3/12)

Abstract: Im Information Retrieval tragen Evaluierungsinitiativen erheblich zur empirisch fundierten Forschung bei. Mit umfangreichen Kollektionen und Aufgaben unterstützen sie die Standardisierung und damit die Systementwicklung. Die wachsenden Anforderungen hinsichtlich der Korpora und Anwendungsszenarien führten zu einer starken Diversifizierung innerhalb der Evaluierungsinitiativen. Dieser Artikel gibt einen Überblick über den aktuellen Stand der wichtigsten Evaluierungsinitiativen und neuen Trends.

Fugmann, R.: ¬Das Faule Ei des Kolumbus im Aslib-Cranfield Vergleich von Informationssystemen : Die erneute Betrachtung eines einflussreichen Experiments (2004) 0.03

0.025222396 = product of:
  0.100889586 = sum of:
    0.033050932 = weight(_text_:der in 2364) [ClassicSimilarity], result of:
      0.033050932 = score(doc=2364,freq=18.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.5182773 = fieldWeight in 2364, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=2364)
    0.034787726 = weight(_text_:wissenschaft in 2364) [ClassicSimilarity], result of:
      0.034787726 = score(doc=2364,freq=2.0), product of:
        0.11331915 = queryWeight, product of:
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.028548526 = queryNorm
        0.30698892 = fieldWeight in 2364, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.0546875 = fieldNorm(doc=2364)
    0.033050932 = weight(_text_:der in 2364) [ClassicSimilarity], result of:
      0.033050932 = score(doc=2364,freq=18.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.5182773 = fieldWeight in 2364, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=2364)
  0.25 = coord(3/12)

Abstract: Der Beitrag gibt einen kritischen Rückblick auf die Experimente des ASLIB-CranfieldProjekts, mit dem die Leistungsfähigkeit verschiedenere Methoden der Inhaltserschließung verglichen wurden. Bemängelt wird die fehlende Unterscheidung zwischen Erinnerungsrecherche und Entdeckungsrecherche sowie die Wirklichkeitsferne der Versuchsbedingungen im ASLIB-Cranfield Projekt insbesondere Abwertung der Indexierung, Wirklichkeitsferne der Suchziele, die Empfehlung zum oberflächlichen Indexieren, die vermeintliche "gesetzmäßige Umkehrrelation" zwischen Ballast und Verlust sowie die Geringschätzung von Informationsverlust. Der Autor plädiert dafür, bei der Weiterentwicklung von Methoden der Inhaltserschließung die Erfahrungen aus der Vergangenheit nicht außer Acht zu lassen.
Source: Information - Wissenschaft und Praxis. 55(2004) H.4, S.211-220

Grummann, M.: Sind Verfahren zur maschinellen Indexierung für Literaturbestände Öffentlicher Bibliotheken geeignet? : Retrievaltests von indexierten ekz-Daten mit der Software IDX (2000) 0.02

0.023833498 = product of:
  0.09533399 = sum of:
    0.017806122 = weight(_text_:der in 1879) [ClassicSimilarity], result of:
      0.017806122 = score(doc=1879,freq=4.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.27922085 = fieldWeight in 1879, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=1879)
    0.017806122 = weight(_text_:der in 1879) [ClassicSimilarity], result of:
      0.017806122 = score(doc=1879,freq=4.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.27922085 = fieldWeight in 1879, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=1879)
    0.059721746 = weight(_text_:forschung in 1879) [ClassicSimilarity], result of:
      0.059721746 = score(doc=1879,freq=2.0), product of:
        0.13888668 = queryWeight, product of:
          4.8649335 = idf(docFreq=926, maxDocs=44218)
          0.028548526 = queryNorm
        0.43000343 = fieldWeight in 1879, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.8649335 = idf(docFreq=926, maxDocs=44218)
          0.0625 = fieldNorm(doc=1879)
  0.25 = coord(3/12)

Abstract: Maschinelles Indexieren vereinheitlicht und vermehrt das Suchvokabular eines Bibliothekskatalogs durch verschiedene Methoden (u.a. Ermittlung der Grundform, Kompositazerlegung, Wortableitungen). Ein Retrievaltest mit einem für öffentliche Bibliotheken typischen Sachbuchbestand zeigt, dass dieses Verfahren die Ergebnisse von OPAC-Recherchen verbessert - trotz 'blumiger' Titelformulierungen. Im Vergleich zu herkömmlichen Erschließungsmethoden (Stich- und Schlagwörter) werden mehr relevante Titel gefunden, ohne gleichzeitig den 'Ballast' zu erhöhen. Das maschinelle Indexieren kann die Verschlagwortung jedoch nicht ersetzen, sondern nur ergänzen
Source: Bibliothek: Forschung und Praxis. 24(2000) H.3, S.297-318

Dresel, R.; Hörnig, D.; Kaluza, H.; Peter, A.; Roßmann, A.; Sieber, W.: Evaluation deutscher Web-Suchwerkzeuge : Ein vergleichender Retrievaltest (2001) 0.02

0.02370925 = product of:
  0.07112775 = sum of:
    0.01259083 = weight(_text_:der in 261) [ClassicSimilarity], result of:
      0.01259083 = score(doc=261,freq=2.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.19743896 = fieldWeight in 261, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=261)
    0.039757397 = weight(_text_:wissenschaft in 261) [ClassicSimilarity], result of:
      0.039757397 = score(doc=261,freq=2.0), product of:
        0.11331915 = queryWeight, product of:
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.028548526 = queryNorm
        0.35084447 = fieldWeight in 261, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.0625 = fieldNorm(doc=261)
    0.01259083 = weight(_text_:der in 261) [ClassicSimilarity], result of:
      0.01259083 = score(doc=261,freq=2.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.19743896 = fieldWeight in 261, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=261)
    0.0061886897 = product of:
      0.030943448 = sum of:
        0.030943448 = weight(_text_:22 in 261) [ClassicSimilarity], result of:
          0.030943448 = score(doc=261,freq=2.0), product of:
            0.09997207 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.028548526 = queryNorm
            0.30952093 = fieldWeight in 261, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=261)
      0.2 = coord(1/5)
  0.33333334 = coord(4/12)

Abstract: Die deutschen Suchmaschinen, Abacho, Acoon, Fireball und Lycos sowie die Web-Kataloge Web.de und Yahoo! werden einem Qualitätstest nach relativem Recall, Precision und Availability unterzogen. Die Methoden der Retrievaltests werden vorgestellt. Im Durchschnitt werden bei einem Cut-Off-Wert von 25 ein Recall von rund 22%, eine Precision von knapp 19% und eine Verfügbarkeit von 24% erreicht
Source: nfd Information - Wissenschaft und Praxis. 52(2001) H.7, S.381-392

Dzeyk, W.: Effektiv und nutzerfreundlich : Einsatz von semantischen Technologien und Usability-Methoden zur Verbesserung der medizinischen Literatursuche (2010) 0.02
```
0.022826394 = product of:
  0.091305576 = sum of:
    0.032588657 = weight(_text_:der in 4416) [ClassicSimilarity], result of:
      0.032588657 = score(doc=4416,freq=70.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.5110283 = fieldWeight in 4416, product of:
          8.3666 = tf(freq=70.0), with freq of:
            70.0 = termFreq=70.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02734375 = fieldNorm(doc=4416)
    0.032588657 = weight(_text_:der in 4416) [ClassicSimilarity], result of:
      0.032588657 = score(doc=4416,freq=70.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.5110283 = fieldWeight in 4416, product of:
          8.3666 = tf(freq=70.0), with freq of:
            70.0 = termFreq=70.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02734375 = fieldNorm(doc=4416)
    0.026128264 = weight(_text_:forschung in 4416) [ClassicSimilarity], result of:
      0.026128264 = score(doc=4416,freq=2.0), product of:
        0.13888668 = queryWeight, product of:
          4.8649335 = idf(docFreq=926, maxDocs=44218)
          0.028548526 = queryNorm
        0.1881265 = fieldWeight in 4416, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.8649335 = idf(docFreq=926, maxDocs=44218)
          0.02734375 = fieldNorm(doc=4416)
  0.25 = coord(3/12)
```
Abstract

In der vorliegenden Arbeit werden die Ergebnisse des MorphoSaurus-Projekts der Deutschen Zentralbibliothek für Medizin (ZB MED) vorgestellt. Ziel des Forschungsprojekts war die substanzielle Verbesserung des Information-Retrievals der medizinischen Suchmaschine MEDPILOT mithilfe computerlinguistischer Ansätze sowie die Optimierung der Gebrauchstauglichkeit (Usability) der Suchmaschinenoberfläche. Das Projekt wurde in Kooperation mit der Averbis GmbH aus Freiburg im Zeitraum von Juni 2007 bis Dezember 2008 an der ZB MED in Köln durchgeführt. Ermöglicht wurde die Realisierung des Projekts durch eine Förderung des Paktes für Forschung und Innovation. Während Averbis die MorphoSaurus-Technologie zur Verarbeitung problematischer Sprachaspekte von Suchanfragen einbrachte und wesentliche Datenbanken der ZB MED in ein Testsystem mit moderner Suchmaschinentechnologie implementierte, evaluierte ein Team der ZB MED das Potenzial dieser Technologie. Neben einem Vergleich der Leistungsfähigkeit zwischen der bisherigen MEDPILOT-Suche und der neuen Sucharchitektur wurde ein Benchmarking mit konkurrierenden Suchmaschinen wie PubMed, Scirus, Google und Google Scholar sowie GoPubMed durchgeführt. Für die Evaluation wurden verschiedene Testkollektionen erstellt, deren Items bzw. Suchphrasen aus einer Inhaltsanalyse realer Suchanfragen des MEDPILOT-Systems gewonnen wurden. Eine Überprüfung der Relevanz der Treffer der Testsuchmaschine als wesentliches Kriterium für die Qualität der Suche zeigte folgendes Ergebnis: Durch die Anwendung der MorphoSaurus-Technologie ist eine im hohen Maße unabhängige Verarbeitung fremdsprachlicher medizinischer Inhalte möglich geworden. Darüber hinaus zeigt die neue Technik insbesondere dort ihre Stärken, wo es um die gleichwertige Verarbeitung von Laien- und Expertensprache, die Analyse von Komposita, Synonymen und grammatikalischen Varianten geht. Zudem sind Module zur Erkennung von Rechtschreibfehlern und zur Auflösung von Akronymen und medizinischen Abkürzungen implementiert worden, die eine weitere Leistungssteigerung des Systems versprechen. Ein Vergleich auf der Basis von MEDLINE-Daten zeigte: Den Suchmaschinen MED-PILOT, PubMed, GoPubMed und Scirus war die Averbis-Testsuchumgebung klar überlegen. Die Trefferrelevanz war größer, es wurden insgesamt mehr Treffer gefunden und die Anzahl der Null-Treffer-Meldungen war im Vergleich zu den anderen Suchmaschinen am geringsten.
Bei einem Vergleich unter Berücksichtigung aller verfügbaren Quellen gelang es mithilfe der MorphoSaurus-Technik - bei wesentlich geringerem Datenbestand - ähnlich gute Resul-tate zu erzielen, wie mit den Suchmaschinen Google oder Google Scholar. Die Ergebnisse der Evaluation lassen den Schluss zu, dass durch den MorphoSaurus-Ansatz die Leistungsfähigkeit von Google oder Google Scholar im Bereich der medizinischen Literatursuche durch eine Erweiterung der vorhandenen Datenbasis sogar deutlich übertroffen werden kann. Zusätzlich zu den Retrieval-Tests wurde eine Usability-Untersuchung der Testsuchmaschine mit Probanden aus der Medizin durchgeführt. Die Testpersonen attestierten dem Such-interface eine hohe Gebrauchstauglichkeit und Nützlichkeit. Der szenariobasierte Usability-Test hat zudem gezeigt, dass die Testpersonen bzw. User die integrierten Unterstützungs-maßnahmen zur Erhöhung der Benutzerfreundlichkeit während der Suche als sehr positiv und nützlich bewerten. In der Testsuchmaschine wurde diese Unterstützung z. B. durch das Aufklappen und Präsentieren von verwandten MeSH- und ICD-10-Begriffen realisiert. Die Einführung eines Schiebereglers zur effektiven Eingrenzung des Suchraums wurde ebenfalls überwiegend positiv bewertet. Zudem wurden nach Abschicken der Suchanfrage sogenannte Verwandte Suchbegriffe aus verschiedenen medizinischen Teilbereichen angezeigt. Diese Facetten-Funktion diente der Eingrenzung bzw. Verfeinerung der Suche und wurde von den Testpersonen mehrheitlich als ein sinnvolles Hilfsangebot bewertet. Insgesamt stellt das MorphoSaurus-Projekt - mit seinem spezifischen Ansatz - ein gelungenes Beispiel für die Innovationsfähigkeit von Bibliotheken im Bereich der öffentlichen Informationsversorgung dar. Durch die mögliche Anpassung der MorphoSaurus-Technologie mittels fachspezifischer Thesauri ist zudem eine hohe Anschlussfähigkeit für Suchmaschinen-projekte anderer Inhaltsdomänen gegeben.

Heinz, M.; Voigt, H.: Aufbau einer Suchmaschine für ein Forschungsinstitut : Aufgabe für die Bibliothek? (2000) 0.02

0.020843327 = product of:
  0.08337331 = sum of:
    0.021807957 = weight(_text_:der in 5234) [ClassicSimilarity], result of:
      0.021807957 = score(doc=5234,freq=6.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34197432 = fieldWeight in 5234, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=5234)
    0.039757397 = weight(_text_:wissenschaft in 5234) [ClassicSimilarity], result of:
      0.039757397 = score(doc=5234,freq=2.0), product of:
        0.11331915 = queryWeight, product of:
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.028548526 = queryNorm
        0.35084447 = fieldWeight in 5234, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.0625 = fieldNorm(doc=5234)
    0.021807957 = weight(_text_:der in 5234) [ClassicSimilarity], result of:
      0.021807957 = score(doc=5234,freq=6.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34197432 = fieldWeight in 5234, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=5234)
  0.25 = coord(3/12)

Abstract: Anhand eines einfachen Modells wird geprüft, ob der Nutzen den Aufbau einer Spezialsuchmaschine trägt. Zum Vergleich werden fünf große Suchmaschinen herangezogen und deren Ergebnisse bei gleichen Fragestellungen analysiert. Es ergeben sich gravierende Abweichungen sowohl in der Überdeckung der Ergebnismengen als auch im Ranking. Es erscheint also sinnvoll, eine eigene Suchmaschine zu betreiben
Source: nfd Information - Wissenschaft und Praxis. 51(2000) H.6, S.335-341

Mandl, T.: Web- und Multimedia-Dokumente : Neuere Entwicklungen bei der Evaluierung von Information Retrieval Systemen (2003) 0.02

0.020843327 = product of:
  0.08337331 = sum of:
    0.021807957 = weight(_text_:der in 1734) [ClassicSimilarity], result of:
      0.021807957 = score(doc=1734,freq=6.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34197432 = fieldWeight in 1734, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=1734)
    0.039757397 = weight(_text_:wissenschaft in 1734) [ClassicSimilarity], result of:
      0.039757397 = score(doc=1734,freq=2.0), product of:
        0.11331915 = queryWeight, product of:
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.028548526 = queryNorm
        0.35084447 = fieldWeight in 1734, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.0625 = fieldNorm(doc=1734)
    0.021807957 = weight(_text_:der in 1734) [ClassicSimilarity], result of:
      0.021807957 = score(doc=1734,freq=6.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34197432 = fieldWeight in 1734, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=1734)
  0.25 = coord(3/12)

Abstract: Die Menge an Daten im Internet steigt weiter rapide an. Damit wächst auch der Bedarf an qualitativ hochwertigen Information Retrieval Diensten zur Orientierung und problemorientierten Suche. Die Entscheidung für die Benutzung oder Beschaffung von Information Retrieval Software erfordert aussagekräftige Evaluierungsergebnisse. Dieser Beitrag stellt neuere Entwicklungen bei der Evaluierung von Information Retrieval Systemen vor und zeigt den Trend zu Spezialisierung und Diversifizierung von Evaluierungsstudien, die den Realitätsgrad derErgebnisse erhöhen. DerSchwerpunkt liegt auf dem Retrieval von Fachtexten, Internet-Seiten und Multimedia-Objekten.
Source: Information - Wissenschaft und Praxis. 54(2003) H.4, S.203-210

Rapke, K.: Automatische Indexierung von Volltexten für die Gruner+Jahr Pressedatenbank (2001) 0.02

0.020809103 = product of:
  0.08323641 = sum of:
    0.026709184 = weight(_text_:der in 6386) [ClassicSimilarity], result of:
      0.026709184 = score(doc=6386,freq=16.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.4188313 = fieldWeight in 6386, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=6386)
    0.029818047 = weight(_text_:wissenschaft in 6386) [ClassicSimilarity], result of:
      0.029818047 = score(doc=6386,freq=2.0), product of:
        0.11331915 = queryWeight, product of:
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.028548526 = queryNorm
        0.26313335 = fieldWeight in 6386, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.046875 = fieldNorm(doc=6386)
    0.026709184 = weight(_text_:der in 6386) [ClassicSimilarity], result of:
      0.026709184 = score(doc=6386,freq=16.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.4188313 = fieldWeight in 6386, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=6386)
  0.25 = coord(3/12)

Abstract: Retrieval Tests sind die anerkannteste Methode, um neue Verfahren der Inhaltserschließung gegenüber traditionellen Verfahren zu rechtfertigen. Im Rahmen einer Diplomarbeit wurden zwei grundsätzlich unterschiedliche Systeme der automatischen inhaltlichen Erschließung anhand der Pressedatenbank des Verlagshauses Gruner + Jahr (G+J) getestet und evaluiert. Untersucht wurde dabei natürlichsprachliches Retrieval im Vergleich zu Booleschem Retrieval. Bei den beiden Systemen handelt es sich zum einen um Autonomy von Autonomy Inc. und DocCat, das von IBM an die Datenbankstruktur der G+J Pressedatenbank angepasst wurde. Ersteres ist ein auf natürlichsprachlichem Retrieval basierendes, probabilistisches System. DocCat demgegenüber basiert auf Booleschem Retrieval und ist ein lernendes System, das auf Grund einer intellektuell erstellten Trainingsvorlage indexiert. Methodisch geht die Evaluation vom realen Anwendungskontext der Textdokumentation von G+J aus. Die Tests werden sowohl unter statistischen wie auch qualitativen Gesichtspunkten bewertet. Ein Ergebnis der Tests ist, dass DocCat einige Mängel gegenüber der intellektuellen Inhaltserschließung aufweist, die noch behoben werden müssen, während das natürlichsprachliche Retrieval von Autonomy in diesem Rahmen und für die speziellen Anforderungen der G+J Textdokumentation so nicht einsetzbar ist
Source: nfd Information - Wissenschaft und Praxis. 52(2001) H.5, S.251-262

Kluck, M.; Mandl, T.; Womser-Hacker, C.: Cross-Language Evaluation Forum (CLEF) : Europäische Initiative zur Bewertung sprachübergreifender Retrievalverfahren (2002) 0.02

0.018237913 = product of:
  0.07295165 = sum of:
    0.019081963 = weight(_text_:der in 266) [ClassicSimilarity], result of:
      0.019081963 = score(doc=266,freq=6.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.29922754 = fieldWeight in 266, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=266)
    0.034787726 = weight(_text_:wissenschaft in 266) [ClassicSimilarity], result of:
      0.034787726 = score(doc=266,freq=2.0), product of:
        0.11331915 = queryWeight, product of:
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.028548526 = queryNorm
        0.30698892 = fieldWeight in 266, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.0546875 = fieldNorm(doc=266)
    0.019081963 = weight(_text_:der in 266) [ClassicSimilarity], result of:
      0.019081963 = score(doc=266,freq=6.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.29922754 = fieldWeight in 266, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=266)
  0.25 = coord(3/12)

Abstract: Seit einigen Jahren hat sich in Europa eine Initiative zur Bewertung von Information Retrieval in mehrsprachigen Kontexten etabliert. Das Cross Language Evaluation forum (CLEF) wird von der EU gefördert und kooperiert mit Evaluierungsprojekten in den USA (TREC) und in Japan (NTCIR). Dieser Artikel stellt das CLEF in den Rahmen der anderen internationalen Initiativen. Neue Entwicklungen sowohl bei den Information Retrieval Systemen als auch bei den Evaluierungsmethoden werden aufgezeit. Die hohe Anzahl von Teilnehmern aus Forschungsinstitutionen und der Industrie beweist die steigende Bedeutung des sprachübergreifenden Retrievals
Source: Information - Wissenschaft und Praxis. 53(2002) H.2, S.82-89

Grasso, L.L.; Wahlig, H.: Google und seine Suchparameter : Eine Top 20-Precision Analyse anhand repräsentativ ausgewählter Anfragen (2005) 0.02

0.016234765 = product of:
  0.06493906 = sum of:
    0.01259083 = weight(_text_:der in 3275) [ClassicSimilarity], result of:
      0.01259083 = score(doc=3275,freq=2.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.19743896 = fieldWeight in 3275, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=3275)
    0.039757397 = weight(_text_:wissenschaft in 3275) [ClassicSimilarity], result of:
      0.039757397 = score(doc=3275,freq=2.0), product of:
        0.11331915 = queryWeight, product of:
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.028548526 = queryNorm
        0.35084447 = fieldWeight in 3275, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.0625 = fieldNorm(doc=3275)
    0.01259083 = weight(_text_:der in 3275) [ClassicSimilarity], result of:
      0.01259083 = score(doc=3275,freq=2.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.19743896 = fieldWeight in 3275, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=3275)
  0.25 = coord(3/12)

Abstract: Im Aufsatz werden zunächst führende Precision-Analysen zusammengefasst und kritisch bewertet. Darauf aufbauend werden Methodik und Ergebnisse dieser auf Google beschränkten Untersuchung vorgestellt. Im Mittelpunkt der Untersuchung werden die von Google angebotenen Retrievaloperatoren einer Qualitätsmessung unterzogen. Als methodisches Mittel dazu dient eine Top20-Precision-Analyse von acht Suchanfragen verschiedener vorab definierter Nutzertypen.
Source: Information - Wissenschaft und Praxis. 56(2005) H.2, S.77-86

Knorz, G.: Testverfahren für intelligente Indexierungs- und Retrievalsysteme anhand deutsch-sprachiger sozialwissenschaftlicher Fachinformation (GIRT) : Bericht über einen Workshop am 12. September 1997 im IZ Sozialwissenschaften, Bonn (1998) 0.02

0.016234765 = product of:
  0.06493906 = sum of:
    0.01259083 = weight(_text_:der in 5080) [ClassicSimilarity], result of:
      0.01259083 = score(doc=5080,freq=2.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.19743896 = fieldWeight in 5080, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=5080)
    0.039757397 = weight(_text_:wissenschaft in 5080) [ClassicSimilarity], result of:
      0.039757397 = score(doc=5080,freq=2.0), product of:
        0.11331915 = queryWeight, product of:
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.028548526 = queryNorm
        0.35084447 = fieldWeight in 5080, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.0625 = fieldNorm(doc=5080)
    0.01259083 = weight(_text_:der in 5080) [ClassicSimilarity], result of:
      0.01259083 = score(doc=5080,freq=2.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.19743896 = fieldWeight in 5080, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=5080)
  0.25 = coord(3/12)

Content: A. Die Initiative "GIRT" 1. Vorträge 2. Ziele und Perspektiven des Projektes GIRT (Krause) 3. Generelle Ergebnisse der TREC-Studien, einschließlich TREC-5 (Womser-Hacker) 4. Ergebnisse des GIRT-Pretests (Kluck) 5. Multilingualität in TREC (Schäuble) B. Abschlußdiskussion und Resumee
Source: nfd Information - Wissenschaft und Praxis. 49(1998) H.2, S.111-116

Günther, M.: Vermitteln Suchmaschinen vollständige Bilder aktueller Themen? : Untersuchung der Gewichtung inhaltlicher Aspekte von Suchmaschinenergebnissen in Deutschland und den USA (2016) 0.02

0.015779253 = product of:
  0.06311701 = sum of:
    0.023607805 = weight(_text_:der in 3068) [ClassicSimilarity], result of:
      0.023607805 = score(doc=3068,freq=18.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.37019804 = fieldWeight in 3068, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3068)
    0.023607805 = weight(_text_:der in 3068) [ClassicSimilarity], result of:
      0.023607805 = score(doc=3068,freq=18.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.37019804 = fieldWeight in 3068, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3068)
    0.0159014 = product of:
      0.039753497 = sum of:
        0.020238286 = weight(_text_:28 in 3068) [ClassicSimilarity], result of:
          0.020238286 = score(doc=3068,freq=2.0), product of:
            0.10226833 = queryWeight, product of:
              3.5822632 = idf(docFreq=3342, maxDocs=44218)
              0.028548526 = queryNorm
            0.19789396 = fieldWeight in 3068, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5822632 = idf(docFreq=3342, maxDocs=44218)
              0.0390625 = fieldNorm(doc=3068)
        0.019515209 = weight(_text_:29 in 3068) [ClassicSimilarity], result of:
          0.019515209 = score(doc=3068,freq=2.0), product of:
            0.10042479 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.028548526 = queryNorm
            0.19432661 = fieldWeight in 3068, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.0390625 = fieldNorm(doc=3068)
      0.4 = coord(2/5)
  0.25 = coord(3/12)

Abstract: Zielsetzung - Vor dem Hintergrund von Suchmaschinenverzerrungen sollte herausgefunden werden, ob sich die von Google und Bing vermittelten Bilder aktueller internationaler Themen in Deutschland und den USA hinsichtlich (1) Vollständigkeit, (2) Abdeckung und (3) Gewichtung der jeweiligen inhaltlichen Aspekte unterscheiden. Forschungsmethoden - Für die empirische Untersuchung wurde eine Methode aus Ansätzen der empirischen Sozialwissenschaften (Inhaltsanalyse) und der Informationswissenschaft (Retrievaltests) entwickelt und angewandt. Ergebnisse - Es zeigte sich, dass Google und Bing in Deutschland und den USA (1) keine vollständigen Bilder aktueller internationaler Themen vermitteln, dass sie (2) auf den ersten Trefferpositionen nicht die drei wichtigsten inhaltlichen Aspekte abdecken, und dass es (3) bei der Gewichtung der inhaltlichen Aspekte keine signifikanten Unterschiede gibt. Allerdings erfahren diese Ergebnisse Einschränkungen durch die Methodik und die Auswertung der empirischen Untersuchung. Schlussfolgerungen - Es scheinen tatsächlich inhaltliche Suchmaschinenverzerrungen vorzuliegen - diese könnten Auswirkungen auf die Meinungsbildung der Suchmaschinennutzer haben. Trotz großem Aufwand bei manueller, und qualitativ schlechteren Ergebnissen bei automatischer Untersuchung sollte dieses Thema weiter erforscht werden.
Content: Vgl.: https://yis.univie.ac.at/index.php/yis/article/view/1355. Diesem Beitrag liegt folgende Abschlussarbeit zugrunde: Günther, Markus: Welches Weltbild vermitteln Suchmaschinen? Untersuchung der Gewichtung inhaltlicher Aspekte von Google- und Bing-Ergebnissen in Deutschland und den USA zu aktuellen internationalen Themen . Masterarbeit (M.A.), Hochschule für Angewandte Wissenschaften Hamburg, 2015. Volltext: http://edoc.sub.uni-hamburg.de/haw/volltexte/2016/332.
Date: 28. 7.2016 16:03:34
Source: Young information scientists. 1(2016), S.13-29

Munkelt, J.: Erstellung einer DNB-Retrieval-Testkollektion (2018) 0.01

0.013734033 = product of:
  0.054936133 = sum of:
    0.024634708 = weight(_text_:der in 4310) [ClassicSimilarity], result of:
      0.024634708 = score(doc=4310,freq=10.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.38630107 = fieldWeight in 4310, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4310)
    0.024634708 = weight(_text_:der in 4310) [ClassicSimilarity], result of:
      0.024634708 = score(doc=4310,freq=10.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.38630107 = fieldWeight in 4310, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4310)
    0.0056667197 = product of:
      0.028333599 = sum of:
        0.028333599 = weight(_text_:28 in 4310) [ClassicSimilarity], result of:
          0.028333599 = score(doc=4310,freq=2.0), product of:
            0.10226833 = queryWeight, product of:
              3.5822632 = idf(docFreq=3342, maxDocs=44218)
              0.028548526 = queryNorm
            0.27705154 = fieldWeight in 4310, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5822632 = idf(docFreq=3342, maxDocs=44218)
              0.0546875 = fieldNorm(doc=4310)
      0.2 = coord(1/5)
  0.25 = coord(3/12)

Abstract: Seit Herbst 2017 findet in der Deutschen Nationalbibliothek die Inhaltserschließung bestimmter Medienwerke rein maschinell statt. Die Qualität dieses Verfahrens, das die Prozessorganisation von Bibliotheken maßgeblich prägen kann, wird unter Fachleuten kontrovers diskutiert. Ihre Standpunkte werden zunächst hinreichend erläutert, ehe die Notwendigkeit einer Qualitätsprüfung des Verfahrens und dessen Grundlagen dargelegt werden. Zentraler Bestandteil einer künftigen Prüfung ist eine Testkollektion. Ihre Erstellung und deren Dokumentation steht im Fokus dieser Arbeit. In diesem Zusammenhang werden auch die Entstehungsgeschichte und Anforderungen an gelungene Testkollektionen behandelt. Abschließend wird ein Retrievaltest durchgeführt, der die Einsatzfähigkeit der erarbeiteten Testkollektion belegt. Seine Ergebnisse dienen ausschließlich der Funktionsüberprüfung. Eine Qualitätsbeurteilung maschineller Inhaltserschließung im Speziellen sowie im Allgemeinen findet nicht statt und ist nicht Ziel der Ausarbeitung.
Date: 21. 6.2018 15:58:28

Mielke, B.: Wider einige gängige Ansichten zur juristischen Informationserschließung (2002) 0.01
```
0.011777642 = product of:
  0.07066585 = sum of:
    0.035332926 = weight(_text_:der in 2145) [ClassicSimilarity], result of:
      0.035332926 = score(doc=2145,freq=28.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.55406165 = fieldWeight in 2145, product of:
          5.2915025 = tf(freq=28.0), with freq of:
            28.0 = termFreq=28.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=2145)
    0.035332926 = weight(_text_:der in 2145) [ClassicSimilarity], result of:
      0.035332926 = score(doc=2145,freq=28.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.55406165 = fieldWeight in 2145, product of:
          5.2915025 = tf(freq=28.0), with freq of:
            28.0 = termFreq=28.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=2145)
  0.16666667 = coord(2/12)
```
Abstract

Ausgehend von einer Betrachtung in der Rechtsinformatik geläufiger Annahmen zur juristischen Informationserschließung beschreibt der Beitrag wesentliche Ergebnisse einer empirischen Studie der Retrievaleffektivität von Re-cherchen in juristischen Datenbanken. Dabei steht die Frage nach der Notwendigkeit einer intellektuellen Erschließung einerseits, der Effektivität der sogenannten Stichwortsuche andererseits im Mittelpunkt. Die Ergebnisse der Studie, bei der auch ein Vergleich zwischen einem Informationssystem auf der Basis eines Booleschen Retrievalmodells mit einem System auf der Basis statistischer Verfahren vorgenommen wurde, legen den Schluss nahe, dass in der rechtsinformatischen Fachliteratur analytisch begründete Annahmen wie die Gefahr zu großer Antwortmengen bei der Stichwortsuche empirisch nicht zu belegen sind. Auch zeigt sich keine Überlegenheit intellektueller Erschließungsverfahren (Beschlagwortung) gegenüber der automatischen Indexierung, im Gegenteil führt der Einsatz eines statistischen Verfahrens bei identischer Dokumentkollektion zu einer höheren Wiedergewinnungsrate (recall).

Krause, J.; Womser-Hacker, C.: PADOK-II : Retrievaltests zur Bewertung von Volltextindexierungsvarianten für das deutsche Patentinformationssystem (1990) 0.01

0.011104069 = product of:
  0.06662441 = sum of:
    0.033312205 = weight(_text_:der in 2653) [ClassicSimilarity], result of:
      0.033312205 = score(doc=2653,freq=14.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.5223744 = fieldWeight in 2653, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=2653)
    0.033312205 = weight(_text_:der in 2653) [ClassicSimilarity], result of:
      0.033312205 = score(doc=2653,freq=14.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.5223744 = fieldWeight in 2653, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=2653)
  0.16666667 = coord(2/12)

Abstract: Vorgestellt werden die Ergebnisse extensiver Retrievaltests von zwei Varianten von Inhalteserschließungen (Freitext und PASSAT) für das deutsche Patentinformationssystem auf der Basis von Volltexten. Die Tests führte die Fachgruppe Linguistische Informationswissenschaft der Universität Regensburg von 1986-1989 in Zusammenarbeit mit dem Deutschen Patentamt, dem Fachinformationszentrum Karlsruhe und meheren industrieellen Partnern durch. Der Schwerpunkt des Berichts liegt auf dem allgemeinen Ansatz der Bewertung der Ziele des Projekts und auf der Darstellung der statistischen Evaluierungsergebnisse.

Search (157 results, page 1 of 8)

Authors

Years

Languages

Types

Themes

Subjects

Classifications