Search (99 results, page 1 of 5)

Marcus, S.: Textvergleich mit mehreren Mustern (2005) 0.03
```
0.03475305 = product of:
  0.10425915 = sum of:
    0.037026346 = weight(_text_:informatik in 862) [ClassicSimilarity], result of:
      0.037026346 = score(doc=862,freq=2.0), product of:
        0.16419695 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.032179873 = queryNorm
        0.2254996 = fieldWeight in 862, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.03125 = fieldNorm(doc=862)
    0.0121002225 = weight(_text_:und in 862) [ClassicSimilarity], result of:
      0.0121002225 = score(doc=862,freq=6.0), product of:
        0.07132241 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.032179873 = queryNorm
        0.16965526 = fieldWeight in 862, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=862)
    0.049266577 = weight(_text_:einzelne in 862) [ClassicSimilarity], result of:
      0.049266577 = score(doc=862,freq=2.0), product of:
        0.18940257 = queryWeight, product of:
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.032179873 = queryNorm
        0.26011568 = fieldWeight in 862, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.885746 = idf(docFreq=333, maxDocs=44218)
          0.03125 = fieldNorm(doc=862)
    0.005866007 = product of:
      0.01759802 = sum of:
        0.01759802 = weight(_text_:29 in 862) [ClassicSimilarity], result of:
          0.01759802 = score(doc=862,freq=2.0), product of:
            0.113198735 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.032179873 = queryNorm
            0.15546128 = fieldWeight in 862, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.03125 = fieldNorm(doc=862)
      0.33333334 = coord(1/3)
  0.33333334 = coord(4/12)
```
Abstract

Das Gebiet des Pattern-Matching besitzt in vielen wissenschaftlichen Bereichen eine hohe Relevanz. Aufgrund unterschiedlicher Einsatzgebiete sind auch Umsetzung und Anwendung des Pattern-Matching sehr verschieden. Die allen Anwendungen des Pattern-Matching inhärente Aufgabe besteht darin, in einer Vielzahl von Eingabedaten bestimmte Muster wieder zu erkennen. Dies ist auch der deutschen Bezeichnung Mustererkennung zu entnehmen. In der Medizin findet Pattern-Matching zum Beispiel bei der Untersuchung von Chromosomensträngen auf bestimmte Folgen von Chromosomen Verwendung. Auf dem Gebiet der Bildverarbeitung können mit Hilfe des Pattern-Matching ganze Bilder verglichen oder einzelne Bildpunkte betrachtet werden, die durch ein Muster identifizierbar sind. Ein weiteres Einsatzgebiet des Pattern-Matching ist das Information-Retrieval, bei dem in gespeicherten Daten nach relevanten Informationen gesucht wird. Die Relevanz der zu suchenden Daten wird auch hier anhand eines Musters, zum Beispiel einem bestimmten Schlagwort, beurteilt. Ein vergleichbares Verfahren findet auch im Internet Anwendung. Internet-Benutzer, die mittels einer Suchmaschine nach bedeutsamen Informationen suchen, erhalten diese durch den Einsatz eines Pattern-Matching-Automaten. Die in diesem Zusammenhang an den Pattern-Matching-Automaten gestellten Anforderungen variieren mit der Suchanfrage, die an eine Suchmaschine gestellt wird. Eine solche Suchanfrage kann im einfachsten Fall aus genau einem Schlüsselwort bestehen. Im komplexeren Fall enthält die Anfrage mehrere Schlüsselwörter. Dabei muss für eine erfolgreiche Suche eine Konkatenation der in der Anfrage enthaltenen Wörter erfolgen. Zu Beginn dieser Arbeit wird in Kapitel 2 eine umfassende Einführung in die Thematik des Textvergleichs gegeben, wobei die Definition einiger grundlegender Begriffe vorgenommen wird. Anschließend werden in Kapitel 3 Verfahren zum Textvergleich mit mehreren Mustern vorgestellt. Dabei wird zunächst ein einfaches Vorgehen erläutert, um einen Einsteig in das Thema des Textvergleichs mit mehreren Mustern zu erleichtern. Danach wird eine komplexe Methode des Textvergleichs vorgestellt und anhand von Beispielen verdeutlicht.

Content

Ausarbeitung im Rahmen des Seminars Suchmaschinen und Suchalgorithmen, Institut für Wirtschaftsinformatik Praktische Informatik in der Wirtschaft, Westfälische Wilhelms-Universität Münster. - Vgl.: http://www-wi.uni-muenster.de/pi/lehre/ss05/seminarSuchen/Ausarbeitungen/SandraMarcus.pdf

Date

13. 2.2007 20:56:29

Crestani, F.; Dominich, S.; Lalmas, M.; Rijsbergen, C.J.K. van: Mathematical, logical, and formal methods in information retrieval : an introduction to the special issue (2003) 0.02

0.017102022 = product of:
  0.10261212 = sum of:
    0.09389226 = weight(_text_:281 in 1451) [ClassicSimilarity], result of:
      0.09389226 = score(doc=1451,freq=2.0), product of:
        0.21349068 = queryWeight, product of:
          6.634292 = idf(docFreq=157, maxDocs=44218)
          0.032179873 = queryNorm
        0.4397956 = fieldWeight in 1451, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.634292 = idf(docFreq=157, maxDocs=44218)
          0.046875 = fieldNorm(doc=1451)
    0.008719858 = product of:
      0.026159571 = sum of:
        0.026159571 = weight(_text_:22 in 1451) [ClassicSimilarity], result of:
          0.026159571 = score(doc=1451,freq=2.0), product of:
            0.11268844 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.032179873 = queryNorm
            0.23214069 = fieldWeight in 1451, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=1451)
      0.33333334 = coord(1/3)
  0.16666667 = coord(2/12)

Date: 22. 3.2003 19:27:36
Source: Journal of the American Society for Information Science and technology. 54(2003) no.4, S.281-284

Robertson, S.E.: ¬The probability ranking principle in IR (1977) 0.02

0.015648711 = product of:
  0.18778452 = sum of:
    0.18778452 = weight(_text_:281 in 1935) [ClassicSimilarity], result of:
      0.18778452 = score(doc=1935,freq=2.0), product of:
        0.21349068 = queryWeight, product of:
          6.634292 = idf(docFreq=157, maxDocs=44218)
          0.032179873 = queryNorm
        0.8795912 = fieldWeight in 1935, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.634292 = idf(docFreq=157, maxDocs=44218)
          0.09375 = fieldNorm(doc=1935)
  0.083333336 = coord(1/12)

Footnote: Wiederabgedruckt in: Readings in information retrieval. Ed.: K. Sparck Jones u. P. Willet. San Francisco: Morgan Kaufmann 1997. S.281-286.

Mayr, P.: Re-Ranking auf Basis von Bradfordizing für die verteilte Suche in Digitalen Bibliotheken (2009) 0.01
```
0.014731957 = product of:
  0.088391736 = sum of:
    0.06320311 = weight(_text_:monographien in 4302) [ClassicSimilarity], result of:
      0.06320311 = score(doc=4302,freq=2.0), product of:
        0.21452549 = queryWeight, product of:
          6.666449 = idf(docFreq=152, maxDocs=44218)
          0.032179873 = queryNorm
        0.2946182 = fieldWeight in 4302, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.666449 = idf(docFreq=152, maxDocs=44218)
          0.03125 = fieldNorm(doc=4302)
    0.025188621 = weight(_text_:und in 4302) [ClassicSimilarity], result of:
      0.025188621 = score(doc=4302,freq=26.0), product of:
        0.07132241 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.032179873 = queryNorm
        0.3531656 = fieldWeight in 4302, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=4302)
  0.16666667 = coord(2/12)
```
Abstract

Trotz großer Dokumentmengen für datenbankübergreifende Literaturrecherchen erwarten akademische Nutzer einen möglichst hohen Anteil an relevanten und qualitativen Dokumenten in den Trefferergebnissen. Insbesondere die Reihenfolge und Struktur der gelisteten Ergebnisse (Ranking) spielt, neben dem direkten Volltextzugriff auf die Dokumente, inzwischen eine entscheidende Rolle beim Design von Suchsystemen. Nutzer erwarten weiterhin flexible Informationssysteme, die es unter anderem zulassen, Einfluss auf das Ranking der Dokumente zu nehmen bzw. alternative Rankingverfahren zu verwenden. In dieser Arbeit werden zwei Mehrwertverfahren für Suchsysteme vorgestellt, die die typischen Probleme bei der Recherche nach wissenschaftlicher Literatur behandeln und damit die Recherchesituation messbar verbessern können. Die beiden Mehrwertdienste semantische Heterogenitätsbehandlung am Beispiel Crosskonkordanzen und Re-Ranking auf Basis von Bradfordizing, die in unterschiedlichen Phasen der Suche zum Einsatz kommen, werden hier ausführlich beschrieben und im empirischen Teil der Arbeit bzgl. der Effektivität für typische fachbezogene Recherchen evaluiert. Vorrangiges Ziel der Promotion ist es, zu untersuchen, ob das hier vorgestellte alternative Re-Rankingverfahren Bradfordizing im Anwendungsbereich bibliographischer Datenbanken zum einen operabel ist und zum anderen voraussichtlich gewinnbringend in Informationssystemen eingesetzt und dem Nutzer angeboten werden kann. Für die Tests wurden Fragestellungen und Daten aus zwei Evaluationsprojekten (CLEF und KoMoHe) verwendet. Die intellektuell bewerteten Dokumente stammen aus insgesamt sieben wissenschaftlichen Fachdatenbanken der Fächer Sozialwissenschaften, Politikwissenschaft, Wirtschaftswissenschaften, Psychologie und Medizin. Die Evaluation der Crosskonkordanzen (insgesamt 82 Fragestellungen) zeigt, dass sich die Retrievalergebnisse signifikant für alle Crosskonkordanzen verbessern; es zeigt sich zudem, dass interdisziplinäre Crosskonkordanzen den stärksten (positiven) Effekt auf die Suchergebnisse haben. Die Evaluation des Re-Ranking nach Bradfordizing (insgesamt 164 Fragestellungen) zeigt, dass die Dokumente der Kernzone (Kernzeitschriften) für die meisten Testreihen eine signifikant höhere Precision als Dokumente der Zone 2 und Zone 3 (Peripheriezeitschriften) ergeben. Sowohl für Zeitschriften als auch für Monographien kann dieser Relevanzvorteil nach Bradfordizing auf einer sehr breiten Basis von Themen und Fragestellungen an zwei unabhängigen Dokumentkorpora empirisch nachgewiesen werden.

Imprint

Berlin : Humboldt-Universität zu Berlin / Institut für Bibliotheks- und Informationswissenschaft
Fichtner, K.: Boyer-Moore Suchalgorithmus (2005) 0.01
```
0.01353466 = product of:
  0.08120796 = sum of:
    0.05553952 = weight(_text_:informatik in 864) [ClassicSimilarity], result of:
      0.05553952 = score(doc=864,freq=2.0), product of:
        0.16419695 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.032179873 = queryNorm
        0.3382494 = fieldWeight in 864, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.046875 = fieldNorm(doc=864)
    0.025668446 = weight(_text_:und in 864) [ClassicSimilarity], result of:
      0.025668446 = score(doc=864,freq=12.0), product of:
        0.07132241 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.032179873 = queryNorm
        0.35989314 = fieldWeight in 864, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=864)
  0.16666667 = coord(2/12)
```
Abstract

Die Masse der Suchalgorithmen lässt sich in zwei grundlegend verschiedene Teilbereiche untergliedern. Auf der einen Seite stehen Algorithmen, die auf komplexen Datenstrukturen (häufig baumartig) ganze Datensätze unter Verwendung eines Indizes finden. Als geläufiger Vertreter sei hier die binäre Suche auf sortierten Arrays oder in binären Bäumen genannt. Die andere Gruppe, der sich diese Ausarbeitung widmet, dient dazu, Entsprechungen von Mustern in gegebenen Zeichenketten zu finden. Auf den folgenden Seiten werden nun zunächst einige Begriffe eingeführt, die für das weitere Verständnis und einen Vergleich verschiedener Suchalgorithmen nötig sind. Weiterhin wird ein naiver Suchalgorithmus dargestellt und mit der Idee von Boyer und Moore verglichen. Hierzu wird ihr Algorithmus zunächst informal beschrieben, dann mit Blick auf eine Implementation näher erläutert und anschließend einer Effizienzanalyse - sowohl empirisch als auch theoretisch - unterzogen. Abschließend findet eine kurze Bewertung mit Bezug auf Schwachstellen, Vorzüge und Verbesserungsmöglichkeiten statt, im Zuge derer einige prominente Modifikationen des Boyer-Moore Algorithmus vorgestellt werden.

Content

Ausarbeitung im Rahmen des Seminars Suchmaschinen und Suchalgorithmen, Institut für Wirtschaftsinformatik Praktische Informatik in der Wirtschaft, Westfälische Wilhelms-Universität Münster. - Vgl.: http://www-wi.uni-muenster.de/pi/lehre/ss05/seminarSuchen/Ausarbeitungen/KristoferFichtner.pdf

Mandl, T.: Web- und Multimedia-Dokumente : Neuere Entwicklungen bei der Evaluierung von Information Retrieval Systemen (2003) 0.01

0.013164906 = product of:
  0.07898943 = sum of:
    0.044764835 = weight(_text_:software in 1734) [ClassicSimilarity], result of:
      0.044764835 = score(doc=1734,freq=2.0), product of:
        0.12766245 = queryWeight, product of:
          3.9671519 = idf(docFreq=2274, maxDocs=44218)
          0.032179873 = queryNorm
        0.35064998 = fieldWeight in 1734, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.9671519 = idf(docFreq=2274, maxDocs=44218)
          0.0625 = fieldNorm(doc=1734)
    0.034224596 = weight(_text_:und in 1734) [ClassicSimilarity], result of:
      0.034224596 = score(doc=1734,freq=12.0), product of:
        0.07132241 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.032179873 = queryNorm
        0.47985753 = fieldWeight in 1734, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1734)
  0.16666667 = coord(2/12)

Abstract: Die Menge an Daten im Internet steigt weiter rapide an. Damit wächst auch der Bedarf an qualitativ hochwertigen Information Retrieval Diensten zur Orientierung und problemorientierten Suche. Die Entscheidung für die Benutzung oder Beschaffung von Information Retrieval Software erfordert aussagekräftige Evaluierungsergebnisse. Dieser Beitrag stellt neuere Entwicklungen bei der Evaluierung von Information Retrieval Systemen vor und zeigt den Trend zu Spezialisierung und Diversifizierung von Evaluierungsstudien, die den Realitätsgrad derErgebnisse erhöhen. DerSchwerpunkt liegt auf dem Retrieval von Fachtexten, Internet-Seiten und Multimedia-Objekten.
Source: Information - Wissenschaft und Praxis. 54(2003) H.4, S.203-210

Joss, M.W.; Wszola, S.: ¬The engines that can : text search and retrieval software, their strategies, and vendors (1996) 0.01

0.01264452 = product of:
  0.07586712 = sum of:
    0.067147255 = weight(_text_:software in 5123) [ClassicSimilarity], result of:
      0.067147255 = score(doc=5123,freq=8.0), product of:
        0.12766245 = queryWeight, product of:
          3.9671519 = idf(docFreq=2274, maxDocs=44218)
          0.032179873 = queryNorm
        0.525975 = fieldWeight in 5123, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          3.9671519 = idf(docFreq=2274, maxDocs=44218)
          0.046875 = fieldNorm(doc=5123)
    0.008719858 = product of:
      0.026159571 = sum of:
        0.026159571 = weight(_text_:22 in 5123) [ClassicSimilarity], result of:
          0.026159571 = score(doc=5123,freq=2.0), product of:
            0.11268844 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.032179873 = queryNorm
            0.23214069 = fieldWeight in 5123, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=5123)
      0.33333334 = coord(1/3)
  0.16666667 = coord(2/12)

Abstract: Traces the development of text searching and retrieval software designed to cope with the increasing demands made by the storage and handling of large amounts of data, recorded on high data storage media, from CD-ROM to multi gigabyte storage media and online information services, with particular reference to the need to cope with graphics as well as conventional ASCII text. Includes details of: Boolean searching, fuzzy searching and matching; relevance ranking; proximity searching and improved strategies for dealing with text searching in very large databases. Concludes that the best searching tools for CD-ROM publishers are those optimized for searching and retrieval on CD-ROM. CD-ROM drives have relatively lower random seek times than hard discs and so the software most appropriate to the medium is that which can effectively arrange the indexes and text on the CD-ROM to avoid continuous random access searching. Lists and reviews a selection of software packages designed to achieve the sort of results required for rapid CD-ROM searching
Date: 12. 9.1996 13:56:22

Dominich, S.: Mathematical foundations of information retrieval (2001) 0.01

0.012120085 = product of:
  0.072720505 = sum of:
    0.065453954 = weight(_text_:informatik in 1753) [ClassicSimilarity], result of:
      0.065453954 = score(doc=1753,freq=4.0), product of:
        0.16419695 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.032179873 = queryNorm
        0.39863077 = fieldWeight in 1753, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1753)
    0.0072665485 = product of:
      0.021799644 = sum of:
        0.021799644 = weight(_text_:22 in 1753) [ClassicSimilarity], result of:
          0.021799644 = score(doc=1753,freq=2.0), product of:
            0.11268844 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.032179873 = queryNorm
            0.19345059 = fieldWeight in 1753, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0390625 = fieldNorm(doc=1753)
      0.33333334 = coord(1/3)
  0.16666667 = coord(2/12)

BK: 54.10 Theoretische Informatik
Classification: 54.10 Theoretische Informatik
Date: 22. 3.2008 12:26:32

Weiß, B.: Verwandte Seiten finden : "Ähnliche Seiten" oder "What's Related" (2005) 0.01
```
0.01156453 = product of:
  0.06938718 = sum of:
    0.046282936 = weight(_text_:informatik in 868) [ClassicSimilarity], result of:
      0.046282936 = score(doc=868,freq=2.0), product of:
        0.16419695 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.032179873 = queryNorm
        0.2818745 = fieldWeight in 868, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.0390625 = fieldNorm(doc=868)
    0.023104243 = weight(_text_:und in 868) [ClassicSimilarity], result of:
      0.023104243 = score(doc=868,freq=14.0), product of:
        0.07132241 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.032179873 = queryNorm
        0.32394084 = fieldWeight in 868, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=868)
  0.16666667 = coord(2/12)
```
Abstract

Die Link-Struktur-Analyse (LSA) ist nicht nur beim Crawling, dem Webseitenranking, der Abgrenzung geographischer Bereiche, der Vorhersage von Linkverwendungen, dem Auffinden von "Mirror"-Seiten, dem Kategorisieren von Webseiten und beim Generieren von Webseitenstatistiken eines der wichtigsten Analyseverfahren, sondern auch bei der Suche nach verwandten Seiten. Um qualitativ hochwertige verwandte Seiten zu finden, bildet sie nach herrschender Meinung den Hauptbestandteil bei der Identifizierung von ähnlichen Seiten innerhalb themenspezifischer Graphen vernetzter Dokumente. Dabei wird stets von zwei Annahmen ausgegangen: Links zwischen zwei Dokumenten implizieren einen verwandten Inhalt beider Dokumente und wenn die Dokumente aus unterschiedlichen Quellen (von unterschiedlichen Autoren, Hosts, Domänen, .) stammen, so bedeutet dies das eine Quelle die andere über einen Link empfiehlt. Aufbauend auf dieser Idee entwickelte Kleinberg 1998 den HITS Algorithmus um verwandte Seiten über die Link-Struktur-Analyse zu bestimmen. Dieser Ansatz wurde von Bharat und Henzinger weiterentwickelt und später auch in Algorithmen wie dem Companion und Cocitation Algorithmus zur Suche von verwandten Seiten basierend auf nur einer Anfrage-URL weiter verfolgt. In der vorliegenden Seminararbeit sollen dabei die Algorithmen, die hinter diesen Überlegungen stehen, näher erläutert werden und im Anschluss jeweils neuere Forschungsansätze auf diesem Themengebiet aufgezeigt werden.

Content

Ausarbeitung im Rahmen des Seminars Suchmaschinen und Suchalgorithmen, Institut für Wirtschaftsinformatik Praktische Informatik in der Wirtschaft, Westfälische Wilhelms-Universität Münster. - Vgl.: http://www-wi.uni-muenster.de/pi/lehre/ss05/seminarSuchen/Ausarbeitungen/BurkhardWei%DF.pdf
Ackermann, J.: Knuth-Morris-Pratt (2005) 0.01
```
0.008499747 = product of:
  0.05099848 = sum of:
    0.037026346 = weight(_text_:informatik in 865) [ClassicSimilarity], result of:
      0.037026346 = score(doc=865,freq=2.0), product of:
        0.16419695 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.032179873 = queryNorm
        0.2254996 = fieldWeight in 865, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.03125 = fieldNorm(doc=865)
    0.013972133 = weight(_text_:und in 865) [ClassicSimilarity], result of:
      0.013972133 = score(doc=865,freq=8.0), product of:
        0.07132241 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.032179873 = queryNorm
        0.19590102 = fieldWeight in 865, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=865)
  0.16666667 = coord(2/12)
```
Abstract

Im Rahmen des Seminars Suchmaschinen und Suchalgorithmen beschäftigt sich diese Arbeit mit dem Auffinden bestimmter Wörter oder Muster in Texten. Der Begriff "Text" wird hier in einem sehr allgemeinen Sinne als strukturierte Folge beliebiger Länge von Zeichen aus einem endlichen Alphabet verstanden. Somit fällt unter diesen Bereich ganz allgemein die Suche nach einem Muster in einer Sequenz von Zeichen. Beispiele hierfür sind neben der Suche von Wörtern in "literarischen" Texten, z.B. das Finden von Pixelfolgen in Bildern oder gar das Finden von Mustern in DNS-Strängen. Das Anwendungsgebiet für eine solche Suche ist weit gefächert. Man denke hier allein an Texteditoren, Literaturdatenbanken, digitale Lexika oder die besagte DNADatenbank. Betrachtet man allein das 1989 publizierte Oxford English Dictionary mit seinen etwa 616500 definierten Stichworten auf gedruckten 21728 Seiten, so gilt es, einen möglichst effizienten Algorithmus für die Suche in Texten zu nutzen. Der in der Arbeit zugrunde liegende Datentyp ist vom Typ String (Zeichenkette), wobei hier offen gelassen wird, wie der Datentyp programmtechnisch realisiert wird. Algorithmen zur Verarbeitung von Zeichenketten (string processing) umfassen ein bestimmtes Spektrum an Anwendungsgebieten [Ot96, S.617 f.], wie z.B. das Komprimieren, das Verschlüssen, das Analysieren (parsen), das Übersetzen von Texten sowie das Suchen in Texten, welches Thema dieses Seminars ist. Im Rahmen dieser Arbeit wird der Knuth-Morris-Pratt Algorithmus vorgestellt, der wie der ebenfalls in diesem Seminar vorgestellte Boyer-Moore Algorithmus einen effizienten Suchalgorithmus darstellt. Dabei soll ein gegebenes Suchwort oder Muster (pattern) in einer gegeben Zeichenkette erkannt werden (pattern matching). Gesucht werden dabei ein oder mehrere Vorkommen eines bestimmten Suchwortes (exact pattern matching). Der Knuth-Morris-Pratt Algorithmus wurde erstmals 1974 als Institutbericht der Stanford University beschrieben und erschien 1977 in der Fachzeitschrift Journal of Computing unter dem Titel "Fast Pattern Matching in Strings" [Kn77]. Der Algorithmus beschreibt eine Suche in Zeichenketten mit linearer Laufzeit. Der Name des Algorithmus setzt sich aus den Entwicklern des Algorithmus Donald E. Knuth, James H. Morris und Vaughan R. Pratt zusammen.

Content

Ausarbeitung im Rahmen des Seminars Suchmaschinen und Suchalgorithmen, Institut für Wirtschaftsinformatik Praktische Informatik in der Wirtschaft, Westfälische Wilhelms-Universität Münster. - Vgl.: http://www-wi.uni-muenster.de/pi/lehre/ss05/seminarSuchen/Ausarbeitungen/JanAckermann.pdf

Tober, M.; Hennig, L.; Furch, D.: SEO Ranking-Faktoren und Rang-Korrelationen 2014 : Google Deutschland (2014) 0.01

0.007144853 = product of:
  0.042869117 = sum of:
    0.03124264 = weight(_text_:und in 1484) [ClassicSimilarity], result of:
      0.03124264 = score(doc=1484,freq=10.0), product of:
        0.07132241 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.032179873 = queryNorm
        0.438048 = fieldWeight in 1484, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1484)
    0.011626477 = product of:
      0.03487943 = sum of:
        0.03487943 = weight(_text_:22 in 1484) [ClassicSimilarity], result of:
          0.03487943 = score(doc=1484,freq=2.0), product of:
            0.11268844 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.032179873 = queryNorm
            0.30952093 = fieldWeight in 1484, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=1484)
      0.33333334 = coord(1/3)
  0.16666667 = coord(2/12)

Abstract: Dieses Whitepaper beschäftigt sich mit der Definition und Bewertung von Faktoren, die eine hohe Rangkorrelation-Koeffizienz mit organischen Suchergebnissen aufweisen und dient dem Zweck der tieferen Analyse von Suchmaschinen-Algorithmen. Die Datenerhebung samt Auswertung bezieht sich auf Ranking-Faktoren für Google-Deutschland im Jahr 2014. Zusätzlich wurden die Korrelationen und Faktoren unter anderem anhand von Durchschnitts- und Medianwerten sowie Entwicklungstendenzen zu den Vorjahren hinsichtlich ihrer Relevanz für vordere Suchergebnis-Positionen interpretiert.
Date: 13. 9.2014 14:45:22

Pan, M.; Huang, J.X.; He, T.; Mao, Z.; Ying, Z.; Tu, X.: ¬A simple kernel co-occurrence-based enhancement for pseudo-relevance feedback (2020) 0.01

0.0065202955 = product of:
  0.078243546 = sum of:
    0.078243546 = weight(_text_:281 in 5678) [ClassicSimilarity], result of:
      0.078243546 = score(doc=5678,freq=2.0), product of:
        0.21349068 = queryWeight, product of:
          6.634292 = idf(docFreq=157, maxDocs=44218)
          0.032179873 = queryNorm
        0.36649632 = fieldWeight in 5678, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.634292 = idf(docFreq=157, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5678)
  0.083333336 = coord(1/12)

Source: Journal of the Association for Information Science and Technology. 71(2020) no.3, S.264-281

Fuhr, N.: Rankingexperimente mit gewichteter Indexierung (1986) 0.01

0.006399653 = product of:
  0.038397916 = sum of:
    0.0209582 = weight(_text_:und in 2051) [ClassicSimilarity], result of:
      0.0209582 = score(doc=2051,freq=2.0), product of:
        0.07132241 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.032179873 = queryNorm
        0.29385152 = fieldWeight in 2051, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=2051)
    0.017439716 = product of:
      0.052319143 = sum of:
        0.052319143 = weight(_text_:22 in 2051) [ClassicSimilarity], result of:
          0.052319143 = score(doc=2051,freq=2.0), product of:
            0.11268844 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.032179873 = queryNorm
            0.46428138 = fieldWeight in 2051, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=2051)
      0.33333334 = coord(1/3)
  0.16666667 = coord(2/12)

Date: 14. 6.2015 22:12:56
Source: Automatische Indexierung zwischen Forschung und Anwendung, Hrsg.: G. Lustig

Shiri, A.A.; Revie, C.: Query expansion behavior within a thesaurus-enhanced search environment : a user-centered evaluation (2006) 0.01
```
0.005874095 = product of:
  0.03524457 = sum of:
    0.027978022 = weight(_text_:software in 56) [ClassicSimilarity], result of:
      0.027978022 = score(doc=56,freq=2.0), product of:
        0.12766245 = queryWeight, product of:
          3.9671519 = idf(docFreq=2274, maxDocs=44218)
          0.032179873 = queryNorm
        0.21915624 = fieldWeight in 56, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.9671519 = idf(docFreq=2274, maxDocs=44218)
          0.0390625 = fieldNorm(doc=56)
    0.0072665485 = product of:
      0.021799644 = sum of:
        0.021799644 = weight(_text_:22 in 56) [ClassicSimilarity], result of:
          0.021799644 = score(doc=56,freq=2.0), product of:
            0.11268844 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.032179873 = queryNorm
            0.19345059 = fieldWeight in 56, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0390625 = fieldNorm(doc=56)
      0.33333334 = coord(1/3)
  0.16666667 = coord(2/12)
```
Abstract

The study reported here investigated the query expansion behavior of end-users interacting with a thesaurus-enhanced search system on the Web. Two groups, namely academic staff and postgraduate students, were recruited into this study. Data were collected from 90 searches performed by 30 users using the OVID interface to the CAB abstracts database. Data-gathering techniques included questionnaires, screen capturing software, and interviews. The results presented here relate to issues of search-topic and search-term characteristics, number and types of expanded queries, usefulness of thesaurus terms, and behavioral differences between academic staff and postgraduate students in their interaction. The key conclusions drawn were that (a) academic staff chose more narrow and synonymous terms than did postgraduate students, who generally selected broader and related terms; (b) topic complexity affected users' interaction with the thesaurus in that complex topics required more query expansion and search term selection; (c) users' prior topic-search experience appeared to have a significant effect on their selection and evaluation of thesaurus terms; (d) in 50% of the searches where additional terms were suggested from the thesaurus, users stated that they had not been aware of the terms at the beginning of the search; this observation was particularly noticeable in the case of postgraduate students.

Date

22. 7.2006 16:32:43
Mayr, P.: Bradfordizing als Re-Ranking-Ansatz in Literaturinformationssystemen (2011) 0.01
```
0.0057445765 = product of:
  0.03446746 = sum of:
    0.025668446 = weight(_text_:und in 4292) [ClassicSimilarity], result of:
      0.025668446 = score(doc=4292,freq=12.0), product of:
        0.07132241 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.032179873 = queryNorm
        0.35989314 = fieldWeight in 4292, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=4292)
    0.008799011 = product of:
      0.02639703 = sum of:
        0.02639703 = weight(_text_:29 in 4292) [ClassicSimilarity], result of:
          0.02639703 = score(doc=4292,freq=2.0), product of:
            0.113198735 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.032179873 = queryNorm
            0.23319192 = fieldWeight in 4292, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.046875 = fieldNorm(doc=4292)
      0.33333334 = coord(1/3)
  0.16666667 = coord(2/12)
```
Abstract

In diesem Artikel wird ein Re-Ranking-Ansatz für Suchsysteme vorgestellt, der die Recherche nach wissenschaftlicher Literatur messbar verbessern kann. Das nichttextorientierte Rankingverfahren Bradfordizing wird eingeführt und anschließend im empirischen Teil des Artikels bzgl. der Effektivität für typische fachbezogene Recherche-Topics evaluiert. Dem Bradford Law of Scattering (BLS), auf dem Bradfordizing basiert, liegt zugrunde, dass sich die Literatur zu einem beliebigen Fachgebiet bzw. -thema in Zonen unterschiedlicher Dokumentenkonzentration verteilt. Dem Kernbereich mit hoher Konzentration der Literatur folgen Bereiche mit mittlerer und geringer Konzentration. Bradfordizing sortiert bzw. rankt eine Dokumentmenge damit nach den sogenannten Kernzeitschriften. Der Retrievaltest mit 164 intellektuell bewerteten Fragestellungen in Fachdatenbanken aus den Bereichen Sozial- und Politikwissenschaften, Wirtschaftswissenschaften, Psychologie und Medizin zeigt, dass die Dokumente der Kernzeitschriften signifikant häufiger relevant bewertet werden als Dokumente der zweiten Dokumentzone bzw. den Peripherie-Zeitschriften. Die Implementierung von Bradfordizing und weiteren Re-Rankingverfahren liefert unmittelbare Mehrwerte für den Nutzer.

Date

9. 2.2011 17:47:29

Source

Information - Wissenschaft und Praxis. 62(2011) H.1, S.3-10

Hüther, H.: Selix im DFG-Projekt Kascade (1998) 0.01

0.005355031 = product of:
  0.032130186 = sum of:
    0.017465167 = weight(_text_:und in 5151) [ClassicSimilarity], result of:
      0.017465167 = score(doc=5151,freq=2.0), product of:
        0.07132241 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.032179873 = queryNorm
        0.24487628 = fieldWeight in 5151, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=5151)
    0.014665018 = product of:
      0.043995053 = sum of:
        0.043995053 = weight(_text_:29 in 5151) [ClassicSimilarity], result of:
          0.043995053 = score(doc=5151,freq=2.0), product of:
            0.113198735 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.032179873 = queryNorm
            0.38865322 = fieldWeight in 5151, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.078125 = fieldNorm(doc=5151)
      0.33333334 = coord(1/3)
  0.16666667 = coord(2/12)

Date: 25. 8.2000 19:55:29
Source: Knowledge Management und Kommunikationssysteme: Proceedings des 6. Internationalen Symposiums für Informationswissenschaft (ISI '98) Prag, 3.-7. November 1998 / Hochschulverband für Informationswissenschaft (HI) e.V. Konstanz ; Fachrichtung Informationswissenschaft der Universität des Saarlandes, Saarbrücken. Hrsg.: Harald H. Zimmermann u. Volker Schramm

Kanaeva, Z.: Ranking: Google und CiteSeer (2005) 0.01

0.0052247597 = product of:
  0.031348556 = sum of:
    0.021175388 = weight(_text_:und in 3276) [ClassicSimilarity], result of:
      0.021175388 = score(doc=3276,freq=6.0), product of:
        0.07132241 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.032179873 = queryNorm
        0.2968967 = fieldWeight in 3276, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3276)
    0.010173167 = product of:
      0.0305195 = sum of:
        0.0305195 = weight(_text_:22 in 3276) [ClassicSimilarity], result of:
          0.0305195 = score(doc=3276,freq=2.0), product of:
            0.11268844 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.032179873 = queryNorm
            0.2708308 = fieldWeight in 3276, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3276)
      0.33333334 = coord(1/3)
  0.16666667 = coord(2/12)

Abstract: Im Rahmen des klassischen Information Retrieval wurden verschiedene Verfahren für das Ranking sowie die Suche in einer homogenen strukturlosen Dokumentenmenge entwickelt. Die Erfolge der Suchmaschine Google haben gezeigt dass die Suche in einer zwar inhomogenen aber zusammenhängenden Dokumentenmenge wie dem Internet unter Berücksichtigung der Dokumentenverbindungen (Links) sehr effektiv sein kann. Unter den von der Suchmaschine Google realisierten Konzepten ist ein Verfahren zum Ranking von Suchergebnissen (PageRank), das in diesem Artikel kurz erklärt wird. Darüber hinaus wird auf die Konzepte eines Systems namens CiteSeer eingegangen, welches automatisch bibliographische Angaben indexiert (engl. Autonomous Citation Indexing, ACI). Letzteres erzeugt aus einer Menge von nicht vernetzten wissenschaftlichen Dokumenten eine zusammenhängende Dokumentenmenge und ermöglicht den Einsatz von Banking-Verfahren, die auf den von Google genutzten Verfahren basieren.
Date: 20. 3.2005 16:23:22
Source: Information - Wissenschaft und Praxis. 56(2005) H.2, S.87-92

Fuhr, N.: Modelle im Information Retrieval (2023) 0.00
```
0.0044765268 = product of:
  0.026859159 = sum of:
    0.01952665 = weight(_text_:und in 800) [ClassicSimilarity], result of:
      0.01952665 = score(doc=800,freq=10.0), product of:
        0.07132241 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.032179873 = queryNorm
        0.27378 = fieldWeight in 800, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=800)
    0.007332509 = product of:
      0.021997526 = sum of:
        0.021997526 = weight(_text_:29 in 800) [ClassicSimilarity], result of:
          0.021997526 = score(doc=800,freq=2.0), product of:
            0.113198735 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.032179873 = queryNorm
            0.19432661 = fieldWeight in 800, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.0390625 = fieldNorm(doc=800)
      0.33333334 = coord(1/3)
  0.16666667 = coord(2/12)
```
Abstract

Information-Retrieval-Modelle -(IR-Modelle) spezifizieren, wie zu einer gegebenen Anfrage die Antwortdokumente aus einer Dokumentenkollektion bestimmt werden. Ausgangsbasis jedes Modells sind dabei zunächst bestimmte Annahmen über die Wissensrepräsentation (s. Teil B Methoden und Systeme der Inhaltserschließung) von Fragen und Dokumenten. Hier bezeichnen wir die Elemente dieser Repräsentationen als Terme, wobei es aus der Sicht des Modells egal ist, wie diese Terme aus dem Dokument (und analog aus der von Benutzenden eingegebenen Anfrage) abgeleitet werden: Bei Texten werden hierzu häufig computerlinguistische Methoden eingesetzt, aber auch komplexere automatische oder manuelle Erschließungsverfahren können zur Anwendung kommen. Repräsentationen besitzen ferner eine bestimmte Struktur. Ein Dokument wird meist als Menge oder Multimenge von Termen aufgefasst, wobei im zweiten Fall das Mehrfachvorkommen berücksichtigt wird. Diese Dokumentrepräsentation wird wiederum auf eine sogenannte Dokumentbeschreibung abgebildet, in der die einzelnen Terme gewichtet sein können. Im Folgenden unterscheiden wir nur zwischen ungewichteter (Gewicht eines Terms ist entweder 0 oder 1) und gewichteter Indexierung (das Gewicht ist eine nichtnegative reelle Zahl). Analog dazu gibt es eine Fragerepräsentation; legt man eine natürlichsprachige Anfrage zugrunde, so kann man die o. g. Verfahren für Dokumenttexte anwenden. Alternativ werden auch grafische oder formale Anfragesprachen verwendet, wobei aus Sicht der Modelle insbesondere deren logische Struktur (etwa beim Booleschen Retrieval) relevant ist. Die Fragerepräsentation wird dann in eine Fragebeschreibung überführt.

Date

24.11.2022 17:20:29

Source

Grundlagen der Informationswissenschaft. Hrsg.: Rainer Kuhlen, Dirk Lewandowski, Wolfgang Semar und Christa Womser-Hacker. 7., völlig neu gefasste Ausg

Chakrabarti, S.; Dom, B.; Kumar, S.R.; Raghavan, P.; Rajagopalan, S.; Tomkins, A.; Kleinberg, J.M.; Gibson, D.: Neue Pfade durch den Internet-Dschungel : Die zweite Generation von Web-Suchmaschinen (1999) 0.00

0.0042840247 = product of:
  0.025704147 = sum of:
    0.013972133 = weight(_text_:und in 3) [ClassicSimilarity], result of:
      0.013972133 = score(doc=3,freq=2.0), product of:
        0.07132241 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.032179873 = queryNorm
        0.19590102 = fieldWeight in 3, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=3)
    0.011732014 = product of:
      0.03519604 = sum of:
        0.03519604 = weight(_text_:29 in 3) [ClassicSimilarity], result of:
          0.03519604 = score(doc=3,freq=2.0), product of:
            0.113198735 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.032179873 = queryNorm
            0.31092256 = fieldWeight in 3, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.0625 = fieldNorm(doc=3)
      0.33333334 = coord(1/3)
  0.16666667 = coord(2/12)

Content: Ausnutzen der Hyperlinks für verbesserte Such- und Findeverfahren; Darstellung des HITS-Algorithmus
Date: 31.12.1996 19:29:41

Maylein, L.; Langenstein, A.: Neues vom Relevanz-Ranking im HEIDI-Katalog der Universitätsbibliothek Heidelberg : Perspektiven für bibliothekarische Dienstleistungen (2013) 0.00

0.0042840247 = product of:
  0.025704147 = sum of:
    0.013972133 = weight(_text_:und in 775) [ClassicSimilarity], result of:
      0.013972133 = score(doc=775,freq=2.0), product of:
        0.07132241 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.032179873 = queryNorm
        0.19590102 = fieldWeight in 775, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=775)
    0.011732014 = product of:
      0.03519604 = sum of:
        0.03519604 = weight(_text_:29 in 775) [ClassicSimilarity], result of:
          0.03519604 = score(doc=775,freq=2.0), product of:
            0.113198735 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.032179873 = queryNorm
            0.31092256 = fieldWeight in 775, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.0625 = fieldNorm(doc=775)
      0.33333334 = coord(1/3)
  0.16666667 = coord(2/12)

Abstract: Das Relevanz-Ranking im Katalog der Universitätsbibliothek Heidelberg HEIDI, bereits 2009 in einem Beitrag in dieser Zeitschrift beschrieben, wurde in den letzten Jahren durch neue Entwicklungen und Methoden stark verbessert. Der Aufsatz beschreibt die Realisierung der bisherigen Rankingmaßnahmen unter der neu eingesetzten Suchmaschinenplattform SOLR. Weiter werden verschiedene neue Möglichkeiten für Rankinganpassungen unter SOLR sowie deren Einsatz im HEIDI-Katalog dargestellt.
Date: 29. 6.2013 18:06:23

Search (99 results, page 1 of 5)

Authors

Years

Languages

Types

Themes

Subjects

Classifications