Search (331 results, page 1 of 17)

Klas, C.-P.; Fuhr, N.; Schaefer, A.: Evaluating strategic support for information access in the DAFFODIL system (2004) 0.03

0.03318806 = product of:
  0.14602746 = sum of:
    0.057089545 = weight(_text_:lecture in 2419) [ClassicSimilarity], result of:
      0.057089545 = score(doc=2419,freq=2.0), product of:
        0.13308205 = queryWeight, product of:
          6.4711404 = idf(docFreq=185, maxDocs=44218)
          0.02056547 = queryNorm
        0.42898005 = fieldWeight in 2419, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.4711404 = idf(docFreq=185, maxDocs=44218)
          0.046875 = fieldNorm(doc=2419)
    0.038912293 = weight(_text_:notes in 2419) [ClassicSimilarity], result of:
      0.038912293 = score(doc=2419,freq=2.0), product of:
        0.10987139 = queryWeight, product of:
          5.3425174 = idf(docFreq=574, maxDocs=44218)
          0.02056547 = queryNorm
        0.35416222 = fieldWeight in 2419, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.3425174 = idf(docFreq=574, maxDocs=44218)
          0.046875 = fieldNorm(doc=2419)
    0.005640535 = weight(_text_:in in 2419) [ClassicSimilarity], result of:
      0.005640535 = score(doc=2419,freq=10.0), product of:
        0.027974274 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02056547 = queryNorm
        0.20163295 = fieldWeight in 2419, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=2419)
    0.018207615 = weight(_text_:computer in 2419) [ClassicSimilarity], result of:
      0.018207615 = score(doc=2419,freq=2.0), product of:
        0.0751567 = queryWeight, product of:
          3.6545093 = idf(docFreq=3109, maxDocs=44218)
          0.02056547 = queryNorm
        0.24226204 = fieldWeight in 2419, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.6545093 = idf(docFreq=3109, maxDocs=44218)
          0.046875 = fieldNorm(doc=2419)
    0.026177472 = sum of:
      0.009459447 = weight(_text_:science in 2419) [ClassicSimilarity], result of:
        0.009459447 = score(doc=2419,freq=2.0), product of:
          0.0541719 = queryWeight, product of:
            2.6341193 = idf(docFreq=8627, maxDocs=44218)
            0.02056547 = queryNorm
          0.17461908 = fieldWeight in 2419, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            2.6341193 = idf(docFreq=8627, maxDocs=44218)
            0.046875 = fieldNorm(doc=2419)
      0.016718024 = weight(_text_:22 in 2419) [ClassicSimilarity], result of:
        0.016718024 = score(doc=2419,freq=2.0), product of:
          0.072016776 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.02056547 = queryNorm
          0.23214069 = fieldWeight in 2419, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.046875 = fieldNorm(doc=2419)
  0.22727273 = coord(5/22)

Abstract: The digital library system Daffodil is targeted at strategic support of users during the information search process. For searching, exploring and managing digital library objects it provides user-customisable information seeking patterns over a federation of heterogeneous digital libraries. In this paper evaluation results with respect to retrieval effectiveness, efficiency and user satisfaction are presented. The analysis focuses on strategic support for the scientific work-flow. Daffodil supports the whole work-flow, from data source selection over information seeking to the representation, organisation and reuse of information. By embedding high level search functionality into the scientific work-flow, the user experiences better strategic system support due to a more systematic work process. These ideas have been implemented in Daffodil followed by a qualitative evaluation. The evaluation has been conducted with 28 participants, ranging from information seeking novices to experts. The results are promising, as they support the chosen model.
Date: 16.11.2008 16:22:48
Series: Lecture notes in computer science; vol.3232
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Berry, M.W.; Browne, M.: Understanding search engines : mathematical modeling and text retrieval (1999) 0.03

0.030253885 = product of:
  0.11093091 = sum of:
    0.05019627 = weight(_text_:informatik in 5777) [ClassicSimilarity], result of:
      0.05019627 = score(doc=5777,freq=4.0), product of:
        0.104934774 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.02056547 = queryNorm
        0.4783569 = fieldWeight in 5777, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.046875 = fieldNorm(doc=5777)
    0.009470944 = weight(_text_:und in 5777) [ClassicSimilarity], result of:
      0.009470944 = score(doc=5777,freq=4.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.20778441 = fieldWeight in 5777, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5777)
    0.009470944 = weight(_text_:und in 5777) [ClassicSimilarity], result of:
      0.009470944 = score(doc=5777,freq=4.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.20778441 = fieldWeight in 5777, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5777)
    0.0035673876 = weight(_text_:in in 5777) [ClassicSimilarity], result of:
      0.0035673876 = score(doc=5777,freq=4.0), product of:
        0.027974274 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02056547 = queryNorm
        0.12752387 = fieldWeight in 5777, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=5777)
    0.031536516 = weight(_text_:computer in 5777) [ClassicSimilarity], result of:
      0.031536516 = score(doc=5777,freq=6.0), product of:
        0.0751567 = queryWeight, product of:
          3.6545093 = idf(docFreq=3109, maxDocs=44218)
          0.02056547 = queryNorm
        0.41961014 = fieldWeight in 5777, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          3.6545093 = idf(docFreq=3109, maxDocs=44218)
          0.046875 = fieldNorm(doc=5777)
    0.00668884 = product of:
      0.01337768 = sum of:
        0.01337768 = weight(_text_:science in 5777) [ClassicSimilarity], result of:
          0.01337768 = score(doc=5777,freq=4.0), product of:
            0.0541719 = queryWeight, product of:
              2.6341193 = idf(docFreq=8627, maxDocs=44218)
              0.02056547 = queryNorm
            0.24694869 = fieldWeight in 5777, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              2.6341193 = idf(docFreq=8627, maxDocs=44218)
              0.046875 = fieldNorm(doc=5777)
      0.5 = coord(1/2)
  0.27272728 = coord(6/22)

Abstract: This book discusses many of the key design issues for building search engines and emphazises the important role that applied mathematics can play in improving information retrieval. The authors discuss not only important data structures, algorithms, and software but also user-centered issues such as interfaces, manual indexing, and document preparation. They also present some of the current problems in information retrieval that many not be familiar to applied mathematicians and computer scientists and some of the driving computational methods (SVD, SDD) for automated conceptual indexing
Classification: ST 230 [Informatik # Monographien # Software und -entwicklung # Software allgemein, (Einführung, Lehrbücher, Methoden der Programmierung) Software engineering, Programmentwicklungssysteme, Softwarewerkzeuge]
LCSH: Text processing (Computer science)
RVK: ST 230 [Informatik # Monographien # Software und -entwicklung # Software allgemein, (Einführung, Lehrbücher, Methoden der Programmierung) Software engineering, Programmentwicklungssysteme, Softwarewerkzeuge]
Subject: Text processing (Computer science)

Schaefer, A.; Jordan, M.; Klas, C.-P.; Fuhr, N.: Active support for query formulation in virtual digital libraries : a case study with DAFFODIL (2005) 0.02

0.023594644 = product of:
  0.10381643 = sum of:
    0.047574617 = weight(_text_:lecture in 4296) [ClassicSimilarity], result of:
      0.047574617 = score(doc=4296,freq=2.0), product of:
        0.13308205 = queryWeight, product of:
          6.4711404 = idf(docFreq=185, maxDocs=44218)
          0.02056547 = queryNorm
        0.35748336 = fieldWeight in 4296, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.4711404 = idf(docFreq=185, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4296)
    0.032426912 = weight(_text_:notes in 4296) [ClassicSimilarity], result of:
      0.032426912 = score(doc=4296,freq=2.0), product of:
        0.10987139 = queryWeight, product of:
          5.3425174 = idf(docFreq=574, maxDocs=44218)
          0.02056547 = queryNorm
        0.29513517 = fieldWeight in 4296, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.3425174 = idf(docFreq=574, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4296)
    0.004700446 = weight(_text_:in in 4296) [ClassicSimilarity], result of:
      0.004700446 = score(doc=4296,freq=10.0), product of:
        0.027974274 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02056547 = queryNorm
        0.16802745 = fieldWeight in 4296, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4296)
    0.015173013 = weight(_text_:computer in 4296) [ClassicSimilarity], result of:
      0.015173013 = score(doc=4296,freq=2.0), product of:
        0.0751567 = queryWeight, product of:
          3.6545093 = idf(docFreq=3109, maxDocs=44218)
          0.02056547 = queryNorm
        0.20188503 = fieldWeight in 4296, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.6545093 = idf(docFreq=3109, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4296)
    0.0039414368 = product of:
      0.0078828735 = sum of:
        0.0078828735 = weight(_text_:science in 4296) [ClassicSimilarity], result of:
          0.0078828735 = score(doc=4296,freq=2.0), product of:
            0.0541719 = queryWeight, product of:
              2.6341193 = idf(docFreq=8627, maxDocs=44218)
              0.02056547 = queryNorm
            0.1455159 = fieldWeight in 4296, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.6341193 = idf(docFreq=8627, maxDocs=44218)
              0.0390625 = fieldNorm(doc=4296)
      0.5 = coord(1/2)
  0.22727273 = coord(5/22)

Abstract: Daffodil is a front-end to federated, heterogeneous digital libraries targeting at strategic support of users during the information seeking process. This is done by offering a variety of functions for searching, exploring and managing digital library objects. However, the distributed search increases response time and the conceptual model of the underlying search processes is inherently weaker. This makes query formulation harder and the resulting waiting times can be frustrating. In this paper, we investigate the concept of proactive support during the user's query formulation. For improving user efficiency and satisfaction, we implemented annotations, proactive support and error markers on the query form itself. These functions decrease the probability for syntactical or semantical errors in queries. Furthermore, the user is able to make better tactical decisions and feels more confident that the system handles the query properly. Evaluations with 30 subjects showed that user satisfaction is improved, whereas no conclusive results were received for efficiency.
Series: Lecture notes in computer science ; 3652
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Ziegler, B.: ESS: ein schneller Algorithmus zur Mustersuche in Zeichenfolgen (1996) 0.02

0.021810552 = product of:
  0.119958036 = sum of:
    0.082819626 = weight(_text_:informatik in 7543) [ClassicSimilarity], result of:
      0.082819626 = score(doc=7543,freq=2.0), product of:
        0.104934774 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.02056547 = queryNorm
        0.7892486 = fieldWeight in 7543, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.109375 = fieldNorm(doc=7543)
    0.015626261 = weight(_text_:und in 7543) [ClassicSimilarity], result of:
      0.015626261 = score(doc=7543,freq=2.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.34282678 = fieldWeight in 7543, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.109375 = fieldNorm(doc=7543)
    0.015626261 = weight(_text_:und in 7543) [ClassicSimilarity], result of:
      0.015626261 = score(doc=7543,freq=2.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.34282678 = fieldWeight in 7543, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.109375 = fieldNorm(doc=7543)
    0.0058858884 = weight(_text_:in in 7543) [ClassicSimilarity], result of:
      0.0058858884 = score(doc=7543,freq=2.0), product of:
        0.027974274 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02056547 = queryNorm
        0.21040362 = fieldWeight in 7543, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.109375 = fieldNorm(doc=7543)
  0.18181819 = coord(4/22)

Source: Informatik: Forschung und Entwicklung. 11(1996) no.2, S.69-83

Hoenkamp, E.; Bruza, P.D.; Song, D.; Huang, Q.: ¬An effective approach to verbose queries using a limited dependencies language model (2009) 0.02

0.019032296 = product of:
  0.0837421 = sum of:
    0.038059693 = weight(_text_:lecture in 2122) [ClassicSimilarity], result of:
      0.038059693 = score(doc=2122,freq=2.0), product of:
        0.13308205 = queryWeight, product of:
          6.4711404 = idf(docFreq=185, maxDocs=44218)
          0.02056547 = queryNorm
        0.2859867 = fieldWeight in 2122, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.4711404 = idf(docFreq=185, maxDocs=44218)
          0.03125 = fieldNorm(doc=2122)
    0.025941528 = weight(_text_:notes in 2122) [ClassicSimilarity], result of:
      0.025941528 = score(doc=2122,freq=2.0), product of:
        0.10987139 = queryWeight, product of:
          5.3425174 = idf(docFreq=574, maxDocs=44218)
          0.02056547 = queryNorm
        0.23610814 = fieldWeight in 2122, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.3425174 = idf(docFreq=574, maxDocs=44218)
          0.03125 = fieldNorm(doc=2122)
    0.004449314 = weight(_text_:in in 2122) [ClassicSimilarity], result of:
      0.004449314 = score(doc=2122,freq=14.0), product of:
        0.027974274 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02056547 = queryNorm
        0.15905021 = fieldWeight in 2122, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.03125 = fieldNorm(doc=2122)
    0.0121384105 = weight(_text_:computer in 2122) [ClassicSimilarity], result of:
      0.0121384105 = score(doc=2122,freq=2.0), product of:
        0.0751567 = queryWeight, product of:
          3.6545093 = idf(docFreq=3109, maxDocs=44218)
          0.02056547 = queryNorm
        0.16150802 = fieldWeight in 2122, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.6545093 = idf(docFreq=3109, maxDocs=44218)
          0.03125 = fieldNorm(doc=2122)
    0.0031531493 = product of:
      0.0063062985 = sum of:
        0.0063062985 = weight(_text_:science in 2122) [ClassicSimilarity], result of:
          0.0063062985 = score(doc=2122,freq=2.0), product of:
            0.0541719 = queryWeight, product of:
              2.6341193 = idf(docFreq=8627, maxDocs=44218)
              0.02056547 = queryNorm
            0.11641272 = fieldWeight in 2122, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.6341193 = idf(docFreq=8627, maxDocs=44218)
              0.03125 = fieldNorm(doc=2122)
      0.5 = coord(1/2)
  0.22727273 = coord(5/22)

Abstract: Intuitively, any 'bag of words' approach in IR should benefit from taking term dependencies into account. Unfortunately, for years the results of exploiting such dependencies have been mixed or inconclusive. To improve the situation, this paper shows how the natural language properties of the target documents can be used to transform and enrich the term dependencies to more useful statistics. This is done in three steps. The term co-occurrence statistics of queries and documents are each represented by a Markov chain. The paper proves that such a chain is ergodic, and therefore its asymptotic behavior is unique, stationary, and independent of the initial state. Next, the stationary distribution is taken to model queries and documents, rather than their initial distributions. Finally, ranking is achieved following the customary language modeling paradigm. The main contribution of this paper is to argue why the asymptotic behavior of the document model is a better representation then just the document's initial distribution. A secondary contribution is to investigate the practical application of this representation in case the queries become increasingly verbose. In the experiments (based on Lemur's search engine substrate) the default query model was replaced by the stable distribution of the query. Just modeling the query this way already resulted in significant improvements over a standard language model baseline. The results were on a par or better than more sophisticated algorithms that use fine-tuned parameters or extensive training. Moreover, the more verbose the query, the more effective the approach seems to become.
Series: Lecture notes in computer science : advances in information retrieval theory; 5766

Dominich, S.: Mathematical foundations of information retrieval (2001) 0.02

0.017325914 = product of:
  0.09529252 = sum of:
    0.04183023 = weight(_text_:informatik in 1753) [ClassicSimilarity], result of:
      0.04183023 = score(doc=1753,freq=4.0), product of:
        0.104934774 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.02056547 = queryNorm
        0.39863077 = fieldWeight in 1753, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1753)
    0.0021021033 = weight(_text_:in in 1753) [ClassicSimilarity], result of:
      0.0021021033 = score(doc=1753,freq=2.0), product of:
        0.027974274 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02056547 = queryNorm
        0.07514416 = fieldWeight in 1753, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1753)
    0.02628043 = weight(_text_:computer in 1753) [ClassicSimilarity], result of:
      0.02628043 = score(doc=1753,freq=6.0), product of:
        0.0751567 = queryWeight, product of:
          3.6545093 = idf(docFreq=3109, maxDocs=44218)
          0.02056547 = queryNorm
        0.34967512 = fieldWeight in 1753, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          3.6545093 = idf(docFreq=3109, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1753)
    0.025079753 = sum of:
      0.011148066 = weight(_text_:science in 1753) [ClassicSimilarity], result of:
        0.011148066 = score(doc=1753,freq=4.0), product of:
          0.0541719 = queryWeight, product of:
            2.6341193 = idf(docFreq=8627, maxDocs=44218)
            0.02056547 = queryNorm
          0.20579056 = fieldWeight in 1753, product of:
            2.0 = tf(freq=4.0), with freq of:
              4.0 = termFreq=4.0
            2.6341193 = idf(docFreq=8627, maxDocs=44218)
            0.0390625 = fieldNorm(doc=1753)
      0.013931687 = weight(_text_:22 in 1753) [ClassicSimilarity], result of:
        0.013931687 = score(doc=1753,freq=2.0), product of:
          0.072016776 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.02056547 = queryNorm
          0.19345059 = fieldWeight in 1753, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.0390625 = fieldNorm(doc=1753)
  0.18181819 = coord(4/22)

Abstract: This book offers a comprehensive and consistent mathematical approach to information retrieval (IR) without which no implementation is possible, and sheds an entirely new light upon the structure of IR models. It contains the descriptions of all IR models in a unified formal style and language, along with examples for each, thus offering a comprehensive overview of them. The book also creates mathematical foundations and a consistent mathematical theory (including all mathematical results achieved so far) of IR as a stand-alone mathematical discipline, which thus can be read and taught independently. Also, the book contains all necessary mathematical knowledge on which IR relies, to help the reader avoid searching different sources. The book will be of interest to computer or information scientists, librarians, mathematicians, undergraduate students and researchers whose work involves information retrieval.
BK: 54.10 Theoretische Informatik
Classification: 54.10 Theoretische Informatik
Date: 22. 3.2008 12:26:32
LCSH: Computer science / Mathematics
Subject: Computer science / Mathematics

Fichtner, K.: Boyer-Moore Suchalgorithmus (2005) 0.01

0.013335907 = product of:
  0.07334749 = sum of:
    0.035494123 = weight(_text_:informatik in 864) [ClassicSimilarity], result of:
      0.035494123 = score(doc=864,freq=2.0), product of:
        0.104934774 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.02056547 = queryNorm
        0.3382494 = fieldWeight in 864, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.046875 = fieldNorm(doc=864)
    0.016404156 = weight(_text_:und in 864) [ClassicSimilarity], result of:
      0.016404156 = score(doc=864,freq=12.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.35989314 = fieldWeight in 864, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=864)
    0.016404156 = weight(_text_:und in 864) [ClassicSimilarity], result of:
      0.016404156 = score(doc=864,freq=12.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.35989314 = fieldWeight in 864, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=864)
    0.0050450475 = weight(_text_:in in 864) [ClassicSimilarity], result of:
      0.0050450475 = score(doc=864,freq=8.0), product of:
        0.027974274 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02056547 = queryNorm
        0.18034597 = fieldWeight in 864, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=864)
  0.18181819 = coord(4/22)

Abstract: Die Masse der Suchalgorithmen lässt sich in zwei grundlegend verschiedene Teilbereiche untergliedern. Auf der einen Seite stehen Algorithmen, die auf komplexen Datenstrukturen (häufig baumartig) ganze Datensätze unter Verwendung eines Indizes finden. Als geläufiger Vertreter sei hier die binäre Suche auf sortierten Arrays oder in binären Bäumen genannt. Die andere Gruppe, der sich diese Ausarbeitung widmet, dient dazu, Entsprechungen von Mustern in gegebenen Zeichenketten zu finden. Auf den folgenden Seiten werden nun zunächst einige Begriffe eingeführt, die für das weitere Verständnis und einen Vergleich verschiedener Suchalgorithmen nötig sind. Weiterhin wird ein naiver Suchalgorithmus dargestellt und mit der Idee von Boyer und Moore verglichen. Hierzu wird ihr Algorithmus zunächst informal beschrieben, dann mit Blick auf eine Implementation näher erläutert und anschließend einer Effizienzanalyse - sowohl empirisch als auch theoretisch - unterzogen. Abschließend findet eine kurze Bewertung mit Bezug auf Schwachstellen, Vorzüge und Verbesserungsmöglichkeiten statt, im Zuge derer einige prominente Modifikationen des Boyer-Moore Algorithmus vorgestellt werden.
Content: Ausarbeitung im Rahmen des Seminars Suchmaschinen und Suchalgorithmen, Institut für Wirtschaftsinformatik Praktische Informatik in der Wirtschaft, Westfälische Wilhelms-Universität Münster. - Vgl.: http://www-wi.uni-muenster.de/pi/lehre/ss05/seminarSuchen/Ausarbeitungen/KristoferFichtner.pdf

Marcus, S.: Textvergleich mit mehreren Mustern (2005) 0.01

0.011438524 = product of:
  0.050329506 = sum of:
    0.02366275 = weight(_text_:informatik in 862) [ClassicSimilarity], result of:
      0.02366275 = score(doc=862,freq=2.0), product of:
        0.104934774 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.02056547 = queryNorm
        0.2254996 = fieldWeight in 862, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.03125 = fieldNorm(doc=862)
    0.0077329935 = weight(_text_:und in 862) [ClassicSimilarity], result of:
      0.0077329935 = score(doc=862,freq=6.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.16965526 = fieldWeight in 862, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=862)
    0.0077329935 = weight(_text_:und in 862) [ClassicSimilarity], result of:
      0.0077329935 = score(doc=862,freq=6.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.16965526 = fieldWeight in 862, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=862)
    0.0056232596 = product of:
      0.011246519 = sum of:
        0.011246519 = weight(_text_:29 in 862) [ClassicSimilarity], result of:
          0.011246519 = score(doc=862,freq=2.0), product of:
            0.072342895 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.02056547 = queryNorm
            0.15546128 = fieldWeight in 862, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.03125 = fieldNorm(doc=862)
      0.5 = coord(1/2)
    0.00557751 = weight(_text_:in in 862) [ClassicSimilarity], result of:
      0.00557751 = score(doc=862,freq=22.0), product of:
        0.027974274 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02056547 = queryNorm
        0.19937998 = fieldWeight in 862, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.03125 = fieldNorm(doc=862)
  0.22727273 = coord(5/22)

Abstract: Das Gebiet des Pattern-Matching besitzt in vielen wissenschaftlichen Bereichen eine hohe Relevanz. Aufgrund unterschiedlicher Einsatzgebiete sind auch Umsetzung und Anwendung des Pattern-Matching sehr verschieden. Die allen Anwendungen des Pattern-Matching inhärente Aufgabe besteht darin, in einer Vielzahl von Eingabedaten bestimmte Muster wieder zu erkennen. Dies ist auch der deutschen Bezeichnung Mustererkennung zu entnehmen. In der Medizin findet Pattern-Matching zum Beispiel bei der Untersuchung von Chromosomensträngen auf bestimmte Folgen von Chromosomen Verwendung. Auf dem Gebiet der Bildverarbeitung können mit Hilfe des Pattern-Matching ganze Bilder verglichen oder einzelne Bildpunkte betrachtet werden, die durch ein Muster identifizierbar sind. Ein weiteres Einsatzgebiet des Pattern-Matching ist das Information-Retrieval, bei dem in gespeicherten Daten nach relevanten Informationen gesucht wird. Die Relevanz der zu suchenden Daten wird auch hier anhand eines Musters, zum Beispiel einem bestimmten Schlagwort, beurteilt. Ein vergleichbares Verfahren findet auch im Internet Anwendung. Internet-Benutzer, die mittels einer Suchmaschine nach bedeutsamen Informationen suchen, erhalten diese durch den Einsatz eines Pattern-Matching-Automaten. Die in diesem Zusammenhang an den Pattern-Matching-Automaten gestellten Anforderungen variieren mit der Suchanfrage, die an eine Suchmaschine gestellt wird. Eine solche Suchanfrage kann im einfachsten Fall aus genau einem Schlüsselwort bestehen. Im komplexeren Fall enthält die Anfrage mehrere Schlüsselwörter. Dabei muss für eine erfolgreiche Suche eine Konkatenation der in der Anfrage enthaltenen Wörter erfolgen. Zu Beginn dieser Arbeit wird in Kapitel 2 eine umfassende Einführung in die Thematik des Textvergleichs gegeben, wobei die Definition einiger grundlegender Begriffe vorgenommen wird. Anschließend werden in Kapitel 3 Verfahren zum Textvergleich mit mehreren Mustern vorgestellt. Dabei wird zunächst ein einfaches Vorgehen erläutert, um einen Einsteig in das Thema des Textvergleichs mit mehreren Mustern zu erleichtern. Danach wird eine komplexe Methode des Textvergleichs vorgestellt und anhand von Beispielen verdeutlicht.
Content: Ausarbeitung im Rahmen des Seminars Suchmaschinen und Suchalgorithmen, Institut für Wirtschaftsinformatik Praktische Informatik in der Wirtschaft, Westfälische Wilhelms-Universität Münster. - Vgl.: http://www-wi.uni-muenster.de/pi/lehre/ss05/seminarSuchen/Ausarbeitungen/SandraMarcus.pdf
Date: 13. 2.2007 20:56:29

0.011409136 = product of:
  0.06275024 = sum of:
    0.029578438 = weight(_text_:informatik in 868) [ClassicSimilarity], result of:
      0.029578438 = score(doc=868,freq=2.0), product of:
        0.104934774 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.02056547 = queryNorm
        0.2818745 = fieldWeight in 868, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.0390625 = fieldNorm(doc=868)
    0.014765427 = weight(_text_:und in 868) [ClassicSimilarity], result of:
      0.014765427 = score(doc=868,freq=14.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.32394084 = fieldWeight in 868, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=868)
    0.014765427 = weight(_text_:und in 868) [ClassicSimilarity], result of:
      0.014765427 = score(doc=868,freq=14.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.32394084 = fieldWeight in 868, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=868)
    0.00364095 = weight(_text_:in in 868) [ClassicSimilarity], result of:
      0.00364095 = score(doc=868,freq=6.0), product of:
        0.027974274 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02056547 = queryNorm
        0.1301535 = fieldWeight in 868, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=868)
  0.18181819 = coord(4/22)

Abstract: Die Link-Struktur-Analyse (LSA) ist nicht nur beim Crawling, dem Webseitenranking, der Abgrenzung geographischer Bereiche, der Vorhersage von Linkverwendungen, dem Auffinden von "Mirror"-Seiten, dem Kategorisieren von Webseiten und beim Generieren von Webseitenstatistiken eines der wichtigsten Analyseverfahren, sondern auch bei der Suche nach verwandten Seiten. Um qualitativ hochwertige verwandte Seiten zu finden, bildet sie nach herrschender Meinung den Hauptbestandteil bei der Identifizierung von ähnlichen Seiten innerhalb themenspezifischer Graphen vernetzter Dokumente. Dabei wird stets von zwei Annahmen ausgegangen: Links zwischen zwei Dokumenten implizieren einen verwandten Inhalt beider Dokumente und wenn die Dokumente aus unterschiedlichen Quellen (von unterschiedlichen Autoren, Hosts, Domänen, .) stammen, so bedeutet dies das eine Quelle die andere über einen Link empfiehlt. Aufbauend auf dieser Idee entwickelte Kleinberg 1998 den HITS Algorithmus um verwandte Seiten über die Link-Struktur-Analyse zu bestimmen. Dieser Ansatz wurde von Bharat und Henzinger weiterentwickelt und später auch in Algorithmen wie dem Companion und Cocitation Algorithmus zur Suche von verwandten Seiten basierend auf nur einer Anfrage-URL weiter verfolgt. In der vorliegenden Seminararbeit sollen dabei die Algorithmen, die hinter diesen Überlegungen stehen, näher erläutert werden und im Anschluss jeweils neuere Forschungsansätze auf diesem Themengebiet aufgezeigt werden.
Content: Ausarbeitung im Rahmen des Seminars Suchmaschinen und Suchalgorithmen, Institut für Wirtschaftsinformatik Praktische Informatik in der Wirtschaft, Westfälische Wilhelms-Universität Münster. - Vgl.: http://www-wi.uni-muenster.de/pi/lehre/ss05/seminarSuchen/Ausarbeitungen/BurkhardWei%DF.pdf

Effektive Information Retrieval Verfahren in Theorie und Praxis : ausgewählte und erweiterte Beiträge des Vierten Hildesheimer Evaluierungs- und Retrievalworkshop (HIER 2005), Hildesheim, 20.7.2005 (2006) 0.01
```
0.010194838 = product of:
  0.05607161 = sum of:
    0.016732091 = weight(_text_:informatik in 5973) [ClassicSimilarity], result of:
      0.016732091 = score(doc=5973,freq=4.0), product of:
        0.104934774 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.02056547 = queryNorm
        0.1594523 = fieldWeight in 5973, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    0.0172915 = weight(_text_:und in 5973) [ClassicSimilarity], result of:
      0.0172915 = score(doc=5973,freq=120.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.3793607 = fieldWeight in 5973, product of:
          10.954452 = tf(freq=120.0), with freq of:
            120.0 = termFreq=120.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    0.0172915 = weight(_text_:und in 5973) [ClassicSimilarity], result of:
      0.0172915 = score(doc=5973,freq=120.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.3793607 = fieldWeight in 5973, product of:
          10.954452 = tf(freq=120.0), with freq of:
            120.0 = termFreq=120.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
    0.004756517 = weight(_text_:in in 5973) [ClassicSimilarity], result of:
      0.004756517 = score(doc=5973,freq=64.0), product of:
        0.027974274 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02056547 = queryNorm
        0.17003182 = fieldWeight in 5973, product of:
          8.0 = tf(freq=64.0), with freq of:
            64.0 = termFreq=64.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.015625 = fieldNorm(doc=5973)
  0.18181819 = coord(4/22)
```
Abstract

Information Retrieval hat sich zu einer Schlüsseltechnologie in der Wissensgesellschaft entwickelt. Die Anzahl der täglichen Anfragen an Internet-Suchmaschinen bildet nur einen Indikator für die große Bedeutung dieses Themas. Der Sammelbandband informiert über Themen wie Information Retrieval-Grundlagen, Retrieval Systeme, Digitale Bibliotheken, Evaluierung und Multilinguale Systeme, beschreibt Anwendungsszenarien und setzt sich mit neuen Herausforderungen an das Information Retrieval auseinander. Die Beiträge behandeln aktuelle Themen und neue Herausforderungen an das Information Retrieval. Die intensive Beteiligung der Informationswissenschaft der Universität Hildesheim am Cross Language Evaluation Forum (CLEF), einer europäischen Evaluierungsinitiative zur Erforschung mehrsprachiger Retrieval Systeme, berührt mehrere der Beiträge. Ebenso spielen Anwendungsszenarien und die Auseinandersetzung mit aktuellen und praktischen Fragestellungen eine große Rolle.

Content

Inhalt: Jan-Hendrik Scheufen: RECOIN: Modell offener Schnittstellen für Information-Retrieval-Systeme und -Komponenten Markus Nick, Klaus-Dieter Althoff: Designing Maintainable Experience-based Information Systems Gesine Quint, Steffen Weichert: Die benutzerzentrierte Entwicklung des Produkt- Retrieval-Systems EIKON der Blaupunkt GmbH Claus-Peter Klas, Sascha Kriewel, André Schaefer, Gudrun Fischer: Das DAFFODIL System - Strategische Literaturrecherche in Digitalen Bibliotheken Matthias Meiert: Entwicklung eines Modells zur Integration digitaler Dokumente in die Universitätsbibliothek Hildesheim Daniel Harbig, René Schneider: Ontology Learning im Rahmen von MyShelf Michael Kluck, Marco Winter: Topic-Entwicklung und Relevanzbewertung bei GIRT: ein Werkstattbericht Thomas Mandl: Neue Entwicklungen bei den Evaluierungsinitiativen im Information Retrieval Joachim Pfister: Clustering von Patent-Dokumenten am Beispiel der Datenbanken des Fachinformationszentrums Karlsruhe Ralph Kölle, Glenn Langemeier, Wolfgang Semar: Programmieren lernen in kollaborativen Lernumgebungen Olga Tartakovski, Margaryta Shramko: Implementierung eines Werkzeugs zur Sprachidentifikation in mono- und multilingualen Texten Nina Kummer: Indexierungstechniken für das japanische Retrieval Suriya Na Nhongkai, Hans-Joachim Bentz: Bilinguale Suche mittels Konzeptnetzen Robert Strötgen, Thomas Mandl, René Schneider: Entwicklung und Evaluierung eines Question Answering Systems im Rahmen des Cross Language Evaluation Forum (CLEF) Niels Jensen: Evaluierung von mehrsprachigem Web-Retrieval: Experimente mit dem EuroGOV-Korpus im Rahmen des Cross Language Evaluation Forum (CLEF)

Footnote

Rez. in: Information - Wissenschaft und Praxis 57(2006) H.5, S.290-291 (C. Schindler): "Weniger als ein Jahr nach dem "Vierten Hildesheimer Evaluierungs- und Retrievalworkshop" (HIER 2005) im Juli 2005 ist der dazugehörige Tagungsband erschienen. Eingeladen hatte die Hildesheimer Informationswissenschaft um ihre Forschungsergebnisse und die einiger externer Experten zum Thema Information Retrieval einem Fachpublikum zu präsentieren und zur Diskussion zu stellen. Unter dem Titel "Effektive Information Retrieval Verfahren in Theorie und Praxis" sind nahezu sämtliche Beiträge des Workshops in dem nun erschienenen, 15 Beiträge umfassenden Band gesammelt. Mit dem Schwerpunkt Information Retrieval (IR) wird ein Teilgebiet der Informationswissenschaft vorgestellt, das schon immer im Zentrum informationswissenschaftlicher Forschung steht. Ob durch den Leistungsanstieg von Prozessoren und Speichermedien, durch die Verbreitung des Internet über nationale Grenzen hinweg oder durch den stetigen Anstieg der Wissensproduktion, festzuhalten ist, dass in einer zunehmend wechselseitig vernetzten Welt die Orientierung und das Auffinden von Dokumenten in großen Wissensbeständen zu einer zentralen Herausforderung geworden sind. Aktuelle Verfahrensweisen zu diesem Thema, dem Information Retrieval, präsentiert der neue Band anhand von praxisbezogenen Projekten und theoretischen Diskussionen. Das Kernthema Information Retrieval wird in dem Sammelband in die Bereiche Retrieval-Systeme, Digitale Bibliothek, Evaluierung und Multilinguale Systeme untergliedert. Die Artikel der einzelnen Sektionen sind insgesamt recht heterogen und bieten daher keine Überschneidungen inhaltlicher Art. Jedoch ist eine vollkommene thematische Abdeckung der unterschiedlichen Bereiche ebenfalls nicht gegeben, was bei der Präsentation von Forschungsergebnissen eines Institutes und seiner Kooperationspartner auch nur bedingt erwartet werden kann. So lässt sich sowohl in der Gliederung als auch in den einzelnen Beiträgen eine thematische Verdichtung erkennen, die das spezielle Profil und die Besonderheit der Hildesheimer Informationswissenschaft im Feld des Information Retrieval wiedergibt. Teil davon ist die mehrsprachige und interdisziplinäre Ausrichtung, die die Schnittstellen zwischen Informationswissenschaft, Sprachwissenschaft und Informatik in ihrer praxisbezogenen und internationalen Forschung fokussiert.
Im ersten Kapitel "Retrieval-Systeme" werden verschiedene Information RetrievalSysteme präsentiert und Verfahren zu deren Gestaltung diskutiert. Jan-Hendrik Scheufen stellt das Meta-Framework RECOIN zur Information Retrieval Forschung vor, das sich durch eine flexible Handhabung unterschiedlichster Applikationen auszeichnet und dadurch eine zentrierte Protokollierung und Steuerung von Retrieval-Prozessen ermöglicht. Dieses Konzept eines offenen, komponentenbasierten Systems wurde in Form eines Plug-Ins für die javabasierte Open-Source-Plattform Eclipse realisiert. Markus Nick und Klaus-Dieter Althoff erläutern in ihrem Beitrag, der übrigens der einzige englischsprachige Text im Buch ist, das Verfahren DILLEBIS zur Erhaltung und Pflege (Maintenance) von erfahrungsbasierten Informationssystemen. Sie bezeichnen dieses Verfahren als Maintainable Experience-based Information System und plädieren für eine Ausrichtung von erfahrungsbasierten Systemen entsprechend diesem Modell. Gesine Quint und Steffen Weichert stellen dagegen in ihrem Beitrag die benutzerzentrierte Entwicklung des Produkt-Retrieval-Systems EIKON vor, das in Kooperation mit der Blaupunkt GmbH realisiert wurde. In einem iterativen Designzyklus erfolgte die Gestaltung von gruppenspezifischen Interaktionsmöglichkeiten für ein Car-Multimedia-Zubehör-System. Im zweiten Kapitel setzen sich mehrere Autoren dezidierter mit dem Anwendungsgebiet "Digitale Bibliothek" auseinander. Claus-Peter Klas, Sascha Kriewel, Andre Schaefer und Gudrun Fischer von der Universität Duisburg-Essen stellen das System DAFFODIL vor, das durch eine Vielzahl an Werkzeugen zur strategischen Unterstützung bei Literaturrecherchen in digitalen Bibliotheken dient. Zusätzlich ermöglicht die Protokollierung sämtlicher Ereignisse den Einsatz des Systems als Evaluationsplattform. Der Aufsatz von Matthias Meiert erläutert die Implementierung von elektronischen Publikationsprozessen an Hochschulen am Beispiel von Abschlussarbeiten des Studienganges Internationales Informationsmanagement der Universität Hildesheim. Neben Rahmenbedingungen werden sowohl der Ist-Zustand als auch der Soll-Zustand des wissenschaftlichen elektronischen Publizierens in Form von gruppenspezifischen Empfehlungen dargestellt. Daniel Harbig und Rene Schneider beschreiben in ihrem Aufsatz zwei Verfahrensweisen zum maschinellen Erlernen von Ontologien, angewandt am virtuellen Bibliotheksregal MyShelf. Nach der Evaluation dieser beiden Ansätze plädieren die Autoren für ein semi-automatisiertes Verfahren zur Erstellung von Ontologien.
"Evaluierung", das Thema des dritten Kapitels, ist in seiner Breite nicht auf das Information Retrieval beschränkt sondern beinhaltet ebenso einzelne Aspekte der Bereiche Mensch-Maschine-Interaktion sowie des E-Learning. Michael Muck und Marco Winter von der Stiftung Wissenschaft und Politik sowie dem Informationszentrum Sozialwissenschaften thematisieren in ihrem Beitrag den Einfluss der Fragestellung (Topic) auf die Bewertung von Relevanz und zeigen Verfahrensweisen für die Topic-Erstellung auf, die beim Cross Language Evaluation Forum (CLEF) Anwendung finden. Im darauf folgenden Aufsatz stellt Thomas Mandl verschiedene Evaluierungsinitiativen im Information Retrieval und aktuelle Entwicklungen dar. Joachim Pfister erläutert in seinem Beitrag das automatisierte Gruppieren, das sogenannte Clustering, von Patent-Dokumenten in den Datenbanken des Fachinformationszentrums Karlsruhe und evaluiert unterschiedliche Clusterverfahren auf Basis von Nutzerbewertungen. Ralph Kölle, Glenn Langemeier und Wolfgang Semar widmen sich dem kollaborativen Lernen unter den speziellen Bedingungen des Programmierens. Dabei werden das System VitaminL zur synchronen Bearbeitung von Programmieraufgaben und das Kennzahlensystem K-3 für die Bewertung kollaborativer Zusammenarbeit in einer Lehrveranstaltung angewendet. Der aktuelle Forschungsschwerpunkt der Hildesheimer Informationswissenschaft zeichnet sich im vierten Kapitel unter dem Thema "Multilinguale Systeme" ab. Hier finden sich die meisten Beiträge des Tagungsbandes wieder. Olga Tartakovski und Margaryta Shramko beschreiben und prüfen das System Langldent, das die Sprache von mono- und multilingualen Texten identifiziert. Die Eigenheiten der japanischen Schriftzeichen stellt Nina Kummer dar und vergleicht experimentell die unterschiedlichen Techniken der Indexierung. Suriya Na Nhongkai und Hans-Joachim Bentz präsentieren und prüfen eine bilinguale Suche auf Basis von Konzeptnetzen, wobei die Konzeptstruktur das verbindende Elemente der beiden Textsammlungen darstellt. Das Entwickeln und Evaluieren eines mehrsprachigen Question-Answering-Systems im Rahmen des Cross Language Evaluation Forum (CLEF), das die alltagssprachliche Formulierung von konkreten Fragestellungen ermöglicht, wird im Beitrag von Robert Strötgen, Thomas Mandl und Rene Schneider thematisiert. Den Schluss bildet der Aufsatz von Niels Jensen, der ein mehrsprachiges Web-Retrieval-System ebenfalls im Zusammenhang mit dem CLEF anhand des multilingualen EuroGOVKorpus evaluiert.
Abschließend lässt sich sagen, dass der Tagungsband einen gelungenen Überblick über die Information Retrieval Projekte der Hildesheimer Informationswissenschaft und ihrer Kooperationspartner gibt. Die einzelnen Beiträge sind sehr anregend und auf einem hohen Niveau angesiedelt. Ein kleines Hindernis für den Leser stellt die inhaltliche und strukturelle Orientierung innerhalb des Bandes dar. Der Bezug der einzelnen Artikel zum Thema des Kapitels wird zwar im Vorwort kurz erläutert. Erschwert wird die Orientierung im Buch jedoch durch fehlende Kapitelüberschriften am Anfang der einzelnen Sektionen. Außerdem ist zu erwähnen, dass einer der Artikel einen anderen Titel als im Inhaltsverzeichnis angekündigt trägt. Sieht der Leser von diesen formalen Mängeln ab, wird er reichlich mit praxisbezogenen und theoretisch fundierten Projektdarstellungen und Forschungsergebnissen belohnt. Dies insbesondere, da nicht nur aktuelle Themen der Informationswissenschaft aufgegriffen, sondern ebenso weiterentwickelt und durch die speziellen interdisziplinären und internationalen Bedingungen in Hildesheim geformt werden. Dabei zeigt sich anhand der verschiedenen Projekte, wie gut die Hildesheimer Informationswissenschaft in die Community überregionaler Informationseinrichtungen und anderer deutscher informationswissenschaftlicher Forschungsgruppen eingebunden ist. Damit hat der Workshop bei einer weiteren Öffnung der Expertengruppe das Potential zu einer eigenständigen Institution im Bereich des Information Retrieval zu werden. In diesem Sinne lässt sich auf weitere fruchtbare Workshops und deren Veröffentlichungen hoffen. Ein nächster Workshop der Universität Hildesheim zum Thema Information Retrieval, organisiert mit der Fachgruppe Information Retrieval der Gesellschaft für Informatik, kündigt sich bereits für den 9. bis 13- Oktober 2006 an."

Wilhelmy, A.: Phonetische Ähnlichkeitssuche in Datenbanken (1991) 0.01

0.009673168 = product of:
  0.05320242 = sum of:
    0.014974878 = weight(_text_:und in 5684) [ClassicSimilarity], result of:
      0.014974878 = score(doc=5684,freq=10.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.328536 = fieldWeight in 5684, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5684)
    0.014974878 = weight(_text_:und in 5684) [ClassicSimilarity], result of:
      0.014974878 = score(doc=5684,freq=10.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.328536 = fieldWeight in 5684, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5684)
    0.0050450475 = weight(_text_:in in 5684) [ClassicSimilarity], result of:
      0.0050450475 = score(doc=5684,freq=8.0), product of:
        0.027974274 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02056547 = queryNorm
        0.18034597 = fieldWeight in 5684, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=5684)
    0.018207615 = weight(_text_:computer in 5684) [ClassicSimilarity], result of:
      0.018207615 = score(doc=5684,freq=2.0), product of:
        0.0751567 = queryWeight, product of:
          3.6545093 = idf(docFreq=3109, maxDocs=44218)
          0.02056547 = queryNorm
        0.24226204 = fieldWeight in 5684, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.6545093 = idf(docFreq=3109, maxDocs=44218)
          0.046875 = fieldNorm(doc=5684)
  0.18181819 = coord(4/22)

Abstract: In dialoggesteuerten Systemen zur Informationswiedergewinnung (Information Retrieval Systems, IRS) kann man - vergröbernd - das Wechselspiel zwischen Mensch und Computer als iterativen Prozess zur Erhöhung von Genauigkeit (Precision) auf der einen und Vollständigkeit (Recall) der Nachweise auf der anderen Seite verstehen. Vorgestellt wird ein maschinell anwendbares Verfahren, das auf phonologische Untersuchungen des Sprachwissenschaftlers Nikolaj S. Trubetzkoy (1890-1938) zurückgeht. In den Grundzügen kann es erheblich zur Verbesserung der Nachweisvollständigkeit beitragen. Dadurch, daß es die 'Ähnlichkeitsumgebungen' von Suchbegriffen in die Recherche mit einbezieht, zeigt es sich vor allem für Systeme mit koordinativer maschineller Indexierung als vorteilhaft. Bei alphabetischen Begriffen erweist sich die Einführung eines solchen zunächst nur auf den Benutzer hin orientierten Verfahrens auch aus technischer Sicht als günstig, da damit die Anzahl der Zugriffe bei den Suchvorgängen auch für große Datenvolumina niedrig gehalten werden kann
Source: Bibliotheken mit und ohne Grenzen: Informationsgesellschaft und Bibliothek. Der österreichische Bibliothekartag 1990, Bregenz, 4.-8.9.1990, Vorträge und Kommissionssitzungen

Smeaton, A.F.; Rijsbergen, C.J. van: ¬The retrieval effects of query expansion on a feedback document retrieval system (1983) 0.01

0.009255639 = product of:
  0.067874685 = sum of:
    0.0058858884 = weight(_text_:in in 2134) [ClassicSimilarity], result of:
      0.0058858884 = score(doc=2134,freq=2.0), product of:
        0.027974274 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02056547 = queryNorm
        0.21040362 = fieldWeight in 2134, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.109375 = fieldNorm(doc=2134)
    0.042484436 = weight(_text_:computer in 2134) [ClassicSimilarity], result of:
      0.042484436 = score(doc=2134,freq=2.0), product of:
        0.0751567 = queryWeight, product of:
          3.6545093 = idf(docFreq=3109, maxDocs=44218)
          0.02056547 = queryNorm
        0.56527805 = fieldWeight in 2134, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.6545093 = idf(docFreq=3109, maxDocs=44218)
          0.109375 = fieldNorm(doc=2134)
    0.01950436 = product of:
      0.03900872 = sum of:
        0.03900872 = weight(_text_:22 in 2134) [ClassicSimilarity], result of:
          0.03900872 = score(doc=2134,freq=2.0), product of:
            0.072016776 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.02056547 = queryNorm
            0.5416616 = fieldWeight in 2134, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.109375 = fieldNorm(doc=2134)
      0.5 = coord(1/2)
  0.13636364 = coord(3/22)

Date: 30. 3.2001 13:32:22
Source: Computer journal. 26(1983), S.239-246
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Ackermann, J.: Knuth-Morris-Pratt (2005) 0.01
```
0.008733539 = product of:
  0.048034463 = sum of:
    0.02366275 = weight(_text_:informatik in 865) [ClassicSimilarity], result of:
      0.02366275 = score(doc=865,freq=2.0), product of:
        0.104934774 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.02056547 = queryNorm
        0.2254996 = fieldWeight in 865, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.03125 = fieldNorm(doc=865)
    0.008929292 = weight(_text_:und in 865) [ClassicSimilarity], result of:
      0.008929292 = score(doc=865,freq=8.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.19590102 = fieldWeight in 865, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=865)
    0.008929292 = weight(_text_:und in 865) [ClassicSimilarity], result of:
      0.008929292 = score(doc=865,freq=8.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.19590102 = fieldWeight in 865, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=865)
    0.006513129 = weight(_text_:in in 865) [ClassicSimilarity], result of:
      0.006513129 = score(doc=865,freq=30.0), product of:
        0.027974274 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02056547 = queryNorm
        0.23282567 = fieldWeight in 865, product of:
          5.477226 = tf(freq=30.0), with freq of:
            30.0 = termFreq=30.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.03125 = fieldNorm(doc=865)
  0.18181819 = coord(4/22)
```
Abstract

Im Rahmen des Seminars Suchmaschinen und Suchalgorithmen beschäftigt sich diese Arbeit mit dem Auffinden bestimmter Wörter oder Muster in Texten. Der Begriff "Text" wird hier in einem sehr allgemeinen Sinne als strukturierte Folge beliebiger Länge von Zeichen aus einem endlichen Alphabet verstanden. Somit fällt unter diesen Bereich ganz allgemein die Suche nach einem Muster in einer Sequenz von Zeichen. Beispiele hierfür sind neben der Suche von Wörtern in "literarischen" Texten, z.B. das Finden von Pixelfolgen in Bildern oder gar das Finden von Mustern in DNS-Strängen. Das Anwendungsgebiet für eine solche Suche ist weit gefächert. Man denke hier allein an Texteditoren, Literaturdatenbanken, digitale Lexika oder die besagte DNADatenbank. Betrachtet man allein das 1989 publizierte Oxford English Dictionary mit seinen etwa 616500 definierten Stichworten auf gedruckten 21728 Seiten, so gilt es, einen möglichst effizienten Algorithmus für die Suche in Texten zu nutzen. Der in der Arbeit zugrunde liegende Datentyp ist vom Typ String (Zeichenkette), wobei hier offen gelassen wird, wie der Datentyp programmtechnisch realisiert wird. Algorithmen zur Verarbeitung von Zeichenketten (string processing) umfassen ein bestimmtes Spektrum an Anwendungsgebieten [Ot96, S.617 f.], wie z.B. das Komprimieren, das Verschlüssen, das Analysieren (parsen), das Übersetzen von Texten sowie das Suchen in Texten, welches Thema dieses Seminars ist. Im Rahmen dieser Arbeit wird der Knuth-Morris-Pratt Algorithmus vorgestellt, der wie der ebenfalls in diesem Seminar vorgestellte Boyer-Moore Algorithmus einen effizienten Suchalgorithmus darstellt. Dabei soll ein gegebenes Suchwort oder Muster (pattern) in einer gegeben Zeichenkette erkannt werden (pattern matching). Gesucht werden dabei ein oder mehrere Vorkommen eines bestimmten Suchwortes (exact pattern matching). Der Knuth-Morris-Pratt Algorithmus wurde erstmals 1974 als Institutbericht der Stanford University beschrieben und erschien 1977 in der Fachzeitschrift Journal of Computing unter dem Titel "Fast Pattern Matching in Strings" [Kn77]. Der Algorithmus beschreibt eine Suche in Zeichenketten mit linearer Laufzeit. Der Name des Algorithmus setzt sich aus den Entwicklern des Algorithmus Donald E. Knuth, James H. Morris und Vaughan R. Pratt zusammen.

Content

Ausarbeitung im Rahmen des Seminars Suchmaschinen und Suchalgorithmen, Institut für Wirtschaftsinformatik Praktische Informatik in der Wirtschaft, Westfälische Wilhelms-Universität Münster. - Vgl.: http://www-wi.uni-muenster.de/pi/lehre/ss05/seminarSuchen/Ausarbeitungen/JanAckermann.pdf

Mayr, P.: Bradfordizing als Re-Ranking-Ansatz in Literaturinformationssystemen (2011) 0.01

0.008416045 = product of:
  0.04628825 = sum of:
    0.016404156 = weight(_text_:und in 4292) [ClassicSimilarity], result of:
      0.016404156 = score(doc=4292,freq=12.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.35989314 = fieldWeight in 4292, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=4292)
    0.016404156 = weight(_text_:und in 4292) [ClassicSimilarity], result of:
      0.016404156 = score(doc=4292,freq=12.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.35989314 = fieldWeight in 4292, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=4292)
    0.008434889 = product of:
      0.016869778 = sum of:
        0.016869778 = weight(_text_:29 in 4292) [ClassicSimilarity], result of:
          0.016869778 = score(doc=4292,freq=2.0), product of:
            0.072342895 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.02056547 = queryNorm
            0.23319192 = fieldWeight in 4292, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.046875 = fieldNorm(doc=4292)
      0.5 = coord(1/2)
    0.0050450475 = weight(_text_:in in 4292) [ClassicSimilarity], result of:
      0.0050450475 = score(doc=4292,freq=8.0), product of:
        0.027974274 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02056547 = queryNorm
        0.18034597 = fieldWeight in 4292, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=4292)
  0.18181819 = coord(4/22)

Abstract: In diesem Artikel wird ein Re-Ranking-Ansatz für Suchsysteme vorgestellt, der die Recherche nach wissenschaftlicher Literatur messbar verbessern kann. Das nichttextorientierte Rankingverfahren Bradfordizing wird eingeführt und anschließend im empirischen Teil des Artikels bzgl. der Effektivität für typische fachbezogene Recherche-Topics evaluiert. Dem Bradford Law of Scattering (BLS), auf dem Bradfordizing basiert, liegt zugrunde, dass sich die Literatur zu einem beliebigen Fachgebiet bzw. -thema in Zonen unterschiedlicher Dokumentenkonzentration verteilt. Dem Kernbereich mit hoher Konzentration der Literatur folgen Bereiche mit mittlerer und geringer Konzentration. Bradfordizing sortiert bzw. rankt eine Dokumentmenge damit nach den sogenannten Kernzeitschriften. Der Retrievaltest mit 164 intellektuell bewerteten Fragestellungen in Fachdatenbanken aus den Bereichen Sozial- und Politikwissenschaften, Wirtschaftswissenschaften, Psychologie und Medizin zeigt, dass die Dokumente der Kernzeitschriften signifikant häufiger relevant bewertet werden als Dokumente der zweiten Dokumentzone bzw. den Peripherie-Zeitschriften. Die Implementierung von Bradfordizing und weiteren Re-Rankingverfahren liefert unmittelbare Mehrwerte für den Nutzer.
Date: 9. 2.2011 17:47:29
Source: Information - Wissenschaft und Praxis. 62(2011) H.1, S.3-10

Kanaeva, Z.: Ranking: Google und CiteSeer (2005) 0.01

0.0076209074 = product of:
  0.04191499 = sum of:
    0.013532738 = weight(_text_:und in 3276) [ClassicSimilarity], result of:
      0.013532738 = score(doc=3276,freq=6.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.2968967 = fieldWeight in 3276, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3276)
    0.013532738 = weight(_text_:und in 3276) [ClassicSimilarity], result of:
      0.013532738 = score(doc=3276,freq=6.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.2968967 = fieldWeight in 3276, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3276)
    0.0050973296 = weight(_text_:in in 3276) [ClassicSimilarity], result of:
      0.0050973296 = score(doc=3276,freq=6.0), product of:
        0.027974274 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02056547 = queryNorm
        0.1822149 = fieldWeight in 3276, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3276)
    0.00975218 = product of:
      0.01950436 = sum of:
        0.01950436 = weight(_text_:22 in 3276) [ClassicSimilarity], result of:
          0.01950436 = score(doc=3276,freq=2.0), product of:
            0.072016776 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.02056547 = queryNorm
            0.2708308 = fieldWeight in 3276, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3276)
      0.5 = coord(1/2)
  0.18181819 = coord(4/22)

Abstract: Im Rahmen des klassischen Information Retrieval wurden verschiedene Verfahren für das Ranking sowie die Suche in einer homogenen strukturlosen Dokumentenmenge entwickelt. Die Erfolge der Suchmaschine Google haben gezeigt dass die Suche in einer zwar inhomogenen aber zusammenhängenden Dokumentenmenge wie dem Internet unter Berücksichtigung der Dokumentenverbindungen (Links) sehr effektiv sein kann. Unter den von der Suchmaschine Google realisierten Konzepten ist ein Verfahren zum Ranking von Suchergebnissen (PageRank), das in diesem Artikel kurz erklärt wird. Darüber hinaus wird auf die Konzepte eines Systems namens CiteSeer eingegangen, welches automatisch bibliographische Angaben indexiert (engl. Autonomous Citation Indexing, ACI). Letzteres erzeugt aus einer Menge von nicht vernetzten wissenschaftlichen Dokumenten eine zusammenhängende Dokumentenmenge und ermöglicht den Einsatz von Banking-Verfahren, die auf den von Google genutzten Verfahren basieren.
Date: 20. 3.2005 16:23:22
Source: Information - Wissenschaft und Praxis. 56(2005) H.2, S.87-92

Tober, M.; Hennig, L.; Furch, D.: SEO Ranking-Faktoren und Rang-Korrelationen 2014 : Google Deutschland (2014) 0.01

0.0069652307 = product of:
  0.051078357 = sum of:
    0.019966504 = weight(_text_:und in 1484) [ClassicSimilarity], result of:
      0.019966504 = score(doc=1484,freq=10.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.438048 = fieldWeight in 1484, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1484)
    0.019966504 = weight(_text_:und in 1484) [ClassicSimilarity], result of:
      0.019966504 = score(doc=1484,freq=10.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.438048 = fieldWeight in 1484, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1484)
    0.01114535 = product of:
      0.0222907 = sum of:
        0.0222907 = weight(_text_:22 in 1484) [ClassicSimilarity], result of:
          0.0222907 = score(doc=1484,freq=2.0), product of:
            0.072016776 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.02056547 = queryNorm
            0.30952093 = fieldWeight in 1484, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=1484)
      0.5 = coord(1/2)
  0.13636364 = coord(3/22)

Abstract: Dieses Whitepaper beschäftigt sich mit der Definition und Bewertung von Faktoren, die eine hohe Rangkorrelation-Koeffizienz mit organischen Suchergebnissen aufweisen und dient dem Zweck der tieferen Analyse von Suchmaschinen-Algorithmen. Die Datenerhebung samt Auswertung bezieht sich auf Ranking-Faktoren für Google-Deutschland im Jahr 2014. Zusätzlich wurden die Korrelationen und Faktoren unter anderem anhand von Durchschnitts- und Medianwerten sowie Entwicklungstendenzen zu den Vorjahren hinsichtlich ihrer Relevanz für vordere Suchergebnis-Positionen interpretiert.
Date: 13. 9.2014 14:45:22

Fuhr, N.: Modelle im Information Retrieval (2023) 0.01

0.0063563683 = product of:
  0.034960024 = sum of:
    0.012479064 = weight(_text_:und in 800) [ClassicSimilarity], result of:
      0.012479064 = score(doc=800,freq=10.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.27378 = fieldWeight in 800, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=800)
    0.012479064 = weight(_text_:und in 800) [ClassicSimilarity], result of:
      0.012479064 = score(doc=800,freq=10.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.27378 = fieldWeight in 800, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=800)
    0.0070290747 = product of:
      0.014058149 = sum of:
        0.014058149 = weight(_text_:29 in 800) [ClassicSimilarity], result of:
          0.014058149 = score(doc=800,freq=2.0), product of:
            0.072342895 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.02056547 = queryNorm
            0.19432661 = fieldWeight in 800, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.0390625 = fieldNorm(doc=800)
      0.5 = coord(1/2)
    0.0029728229 = weight(_text_:in in 800) [ClassicSimilarity], result of:
      0.0029728229 = score(doc=800,freq=4.0), product of:
        0.027974274 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02056547 = queryNorm
        0.10626988 = fieldWeight in 800, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=800)
  0.18181819 = coord(4/22)

Abstract: Information-Retrieval-Modelle -(IR-Modelle) spezifizieren, wie zu einer gegebenen Anfrage die Antwortdokumente aus einer Dokumentenkollektion bestimmt werden. Ausgangsbasis jedes Modells sind dabei zunächst bestimmte Annahmen über die Wissensrepräsentation (s. Teil B Methoden und Systeme der Inhaltserschließung) von Fragen und Dokumenten. Hier bezeichnen wir die Elemente dieser Repräsentationen als Terme, wobei es aus der Sicht des Modells egal ist, wie diese Terme aus dem Dokument (und analog aus der von Benutzenden eingegebenen Anfrage) abgeleitet werden: Bei Texten werden hierzu häufig computerlinguistische Methoden eingesetzt, aber auch komplexere automatische oder manuelle Erschließungsverfahren können zur Anwendung kommen. Repräsentationen besitzen ferner eine bestimmte Struktur. Ein Dokument wird meist als Menge oder Multimenge von Termen aufgefasst, wobei im zweiten Fall das Mehrfachvorkommen berücksichtigt wird. Diese Dokumentrepräsentation wird wiederum auf eine sogenannte Dokumentbeschreibung abgebildet, in der die einzelnen Terme gewichtet sein können. Im Folgenden unterscheiden wir nur zwischen ungewichteter (Gewicht eines Terms ist entweder 0 oder 1) und gewichteter Indexierung (das Gewicht ist eine nichtnegative reelle Zahl). Analog dazu gibt es eine Fragerepräsentation; legt man eine natürlichsprachige Anfrage zugrunde, so kann man die o. g. Verfahren für Dokumenttexte anwenden. Alternativ werden auch grafische oder formale Anfragesprachen verwendet, wobei aus Sicht der Modelle insbesondere deren logische Struktur (etwa beim Booleschen Retrieval) relevant ist. Die Fragerepräsentation wird dann in eine Fragebeschreibung überführt.
Date: 24.11.2022 17:20:29
Source: Grundlagen der Informationswissenschaft. Hrsg.: Rainer Kuhlen, Dirk Lewandowski, Wolfgang Semar und Christa Womser-Hacker. 7., völlig neu gefasste Ausg

Maylein, L.; Langenstein, A.: Neues vom Relevanz-Ranking im HEIDI-Katalog der Universitätsbibliothek Heidelberg : Perspektiven für bibliothekarische Dienstleistungen (2013) 0.01

0.0063510225 = product of:
  0.034930624 = sum of:
    0.008929292 = weight(_text_:und in 775) [ClassicSimilarity], result of:
      0.008929292 = score(doc=775,freq=2.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.19590102 = fieldWeight in 775, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=775)
    0.008929292 = weight(_text_:und in 775) [ClassicSimilarity], result of:
      0.008929292 = score(doc=775,freq=2.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.19590102 = fieldWeight in 775, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=775)
    0.011246519 = product of:
      0.022493038 = sum of:
        0.022493038 = weight(_text_:29 in 775) [ClassicSimilarity], result of:
          0.022493038 = score(doc=775,freq=2.0), product of:
            0.072342895 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.02056547 = queryNorm
            0.31092256 = fieldWeight in 775, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.0625 = fieldNorm(doc=775)
      0.5 = coord(1/2)
    0.0058255196 = weight(_text_:in in 775) [ClassicSimilarity], result of:
      0.0058255196 = score(doc=775,freq=6.0), product of:
        0.027974274 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02056547 = queryNorm
        0.2082456 = fieldWeight in 775, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0625 = fieldNorm(doc=775)
  0.18181819 = coord(4/22)

Abstract: Das Relevanz-Ranking im Katalog der Universitätsbibliothek Heidelberg HEIDI, bereits 2009 in einem Beitrag in dieser Zeitschrift beschrieben, wurde in den letzten Jahren durch neue Entwicklungen und Methoden stark verbessert. Der Aufsatz beschreibt die Realisierung der bisherigen Rankingmaßnahmen unter der neu eingesetzten Suchmaschinenplattform SOLR. Weiter werden verschiedene neue Möglichkeiten für Rankinganpassungen unter SOLR sowie deren Einsatz im HEIDI-Katalog dargestellt.
Date: 29. 6.2013 18:06:23

Behnert, C.; Borst, T.: Neue Formen der Relevanz-Sortierung in bibliothekarischen Informationssystemen : das DFG-Projekt LibRank (2015) 0.01

0.0062397993 = product of:
  0.045758527 = sum of:
    0.019966504 = weight(_text_:und in 5392) [ClassicSimilarity], result of:
      0.019966504 = score(doc=5392,freq=10.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.438048 = fieldWeight in 5392, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=5392)
    0.019966504 = weight(_text_:und in 5392) [ClassicSimilarity], result of:
      0.019966504 = score(doc=5392,freq=10.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.438048 = fieldWeight in 5392, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=5392)
    0.0058255196 = weight(_text_:in in 5392) [ClassicSimilarity], result of:
      0.0058255196 = score(doc=5392,freq=6.0), product of:
        0.027974274 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02056547 = queryNorm
        0.2082456 = fieldWeight in 5392, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0625 = fieldNorm(doc=5392)
  0.13636364 = coord(3/22)

Abstract: Das von der DFG geförderte Projekt LibRank erforscht neue Rankingverfahren für bibliothekarische Informationssysteme, die aufbauend auf Erkenntnissen aus dem Bereich Websuche qualitätsinduzierende Faktoren wie z. B. Aktualität, Popularität und Verfügbarkeit von einzelnen Medien berücksichtigen. Die konzipierten Verfahren werden im Kontext eines in den Wirtschaftswissenschaften häufig genutzten Rechercheportals (EconBiz) entwickelt und in einem Testsystem systematisch evaluiert. Es werden Rankingfaktoren, die für den Bibliotheksbereich von besonderem Interesse sind, vorgestellt und exemplarisch Probleme und Herausforderungen aufgezeigt.
Source: Bibliothek: Forschung und Praxis. 39(2015) H.3, S.384-393

Fuhr, N.: Rankingexperimente mit gewichteter Indexierung (1986) 0.01

0.005932623 = product of:
  0.0435059 = sum of:
    0.013393938 = weight(_text_:und in 2051) [ClassicSimilarity], result of:
      0.013393938 = score(doc=2051,freq=2.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.29385152 = fieldWeight in 2051, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=2051)
    0.013393938 = weight(_text_:und in 2051) [ClassicSimilarity], result of:
      0.013393938 = score(doc=2051,freq=2.0), product of:
        0.04558063 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02056547 = queryNorm
        0.29385152 = fieldWeight in 2051, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=2051)
    0.016718024 = product of:
      0.03343605 = sum of:
        0.03343605 = weight(_text_:22 in 2051) [ClassicSimilarity], result of:
          0.03343605 = score(doc=2051,freq=2.0), product of:
            0.072016776 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.02056547 = queryNorm
            0.46428138 = fieldWeight in 2051, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=2051)
      0.5 = coord(1/2)
  0.13636364 = coord(3/22)

Date: 14. 6.2015 22:12:56
Source: Automatische Indexierung zwischen Forschung und Anwendung, Hrsg.: G. Lustig

Search (331 results, page 1 of 17)

Authors

Years

Languages

Types

Themes

Subjects

Classifications