Document (#34820)

Author
Pfäffli, W.
Title
¬La qualité des résultats de recherche dans le cadre du projet MACS (Multilingual Access to Subjects) : vers un élargissement des ensembles de résultats de recherche
Imprint
Bern
Year
2009
Pages
50 S
Abstract
Cette étude aborde la problématique de la qualité des résultats de recherche obtenus par l'intermédiaire de liens établis dans le cadre du projet MACS (Multilingual Access to Subjects) en considérant plus particulièrement la perspective de l'usager. Elle cherche à démontrer que ces liens, dans leur définition actuelle, ne sont à eux seuls pas en mesure de garantir des résultats satisfaisants pour un usager et qu'ils doivent être complétés par d'autres mesures. Elle se compose de trois parties principales : - la première partie présente le contexte général : après un bref historique, les principes de base du projet MACS et les difficultés rencontrées lors de l'évaluation de résultats de recherche sont expliqués. La question des différentes perspectives de l'indexeur et de l'usager est plus particulièrement développée. - la seconde partie présente les tests sur les titres communs à plusieurs bibliothèques qui ont été effectués et énumère les différents facteurs qui affaiblissent la qualité des résultats et empêchent notamment l'usager de retrouver des titres pertinents. - la troisième partie contient quelques pistes susceptibles de remédier aux biais relevés dans la deuxième partie et s'interroge sur les caractéristiques d'une interface de recherche, qui permettraient d'améliorer une recherche thématique multilingue.
Conclusion Le tout premier point de départ de cette étude était le principe de validation des liens par la cohérence des résultats. Nous avons vu que ce principe jour un rôle très important dans la problématique générale de l'interopérabilité entre systèmes documentaires, bien qu'il ne soit pas sans soulever de nombreuses questions pratiques lors de sa mise en oeuvre concrète, questions auxquelles aucune étude n'a pour le moment offert de réponse détaillée qui puisse servir à élaborer un début de méthodologie. Mais nous avons surtout vu lors de l'étude d'exemples concrets que nous nous mouvons dans un contexte influencé par de nombreux facteurs, en grande partie, peu ou difficilement prévisibles : vouloir obtenir deux ensembles de titres pertinents clairement définis, en devant tenir compte du contexte culturel des fonds qui sont comparés, des différences de structure des langages documentaires, des politiques d'indexation, de la subjectivité des indexeurs et enfin des paramètres des moteurs de recherche, relève de la gageure !
L'examen des titres communs nous a montré qu'en tous les cas, une partie des titres pertinents échapperaient à une requête effectuée par l'intermédiaire du lien. Il nous semble donc plus important que les efforts se concentrent sur les moyens d'effectivement donner un accès à des documents potentiellement pertinents plutôt que de définir plus précisément la qualité des liens au vu des résultats. Une première voie est le recours aux relations hiérarchiques des langages documentaires, mais nous avons vu qu'elles ne sont pas en mesure d'apporter une solution dans tous les cas. Le recours à une classification, à une ontologie ou à des techniques de traitement automatique du langage sont d'autres voies à explorer, qui peuvent éviter de devoir multiplier les liens, et par là compliquer encore leur gestion. En chemin, nous avons rencontré , mais sans pouvoir les aborder, encore bien d'autres questions, qui sont toutes autant de défis supplémentaires à relever, comme le problème de l'accès aux titres non indexés ou le problème de l'évolution des langages documentaires et donc de la mise à jour des liens. Nous avons aussi laissé de côté les questions techniques de l'accès de l'interface aux différents catalogues et des possibilités de présentations des résultats de recherche proprement dits (par bibliothèque interrogée ou réunis en un ensemble, ranking). Il reste ainsi assez à faire jusqu'au jour où un usager pourra entrer un terme de recherche dans une interface conviviale, qui lui ouvrira un accès thématique simple mais complet aux ressources des bibliothèques d'Europe, puis du monde !
Content
Abschlussarbeit MAS Bibliotheks- und Informationswissenschaften 2007-2009
Theme
Multilinguale Probleme
Object
MACS

Similar documents (content)

  1. Dauzats, M.: ¬Le thésaurus de l'image : étude des langages documentaires pour l'audiovisuel (1994) 0.43
    0.42973173 = sum of:
      0.42973173 = product of:
        2.6858234 = sum of:
          0.28526583 = weight(title_txt:pour in 2088) [ClassicSimilarity], result of:
            0.28526583 = score(doc=2088,freq=1.0), product of:
              0.11324285 = queryWeight, product of:
                1.7601182 = boost
                8.061001 = idf(docFreq=35, maxDocs=41962)
                0.007981417 = queryNorm
              2.5190628 = fieldWeight in 2088, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.061001 = idf(docFreq=35, maxDocs=41962)
                0.3125 = fieldNorm(doc=2088)
          0.66601586 = weight(title_txt:étude in 2088) [ClassicSimilarity], result of:
            0.66601586 = score(doc=2088,freq=1.0), product of:
              0.22813806 = queryWeight, product of:
                3.0597148 = boost
                9.341934 = idf(docFreq=9, maxDocs=41962)
                0.007981417 = queryNorm
              2.9193544 = fieldWeight in 2088, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.341934 = idf(docFreq=9, maxDocs=41962)
                0.3125 = fieldNorm(doc=2088)
          0.7813542 = weight(title_txt:langages in 2088) [ClassicSimilarity], result of:
            0.7813542 = score(doc=2088,freq=1.0), product of:
              0.25376984 = queryWeight, product of:
                3.2270231 = boost
                9.85276 = idf(docFreq=5, maxDocs=41962)
                0.007981417 = queryNorm
              3.0789876 = fieldWeight in 2088, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.85276 = idf(docFreq=5, maxDocs=41962)
                0.3125 = fieldNorm(doc=2088)
          0.9531876 = weight(title_txt:documentaires in 2088) [ClassicSimilarity], result of:
            0.9531876 = score(doc=2088,freq=1.0), product of:
              0.31888923 = queryWeight, product of:
                4.1770663 = boost
                9.565078 = idf(docFreq=7, maxDocs=41962)
                0.007981417 = queryNorm
              2.9890869 = fieldWeight in 2088, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.565078 = idf(docFreq=7, maxDocs=41962)
                0.3125 = fieldNorm(doc=2088)
        0.16 = coord(4/25)
    
  2. Menon, B.: Optimiser l'acces a l'information, une opportunite pour les langages documentaires? (2007) 0.24
    0.24237691 = sum of:
      0.24237691 = product of:
        2.0198076 = sum of:
          0.28526583 = weight(title_txt:pour in 4259) [ClassicSimilarity], result of:
            0.28526583 = score(doc=4259,freq=1.0), product of:
              0.11324285 = queryWeight, product of:
                1.7601182 = boost
                8.061001 = idf(docFreq=35, maxDocs=41962)
                0.007981417 = queryNorm
              2.5190628 = fieldWeight in 4259, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.061001 = idf(docFreq=35, maxDocs=41962)
                0.3125 = fieldNorm(doc=4259)
          0.7813542 = weight(title_txt:langages in 4259) [ClassicSimilarity], result of:
            0.7813542 = score(doc=4259,freq=1.0), product of:
              0.25376984 = queryWeight, product of:
                3.2270231 = boost
                9.85276 = idf(docFreq=5, maxDocs=41962)
                0.007981417 = queryNorm
              3.0789876 = fieldWeight in 4259, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.85276 = idf(docFreq=5, maxDocs=41962)
                0.3125 = fieldNorm(doc=4259)
          0.9531876 = weight(title_txt:documentaires in 4259) [ClassicSimilarity], result of:
            0.9531876 = score(doc=4259,freq=1.0), product of:
              0.31888923 = queryWeight, product of:
                4.1770663 = boost
                9.565078 = idf(docFreq=7, maxDocs=41962)
                0.007981417 = queryNorm
              2.9890869 = fieldWeight in 4259, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.565078 = idf(docFreq=7, maxDocs=41962)
                0.3125 = fieldNorm(doc=4259)
        0.12 = coord(3/25)
    
  3. Cote, C.: Conception de systèmes d'information utilisé dans le cours d'une activité : méthologie et outils de formalisation pour l'identification des opportunités informationelles (1999) 0.22
    0.21698695 = sum of:
      0.21698695 = product of:
        1.3561685 = sum of:
          0.15540372 = weight(title_txt:systèmes in 241) [ClassicSimilarity], result of:
            0.15540372 = score(doc=241,freq=1.0), product of:
              0.07604603 = queryWeight, product of:
                1.019905 = boost
                9.341934 = idf(docFreq=9, maxDocs=41962)
                0.007981417 = queryNorm
              2.043548 = fieldWeight in 241, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.341934 = idf(docFreq=9, maxDocs=41962)
                0.21875 = fieldNorm(doc=241)
          0.16680783 = weight(title_txt:d'une in 241) [ClassicSimilarity], result of:
            0.16680783 = score(doc=241,freq=1.0), product of:
              0.07972231 = queryWeight, product of:
                1.0442666 = boost
                9.565078 = idf(docFreq=7, maxDocs=41962)
                0.007981417 = queryNorm
              2.0923607 = fieldWeight in 241, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.565078 = idf(docFreq=7, maxDocs=41962)
                0.21875 = fieldNorm(doc=241)
          0.1996861 = weight(title_txt:pour in 241) [ClassicSimilarity], result of:
            0.1996861 = score(doc=241,freq=1.0), product of:
              0.11324285 = queryWeight, product of:
                1.7601182 = boost
                8.061001 = idf(docFreq=35, maxDocs=41962)
                0.007981417 = queryNorm
              1.7633439 = fieldWeight in 241, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.061001 = idf(docFreq=35, maxDocs=41962)
                0.21875 = fieldNorm(doc=241)
          0.83427083 = weight(title_txt:dans in 241) [ClassicSimilarity], result of:
            0.83427083 = score(doc=241,freq=1.0), product of:
              0.46630523 = queryWeight, product of:
                7.1433444 = boost
                8.178783 = idf(docFreq=31, maxDocs=41962)
                0.007981417 = queryNorm
              1.7891089 = fieldWeight in 241, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.178783 = idf(docFreq=31, maxDocs=41962)
                0.21875 = fieldNorm(doc=241)
        0.16 = coord(4/25)
    
  4. Niel, A.: ¬Les sources bibliographiques : étude comparée de leur utilisation dans les bibliothèques universitaires françaises (1994) 0.21
    0.21411818 = sum of:
      0.21411818 = product of:
        1.7843182 = sum of:
          0.29805315 = weight(title_txt:bibliothèques in 6775) [ClassicSimilarity], result of:
            0.29805315 = score(doc=6775,freq=1.0), product of:
              0.13530487 = queryWeight, product of:
                1.9239473 = boost
                8.811306 = idf(docFreq=16, maxDocs=41962)
                0.007981417 = queryNorm
              2.2028265 = fieldWeight in 6775, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.811306 = idf(docFreq=16, maxDocs=41962)
                0.25 = fieldNorm(doc=6775)
          0.5328127 = weight(title_txt:étude in 6775) [ClassicSimilarity], result of:
            0.5328127 = score(doc=6775,freq=1.0), product of:
              0.22813806 = queryWeight, product of:
                3.0597148 = boost
                9.341934 = idf(docFreq=9, maxDocs=41962)
                0.007981417 = queryNorm
              2.3354836 = fieldWeight in 6775, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.341934 = idf(docFreq=9, maxDocs=41962)
                0.25 = fieldNorm(doc=6775)
          0.95345235 = weight(title_txt:dans in 6775) [ClassicSimilarity], result of:
            0.95345235 = score(doc=6775,freq=1.0), product of:
              0.46630523 = queryWeight, product of:
                7.1433444 = boost
                8.178783 = idf(docFreq=31, maxDocs=41962)
                0.007981417 = queryNorm
              2.0446959 = fieldWeight in 6775, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.178783 = idf(docFreq=31, maxDocs=41962)
                0.25 = fieldNorm(doc=6775)
        0.12 = coord(3/25)
    
  5. Paganelli, C.: Étude de l'activité des utilisaterus erepérage d'indices linguistiques pour la recherche d'information textuelle dans les documents techniques (1999) 0.18
    0.18002017 = sum of:
      0.18002017 = product of:
        1.5001681 = sum of:
          0.1996861 = weight(title_txt:pour in 346) [ClassicSimilarity], result of:
            0.1996861 = score(doc=346,freq=1.0), product of:
              0.11324285 = queryWeight, product of:
                1.7601182 = boost
                8.061001 = idf(docFreq=35, maxDocs=41962)
                0.007981417 = queryNorm
              1.7633439 = fieldWeight in 346, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.061001 = idf(docFreq=35, maxDocs=41962)
                0.21875 = fieldNorm(doc=346)
          0.4662111 = weight(title_txt:étude in 346) [ClassicSimilarity], result of:
            0.4662111 = score(doc=346,freq=1.0), product of:
              0.22813806 = queryWeight, product of:
                3.0597148 = boost
                9.341934 = idf(docFreq=9, maxDocs=41962)
                0.007981417 = queryNorm
              2.043548 = fieldWeight in 346, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.341934 = idf(docFreq=9, maxDocs=41962)
                0.21875 = fieldNorm(doc=346)
          0.83427083 = weight(title_txt:dans in 346) [ClassicSimilarity], result of:
            0.83427083 = score(doc=346,freq=1.0), product of:
              0.46630523 = queryWeight, product of:
                7.1433444 = boost
                8.178783 = idf(docFreq=31, maxDocs=41962)
                0.007981417 = queryNorm
              1.7891089 = fieldWeight in 346, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.178783 = idf(docFreq=31, maxDocs=41962)
                0.21875 = fieldNorm(doc=346)
        0.12 = coord(3/25)