Document (#34820)

Author
Pfäffli, W.
Title
¬La qualité des résultats de recherche dans le cadre du projet MACS (Multilingual Access to Subjects) : vers un élargissement des ensembles de résultats de recherche
Imprint
Bern
Year
2009
Pages
50 S
Abstract
Cette étude aborde la problématique de la qualité des résultats de recherche obtenus par l'intermédiaire de liens établis dans le cadre du projet MACS (Multilingual Access to Subjects) en considérant plus particulièrement la perspective de l'usager. Elle cherche à démontrer que ces liens, dans leur définition actuelle, ne sont à eux seuls pas en mesure de garantir des résultats satisfaisants pour un usager et qu'ils doivent être complétés par d'autres mesures. Elle se compose de trois parties principales : - la première partie présente le contexte général : après un bref historique, les principes de base du projet MACS et les difficultés rencontrées lors de l'évaluation de résultats de recherche sont expliqués. La question des différentes perspectives de l'indexeur et de l'usager est plus particulièrement développée. - la seconde partie présente les tests sur les titres communs à plusieurs bibliothèques qui ont été effectués et énumère les différents facteurs qui affaiblissent la qualité des résultats et empêchent notamment l'usager de retrouver des titres pertinents. - la troisième partie contient quelques pistes susceptibles de remédier aux biais relevés dans la deuxième partie et s'interroge sur les caractéristiques d'une interface de recherche, qui permettraient d'améliorer une recherche thématique multilingue.
Conclusion Le tout premier point de départ de cette étude était le principe de validation des liens par la cohérence des résultats. Nous avons vu que ce principe jour un rôle très important dans la problématique générale de l'interopérabilité entre systèmes documentaires, bien qu'il ne soit pas sans soulever de nombreuses questions pratiques lors de sa mise en oeuvre concrète, questions auxquelles aucune étude n'a pour le moment offert de réponse détaillée qui puisse servir à élaborer un début de méthodologie. Mais nous avons surtout vu lors de l'étude d'exemples concrets que nous nous mouvons dans un contexte influencé par de nombreux facteurs, en grande partie, peu ou difficilement prévisibles : vouloir obtenir deux ensembles de titres pertinents clairement définis, en devant tenir compte du contexte culturel des fonds qui sont comparés, des différences de structure des langages documentaires, des politiques d'indexation, de la subjectivité des indexeurs et enfin des paramètres des moteurs de recherche, relève de la gageure !
L'examen des titres communs nous a montré qu'en tous les cas, une partie des titres pertinents échapperaient à une requête effectuée par l'intermédiaire du lien. Il nous semble donc plus important que les efforts se concentrent sur les moyens d'effectivement donner un accès à des documents potentiellement pertinents plutôt que de définir plus précisément la qualité des liens au vu des résultats. Une première voie est le recours aux relations hiérarchiques des langages documentaires, mais nous avons vu qu'elles ne sont pas en mesure d'apporter une solution dans tous les cas. Le recours à une classification, à une ontologie ou à des techniques de traitement automatique du langage sont d'autres voies à explorer, qui peuvent éviter de devoir multiplier les liens, et par là compliquer encore leur gestion. En chemin, nous avons rencontré , mais sans pouvoir les aborder, encore bien d'autres questions, qui sont toutes autant de défis supplémentaires à relever, comme le problème de l'accès aux titres non indexés ou le problème de l'évolution des langages documentaires et donc de la mise à jour des liens. Nous avons aussi laissé de côté les questions techniques de l'accès de l'interface aux différents catalogues et des possibilités de présentations des résultats de recherche proprement dits (par bibliothèque interrogée ou réunis en un ensemble, ranking). Il reste ainsi assez à faire jusqu'au jour où un usager pourra entrer un terme de recherche dans une interface conviviale, qui lui ouvrira un accès thématique simple mais complet aux ressources des bibliothèques d'Europe, puis du monde !
Content
Abschlussarbeit MAS Bibliotheks- und Informationswissenschaften 2007-2009
Theme
Multilinguale Probleme
Object
MACS

Similar documents (content)

  1. Dauzats, M.: ¬Le thésaurus de l'image : étude des langages documentaires pour l'audiovisuel (1994) 0.34
    0.34368294 = sum of:
      0.34368294 = product of:
        2.1480184 = sum of:
          0.22851105 = weight(title_txt:pour in 3088) [ClassicSimilarity], result of:
            0.22851105 = score(doc=3088,freq=1.0), product of:
              0.090372756 = queryWeight, product of:
                1.7609097 = boost
                8.091326 = idf(docFreq=35, maxDocs=43254)
                0.006342796 = queryNorm
              2.5285392 = fieldWeight in 3088, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.091326 = idf(docFreq=35, maxDocs=43254)
                0.3125 = fieldNorm(doc=3088)
          0.53268737 = weight(title_txt:étude in 3088) [ClassicSimilarity], result of:
            0.53268737 = score(doc=3088,freq=1.0), product of:
              0.1818771 = queryWeight, product of:
                3.0595176 = boost
                9.37226 = idf(docFreq=9, maxDocs=43254)
                0.006342796 = queryNorm
              2.9288313 = fieldWeight in 3088, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.37226 = idf(docFreq=9, maxDocs=43254)
                0.3125 = fieldNorm(doc=3088)
          0.6246217 = weight(title_txt:langages in 3088) [ClassicSimilarity], result of:
            0.6246217 = score(doc=3088,freq=1.0), product of:
              0.20224346 = queryWeight, product of:
                3.2262735 = boost
                9.883085 = idf(docFreq=5, maxDocs=43254)
                0.006342796 = queryNorm
              3.0884643 = fieldWeight in 3088, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.883085 = idf(docFreq=5, maxDocs=43254)
                0.3125 = fieldNorm(doc=3088)
          0.7621982 = weight(title_txt:documentaires in 3088) [ClassicSimilarity], result of:
            0.7621982 = score(doc=3088,freq=1.0), product of:
              0.25418776 = queryWeight, product of:
                4.176482 = boost
                9.595404 = idf(docFreq=7, maxDocs=43254)
                0.006342796 = queryNorm
              2.9985638 = fieldWeight in 3088, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.595404 = idf(docFreq=7, maxDocs=43254)
                0.3125 = fieldNorm(doc=3088)
        0.16 = coord(4/25)
    
  2. Bélair, J.-A.; Bourdon, F.; Mingam, M.: ¬Le Répertoire de vedettes-matière et RAMEAU : deux langages d'indexation en français : un luxe nécessaire (2005) 0.26
    0.25892407 = sum of:
      0.25892407 = product of:
        1.6182754 = sum of:
          0.14689468 = weight(title_txt:d'indexation in 360) [ClassicSimilarity], result of:
            0.14689468 = score(doc=360,freq=1.0), product of:
              0.061996438 = queryWeight, product of:
                1.031304 = boost
                9.47762 = idf(docFreq=8, maxDocs=43254)
                0.006342796 = queryNorm
              2.369405 = fieldWeight in 360, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.47762 = idf(docFreq=8, maxDocs=43254)
                0.25 = fieldNorm(doc=360)
          0.17666969 = weight(abstract_txt:cette in 360) [ClassicSimilarity], result of:
            0.17666969 = score(doc=360,freq=2.0), product of:
              0.13482897 = queryWeight, product of:
                2.150849 = boost
                9.883085 = idf(docFreq=5, maxDocs=43254)
                0.006342796 = queryNorm
              1.3103244 = fieldWeight in 360, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                9.883085 = idf(docFreq=5, maxDocs=43254)
                0.09375 = fieldNorm(doc=360)
          0.49969736 = weight(title_txt:langages in 360) [ClassicSimilarity], result of:
            0.49969736 = score(doc=360,freq=1.0), product of:
              0.20224346 = queryWeight, product of:
                3.2262735 = boost
                9.883085 = idf(docFreq=5, maxDocs=43254)
                0.006342796 = queryNorm
              2.4707713 = fieldWeight in 360, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.883085 = idf(docFreq=5, maxDocs=43254)
                0.25 = fieldNorm(doc=360)
          0.7950136 = weight(abstract_txt:nous in 360) [ClassicSimilarity], result of:
            0.7950136 = score(doc=360,freq=2.0), product of:
              0.60673034 = queryWeight, product of:
                9.678821 = boost
                9.883085 = idf(docFreq=5, maxDocs=43254)
                0.006342796 = queryNorm
              1.3103244 = fieldWeight in 360, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                9.883085 = idf(docFreq=5, maxDocs=43254)
                0.09375 = fieldNorm(doc=360)
        0.16 = coord(4/25)
    
  3. Boutin, E.: ¬La recherche d'information sur Internet au prisme de la théorie des facettes (2008) 0.21
    0.20757206 = sum of:
      0.20757206 = product of:
        1.2973254 = sum of:
          0.12492433 = weight(abstract_txt:cette in 4801) [ClassicSimilarity], result of:
            0.12492433 = score(doc=4801,freq=1.0), product of:
              0.13482897 = queryWeight, product of:
                2.150849 = boost
                9.883085 = idf(docFreq=5, maxDocs=43254)
                0.006342796 = queryNorm
              0.92653924 = fieldWeight in 4801, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.883085 = idf(docFreq=5, maxDocs=43254)
                0.09375 = fieldNorm(doc=4801)
          0.23546858 = weight(abstract_txt:recherche in 4801) [ClassicSimilarity], result of:
            0.23546858 = score(doc=4801,freq=3.0), product of:
              0.23550723 = queryWeight, product of:
                6.0301304 = boost
                6.157392 = idf(docFreq=248, maxDocs=43254)
                0.006342796 = queryNorm
              0.99983585 = fieldWeight in 4801, product of:
                1.7320508 = tf(freq=3.0), with freq of:
                  3.0 = termFreq=3.0
                6.157392 = idf(docFreq=248, maxDocs=43254)
                0.09375 = fieldNorm(doc=4801)
          0.374773 = weight(abstract_txt:sont in 4801) [ClassicSimilarity], result of:
            0.374773 = score(doc=4801,freq=1.0), product of:
              0.40448692 = queryWeight, product of:
                6.452547 = boost
                9.883085 = idf(docFreq=5, maxDocs=43254)
                0.006342796 = queryNorm
              0.92653924 = fieldWeight in 4801, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.883085 = idf(docFreq=5, maxDocs=43254)
                0.09375 = fieldNorm(doc=4801)
          0.5621595 = weight(abstract_txt:nous in 4801) [ClassicSimilarity], result of:
            0.5621595 = score(doc=4801,freq=1.0), product of:
              0.60673034 = queryWeight, product of:
                9.678821 = boost
                9.883085 = idf(docFreq=5, maxDocs=43254)
                0.006342796 = queryNorm
              0.92653924 = fieldWeight in 4801, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.883085 = idf(docFreq=5, maxDocs=43254)
                0.09375 = fieldNorm(doc=4801)
        0.16 = coord(4/25)
    
  4. Menon, B.: Optimiser l'acces a l'information, une opportunite pour les langages documentaires? (2007) 0.19
    0.19383971 = sum of:
      0.19383971 = product of:
        1.6153309 = sum of:
          0.22851105 = weight(title_txt:pour in 4846) [ClassicSimilarity], result of:
            0.22851105 = score(doc=4846,freq=1.0), product of:
              0.090372756 = queryWeight, product of:
                1.7609097 = boost
                8.091326 = idf(docFreq=35, maxDocs=43254)
                0.006342796 = queryNorm
              2.5285392 = fieldWeight in 4846, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.091326 = idf(docFreq=35, maxDocs=43254)
                0.3125 = fieldNorm(doc=4846)
          0.6246217 = weight(title_txt:langages in 4846) [ClassicSimilarity], result of:
            0.6246217 = score(doc=4846,freq=1.0), product of:
              0.20224346 = queryWeight, product of:
                3.2262735 = boost
                9.883085 = idf(docFreq=5, maxDocs=43254)
                0.006342796 = queryNorm
              3.0884643 = fieldWeight in 4846, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.883085 = idf(docFreq=5, maxDocs=43254)
                0.3125 = fieldNorm(doc=4846)
          0.7621982 = weight(title_txt:documentaires in 4846) [ClassicSimilarity], result of:
            0.7621982 = score(doc=4846,freq=1.0), product of:
              0.25418776 = queryWeight, product of:
                4.176482 = boost
                9.595404 = idf(docFreq=7, maxDocs=43254)
                0.006342796 = queryNorm
              2.9985638 = fieldWeight in 4846, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.595404 = idf(docFreq=7, maxDocs=43254)
                0.3125 = fieldNorm(doc=4846)
        0.12 = coord(3/25)
    
  5. Cote, C.: Conception de systèmes d'information utilisé dans le cours d'une activité : méthologie et outils de formalisation pour l'identification des opportunités informationelles (1999) 0.17
    0.17373078 = sum of:
      0.17373078 = product of:
        1.0858173 = sum of:
          0.12429372 = weight(title_txt:systèmes in 1241) [ClassicSimilarity], result of:
            0.12429372 = score(doc=1241,freq=1.0), product of:
              0.060625706 = queryWeight, product of:
                1.0198393 = boost
                9.37226 = idf(docFreq=9, maxDocs=43254)
                0.006342796 = queryNorm
              2.0501819 = fieldWeight in 1241, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.37226 = idf(docFreq=9, maxDocs=43254)
                0.21875 = fieldNorm(doc=1241)
          0.13338467 = weight(title_txt:d'une in 1241) [ClassicSimilarity], result of:
            0.13338467 = score(doc=1241,freq=1.0), product of:
              0.06354694 = queryWeight, product of:
                1.0441206 = boost
                9.595404 = idf(docFreq=7, maxDocs=43254)
                0.006342796 = queryNorm
              2.0989945 = fieldWeight in 1241, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.595404 = idf(docFreq=7, maxDocs=43254)
                0.21875 = fieldNorm(doc=1241)
          0.15995775 = weight(title_txt:pour in 1241) [ClassicSimilarity], result of:
            0.15995775 = score(doc=1241,freq=1.0), product of:
              0.090372756 = queryWeight, product of:
                1.7609097 = boost
                8.091326 = idf(docFreq=35, maxDocs=43254)
                0.006342796 = queryNorm
              1.7699776 = fieldWeight in 1241, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.091326 = idf(docFreq=35, maxDocs=43254)
                0.21875 = fieldNorm(doc=1241)
          0.66818124 = weight(title_txt:dans in 1241) [ClassicSimilarity], result of:
            0.66818124 = score(doc=1241,freq=1.0), product of:
              0.3720919 = queryWeight, product of:
                7.146171 = boost
                8.209109 = idf(docFreq=31, maxDocs=43254)
                0.006342796 = queryNorm
              1.7957426 = fieldWeight in 1241, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.209109 = idf(docFreq=31, maxDocs=43254)
                0.21875 = fieldNorm(doc=1241)
        0.16 = coord(4/25)