Search (23 results, page 1 of 2)

  • × theme_ss:"Volltextretrieval"
  1. Ojala, M.: Research into full-text retrieval (1990) 0.01
    0.010515994 = product of:
      0.042063978 = sum of:
        0.042063978 = weight(_text_:m in 576) [ClassicSimilarity], result of:
          0.042063978 = score(doc=576,freq=2.0), product of:
            0.07649739 = queryWeight, product of:
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.030740997 = queryNorm
            0.54987466 = fieldWeight in 576, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.15625 = fieldNorm(doc=576)
      0.25 = coord(1/4)
    
  2. Calkins, M.: Free text or controlled vocabulary? (1980) 0.01
    0.008412795 = product of:
      0.03365118 = sum of:
        0.03365118 = weight(_text_:m in 786) [ClassicSimilarity], result of:
          0.03365118 = score(doc=786,freq=2.0), product of:
            0.07649739 = queryWeight, product of:
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.030740997 = queryNorm
            0.4398997 = fieldWeight in 786, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.125 = fieldNorm(doc=786)
      0.25 = coord(1/4)
    
  3. Kugler, A.: Automatisierte Volltexterschließung von Retrodigitalisaten am Beispiel historischer Zeitungen (2018) 0.01
    0.008293751 = product of:
      0.033175003 = sum of:
        0.033175003 = product of:
          0.066350006 = sum of:
            0.066350006 = weight(_text_:da in 4595) [ClassicSimilarity], result of:
              0.066350006 = score(doc=4595,freq=4.0), product of:
                0.1475006 = queryWeight, product of:
                  4.7981725 = idf(docFreq=990, maxDocs=44218)
                  0.030740997 = queryNorm
                0.44982868 = fieldWeight in 4595, product of:
                  2.0 = tf(freq=4.0), with freq of:
                    4.0 = termFreq=4.0
                  4.7981725 = idf(docFreq=990, maxDocs=44218)
                  0.046875 = fieldNorm(doc=4595)
          0.5 = coord(1/2)
      0.25 = coord(1/4)
    
    Abstract
    Seit ein paar Jahren postuliert die DFG in ihren Praxisregeln "Digitalisierung", dass eine ausschließliche Bilddigitalisierung nicht mehr den wissenschaftlichen Ansprüchen Genüge leiste, sondern der digitale Volltext notwendig sei, da dieser die Basis für eine wissenschaftliche Nachnutzung darstellt. Um ein besseres Verständnis davon zu erlangen, was sich hinter dem Begriff "Volltext" verbirgt, wird im Folgenden ein kleiner Einblick in die technischen Verfahren zur automatisierten Volltexterschließung von Retrodigitalisaten geboten. Fortschritte und auch Grenzen der aktuellen Methoden werden vorgestellt und wie Qualität in diesem Zusammenhang überhaupt bemessen werden kann. Die automatisierten Verfahren zur Volltexterschließung werden am Beispiel historischer Zeitungen erläutert, da deren Zugänglichmachung gerade in den Geisteswissenschaften ein großes Desiderat ist und diese Quellengattung zugleich aufgrund der Spaltenstruktur besondere technische Herausforderungen mit sich bringt. 2016 wurde das DFG-Projekt zur Erstellung eines "Masterplan Zeitungsdigitalisierung" fertiggestellt, dessen Ergebnisse hier einfließen.
  4. Baguhn, J.: Volltextretrieval : stürmische Entwicklungen (1995) 0.01
    0.0078194225 = product of:
      0.03127769 = sum of:
        0.03127769 = product of:
          0.06255538 = sum of:
            0.06255538 = weight(_text_:da in 2329) [ClassicSimilarity], result of:
              0.06255538 = score(doc=2329,freq=2.0), product of:
                0.1475006 = queryWeight, product of:
                  4.7981725 = idf(docFreq=990, maxDocs=44218)
                  0.030740997 = queryNorm
                0.42410251 = fieldWeight in 2329, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  4.7981725 = idf(docFreq=990, maxDocs=44218)
                  0.0625 = fieldNorm(doc=2329)
          0.5 = coord(1/2)
      0.25 = coord(1/4)
    
    Abstract
    10 Jahre cogito lassen auch uns auf diesen in der Branche langen Zeitraum zurückblicken. Der Informationsmarkt 1985 war noch gut überschaubar und von der PSI noch gar nicht als attraktiv erkannt. Doch schon zu diesem Zeitpunkt machten wir uns Gedanken über die Verarbeitung von unstrukturierten Informationen, da mehrere Nachrichtenverteilsysteme für größere Behörden relalisiert wurden. Die Wünsche der Benutzer waren mit herkömmlichen Datenbanken nur schwer zu realisieren oder die Zugriffszeiten zu lang
  5. Silva, E.M. da: Comparing the use of full text search between a conventional IR System and a DBMS (2018) 0.01
    0.0078194225 = product of:
      0.03127769 = sum of:
        0.03127769 = product of:
          0.06255538 = sum of:
            0.06255538 = weight(_text_:da in 4719) [ClassicSimilarity], result of:
              0.06255538 = score(doc=4719,freq=2.0), product of:
                0.1475006 = queryWeight, product of:
                  4.7981725 = idf(docFreq=990, maxDocs=44218)
                  0.030740997 = queryNorm
                0.42410251 = fieldWeight in 4719, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  4.7981725 = idf(docFreq=990, maxDocs=44218)
                  0.0625 = fieldNorm(doc=4719)
          0.5 = coord(1/2)
      0.25 = coord(1/4)
    
  6. Ashford, J.H.; Matkin, D.I.: Studies in the application of free text package systems for information storage and retrieval in libraries and related information centres (1982) 0.01
    0.007361196 = product of:
      0.029444784 = sum of:
        0.029444784 = weight(_text_:m in 1351) [ClassicSimilarity], result of:
          0.029444784 = score(doc=1351,freq=2.0), product of:
            0.07649739 = queryWeight, product of:
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.030740997 = queryNorm
            0.38491225 = fieldWeight in 1351, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.109375 = fieldNorm(doc=1351)
      0.25 = coord(1/4)
    
    Type
    m
  7. Tenopir, C.; Ro, J.S.: Full text databases (1990) 0.01
    0.007361196 = product of:
      0.029444784 = sum of:
        0.029444784 = weight(_text_:m in 1916) [ClassicSimilarity], result of:
          0.029444784 = score(doc=1916,freq=2.0), product of:
            0.07649739 = queryWeight, product of:
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.030740997 = queryNorm
            0.38491225 = fieldWeight in 1916, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.109375 = fieldNorm(doc=1916)
      0.25 = coord(1/4)
    
    Type
    m
  8. Molto, M.: Improving full text search performance through textual analysis (1993) 0.00
    0.0042063976 = product of:
      0.01682559 = sum of:
        0.01682559 = weight(_text_:m in 5099) [ClassicSimilarity], result of:
          0.01682559 = score(doc=5099,freq=2.0), product of:
            0.07649739 = queryWeight, product of:
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.030740997 = queryNorm
            0.21994986 = fieldWeight in 5099, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.0625 = fieldNorm(doc=5099)
      0.25 = coord(1/4)
    
  9. Witt, M.: Au sujet des mots-clés (1997) 0.00
    0.0042063976 = product of:
      0.01682559 = sum of:
        0.01682559 = weight(_text_:m in 1666) [ClassicSimilarity], result of:
          0.01682559 = score(doc=1666,freq=2.0), product of:
            0.07649739 = queryWeight, product of:
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.030740997 = queryNorm
            0.21994986 = fieldWeight in 1666, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.0625 = fieldNorm(doc=1666)
      0.25 = coord(1/4)
    
  10. Laegreid, J.A.: SIFT: a Norwegian information retrieval system (1993) 0.00
    0.0041649807 = product of:
      0.016659923 = sum of:
        0.016659923 = product of:
          0.033319846 = sum of:
            0.033319846 = weight(_text_:22 in 7701) [ClassicSimilarity], result of:
              0.033319846 = score(doc=7701,freq=2.0), product of:
                0.107649736 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.030740997 = queryNorm
                0.30952093 = fieldWeight in 7701, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0625 = fieldNorm(doc=7701)
          0.5 = coord(1/2)
      0.25 = coord(1/4)
    
    Date
    23. 1.1999 19:22:09
  11. Reinisch, F.: Wer suchet - der findet? : oder Die Überwindung der sprachlichen Grenzen bei der Suche in Volltextdatenbanken (2000) 0.00
    0.0041649807 = product of:
      0.016659923 = sum of:
        0.016659923 = product of:
          0.033319846 = sum of:
            0.033319846 = weight(_text_:22 in 4919) [ClassicSimilarity], result of:
              0.033319846 = score(doc=4919,freq=2.0), product of:
                0.107649736 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.030740997 = queryNorm
                0.30952093 = fieldWeight in 4919, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0625 = fieldNorm(doc=4919)
          0.5 = coord(1/2)
      0.25 = coord(1/4)
    
    Date
    22. 7.2000 17:48:06
  12. Zillmann, H.: OSIRIS und eLib : Information Retrieval und Search Engines in Full-text Databases (2001) 0.00
    0.0041649807 = product of:
      0.016659923 = sum of:
        0.016659923 = product of:
          0.033319846 = sum of:
            0.033319846 = weight(_text_:22 in 5937) [ClassicSimilarity], result of:
              0.033319846 = score(doc=5937,freq=2.0), product of:
                0.107649736 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.030740997 = queryNorm
                0.30952093 = fieldWeight in 5937, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0625 = fieldNorm(doc=5937)
          0.5 = coord(1/2)
      0.25 = coord(1/4)
    
    Date
    14. 6.2001 12:22:31
  13. Dambeck, H.; Engler, T.: Gesucht und gefunden : Neun Volltext-Suchprogramme für den Desktop (2002) 0.00
    0.0041649807 = product of:
      0.016659923 = sum of:
        0.016659923 = product of:
          0.033319846 = sum of:
            0.033319846 = weight(_text_:22 in 1169) [ClassicSimilarity], result of:
              0.033319846 = score(doc=1169,freq=2.0), product of:
                0.107649736 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.030740997 = queryNorm
                0.30952093 = fieldWeight in 1169, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0625 = fieldNorm(doc=1169)
          0.5 = coord(1/2)
      0.25 = coord(1/4)
    
    Source
    c't. 2002, H.22, S.190-197
  14. Rosemann, L.: ¬Die Volltextabfrage und das Alleinstellungsmerkmal des physischen Buches (2006) 0.00
    0.0041468753 = product of:
      0.016587501 = sum of:
        0.016587501 = product of:
          0.033175003 = sum of:
            0.033175003 = weight(_text_:da in 5142) [ClassicSimilarity], result of:
              0.033175003 = score(doc=5142,freq=4.0), product of:
                0.1475006 = queryWeight, product of:
                  4.7981725 = idf(docFreq=990, maxDocs=44218)
                  0.030740997 = queryNorm
                0.22491434 = fieldWeight in 5142, product of:
                  2.0 = tf(freq=4.0), with freq of:
                    4.0 = termFreq=4.0
                  4.7981725 = idf(docFreq=990, maxDocs=44218)
                  0.0234375 = fieldNorm(doc=5142)
          0.5 = coord(1/2)
      0.25 = coord(1/4)
    
    Content
    . . . Ich plädiere hier aus den oben genannten wissenstheoretischen Gründen nicht nur für die Aufrechterhaltung eines Mindestmaßes an Registern und Indexen im Anhang von physischen Büchern, sondern sogar für deren Ausbau, deren standardmäßige Zugabe bei Sach- und wissenschaftlichen Büchern gerade angesichts der Volltextnutzung durch Online-Abfragen. Warum? Hierzu sechs Argumente: 1. Wie oben bereits angerissen, lehrt die Erfahrung bei CD-ROM-Zugaben zu opulenten Werken, dass Parallelmedien mit Parallelinhalten von den Nutzern nicht wirklich angenommen werden; es ist umständlich, zur Auffindung bestimmter Textstellen den Computer befragen zu müssen und die Fundstellen dann zwischen zwei Buchdeckeln nachzuschlagen. 2. Über frei wählbare Suchbegriffe seitens des Nutzers ist noch keine Qualität der Suchergebnisse garantiert. Erst das Einrechnen entsprechender Verweisungsbegriffe und Synonyme in die Suchabfrage führt zu Qualität des Ergebnisses. Die scheinbar eingesparten Kosten einer einmaligen bzw. abonnementartigen Investition in eine Online-Verfügbarkeit der Buchinhalte vonseiten der Verlage werden dann über die Hintertür doch wieder fällig, wenn sich nämlich herausstellt, dass Nutzer bei der von ihnen gesuchten Information nicht fündig werden, weil sie unter dem "falschen", d.h. entweder ihnen nicht bekannten oder einem ihnen gerade nicht präsenten Schlagwort gesucht haben. Die Online-Suchabfrage, die auf den ersten Blick höchst nutzerfreundlich erscheint, da eine ungeheure Menge an Titeln die Abfrage umfasst, erweist sich womöglich als wenig brauchbar, wenn sich die Trefferqualität aus den genannten Gründen als beschränkt herausstellt. 3. Nur bei entsprechenden Restriktionen des Zugangs bzw. der präsentierten Textausschnitte werden die Verlage es gewährleistet sehen, dass die Nutzerin, der Nutzer nicht vom Kauf des physischen Buches Abstand nehmen. Nur wenn die Nutzer wissen, dass ihnen gerade jene Informationen am Bildschirm vorenthalten werden, die sie im zu erwerbenden Buch mit Gewissheit finden werden, werden sie das Buch noch erwerben wollen. Wer auf die Schnelle nur ein Kochrezept aus einem teuer bebilderten Kochbuch der Oberklasse abrufen kann, wird das teure Kochbuch eben nicht mehr kaufen. Analog stellt sich die Frage, ob nicht aus diesem Grunde auch Bibliotheken erwägen werden, angesichts der elektronischen Präsenz teuerer physischer Bücher auf den Erwerb der Letzteren zu verzichten, wohl wissend, dass den Wissenschaftlern im Zweifel einige Mausklicks genügen, um die gewünschte Begriffsrecherche erschöpfend beantwortet zu finden.
    4. Vermutlich wird sich aufgrund der genannten Gründe der Buchservice Volltextsuche als heterogen darstellen: Einige Verlage werden gar nicht mitspielen, andere werden ein Buch im Vollzugriff, ein anderes nur zum Teil, ein drittes nur als Metainformation usw. indizieren lassen. Dies wird letztlich ebenfalls die Trefferqualität schmälern, da der Nutzer dann wiederum wissen muss, genau welche Informationen und Texte ihm bei seiner Suche vorenthalten werden. Das gedruckte Sachbuch wird gegen seinen eigenen digitalen Klon ein Alleinstellungsmerkmal brauchen, um weiterhin attraktiv zu sein. 5. Ein solches Alleinstellungsmerkmal würde m.E. maßgeblich durch die Erstellung von gedruckten Registern bereits in der Druckausgabe erreicht werden. Damit würde die Druckausgabe tatsächlich an Wert gewinnen und der Buchkäufer erhielte einen echten Mehrwert. Zum einen spiegelt sich bereits in der Erstellung konventioneller gedruckter Register die zweite digitale Revolution wider: Moderne Registererstellung basiert heutzutage ebenfalls auf der digitalen Verwertung des Volltextes. Zum anderen erfordert das "Registermachen" zugleich die Erbringung jener o.g. sachdienlichen Mehrinformationen wie Verweisungsbegriffe, vernünftige Klassifizierungen, nicht-redundante Begriffsauswahl etc., die nur begrenzt automatisierbar sind und Fachwissen erfordern. Erst diese beiden Komponenten lassen die Indexierung schlussendlich zu einer hochwertigen Aufbereitung sequentieller Information werden. 6. Genau diese Mehr- und Metainformationen, die die vorausgegangene Erstellung eines Print-Vollregisters geliefert hat, lassen sich dann in den Suchalgorithmus der Online-Suche zur Qualitätssteigerung der Treffer einrechnen."
  15. Couvreur, T.R.; Benzel, R.N.; Miller, S.F.; Zeitler, D.N.; Lee, D.L.; Singhal, M.; Shivaratri, N.; Wong, W.Y.P.: ¬An analysis of performance and cost factors in searching large text databases using parallel search systems (1994) 0.00
    0.003680598 = product of:
      0.014722392 = sum of:
        0.014722392 = weight(_text_:m in 7657) [ClassicSimilarity], result of:
          0.014722392 = score(doc=7657,freq=2.0), product of:
            0.07649739 = queryWeight, product of:
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.030740997 = queryNorm
            0.19245613 = fieldWeight in 7657, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.0546875 = fieldNorm(doc=7657)
      0.25 = coord(1/4)
    
  16. Magennis, M.: Expert rule-based query expansion (1995) 0.00
    0.003680598 = product of:
      0.014722392 = sum of:
        0.014722392 = weight(_text_:m in 5181) [ClassicSimilarity], result of:
          0.014722392 = score(doc=5181,freq=2.0), product of:
            0.07649739 = queryWeight, product of:
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.030740997 = queryNorm
            0.19245613 = fieldWeight in 5181, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5181)
      0.25 = coord(1/4)
    
  17. Bernard, M.: Modelling the efficient access to full-text information (1996) 0.00
    0.003680598 = product of:
      0.014722392 = sum of:
        0.014722392 = weight(_text_:m in 5610) [ClassicSimilarity], result of:
          0.014722392 = score(doc=5610,freq=2.0), product of:
            0.07649739 = queryWeight, product of:
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.030740997 = queryNorm
            0.19245613 = fieldWeight in 5610, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5610)
      0.25 = coord(1/4)
    
  18. Casale, M.: Full text retrieval for the Web (1996) 0.00
    0.003680598 = product of:
      0.014722392 = sum of:
        0.014722392 = weight(_text_:m in 6757) [ClassicSimilarity], result of:
          0.014722392 = score(doc=6757,freq=2.0), product of:
            0.07649739 = queryWeight, product of:
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.030740997 = queryNorm
            0.19245613 = fieldWeight in 6757, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.0546875 = fieldNorm(doc=6757)
      0.25 = coord(1/4)
    
  19. Melucci, M.: Passage retrieval : a probabilistic technique (1998) 0.00
    0.003680598 = product of:
      0.014722392 = sum of:
        0.014722392 = weight(_text_:m in 1150) [ClassicSimilarity], result of:
          0.014722392 = score(doc=1150,freq=2.0), product of:
            0.07649739 = queryWeight, product of:
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.030740997 = queryNorm
            0.19245613 = fieldWeight in 1150, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.0546875 = fieldNorm(doc=1150)
      0.25 = coord(1/4)
    
  20. Shewale, N.G.: Information delivery of full-text databases in academic and research libraries using hypermedia (1998) 0.00
    0.003680598 = product of:
      0.014722392 = sum of:
        0.014722392 = weight(_text_:m in 3566) [ClassicSimilarity], result of:
          0.014722392 = score(doc=3566,freq=2.0), product of:
            0.07649739 = queryWeight, product of:
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.030740997 = queryNorm
            0.19245613 = fieldWeight in 3566, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.4884486 = idf(docFreq=9980, maxDocs=44218)
              0.0546875 = fieldNorm(doc=3566)
      0.25 = coord(1/4)
    
    Source
    Information management in academic and research libraries: Proceedings of the 5th National convention for Automation of Libraries in Education and Research (CALIBER-98), Bhubaneswar, India, 4-5 March 1998. Ed. by M. Mahapatra et al