Search (8 results, page 1 of 1)

  • × theme_ss:"Volltextretrieval"
  1. Kugler, A.: Automatisierte Volltexterschließung von Retrodigitalisaten am Beispiel historischer Zeitungen (2018) 0.05
    0.045704618 = product of:
      0.15234873 = sum of:
        0.055194784 = weight(_text_:bibliothek in 4595) [ClassicSimilarity], result of:
          0.055194784 = score(doc=4595,freq=4.0), product of:
            0.14340276 = queryWeight, product of:
              4.1055303 = idf(docFreq=1980, maxDocs=44218)
              0.034929167 = queryNorm
            0.38489348 = fieldWeight in 4595, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.1055303 = idf(docFreq=1980, maxDocs=44218)
              0.046875 = fieldNorm(doc=4595)
        0.055194784 = weight(_text_:bibliothek in 4595) [ClassicSimilarity], result of:
          0.055194784 = score(doc=4595,freq=4.0), product of:
            0.14340276 = queryWeight, product of:
              4.1055303 = idf(docFreq=1980, maxDocs=44218)
              0.034929167 = queryNorm
            0.38489348 = fieldWeight in 4595, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.1055303 = idf(docFreq=1980, maxDocs=44218)
              0.046875 = fieldNorm(doc=4595)
        0.041959155 = product of:
          0.08391831 = sum of:
            0.08391831 = weight(_text_:digitalisierung in 4595) [ClassicSimilarity], result of:
              0.08391831 = score(doc=4595,freq=2.0), product of:
                0.21027826 = queryWeight, product of:
                  6.0201335 = idf(docFreq=291, maxDocs=44218)
                  0.034929167 = queryNorm
                0.3990822 = fieldWeight in 4595, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  6.0201335 = idf(docFreq=291, maxDocs=44218)
                  0.046875 = fieldNorm(doc=4595)
          0.5 = coord(1/2)
      0.3 = coord(3/10)
    
    Abstract
    Seit ein paar Jahren postuliert die DFG in ihren Praxisregeln "Digitalisierung", dass eine ausschließliche Bilddigitalisierung nicht mehr den wissenschaftlichen Ansprüchen Genüge leiste, sondern der digitale Volltext notwendig sei, da dieser die Basis für eine wissenschaftliche Nachnutzung darstellt. Um ein besseres Verständnis davon zu erlangen, was sich hinter dem Begriff "Volltext" verbirgt, wird im Folgenden ein kleiner Einblick in die technischen Verfahren zur automatisierten Volltexterschließung von Retrodigitalisaten geboten. Fortschritte und auch Grenzen der aktuellen Methoden werden vorgestellt und wie Qualität in diesem Zusammenhang überhaupt bemessen werden kann. Die automatisierten Verfahren zur Volltexterschließung werden am Beispiel historischer Zeitungen erläutert, da deren Zugänglichmachung gerade in den Geisteswissenschaften ein großes Desiderat ist und diese Quellengattung zugleich aufgrund der Spaltenstruktur besondere technische Herausforderungen mit sich bringt. 2016 wurde das DFG-Projekt zur Erstellung eines "Masterplan Zeitungsdigitalisierung" fertiggestellt, dessen Ergebnisse hier einfließen.
    Content
    Vgl.: http://journals.ub.uni-heidelberg.de/index.php/bibliothek/article/view/48394. Vgl. auch: URN (PDF): http://nbn-resolving.de/urn:nbn:de:bsz:16-pb-483949.
    Source
    Perspektive Bibliothek. 7(2018) H.1, S.33-54
  2. Enderle, W.: Neue Wege der bibliothekarischen Informationserschließung : von der Erschließung unselbständiger Literatur über Volltextindizierung bis zu Hypertext- und Expertensystemen (1994) 0.02
    0.015611442 = product of:
      0.07805721 = sum of:
        0.039028604 = weight(_text_:bibliothek in 2035) [ClassicSimilarity], result of:
          0.039028604 = score(doc=2035,freq=2.0), product of:
            0.14340276 = queryWeight, product of:
              4.1055303 = idf(docFreq=1980, maxDocs=44218)
              0.034929167 = queryNorm
            0.27216077 = fieldWeight in 2035, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.1055303 = idf(docFreq=1980, maxDocs=44218)
              0.046875 = fieldNorm(doc=2035)
        0.039028604 = weight(_text_:bibliothek in 2035) [ClassicSimilarity], result of:
          0.039028604 = score(doc=2035,freq=2.0), product of:
            0.14340276 = queryWeight, product of:
              4.1055303 = idf(docFreq=1980, maxDocs=44218)
              0.034929167 = queryNorm
            0.27216077 = fieldWeight in 2035, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.1055303 = idf(docFreq=1980, maxDocs=44218)
              0.046875 = fieldNorm(doc=2035)
      0.2 = coord(2/10)
    
    Abstract
    Die bibliothekarische Informationserschließung war unist bislang durch den OPAC geprägt, der im wesentlichen die Monographien und Zeitschriften einer Bibliothek erschließt. Es werden 2 neue Bereiche skizziert, die in Zukunft ebenfalls Teil der bibliothekarischen Informationserschließung sein können und werden: die Erschließung unselbständiger Literatur und der Einsatz automatisierter 'reference and information services'. Im ersten Fall ist die Entwicklung bereits weit vorangeschritten, Verbundsysteme und Library Suppliers bieten bereits Inhaltsdaten von Zeitschriften als Fremdleistung an. Im zweiten Fall ist die Entwicklung, vor allem im angloamerikanischen Raum, noch - trotz zahlreicher Projekte - in den Anfängen. Der Einsatz wissensbasierter Systeme in diesem Bereich macht die Aufgaben hier besonders komplex, biete zugleich aber hanz neue Lösungsmöglichkeiten an, wie am Beispiel einiger amerikanischer Projekte dokumentiert wird. Wesentlich ist, daß Informationserschließungssysteme, wie sie ansatzweise im Internet bereits eingesetzt werden, den gesamten bereich elektronischer wie herkömmlicher Information umfassen, um einen allgemeinen und umfassenden Einstieg für den Informationssuchenden zu bieten
  3. Rosemann, L.: ¬Die Volltextabfrage und das Alleinstellungsmerkmal des physischen Buches (2006) 0.01
    0.007805721 = product of:
      0.039028604 = sum of:
        0.019514302 = weight(_text_:bibliothek in 5142) [ClassicSimilarity], result of:
          0.019514302 = score(doc=5142,freq=2.0), product of:
            0.14340276 = queryWeight, product of:
              4.1055303 = idf(docFreq=1980, maxDocs=44218)
              0.034929167 = queryNorm
            0.13608038 = fieldWeight in 5142, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.1055303 = idf(docFreq=1980, maxDocs=44218)
              0.0234375 = fieldNorm(doc=5142)
        0.019514302 = weight(_text_:bibliothek in 5142) [ClassicSimilarity], result of:
          0.019514302 = score(doc=5142,freq=2.0), product of:
            0.14340276 = queryWeight, product of:
              4.1055303 = idf(docFreq=1980, maxDocs=44218)
              0.034929167 = queryNorm
            0.13608038 = fieldWeight in 5142, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.1055303 = idf(docFreq=1980, maxDocs=44218)
              0.0234375 = fieldNorm(doc=5142)
      0.2 = coord(2/10)
    
    Content
    "Mit Google Print bzw. mittlerweile Google Book Search und dem Projekt zur Übernahme eines brancheneigenen Portals zur Pflege und Bereitstellung digitaler Daten aus Büchern namens "Volltextsuche online" initiiert durch den Börsenverein des Deutschen Buchhandels tritt ein Thema auf den Plan, das im deutschen Sprachraum lange vernachlässigt wurde: allgemein gesprochen, die Notwendigkeit der Texterschließung durch Indexierung - sei sie gedruckt in Form von Registern im Anhang von Sach- und wissenschaftlichen Büchern oder ungedruckt in Form sog. Volltextabfragen per Suchmaske am Computer. Angesichts der exponentiell wachsenden Menge an Wissen ist es gut, wenn hierzu Überlegungen angestellt werden und damit die Chance besteht, neben der wirtschaftlichen auch über die wissenstheoretische Dimension dieser Dienste nachzudenken. Zweifellos wird die Bedeutung der Indexierung von Fließtext aus wissenstheoretischer Sicht in Zukunft noch weiter wachsen und bedeutet im Falle einer Online-Plattform (wenn sie denn in naher Zukunft eine hinreichend große Menge an Büchern in ihrem Datenbestand aufweisen wird) die Erfüllung eines Traumes für die wissenschaftliche Arbeit: Es ist fantastisch, in Millisekunden das Vorhandensein von Personen, Termen, Phrasen und Wortkomposita zu ermitteln, um die Ein- bzw. Nichteinschlägigkeit eines Buches und - mehr noch -vieler Bücher für die eigene Arbeit eindeutig beantworten zu können. Es ist fantastisch, im Trefferfall die gesuchte Information sogleich auf dem Monitor exzerpieren zu können oder sich auch bei ausbleibenden Treffern das Durcharbeiten eines ganzen Buches, vielleicht sogar einer halben Bibliothek ersparen zu können. Dabei ist das letztere Resultat mindestens eine genauso wichtige Information wie die erste, denn auch sie wird- man darf fast sagen, so gut wie immer - zu einer unglaublichen Ersparnis an Zeit verhelfen; hier bedeutet allein schon die Verringerung der Datenmenge einen Zuwachs an Wissen unter minimalem Zeitaufwand. Angesichts dieser Diagnose ist die These zu wagen, die digitale Revolution beginnt erst wirklich bei der Nutzung der Volltexte selbst als Datenquelle zur Wissensabfrage.
  4. Laegreid, J.A.: SIFT: a Norwegian information retrieval system (1993) 0.00
    0.0018929681 = product of:
      0.01892968 = sum of:
        0.01892968 = product of:
          0.03785936 = sum of:
            0.03785936 = weight(_text_:22 in 7701) [ClassicSimilarity], result of:
              0.03785936 = score(doc=7701,freq=2.0), product of:
                0.122315995 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.034929167 = queryNorm
                0.30952093 = fieldWeight in 7701, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0625 = fieldNorm(doc=7701)
          0.5 = coord(1/2)
      0.1 = coord(1/10)
    
    Date
    23. 1.1999 19:22:09
  5. Reinisch, F.: Wer suchet - der findet? : oder Die Überwindung der sprachlichen Grenzen bei der Suche in Volltextdatenbanken (2000) 0.00
    0.0018929681 = product of:
      0.01892968 = sum of:
        0.01892968 = product of:
          0.03785936 = sum of:
            0.03785936 = weight(_text_:22 in 4919) [ClassicSimilarity], result of:
              0.03785936 = score(doc=4919,freq=2.0), product of:
                0.122315995 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.034929167 = queryNorm
                0.30952093 = fieldWeight in 4919, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0625 = fieldNorm(doc=4919)
          0.5 = coord(1/2)
      0.1 = coord(1/10)
    
    Date
    22. 7.2000 17:48:06
  6. Zillmann, H.: OSIRIS und eLib : Information Retrieval und Search Engines in Full-text Databases (2001) 0.00
    0.0018929681 = product of:
      0.01892968 = sum of:
        0.01892968 = product of:
          0.03785936 = sum of:
            0.03785936 = weight(_text_:22 in 5937) [ClassicSimilarity], result of:
              0.03785936 = score(doc=5937,freq=2.0), product of:
                0.122315995 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.034929167 = queryNorm
                0.30952093 = fieldWeight in 5937, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0625 = fieldNorm(doc=5937)
          0.5 = coord(1/2)
      0.1 = coord(1/10)
    
    Date
    14. 6.2001 12:22:31
  7. Dambeck, H.; Engler, T.: Gesucht und gefunden : Neun Volltext-Suchprogramme für den Desktop (2002) 0.00
    0.0018929681 = product of:
      0.01892968 = sum of:
        0.01892968 = product of:
          0.03785936 = sum of:
            0.03785936 = weight(_text_:22 in 1169) [ClassicSimilarity], result of:
              0.03785936 = score(doc=1169,freq=2.0), product of:
                0.122315995 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.034929167 = queryNorm
                0.30952093 = fieldWeight in 1169, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0625 = fieldNorm(doc=1169)
          0.5 = coord(1/2)
      0.1 = coord(1/10)
    
    Source
    c't. 2002, H.22, S.190-197
  8. Sievert, M.E.; McKinin, E.J.: Why full-text misses some relevant documents : an analysis of documents not retrieved by CCML or MEDIS (1989) 0.00
    0.0014197261 = product of:
      0.01419726 = sum of:
        0.01419726 = product of:
          0.02839452 = sum of:
            0.02839452 = weight(_text_:22 in 3564) [ClassicSimilarity], result of:
              0.02839452 = score(doc=3564,freq=2.0), product of:
                0.122315995 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.034929167 = queryNorm
                0.23214069 = fieldWeight in 3564, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.046875 = fieldNorm(doc=3564)
          0.5 = coord(1/2)
      0.1 = coord(1/10)
    
    Date
    9. 1.1996 10:22:31