Search (5 results, page 1 of 1)

  • × language_ss:"e"
  • × theme_ss:"Kataloganreicherung"
  • × year_i:[2000 TO 2010}
  1. Kantor, P.B.; Voorhees, E.: Information retrieval with scanned texts (2000) 0.01
    0.012945342 = product of:
      0.09061739 = sum of:
        0.022830293 = weight(_text_:information in 3901) [ClassicSimilarity], result of:
          0.022830293 = score(doc=3901,freq=4.0), product of:
            0.052020688 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.029633347 = queryNorm
            0.43886948 = fieldWeight in 3901, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.125 = fieldNorm(doc=3901)
        0.067787096 = weight(_text_:retrieval in 3901) [ClassicSimilarity], result of:
          0.067787096 = score(doc=3901,freq=4.0), product of:
            0.08963835 = queryWeight, product of:
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.029633347 = queryNorm
            0.75622874 = fieldWeight in 3901, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.125 = fieldNorm(doc=3901)
      0.14285715 = coord(2/14)
    
    Source
    Information retrieval. 2(2000), S.165-176
  2. Hauer, M.: Collaborative catalog enrichment : 4. Benutzertreffen intelligentCAPTURE / dandelon.com (2007) 0.01
    0.007899201 = product of:
      0.036862936 = sum of:
        0.019314893 = weight(_text_:bibliothek in 515) [ClassicSimilarity], result of:
          0.019314893 = score(doc=515,freq=2.0), product of:
            0.121660605 = queryWeight, product of:
              4.1055303 = idf(docFreq=1980, maxDocs=44218)
              0.029633347 = queryNorm
            0.15876046 = fieldWeight in 515, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.1055303 = idf(docFreq=1980, maxDocs=44218)
              0.02734375 = fieldNorm(doc=515)
        0.0070627616 = weight(_text_:information in 515) [ClassicSimilarity], result of:
          0.0070627616 = score(doc=515,freq=8.0), product of:
            0.052020688 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.029633347 = queryNorm
            0.13576832 = fieldWeight in 515, product of:
              2.828427 = tf(freq=8.0), with freq of:
                8.0 = termFreq=8.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.02734375 = fieldNorm(doc=515)
        0.010485282 = weight(_text_:retrieval in 515) [ClassicSimilarity], result of:
          0.010485282 = score(doc=515,freq=2.0), product of:
            0.08963835 = queryWeight, product of:
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.029633347 = queryNorm
            0.11697317 = fieldWeight in 515, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.02734375 = fieldNorm(doc=515)
      0.21428572 = coord(3/14)
    
    Content
    "AGI - Information Management Consultants (www.agi-imc.de) hatte am 8. und 9. Mai 2007 zum vierten Mal Bibliotheken und Partner zum Erfahrungsaustausch nach Neustadt an der Weinstraße eingeladen. Die angereisten Teilnehmer betreiben bereits mittels intelligentCAPTURE die Produktion und über dandelon.com den Austausch und die Publikation (www.dandelon.com). Mittlerweile wird intelligentCAPTURE in Deutschland, Österreich, Liechtenstein, Italien und in der Schweiz eingesetzt. Die PDF-Dateien gelangen über einen Partner bis zur weltgrößten Bibliothek, der Library of Congress in Washington. In Deutschland ist der GBV - Gemeinsamer Bibliotheksverband in Göttingen (www.gbv.de) Partner von AGI und der größte Sekundärnutzer von dandelon.com. In dandelon.com sind derzeit über 220.000 Bücher suchbar, die Datenbank wächst täglich. Weitere 62.000 Titel werden nach einem Software-Update demnächst geladen; sie stammen aus Projekten mit der Staats-und Universitätsbibliothek Hamburg und der TIB Hannover. Vergleichbare Scanprojekte laufen derzeit in einer Spezialbibliothek in Hamburg, der UB Braunschweig und UB Mainz. AGI geht von 400 bis 500.000 Buchtiteln bis Ende 2007 aus. Erstmals sahen die Teilnehmer "intelligentCAPTURE mobile". Eine Lösung, welche die Scanner selbst zwischen die engsten Regale fährt und somit erheblich den Transportaufwand reduziert - der Scanner wird zum Buch transportiert, nicht Tonnen von Büchern zu Scannern. Gemeinsam mit dem führenden Anbieter von Bibliothekseinrichtungen Schulz Speyer (www.schulzspeyer.de) wurde intelligentCAPTURE mobil gemacht.
    Bis zu 530 Bücherinhaltsverzeichnisse wurden bisher von einer Person an einem Tag damit produziert. Rund 1.000 Bücher pro Tag ist die durchschnittliche Menge bei einem Scanteam mit drei Scanstationen. Digitalisiert wird immer nur der urheberrechtsfreie bzw. durch Lizenzierung zulässige Bereich. Neben Büchern werden auch Zeitschriften ausgewertet. So sind z.B. die Aufsätze aus der Zeitschrift "IWP - Information. Wissenschaft und Praxis" der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis (http://www.dgi-info.de) komplett digital - und einige auch mit MP3Hördateien ergänzt. Anwendung finden seit 2006 die Lösungen von AGI auch in der Suche von Parlamentsmaterialien, also in der öffentlichen Verwaltung - konkret dem wirtschaftlich erfolgreichsten Bundesland Österreichs, Vorarlberg. Diese Leistung wird als Dienstleistung der Vorarlberger Landesbibliothek (http://vlb-katalog.vorarlberg.de) erbracht (www.vorarlberg.at/landtag/landtag/parlamentarischematerialien/recherche.htm)
    Das Highlight unter den Referaten bei dieser Tagung waren die Ausführungen des Vordenkers Andreas Prokoph, Lead Architect - Search Technologies and Portal Server Development, vom deutschen IBM Entwicklungslabor. Er sprach über Information Retrieval. Mit über 200 Patenten, darunter auch seinen eigenen, liegt IBM in diesem Forschungsfeld weit vorne. Die IBM Suchmaschine OMNIFIND soll möglichst bald die Suchtechnik hinter dandelon.com ersetzen und den Suchraum auf Kataloge, Open Archives, Verlage, Hochschul-Server ausdehnen. Schon heute basieren intelligentCAPTURE und dandelon.com weitgehend auf IBM-Technologien, konkret Lotus Notes & Domino und Lotus Sametime (www.ibm.corn/ lotus/hannover), aber auch auf integrierten Modulen anderer international führender Technologiespezialisten."
    Source
    Information - Wissenschaft und Praxis. 58(2007) H.5, S.311
  3. Tseng, Y.-H.: Automatic cataloguing and searching for retrospective data by use of OCR text (2001) 0.01
    0.0059455284 = product of:
      0.041618697 = sum of:
        0.0104854815 = weight(_text_:information in 5421) [ClassicSimilarity], result of:
          0.0104854815 = score(doc=5421,freq=6.0), product of:
            0.052020688 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.029633347 = queryNorm
            0.20156369 = fieldWeight in 5421, product of:
              2.4494898 = tf(freq=6.0), with freq of:
                6.0 = termFreq=6.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.046875 = fieldNorm(doc=5421)
        0.031133216 = weight(_text_:retrieval in 5421) [ClassicSimilarity], result of:
          0.031133216 = score(doc=5421,freq=6.0), product of:
            0.08963835 = queryWeight, product of:
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.029633347 = queryNorm
            0.34732026 = fieldWeight in 5421, product of:
              2.4494898 = tf(freq=6.0), with freq of:
                6.0 = termFreq=6.0
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.046875 = fieldNorm(doc=5421)
      0.14285715 = coord(2/14)
    
    Abstract
    This article describes our efforts in supporting information retrieval from OCR degraded text. In particular, we report our approach to an automatic cataloging and searching contest for books in multiple languages. In this contest, 500 books in English, German, French, and Italian published during the 1770s to 1970s are scanned into images and OCRed to digital text. The goal is to use only automatic ways to extract information for sophisticated searching. We adopted the vector space retrieval model, an n-gram indexing method, and a special weighting scheme to tackle this problem. Although the performance by this approach is slightly inferior to the best approach, which is mainly based on regular expression match, one advantage of our approach is that it is less language dependent and less layout sensitive, thus is readily applicable to other languages and document collections. Problems of OCR text retrieval for some Asian languages are also discussed in this article, and solutions are suggested
    Source
    Journal of the American Society for Information Science and technology. 52(2001) no.5, S.378-390
  4. Lam, V.-T.: Enhancing subject access to monographs in Online Public Access Catalogs : table of contents added to bibliographic records (2000) 0.00
    0.002011945 = product of:
      0.014083615 = sum of:
        0.0060537956 = weight(_text_:information in 1187) [ClassicSimilarity], result of:
          0.0060537956 = score(doc=1187,freq=2.0), product of:
            0.052020688 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.029633347 = queryNorm
            0.116372846 = fieldWeight in 1187, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.046875 = fieldNorm(doc=1187)
        0.008029819 = product of:
          0.024089456 = sum of:
            0.024089456 = weight(_text_:22 in 1187) [ClassicSimilarity], result of:
              0.024089456 = score(doc=1187,freq=2.0), product of:
                0.103770934 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.029633347 = queryNorm
                0.23214069 = fieldWeight in 1187, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.046875 = fieldNorm(doc=1187)
          0.33333334 = coord(1/3)
      0.14285715 = coord(2/14)
    
    Date
    22. 9.1997 19:16:05
    Imprint
    Urbana-Champaign, IL : Illinois University at Urbana-Champaign, Graduate School of Library and Information Science
  5. "Catalogue enrichment" : hbz kooperiert mit Springer (2006) 0.00
    3.6034497E-4 = product of:
      0.0050448296 = sum of:
        0.0050448296 = weight(_text_:information in 5165) [ClassicSimilarity], result of:
          0.0050448296 = score(doc=5165,freq=2.0), product of:
            0.052020688 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.029633347 = queryNorm
            0.09697737 = fieldWeight in 5165, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.0390625 = fieldNorm(doc=5165)
      0.071428575 = coord(1/14)
    
    Series
    Information digital