Search (10 results, page 1 of 1)

  • × theme_ss:"Kataloganreicherung"
  1. Lohmann, H.: KASCADE: Dokumentanreicherung und automatische Inhaltserschließung : Projektbericht und Ergebnisse des Retrievaltests (2000) 0.01
    0.0057617277 = product of:
      0.07490246 = sum of:
        0.07490246 = weight(_text_:komponente in 494) [ClassicSimilarity], result of:
          0.07490246 = score(doc=494,freq=4.0), product of:
            0.17682779 = queryWeight, product of:
              7.7456436 = idf(docFreq=51, maxDocs=44218)
              0.022829322 = queryNorm
            0.4235899 = fieldWeight in 494, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              7.7456436 = idf(docFreq=51, maxDocs=44218)
              0.02734375 = fieldNorm(doc=494)
      0.07692308 = coord(1/13)
    
    Abstract
    Verbesserungen des Gewichtungsverfahrens sollten schließlich unterstützt werden durch Maßnahmen zur Optimierung der Retrievalumgebung, etwa durch - den Einsatz von Hypertextwerkzeugen; - die Integration der THEAS-Komponente, mit der die automatische Mehrwortgruppengewinnung mit Hilfe eines Mehrwortgruppen-Parsers möglich ist; dies könnte im Rahmen der Dialogführung mit dem Nutzer eingesetzt werden, wenn dieser Teilkomponenten solcher Mehrwortgruppen im Retrieval verwendet. Mit THEAS wäre daneben der Einstieg in das Retrieval über das Register mit kanonischen Formen möglich; - die Integration von Wörterbuchfunktionen zur Benutzerunterstützung. Eine Weiterentwicklung des SELIX-Verfahrens könnte daneben in diese Richtungen erfolgen: - Bildung von Dokument-Clustern. Dabei werden Dokumente in einem Dokumenten-Raum einander in dem Maße zugeordnet, in dem ihre selektierten Grundformen übereinstimmen. - Errichtung von statistisch basierten semantischen Netzen, in denen Grundformen einander in einem Begriffs-Raum in dem Maße zugeordnet werden, in dem sie "gemeinsam" in Dokumenten auftreten.
    Da sich mit jedem Dokument, das zu dem im Gewichtungsverfahren befindlichen Gesamtbestand hinzukommt, die Werte aller bereits gewichteten Deskriptoren ändern können, müsste die Berechnung der Häufigkeitsverteilung jeder Grundform im Prinzip nach jeder Änderung im Dokumentbestand neu berechnet werden. Eine Online-Aktualisierung des Bestandes erscheint daher wenig sinnvoll. In der Praxis könnte eine Neuberechnung in bestimmten zeitlichen Abständen mit einem Abzug des OPAC-Bestandes unabhängig vom eigentlichen Betrieb des OPAC erfolgen, was auch insofern genügen würde, als die zugrunde liegenden Maße auf relativen Häufigkeiten basieren. Dadurch würde nur ein geringer Verzug in der Bereitstellung der aktuellen Gewichte eintreten. Außerdem würde der Zeitfaktor eine nur untergeordnete Rolle spielen, da ein offline ablaufender Gewichtungslauf erst bis zum nächsten Aktualisierungszeitpunkt abgeschlossen sein müsste. Denkbar wäre zusätzlich, für die Zeit zwischen zwei Aktualisierungen des OPACs für die in den Neuzugängen enthaltenen Begriffe Standardgewichte einzusetzen, soweit diese Begriffe bereits in dem Bestand auftreten. Bei entsprechender Optimierung und Rationalisierung der SELIX-Verfahrensabläufe, Nutzung der Gewichte auf der Retrievalseite für ein Ranking der auszugebenden Dokumente und Integration der THEAS-Komponente kann das Verfahren zu einem wirkungsvollen Instrument zur Verbesserung der Retrievaleffektivität weiterentwickelt werden.
  2. Müller, C.; Sternitzke, N.; Stratmann, R.; Parschik, T.: Kataloganreicherung und Zeitschriftenerschließung mit MyBib eDoc und C-3 am Ibero-Amerikanischen Institut, Preußischer Kulturbesitz : Neue Verfahren zur Optimierung der bibliografischen Nachweissituation in einer großen Spezialbibliothek (2010) 0.00
    0.0031106216 = product of:
      0.04043808 = sum of:
        0.04043808 = weight(_text_:formale in 3499) [ClassicSimilarity], result of:
          0.04043808 = score(doc=3499,freq=2.0), product of:
            0.14453042 = queryWeight, product of:
              6.330911 = idf(docFreq=213, maxDocs=44218)
              0.022829322 = queryNorm
            0.2797894 = fieldWeight in 3499, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              6.330911 = idf(docFreq=213, maxDocs=44218)
              0.03125 = fieldNorm(doc=3499)
      0.07692308 = coord(1/13)
    
    Abstract
    Zur Bewältigung dieser Menge an Artikeldaten kommt im IAI die Software C-3 der ImageWare Components GmbH zum Einsatz, die es ermöglicht, die formale Erschließung in einem größtenteils automatisierten Geschäftsgang durchzuführen. In den einzelnen Modulen von C-3 erfolgt die automatische Erkennung der Titel-, Autoren- und Seitenzahlinformationen in den gescannten Inhaltsverzeichnissen sowie deren automatische Indexierung und Konversion in Katalogisate. An den Indexierungsarbeitsplätzen kommen normale Standard-PCs zum Einsatz, über die auf die Auftragsverwaltung des zentralen C-3 Periodikaservers per Browser zugegriffen wird. Die C-3 Software besteht aus den Programmmodulen C-3 Template und C-3 Index. In C-3 Template werden einmalig für jeden Zeitschriftentitel die Struktur der Inhaltsverzeichnisse (Interpretationstyp Regel, Tabelle oder Freiform), die Abfolge von Aufsatztitel, Autoren und Seitenzahlen sowie die Schriftattribute (fett, kursiv etc.) der bibliografischen Daten festgelegt. Auf Basis dieser Templatedefinition werden die Scans der jeweiligen Inhaltsverzeichnisse im C-3 Index Modul mit der OCR Software Abbyy Fine Reader so erkannt, dass die bibliografischen Informationen der einzelnen Aufsätze bereits kategorisiert und aufsatzweise separiert ausgegeben werden. Die dabei erzeugten Daten können, sofern erforderlich, noch während der Bearbeitung mit C-3 mit einer Reihe von integrierten Nachbearbeitungstools korrigiert und im Anschluss im XML-Format an den C-3 Periodikaserver exportiert werden. Automatische Konversionsroutinen erzeugen aus den xml-Dateien serverseitig Artikeldaten im Pica3-Format, die nach einer abschließenden Qualitätskontrolle in die Online Contents Datenbanken des GBV eingespielt werden.
  3. Gratch, B.; Settel, B.; Atherton, P.: Characteristics of book indexes for subject retrieval in the humanities and social sciences (1978) 0.00
    0.0011103286 = product of:
      0.014434271 = sum of:
        0.014434271 = product of:
          0.04330281 = sum of:
            0.04330281 = weight(_text_:22 in 1061) [ClassicSimilarity], result of:
              0.04330281 = score(doc=1061,freq=2.0), product of:
                0.079944395 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.022829322 = queryNorm
                0.5416616 = fieldWeight in 1061, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.109375 = fieldNorm(doc=1061)
          0.33333334 = coord(1/3)
      0.07692308 = coord(1/13)
    
    Source
    Indexer. 11(1978), S.14-22
  4. Ingwersen, P.; Wormell, I.: Modern indexing and retrieval techniques matching different types of information needs (1989) 0.00
    0.0011103286 = product of:
      0.014434271 = sum of:
        0.014434271 = product of:
          0.04330281 = sum of:
            0.04330281 = weight(_text_:22 in 7322) [ClassicSimilarity], result of:
              0.04330281 = score(doc=7322,freq=2.0), product of:
                0.079944395 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.022829322 = queryNorm
                0.5416616 = fieldWeight in 7322, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.109375 = fieldNorm(doc=7322)
          0.33333334 = coord(1/3)
      0.07692308 = coord(1/13)
    
    Source
    International forum on information and documentation. 14(1989), S.17-22
  5. Lam, V.-T.: Enhancing subject access to monographs in Online Public Access Catalogs : table of contents added to bibliographic records (2000) 0.00
    4.758551E-4 = product of:
      0.006186116 = sum of:
        0.006186116 = product of:
          0.018558348 = sum of:
            0.018558348 = weight(_text_:22 in 1187) [ClassicSimilarity], result of:
              0.018558348 = score(doc=1187,freq=2.0), product of:
                0.079944395 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.022829322 = queryNorm
                0.23214069 = fieldWeight in 1187, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.046875 = fieldNorm(doc=1187)
          0.33333334 = coord(1/3)
      0.07692308 = coord(1/13)
    
    Date
    22. 9.1997 19:16:05
  6. Leissing, U.; Rädler, K.; Hauer, M.: Query-Expansion durch Fachthesauri : Erfahrungsbericht zu dandelon.com, Vorarlberger Parlamentsinformationssystem und vorarlberg.at (2010) 0.00
    4.758551E-4 = product of:
      0.006186116 = sum of:
        0.006186116 = product of:
          0.018558348 = sum of:
            0.018558348 = weight(_text_:22 in 3728) [ClassicSimilarity], result of:
              0.018558348 = score(doc=3728,freq=2.0), product of:
                0.079944395 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.022829322 = queryNorm
                0.23214069 = fieldWeight in 3728, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.046875 = fieldNorm(doc=3728)
          0.33333334 = coord(1/3)
      0.07692308 = coord(1/13)
    
    Source
    Wissensspeicher in digitalen Räumen: Nachhaltigkeit - Verfügbarkeit - semantische Interoperabilität. Proceedings der 11. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation, Konstanz, 20. bis 22. Februar 2008. Hrsg.: J. Sieglerschmidt u. H.P.Ohly
  7. Rädler, K.: Kataloganreicherung mit digitalen Inhaltsverzeichnissen eröffnet neue Geschäftsfelder : Erfahrungen aus der Vorarlberger Landesbibliothek (2008) 0.00
    3.9654592E-4 = product of:
      0.0051550968 = sum of:
        0.0051550968 = product of:
          0.01546529 = sum of:
            0.01546529 = weight(_text_:22 in 1942) [ClassicSimilarity], result of:
              0.01546529 = score(doc=1942,freq=2.0), product of:
                0.079944395 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.022829322 = queryNorm
                0.19345059 = fieldWeight in 1942, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0390625 = fieldNorm(doc=1942)
          0.33333334 = coord(1/3)
      0.07692308 = coord(1/13)
    
    Date
    22. 6.2008 17:14:24
  8. Hauer, M.: Collaborative Catalog Enrichment : Digitalisierung und Information Retrieval (2011) 0.00
    3.9654592E-4 = product of:
      0.0051550968 = sum of:
        0.0051550968 = product of:
          0.01546529 = sum of:
            0.01546529 = weight(_text_:22 in 160) [ClassicSimilarity], result of:
              0.01546529 = score(doc=160,freq=2.0), product of:
                0.079944395 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.022829322 = queryNorm
                0.19345059 = fieldWeight in 160, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0390625 = fieldNorm(doc=160)
          0.33333334 = coord(1/3)
      0.07692308 = coord(1/13)
    
    Source
    ¬Die Kraft der digitalen Unordnung: 32. Arbeits- und Fortbildungstagung der ASpB e. V., Sektion 5 im Deutschen Bibliotheksverband, 22.-25. September 2009 in der Universität Karlsruhe. Hrsg: Jadwiga Warmbrunn u.a
  9. Barnes, S.; McCue, J.: Linking library records to bibliographic databases : an analysis of common data elements in BIOSIS, Agricola, and the OPAC (1991) 0.00
    3.1723673E-4 = product of:
      0.0041240775 = sum of:
        0.0041240775 = product of:
          0.012372232 = sum of:
            0.012372232 = weight(_text_:22 in 520) [ClassicSimilarity], result of:
              0.012372232 = score(doc=520,freq=2.0), product of:
                0.079944395 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.022829322 = queryNorm
                0.15476047 = fieldWeight in 520, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03125 = fieldNorm(doc=520)
          0.33333334 = coord(1/3)
      0.07692308 = coord(1/13)
    
    Date
    8. 1.2007 17:22:25
  10. Ikas, W.-V.; Litten, F.: World Wide Web und Catalogue Enrichment : Möglichkeiten des verbesserten Nachweises von mikroverfilmten Handschriften und Inkunabeln (2007) 0.00
    3.1723673E-4 = product of:
      0.0041240775 = sum of:
        0.0041240775 = product of:
          0.012372232 = sum of:
            0.012372232 = weight(_text_:22 in 323) [ClassicSimilarity], result of:
              0.012372232 = score(doc=323,freq=2.0), product of:
                0.079944395 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.022829322 = queryNorm
                0.15476047 = fieldWeight in 323, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03125 = fieldNorm(doc=323)
          0.33333334 = coord(1/3)
      0.07692308 = coord(1/13)
    
    Date
    22. 5.2007 11:19:21