Search (6 results, page 1 of 1)

  • × author_ss:"Oberhauser, O."
  1. Oberhauser, O.: Automatisches Klassifizieren : Entwicklungsstand - Methodik - Anwendungsbereiche (2005) 0.02
    0.017263593 = product of:
      0.06905437 = sum of:
        0.048603527 = weight(_text_:fortschritt in 38) [ClassicSimilarity], result of:
          0.048603527 = score(doc=38,freq=2.0), product of:
            0.25497913 = queryWeight, product of:
              6.901097 = idf(docFreq=120, maxDocs=44218)
              0.036947623 = queryNorm
            0.19061767 = fieldWeight in 38, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              6.901097 = idf(docFreq=120, maxDocs=44218)
              0.01953125 = fieldNorm(doc=38)
        0.020450847 = weight(_text_:entwicklung in 38) [ClassicSimilarity], result of:
          0.020450847 = score(doc=38,freq=2.0), product of:
            0.16539653 = queryWeight, product of:
              4.4765134 = idf(docFreq=1366, maxDocs=44218)
              0.036947623 = queryNorm
            0.12364738 = fieldWeight in 38, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.4765134 = idf(docFreq=1366, maxDocs=44218)
              0.01953125 = fieldNorm(doc=38)
      0.25 = coord(2/8)
    
    Footnote
    Zum Inhalt Auf einen kurzen einleitenden Abschnitt folgt eine Einführung in die grundlegende Methodik des automatischen Klassifizierens. Oberhauser erklärt hier Begriffe wie Einfach- und Mehrfachklassifizierung, Klassen- und Dokumentzentrierung, und geht danach auf die hauptsächlichen Anwendungen der automatischen Klassifikation von Textdokumenten, maschinelle Lernverfahren und Techniken der Dimensionsreduktion bei der Indexierung ein. Zwei weitere Unterkapitel sind der Erstellung von Klassifikatoren und den Methoden für deren Auswertung gewidmet. Das Kapitel wird abgerundet von einer kurzen Auflistung einiger Softwareprodukte für automatisches Klassifizieren, die sowohl kommerzielle Software, als auch Projekte aus dem Open-Source-Bereich umfasst. Der Hauptteil des Buches ist den großen Projekten zur automatischen Erschließung von Webdokumenten gewidmet, die von OCLC (Scorpion) sowie an den Universitäten Lund (Nordic WAIS/WWW, DESIRE II), Wolverhampton (WWLib-TOS, WWLib-TNG, Old ACE, ACE) und Oldenburg (GERHARD, GERHARD II) durchgeführt worden sind. Der Autor beschreibt hier sehr detailliert - wobei der Detailliertheitsgrad unterschiedlich ist, je nachdem, was aus der Projektdokumentation geschlossen werden kann - die jeweilige Zielsetzung des Projektes, die verwendete Klassifikation, die methodische Vorgehensweise sowie die Evaluierungsmethoden und -ergebnisse. Sofern Querverweise zu anderen Projekten bestehen, werden auch diese besprochen. Der Verfasser geht hier sehr genau auf wichtige Aspekte wie Vokabularbildung, Textaufbereitung und Gewichtung ein, so dass der Leser eine gute Vorstellung von den Ansätzen und der möglichen Weiterentwicklung des Projektes bekommt. In einem weiteren Kapitel wird auf einige kleinere Projekte eingegangen, die dem für Bibliotheken besonders interessanten Thema des automatischen Klassifizierens von Büchern sowie den Bereichen Patentliteratur, Mediendokumentation und dem Einsatz bei Informationsdiensten gewidmet sind. Die Darstellung wird ergänzt von einem Literaturverzeichnis mit über 250 Titeln zu den konkreten Projekten sowie einem Abkürzungs- und einem Abbildungsverzeichnis. In der abschließenden Diskussion der beschriebenen Projekte wird einerseits auf die Bedeutung der einzelnen Projekte für den methodischen Fortschritt eingegangen, andererseits aber auch einiges an Kritik geäußert, v. a. bezüglich der mangelnden Auswertung der Projektergebnisse und des Fehlens an brauchbarer Dokumentation. So waren z. B. die Projektseiten des Projekts GERHARD (www.gerhard.de/) auf den Stand von 1998 eingefroren, zurzeit [11.07.06] sind sie überhaupt nicht mehr erreichbar. Mit einigem Erstaunen stellt Oberhauser auch fest, dass - abgesehen von der fast 15 Jahre alten Untersuchung von Larsen - »keine signifikanten Studien oder Anwendungen aus dem Bibliotheksbereich vorliegen« (S. 139). Wie der Autor aber selbst ergänzend ausführt, dürfte dies daran liegen, dass sich bibliografische Metadaten wegen des geringen Textumfangs sehr schlecht für automatische Klassifikation eignen, und dass - wie frühere Ergebnisse gezeigt haben - das übliche TF/IDF-Verfahren nicht für Katalogisate geeignet ist (ibd.).
    Die am Anfang des Werkes gestellte Frage, ob »die Techniken des automatischen Klassifizierens heute bereits so weit [sind], dass damit grosse Mengen elektronischer Dokumente [-] zufrieden stellend erschlossen werden können? « (S. 13), beantwortet der Verfasser mit einem eindeutigen »nein«, was Salton und McGills Aussage von 1983, »daß einfache automatische Indexierungsverfahren schnell und kostengünstig arbeiten, und daß sie Recall- und Precisionwerte erreichen, die mindestens genauso gut sind wie bei der manuellen Indexierung mit kontrolliertem Vokabular « (Gerard Salton und Michael J. McGill: Information Retrieval. Hamburg u.a. 1987, S. 64 f.) kräftig relativiert. Über die Gründe, warum drei der großen Projekte nicht weiter verfolgt werden, will Oberhauser nicht spekulieren, nennt aber mangelnden Erfolg, Verlagerung der Arbeit in den beteiligten Institutionen sowie Finanzierungsprobleme als mögliche Ursachen. Das größte Entwicklungspotenzial beim automatischen Erschließen großer Dokumentenmengen sieht der Verfasser heute in den Bereichen der Patentund Mediendokumentation. Hier solle man im bibliothekarischen Bereich die Entwicklung genau verfolgen, da diese »sicherlich mittelfristig auf eine qualitativ zufrieden stellende Vollautomatisierung« abziele (S. 146). Oberhausers Darstellung ist ein rundum gelungenes Werk, das zum Handapparat eines jeden, der sich für automatische Erschließung interessiert, gehört."
  2. Oberhauser, O.: Digitale Langzeitarchivierung als Thema internationaler Institutionen und Organisationen : Ein bibliotheksorientierter Überblick (2003) 0.00
    0.004999761 = product of:
      0.039998088 = sum of:
        0.039998088 = product of:
          0.079996176 = sum of:
            0.079996176 = weight(_text_:zukunft in 2035) [ClassicSimilarity], result of:
              0.079996176 = score(doc=2035,freq=2.0), product of:
                0.1828649 = queryWeight, product of:
                  4.949301 = idf(docFreq=851, maxDocs=44218)
                  0.036947623 = queryNorm
                0.4374605 = fieldWeight in 2035, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  4.949301 = idf(docFreq=851, maxDocs=44218)
                  0.0625 = fieldNorm(doc=2035)
          0.5 = coord(1/2)
      0.125 = coord(1/8)
    
    Abstract
    Digitale Langzeitarchivierung ist nicht nur Gegenstand zahlreicher nationaler Initiativen, sondern auch Thema internationaler Institutionen und Projekte. ln diesem Beitrag werden die relevanten Aktivitäten von 13 weIt- bzw. europaweit tätigen Organisationen des Bildungs- und Informationswesens insgesamt sowie des Bibliothekswesens im Speziellen untersucht und referiert. Diese bewegen sich allerdings - zum Teil auch mehrgleisig - bislang überwiegend im grundlegenden bzw. konzeptionellen Bereich, wogegen praktische Lösungen und Implementierungen noch selten sind und wohl erst für die Zukunft erwartet werden dürfen.
  3. Oberhauser, O.: Bibliothekssysteme und Bibliotheksstruktur (1997) 0.00
    0.0037544195 = product of:
      0.030035356 = sum of:
        0.030035356 = product of:
          0.060070712 = sum of:
            0.060070712 = weight(_text_:22 in 6637) [ClassicSimilarity], result of:
              0.060070712 = score(doc=6637,freq=2.0), product of:
                0.12938428 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.036947623 = queryNorm
                0.46428138 = fieldWeight in 6637, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.09375 = fieldNorm(doc=6637)
          0.5 = coord(1/2)
      0.125 = coord(1/8)
    
    Date
    10. 3.2002 16:19:22
  4. Oberhauser, O.: Relevance Ranking in den Online-Katalogen der "nächsten Generation" (2010) 0.00
    0.0037498206 = product of:
      0.029998565 = sum of:
        0.029998565 = product of:
          0.05999713 = sum of:
            0.05999713 = weight(_text_:zukunft in 4308) [ClassicSimilarity], result of:
              0.05999713 = score(doc=4308,freq=2.0), product of:
                0.1828649 = queryWeight, product of:
                  4.949301 = idf(docFreq=851, maxDocs=44218)
                  0.036947623 = queryNorm
                0.32809538 = fieldWeight in 4308, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  4.949301 = idf(docFreq=851, maxDocs=44218)
                  0.046875 = fieldNorm(doc=4308)
          0.5 = coord(1/2)
      0.125 = coord(1/8)
    
    Abstract
    Relevance Ranking in Online-Katalogen ist zwar kein neues Thema, doch liegt dazu nicht allzu viel Literatur vor, die das Prädikat "ernstzunehmen" verdient. Dies ist zum einen darin begründet, dass das Interesse an der Ausgabe ranggereihter Ergebnislisten auf Seiten aller Beteiligter (Bibliothekare, Softwarehersteller, Benutzer) traditionell gering war. Zum anderen ging die seit einigen Jahren populär gewordene Kritik an den bestehenden OPACs vielfach von einer unzureichenden Wissensbasis aus und produzierte oft nur polemische oder emotional gefärbte Beiträge, die zum Thema Ranking wenig beitrugen. ... Der hier beschriebene Test ist natürlich in keiner Weise erschöpfend oder repräsentativ. Dennoch gibt er, wie ich glaube, Anlass zu einiger Hoffnung. Er lässt vermuten, dass die "neuen" OPACs - zumindest was das Relevance Ranking betrifft - auf dem Weg in die richtige Richtung sind. Wie gut es wirklich gelingen wird, die Rankingleistung von Suchmaschinen wie Google, die unter völlig anderen Voraussetzungen arbeiten, einzuholen, wird aber erst die Zukunft zeigen.
  5. Seidler, W.; Oberhauser, O.: Managing a large academic CD-ROM network (1996) 0.00
    0.003128683 = product of:
      0.025029464 = sum of:
        0.025029464 = product of:
          0.050058927 = sum of:
            0.050058927 = weight(_text_:22 in 6195) [ClassicSimilarity], result of:
              0.050058927 = score(doc=6195,freq=2.0), product of:
                0.12938428 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.036947623 = queryNorm
                0.38690117 = fieldWeight in 6195, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.078125 = fieldNorm(doc=6195)
          0.5 = coord(1/2)
      0.125 = coord(1/8)
    
    Source
    Audiovisual librarian. 22(1996) no.3, S.190-193
  6. Oberhauser, O.: Implementierung und Parametrisierung klassifikatorischer Recherchekomponenten im OPAC (2005) 0.00
    0.0010950391 = product of:
      0.008760313 = sum of:
        0.008760313 = product of:
          0.017520625 = sum of:
            0.017520625 = weight(_text_:22 in 3353) [ClassicSimilarity], result of:
              0.017520625 = score(doc=3353,freq=2.0), product of:
                0.12938428 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.036947623 = queryNorm
                0.1354154 = fieldWeight in 3353, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.02734375 = fieldNorm(doc=3353)
          0.5 = coord(1/2)
      0.125 = coord(1/8)
    
    Source
    Mitteilungen der Vereinigung Österreichischer Bibliothekarinnen und Bibliothekare. 58(2005) H.1, S.22-37