Search (88 results, page 2 of 5)

Bollmann, P.; Konrad, E.; Schneider, H.-J.; Zuse, H.: Anwendung automatischer Klassifikationsverfahren mit dem System FAKYR (1978) 0.01

0.009384651 = product of:
  0.056307904 = sum of:
    0.028153952 = weight(_text_:der in 82) [ClassicSimilarity], result of:
      0.028153952 = score(doc=82,freq=10.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.44148692 = fieldWeight in 82, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=82)
    0.028153952 = weight(_text_:der in 82) [ClassicSimilarity], result of:
      0.028153952 = score(doc=82,freq=10.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.44148692 = fieldWeight in 82, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=82)
  0.16666667 = coord(2/12)

Abstract: Es wird ein Verfahren zum Vergelich von Klassifikationen vorgestellt. Es gestattet, die Abweichungen zwischen zwei Klassifikationen zu lokalisieren und erleichtert so die intellektuelle Kontrolle. Das Verfahren ist als Baustein des Systems FAKYR implementiert. Es wird auf Klassifikationen angeandt, die durch graphentheoretische Verfahren entstanden sind. Zunächst wird gezeigt, wie die Veränderung des Schnittes das Klassifikationsergebnis beeinflußt, anschließend wird das Vergleichsverfahren bei der automatischen Erstellung zweisprachiger Termklassen benutzt
Source: Kooperation in der Klassifikation I. Proc. der Sekt.1-3 der 2. Fachtagung der Gesellschaft für Klassifikation, Frankfurt-Hoechst, 6.-7.4.1978. Bearb.: W. Dahlberg

Jersek, T.: Automatische DDC-Klassifizierung mit Lingo : Vorgehensweise und Ergebnisse (2012) 0.01

0.009384651 = product of:
  0.056307904 = sum of:
    0.028153952 = weight(_text_:der in 122) [ClassicSimilarity], result of:
      0.028153952 = score(doc=122,freq=10.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.44148692 = fieldWeight in 122, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=122)
    0.028153952 = weight(_text_:der in 122) [ClassicSimilarity], result of:
      0.028153952 = score(doc=122,freq=10.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.44148692 = fieldWeight in 122, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=122)
  0.16666667 = coord(2/12)

Abstract: Die Arbeit befasst sich mit der Realisierung und der Durchführung einer automatischen DDCKlassifizierung durch das Indexierungssystem Lingo. Dies geschieht durch die Einbeziehung von Relationen des DFG-Projektes CrissCross, anhand derer Lingo bibliographische Titeldatensätze automatisch klassifiziert. Der dabei verwendete Ansatz wird mit dem üblichen methodischen Vorgehen bei automatischen Klassifizierungssystemen verglichen. Das Klassifizierungsverfahren wird daraufhin anhand einer Testkollektion von bibliographischen Titeldatensätzen der Deutschen Nationalbibliothek (DNB) getestet. Es folgt eine Diskussion der Ergebnisse und eine Bewertung des Klassifizierungssystems.

Reiner, U.: Automatic analysis of DDC notations (2007) 0.01

0.008903062 = product of:
  0.053418368 = sum of:
    0.026709184 = weight(_text_:der in 118) [ClassicSimilarity], result of:
      0.026709184 = score(doc=118,freq=4.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.4188313 = fieldWeight in 118, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.09375 = fieldNorm(doc=118)
    0.026709184 = weight(_text_:der in 118) [ClassicSimilarity], result of:
      0.026709184 = score(doc=118,freq=4.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.4188313 = fieldWeight in 118, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.09375 = fieldNorm(doc=118)
  0.16666667 = coord(2/12)

Content: Vortrag während der EDUG-Konferenz der European DDC users' group am 11.06.2007 in Bern.

Groß, T.; Faden, M.: Automatische Indexierung elektronischer Dokumente an der Deutschen Zentralbibliothek für Wirtschaftswissenschaften : Bericht über die Jahrestagung der Internationalen Buchwissenschaftlichen Gesellschaft (2010) 0.01
```
0.0086522205 = product of:
  0.05191332 = sum of:
    0.02595666 = weight(_text_:der in 4051) [ClassicSimilarity], result of:
      0.02595666 = score(doc=4051,freq=34.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.40703082 = fieldWeight in 4051, product of:
          5.8309517 = tf(freq=34.0), with freq of:
            34.0 = termFreq=34.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=4051)
    0.02595666 = weight(_text_:der in 4051) [ClassicSimilarity], result of:
      0.02595666 = score(doc=4051,freq=34.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.40703082 = fieldWeight in 4051, product of:
          5.8309517 = tf(freq=34.0), with freq of:
            34.0 = termFreq=34.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=4051)
  0.16666667 = coord(2/12)
```
Abstract

Die zunehmende Verfügbarmachung digitaler Informationen in den letzten Jahren sowie die Aussicht auf ein weiteres Ansteigen der sogenannten Datenflut kumulieren in einem grundlegenden, sich weiter verstärkenden Informationsstrukturierungsproblem. Die stetige Zunahme von digitalen Informationsressourcen im World Wide Web sichert zwar jederzeit und ortsungebunden den Zugriff auf verschiedene Informationen; offen bleibt der strukturierte Zugang, insbesondere zu wissenschaftlichen Ressourcen. Angesichts der steigenden Anzahl elektronischer Inhalte und vor dem Hintergrund stagnierender bzw. knapper werdender personeller Ressourcen in der Sacherschließun schafft keine Bibliothek bzw. kein Bibliotheksverbund es mehr, weder aktuell noch zukünftig, alle digitalen Daten zu erfassen, zu strukturieren und zueinander in Beziehung zu setzen. In der Informationsgesellschaft des 21. Jahrhunderts wird es aber zunehmend wichtiger, die in der Flut verschwundenen wissenschaftlichen Informationen zeitnah, angemessen und vollständig zu strukturieren und somit als Basis für eine Wissensgenerierung wieder nutzbar zu machen. Eine normierte Inhaltserschließung digitaler Informationsressourcen ist deshalb für die Deutsche Zentralbibliothek für Wirtschaftswissenschaften (ZBW) als wichtige Informationsinfrastruktureinrichtung in diesem Bereich ein entscheidender und auch erfolgskritischer Aspekt im Wettbewerb mit anderen Informationsdienstleistern. Weil die traditionelle intellektuelle Sacherschließung aber nicht beliebig skalierbar ist - mit dem Anstieg der Zahl an Online-Dokumenten steigt proportional auch der personelle Ressourcenbedarf an Fachreferenten, wenn ein gewisser Qualitätsstandard gehalten werden soll - bedarf es zukünftig anderer Sacherschließungsverfahren. Automatisierte Verschlagwortungsmethoden werden dabei als einzige Möglichkeit angesehen, die bibliothekarische Sacherschließung auch im digitalen Zeitalter zukunftsfest auszugestalten. Zudem können maschinelle Ansätze dazu beitragen, die Heterogenitäten (Indexierungsinkonsistenzen) zwischen den einzelnen Sacherschließer zu nivellieren, und somit zu einer homogeneren Erschließung des Bibliotheksbestandes beitragen.
Mit der Anfang 2010 begonnen Implementierung und Ergebnisevaluierung des automatischen Indexierungsverfahrens "Decisiv Categorization" der Firma Recommind soll das hier skizzierte Informationsstrukturierungsproblem in zwei Schritten gelöst werden. Kurz- bis mittelfristig soll die intellektuelle Indexierung durch ein semiautomatisches Verfahren6 unterstützt werden. Mittel- bis langfristig soll das maschinelle Verfahren, aufbauend auf einem entsprechenden Training, in die Lage versetzt werden, sowohl im Hause vorliegende Dokumente vollautomatisch zu indexieren als auch ZBW-fremde digitale Informationsressourcen zu verschlagworten bzw. zu klassifizieren, um sie in einem gemeinsamen Suchraum auffindbar machen zu können. Im Anschluss an diese Einleitung werden die ersten Ansätze maschineller Sacherschließung an der ZBW (2001-2004) und deren Ergebnisse und Problemlagen aufgezeigt. Danach werden die Rahmenbedingungen (Projektauftrag und -ziel) für eine Wiederaufnahme des Vorhabens im Jahre 2009 aufgezeigt, gefolgt von einer Darstellung der Funktionsweise der Recommind-Technologie und deren Einsatz im Rahmen der Sacherschließung von Online-Dokumenten mit einem Thesaurus. Schwerpunkt dieser Abhandlung bilden im Anschluss daran die Evaluierungsmöglichkeiten automatischer Indexierungsansätze sowie die aktuellen Ergebnisse und zentralen Erkenntnisse des Einsatzes im Kontext der ZBW. Das Fazit beschreibt die entsprechenden Schlussfolgerungen aus den erzielten Ergebnissen sowie den Ausblick auf das weitere Vorgehen.

Fangmeyer, H.; Gloden, R.: Bewertung und Vergleich von Klassifikationsergebnissen bei automatischen Verfahren (1978) 0.01

0.008393887 = product of:
  0.05036332 = sum of:
    0.02518166 = weight(_text_:der in 81) [ClassicSimilarity], result of:
      0.02518166 = score(doc=81,freq=8.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.3948779 = fieldWeight in 81, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=81)
    0.02518166 = weight(_text_:der in 81) [ClassicSimilarity], result of:
      0.02518166 = score(doc=81,freq=8.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.3948779 = fieldWeight in 81, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=81)
  0.16666667 = coord(2/12)

Source: Kooperation in der Klassifikation I. Proc. der Sekt.1-3 der 2. Fachtagung der Gesellschaft für Klassifikation, Frankfurt-Hoechst, 6.-7.4.1978. Bearb.: W. Dahlberg

Koch, T.: Nutzung von Klassifikationssystemen zur verbesserten Beschreibung, Organisation und Suche von Internetressourcen (1998) 0.01

0.008393887 = product of:
  0.05036332 = sum of:
    0.02518166 = weight(_text_:der in 1030) [ClassicSimilarity], result of:
      0.02518166 = score(doc=1030,freq=8.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.3948779 = fieldWeight in 1030, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=1030)
    0.02518166 = weight(_text_:der in 1030) [ClassicSimilarity], result of:
      0.02518166 = score(doc=1030,freq=8.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.3948779 = fieldWeight in 1030, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=1030)
  0.16666667 = coord(2/12)

Abstract: In den ersten Jahren der Internetdienste wurde auf Klassifikationen weitgehend verzichtet. Viele Anbieter argumentierten, daß diese wie auch andere Metadaten von der Entwicklung aufgrund der Volltextindices überholt sind. Inzwischen hat sich das Blatt gewendet: Die meisten der großen Suchdienste bieten eine mehr oder minder ausgefeilte Klassifikation an. eine Reihe von Internetdiensten verwendet etablierte Bibliotheksklassifikationssysteme; deren Einsatzbereiche, die Vor- und Nachteile sowie Anwendungsbeispiele sind Thema dieses Aufsatzes

Puzicha, J.: Informationen finden! : Intelligente Suchmaschinentechnologie & automatische Kategorisierung (2007) 0.01
```
0.008328052 = product of:
  0.04996831 = sum of:
    0.024984155 = weight(_text_:der in 2817) [ClassicSimilarity], result of:
      0.024984155 = score(doc=2817,freq=14.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.3917808 = fieldWeight in 2817, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=2817)
    0.024984155 = weight(_text_:der in 2817) [ClassicSimilarity], result of:
      0.024984155 = score(doc=2817,freq=14.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.3917808 = fieldWeight in 2817, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=2817)
  0.16666667 = coord(2/12)
```
Abstract

Wie in diesem Text erläutert wurde, ist die Effektivität von Such- und Klassifizierungssystemen durch folgendes bestimmt: 1) den Arbeitsauftrag, 2) die Genauigkeit des Systems, 3) den zu erreichenden Automatisierungsgrad, 4) die Einfachheit der Integration in bereits vorhandene Systeme. Diese Kriterien gehen davon aus, dass jedes System, unabhängig von der Technologie, in der Lage ist, Grundvoraussetzungen des Produkts in Bezug auf Funktionalität, Skalierbarkeit und Input-Methode zu erfüllen. Diese Produkteigenschaften sind in der Recommind Produktliteratur genauer erläutert. Von diesen Fähigkeiten ausgehend sollte die vorhergehende Diskussion jedoch einige klare Trends aufgezeigt haben. Es ist nicht überraschend, dass jüngere Entwicklungen im Maschine Learning und anderen Bereichen der Informatik einen theoretischen Ausgangspunkt für die Entwicklung von Suchmaschinen- und Klassifizierungstechnologie haben. Besonders jüngste Fortschritte bei den statistischen Methoden (PLSA) und anderen mathematischen Werkzeugen (SVMs) haben eine Ergebnisqualität auf Durchbruchsniveau erreicht. Dazu kommt noch die Flexibilität in der Anwendung durch Selbsttraining und Kategorienerkennen von PLSA-Systemen, wie auch eine neue Generation von vorher unerreichten Produktivitätsverbesserungen.

Content

Technical Whitepaper - Grundlagen der Informationsgewinnung
Kasprzik, A.: Automatisierte und semiautomatisierte Klassifizierung : eine Analyse aktueller Projekte (2014) 0.01
```
0.008328052 = product of:
  0.04996831 = sum of:
    0.024984155 = weight(_text_:der in 2470) [ClassicSimilarity], result of:
      0.024984155 = score(doc=2470,freq=14.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.3917808 = fieldWeight in 2470, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=2470)
    0.024984155 = weight(_text_:der in 2470) [ClassicSimilarity], result of:
      0.024984155 = score(doc=2470,freq=14.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.3917808 = fieldWeight in 2470, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=2470)
  0.16666667 = coord(2/12)
```
Abstract

Das sprunghafte Anwachsen der Menge digital verfügbarer Dokumente gepaart mit dem Zeit- und Personalmangel an wissenschaftlichen Bibliotheken legt den Einsatz von halb- oder vollautomatischen Verfahren für die verbale und klassifikatorische Inhaltserschließung nahe. Nach einer kurzen allgemeinen Einführung in die gängige Methodik beleuchtet dieser Artikel eine Reihe von Projekten zur automatisierten Klassifizierung aus dem Zeitraum 2007-2012 und aus dem deutschsprachigen Raum. Ein Großteil der vorgestellten Projekte verwendet Methoden des Maschinellen Lernens aus der Künstlichen Intelligenz, arbeitet meist mit angepassten Versionen einer kommerziellen Software und bezieht sich in der Regel auf die Dewey Decimal Classification (DDC). Als Datengrundlage dienen Metadatensätze, Abstracs, Inhaltsverzeichnisse und Volltexte in diversen Datenformaten. Die abschließende Analyse enthält eine Anordnung der Projekte nach einer Reihe von verschiedenen Kriterien und eine Zusammenfassung der aktuellen Lage und der größten Herausfordungen für automatisierte Klassifizierungsverfahren.
Schek, M.: Automatische Klassifizierung in Erschließung und Recherche eines Pressearchivs (2006) 0.01
```
0.007851763 = product of:
  0.047110572 = sum of:
    0.023555286 = weight(_text_:der in 6043) [ClassicSimilarity], result of:
      0.023555286 = score(doc=6043,freq=28.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.36937445 = fieldWeight in 6043, product of:
          5.2915025 = tf(freq=28.0), with freq of:
            28.0 = termFreq=28.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=6043)
    0.023555286 = weight(_text_:der in 6043) [ClassicSimilarity], result of:
      0.023555286 = score(doc=6043,freq=28.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.36937445 = fieldWeight in 6043, product of:
          5.2915025 = tf(freq=28.0), with freq of:
            28.0 = termFreq=28.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=6043)
  0.16666667 = coord(2/12)
```
Abstract

Die Süddeutsche Zeitung (SZ) verfügt seit ihrer Gründung 1945 über ein Pressearchiv, das die Texte der eigenen Redakteure und zahlreicher nationaler und internationaler Publikationen dokumentiert und für Recherchezwecke bereitstellt. Die DIZ-Pressedatenbank (www.medienport.de) ermöglicht die browserbasierte Recherche für Redakteure und externe Kunden im Intra- und Internet und die kundenspezifischen Content Feeds für Verlage, Rundfunkanstalten und Portale. Die DIZ-Pressedatenbank enthält z. Zt. 7,8 Millionen Artikel, die jeweils als HTML oder PDF abrufbar sind. Täglich kommen ca. 3.500 Artikel hinzu, von denen ca. 1.000 durch Dokumentare inhaltlich erschlossen werden. Die Informationserschließung erfolgt im DIZ nicht durch die Vergabe von Schlagwörtern am Dokument, sondern durch die Verlinkung der Artikel mit "virtuellen Mappen", den Dossiers. Insgesamt enthält die DIZ-Pressedatenbank ca. 90.000 Dossiers, die untereinander zum "DIZ-Wissensnetz" verlinkt sind. DIZ definiert das Wissensnetz als Alleinstellungsmerkmal und wendet beträchtliche personelle Ressourcen für die Aktualisierung und Qualitätssicherung der Dossiers auf. Im Zuge der Medienkrise mussten sich DIZ der Herausforderung stellen, bei sinkenden Lektoratskapazitäten die Qualität der Informationserschließung im Input zu erhalten. Auf der Outputseite gilt es, eine anspruchsvolle Zielgruppe - u.a. die Redakteure der Süddeutschen Zeitung - passgenau und zeitnah mit den Informationen zu versorgen, die sie für ihre tägliche Arbeit benötigt. Bezogen auf die Ausgangssituation in der Dokumentation der Süddeutschen Zeitung identifizierte DIZ drei Ansatzpunkte, wie die Aufwände auf der Inputseite (Lektorat) zu optimieren sind und gleichzeitig auf der Outputseite (Recherche) das Wissensnetz besser zu vermarkten ist: - (Teil-)Automatische Klassifizierung von Pressetexten (Vorschlagwesen) - Visualisierung des Wissensnetzes - Neue Retrievalmöglichkeiten (Ähnlichkeitssuche, Clustering) Im Bereich "Visualisierung" setzt DIZ auf den Net-Navigator von intelligent views, eine interaktive Visualisierung allgemeiner Graphen, basierend auf einem physikalischen Modell. In den Bereichen automatische Klassifizierung, Ähnlichkeitssuche und Clustering hat DIZ sich für das Produkt nextBot der Firma Brainbot entschieden.

Source

Spezialbibliotheken zwischen Auftrag und Ressourcen: 6.-9. September 2005 in München, 30. Arbeits- und Fortbildungstagung der ASpB e.V. / Sektion 5 im Deutschen Bibliotheksverband. Red.: M. Brauer

Wätjen, H.-J.: Automatisches Sammeln, Klassifizieren und Indexieren von wissenschaftlich relevanten Informationsressourcen im deutschen World Wide Web : das DFG-Projekt GERHARD (1998) 0.01

0.0074192174 = product of:
  0.044515304 = sum of:
    0.022257652 = weight(_text_:der in 3066) [ClassicSimilarity], result of:
      0.022257652 = score(doc=3066,freq=4.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34902605 = fieldWeight in 3066, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.078125 = fieldNorm(doc=3066)
    0.022257652 = weight(_text_:der in 3066) [ClassicSimilarity], result of:
      0.022257652 = score(doc=3066,freq=4.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34902605 = fieldWeight in 3066, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.078125 = fieldNorm(doc=3066)
  0.16666667 = coord(2/12)

Footnote: Vortrag auf der 20. Online-Tagung der Deutschen Gesellschaft für Dokumentation, 5.-7.5.1998. Session 3: WWW-Suchmaschinen

Vizine-Goetz, D.: NetLab / OCLC collaboration seeks to improve Web searching (1999) 0.01

0.0074192174 = product of:
  0.044515304 = sum of:
    0.022257652 = weight(_text_:der in 4180) [ClassicSimilarity], result of:
      0.022257652 = score(doc=4180,freq=4.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34902605 = fieldWeight in 4180, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.078125 = fieldNorm(doc=4180)
    0.022257652 = weight(_text_:der in 4180) [ClassicSimilarity], result of:
      0.022257652 = score(doc=4180,freq=4.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34902605 = fieldWeight in 4180, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.078125 = fieldNorm(doc=4180)
  0.16666667 = coord(2/12)

Abstract: Vorstellung verschiedener Projekte zur Verbesserung der Internet-Erschließung mit Hilfe der DDC

Wätjen, H.-J.: GERHARD : Automatisches Sammeln, Klassifizieren und Indexieren von wissenschaftlich relevanten Informationsressourcen im deutschen World Wide Web (1998) 0.01

0.007344651 = product of:
  0.044067904 = sum of:
    0.022033952 = weight(_text_:der in 3064) [ClassicSimilarity], result of:
      0.022033952 = score(doc=3064,freq=8.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34551817 = fieldWeight in 3064, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3064)
    0.022033952 = weight(_text_:der in 3064) [ClassicSimilarity], result of:
      0.022033952 = score(doc=3064,freq=8.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34551817 = fieldWeight in 3064, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3064)
  0.16666667 = coord(2/12)

Abstract: Die intellektuelle Erschließung des Internet befindet sich in einer Krise. Yahoo und andere Dienste können mit dem Wachstum des Web nicht mithalten. GERHARD ist derzeit weltweit der einzige Such- und Navigationsdienst, der die mit einem Roboter gesammelten Internetressourcen mit computerlinguistischen und statistischen Verfahren auch automatisch vollständig klassifiziert. Weit über eine Million HTML-Dokumente von wissenschaftlich relevanten Servern in Deutschland können wie bei anderen Suchmaschinen in der Datenbank gesucht, aber auch über die Navigation in der dreisprachigen Universalen Dezimalklassifikation (ETH-Bibliothek Zürich) recherchiert werden

Panyr, J.: Automatische Indexierung und Klassifikation (1983) 0.01

0.007269319 = product of:
  0.043615915 = sum of:
    0.021807957 = weight(_text_:der in 7692) [ClassicSimilarity], result of:
      0.021807957 = score(doc=7692,freq=6.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34197432 = fieldWeight in 7692, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=7692)
    0.021807957 = weight(_text_:der in 7692) [ClassicSimilarity], result of:
      0.021807957 = score(doc=7692,freq=6.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34197432 = fieldWeight in 7692, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=7692)
  0.16666667 = coord(2/12)

Abstract: Im Beitrag wird zunächst eine terminologische Klärung und Gliederung für drei Indexierungsmethoden und weitere Begriffe, die Konsistenzprobleme bei intellektueller Indexierung betreffen, unternommen. Zur automatichen Indexierung werden Extraktionsmethoden erläutert und zur Automatischen Klassifikation (Clustering) und Indexierung zwei Anwendungen vorgestellt. Eine enge Kooperation zwischen den Befürwortern der intellektuellen und den Entwicklern von automatischen Indexierungsverfahren wird empfohlen
Source: Automatisierung in der Klassifikation. Proc. 7. Jahrestagung der Gesellschaft für Klassifikation (Teil 1), Königswinter, 5.-8.4.1983. Hrsg.: I. Dahlberg u.a

Zhang, X: Rough set theory based automatic text categorization (2005) 0.01

0.007269319 = product of:
  0.043615915 = sum of:
    0.021807957 = weight(_text_:der in 2822) [ClassicSimilarity], result of:
      0.021807957 = score(doc=2822,freq=6.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34197432 = fieldWeight in 2822, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=2822)
    0.021807957 = weight(_text_:der in 2822) [ClassicSimilarity], result of:
      0.021807957 = score(doc=2822,freq=6.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.34197432 = fieldWeight in 2822, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=2822)
  0.16666667 = coord(2/12)

Abstract: Der Forschungsbericht "Rough Set Theory Based Automatic Text Categorization and the Handling of Semantic Heterogeneity" von Xueying Zhang ist in Buchform auf Englisch erschienen. Zhang hat in ihrer Arbeit ein Verfahren basierend auf der Rough Set Theory entwickelt, das Beziehungen zwischen Schlagwörtern verschiedener Vokabulare herstellt. Sie war von 2003 bis 2005 Mitarbeiterin des IZ und ist seit Oktober 2005 Associate Professor an der Nanjing University of Science and Technology.

Chan, L.M.; Lin, X.; Zeng, M.: Structural and multilingual approaches to subject access on the Web (1999) 0.01

0.005935374 = product of:
  0.035612244 = sum of:
    0.017806122 = weight(_text_:der in 162) [ClassicSimilarity], result of:
      0.017806122 = score(doc=162,freq=4.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.27922085 = fieldWeight in 162, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=162)
    0.017806122 = weight(_text_:der in 162) [ClassicSimilarity], result of:
      0.017806122 = score(doc=162,freq=4.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.27922085 = fieldWeight in 162, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=162)
  0.16666667 = coord(2/12)

Abstract: Zu den großen Herausforderungen einer sinnvollen Suche im WWW gehören die riesige Menge des Verfügbaren und die Sparchbarrieren. Verfahren, die die Web-Ressourcen im Hinblick auf ein effizienteres Retrieval inhaltlich strukturieren, werden daher ebenso dringend benötigt wie Programme, die mit der Sprachvielfalt umgehen können. Im folgenden Vortrag werden wir einige Ansätze diskutieren, die zur Bewältigung der beiden Probleme derzeit unternommen werden

Frobese, D.T.: Klassifikationsaufgaben mit der SENTRAX : Konkreter Fall: Automatische Detektion von SPAM (2006) 0.01

0.005935374 = product of:
  0.035612244 = sum of:
    0.017806122 = weight(_text_:der in 5980) [ClassicSimilarity], result of:
      0.017806122 = score(doc=5980,freq=4.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.27922085 = fieldWeight in 5980, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=5980)
    0.017806122 = weight(_text_:der in 5980) [ClassicSimilarity], result of:
      0.017806122 = score(doc=5980,freq=4.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.27922085 = fieldWeight in 5980, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=5980)
  0.16666667 = coord(2/12)

Footnote: Beitrag der Proceedings des Fünften Hildesheimer Evaluierungs- und Retrievalworkshop (HIER 2006), Hildesheim, xx.x.2006.

Krüger, C.: Evaluation des WWW-Suchdienstes GERHARD unter besonderer Beachtung automatischer Indexierung (1999) 0.01
```
0.005865407 = product of:
  0.03519244 = sum of:
    0.01759622 = weight(_text_:der in 1777) [ClassicSimilarity], result of:
      0.01759622 = score(doc=1777,freq=10.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.27592933 = fieldWeight in 1777, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1777)
    0.01759622 = weight(_text_:der in 1777) [ClassicSimilarity], result of:
      0.01759622 = score(doc=1777,freq=10.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.27592933 = fieldWeight in 1777, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1777)
  0.16666667 = coord(2/12)
```
Abstract

Die vorliegende Arbeit beinhaltet eine Beschreibung und Evaluation des WWW - Suchdienstes GERHARD (German Harvest Automated Retrieval and Directory). GERHARD ist ein Such- und Navigationssystem für das deutsche World Wide Web, weiches ausschließlich wissenschaftlich relevante Dokumente sammelt, und diese auf der Basis computerlinguistischer und statistischer Methoden automatisch mit Hilfe eines bibliothekarischen Klassifikationssystems klassifiziert. Mit dem DFG - Projekt GERHARD ist der Versuch unternommen worden, mit einem auf einem automatischen Klassifizierungsverfahren basierenden World Wide Web - Dienst eine Alternative zu herkömmlichen Methoden der Interneterschließung zu entwickeln. GERHARD ist im deutschsprachigen Raum das einzige Verzeichnis von Internetressourcen, dessen Erstellung und Aktualisierung vollständig automatisch (also maschinell) erfolgt. GERHARD beschränkt sich dabei auf den Nachweis von Dokumenten auf wissenschaftlichen WWW - Servern. Die Grundidee dabei war, kostenintensive intellektuelle Erschließung und Klassifizierung von lnternetseiten durch computerlinguistische und statistische Methoden zu ersetzen, um auf diese Weise die nachgewiesenen Internetressourcen automatisch auf das Vokabular eines bibliothekarischen Klassifikationssystems abzubilden. GERHARD steht für German Harvest Automated Retrieval and Directory. Die WWW - Adresse (URL) von GERHARD lautet: http://www.gerhard.de. Im Rahmen der vorliegenden Diplomarbeit soll eine Beschreibung des Dienstes mit besonderem Schwerpunkt auf dem zugrundeliegenden Indexierungs- bzw. Klassifizierungssystem erfolgen und anschließend mit Hilfe eines kleinen Retrievaltests die Effektivität von GERHARD überprüft werden.

Footnote

Diplomarbeit im Fach Inhaltliche Erschließung, Studiengang Informationsmanagement der FH Stuttgart - Hochschule für Bibliotheks- und Informationswesen

Braun, T.: Dokumentklassifikation durch Clustering (o.J.) 0.01

0.005246179 = product of:
  0.031477075 = sum of:
    0.015738538 = weight(_text_:der in 1671) [ClassicSimilarity], result of:
      0.015738538 = score(doc=1671,freq=2.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.2467987 = fieldWeight in 1671, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.078125 = fieldNorm(doc=1671)
    0.015738538 = weight(_text_:der in 1671) [ClassicSimilarity], result of:
      0.015738538 = score(doc=1671,freq=2.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.2467987 = fieldWeight in 1671, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.078125 = fieldNorm(doc=1671)
  0.16666667 = coord(2/12)

Abstract: Beim Clustering werden Dokumente aufgrund von Ähnlichkeiten untereinander klassifiziert, im Gegensatz z.B. zur Klassifikation anhand einer Ontologie. Bei den gebräuchlichen Clusteringverfahren wird ein Dokument als die Menge seiner Wörter angesehen. Zur Bestimmung der Ähnlichkeit zwischen Dokumenten werden verschiedene Ähnlichkeitsmaße definiert.

Oberhauser, O.: Automatisches Klassifizieren und Bibliothekskataloge (2005) 0.01

0.0051934524 = product of:
  0.031160714 = sum of:
    0.015580357 = weight(_text_:der in 4099) [ClassicSimilarity], result of:
      0.015580357 = score(doc=4099,freq=4.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.24431825 = fieldWeight in 4099, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4099)
    0.015580357 = weight(_text_:der in 4099) [ClassicSimilarity], result of:
      0.015580357 = score(doc=4099,freq=4.0), product of:
        0.06377075 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.028548526 = queryNorm
        0.24431825 = fieldWeight in 4099, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4099)
  0.16666667 = coord(2/12)

Abstract: In der bibliothekarischen Welt sind die Vorzüge einer klassifikatorischen Inhaltserschließung seit jeher wohlbekannt. Auch im Zeitalter der Online-Kataloge gibt es dafür keinen wirklichen Ersatz, da - kurz formuliert - ein stichwortbasiertes Retrieval alleine mit Problemen wie Ambiguität und Mehrsprachigkeit nicht fertig zu werden vermag. Zahlreiche Online-Kataloge weisen daher Notationen verschiedener Klassifikationssysteme auf; allerdings sind die darauf basierenden Abfragemöglichkeiten meist noch arg unterentwickelt. Viele Datensätze in OPACs sind aber überhaupt nicht sachlich erschlossen, sei es, dass sie aus retrospektiv konvertierten Nominalkatalogen stammen, sei es, dass ein Mangel an personellen Ressourcen ihre inhaltliche Erschließung verhindert hat. Angesichts großer Mengen solcher Datensätze liegt ein Interesse an automatischen Verfahren zur Sacherschließung durchaus nahe.

GERHARD : eine Spezialsuchmaschine für die Wissenschaft (1998) 0.00

0.0049696746 = product of:
  0.059636094 = sum of:
    0.059636094 = weight(_text_:wissenschaft in 381) [ClassicSimilarity], result of:
      0.059636094 = score(doc=381,freq=2.0), product of:
        0.11331915 = queryWeight, product of:
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.028548526 = queryNorm
        0.5262667 = fieldWeight in 381, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.969352 = idf(docFreq=2269, maxDocs=44218)
          0.09375 = fieldNorm(doc=381)
  0.083333336 = coord(1/12)

Search (88 results, page 2 of 5)

Authors

Years

Languages

Types

Themes

Subjects