Search (124 results, page 1 of 7)

Lepsky, K.: Automatische Indexierung des Reallexikons zur Deutschen Kunstgeschichte (2006) 0.09
```
0.093683675 = product of:
  0.12491156 = sum of:
    0.07291678 = weight(_text_:lexikon in 6080) [ClassicSimilarity], result of:
      0.07291678 = score(doc=6080,freq=2.0), product of:
        0.30085498 = queryWeight, product of:
          6.2675414 = idf(docFreq=227, maxDocs=44218)
          0.04800207 = queryNorm
        0.24236521 = fieldWeight in 6080, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.2675414 = idf(docFreq=227, maxDocs=44218)
          0.02734375 = fieldNorm(doc=6080)
    0.05117215 = weight(_text_:von in 6080) [ClassicSimilarity], result of:
      0.05117215 = score(doc=6080,freq=30.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.39957306 = fieldWeight in 6080, product of:
          5.477226 = tf(freq=30.0), with freq of:
            30.0 = termFreq=30.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.02734375 = fieldNorm(doc=6080)
    8.2263234E-4 = product of:
      0.002467897 = sum of:
        0.002467897 = weight(_text_:a in 6080) [ClassicSimilarity], result of:
          0.002467897 = score(doc=6080,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.044588212 = fieldWeight in 6080, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.02734375 = fieldNorm(doc=6080)
      0.33333334 = coord(1/3)
  0.75 = coord(3/4)
```
Abstract

Digitalisierungsvorhaben sorgen für eine immer größere Verfügbarkeit von Inhalten bislang ausschließlich gedruckt vorliegender Werke, zunehmend auch von ganzen Büchern. Projekte wie "Google Print" versprechen die völlige elektronische Verfügbarkeit von Informationen nahezu unabhängig von Zeit und Ort und sorgen dafür, dass die Hüter der konventionellen Information, die Bibliotheken, in Angst und Schrecken versetzt werden angesichts des befürchteten Verlusts ihrer traditionellen Rolle. Die Debatte kreist dabei eher selten um die Frage, welcher Nutzen sich konkret aus dem elektronischen Volltext ergibt: Der Nutzen steht schlichtweg außer Frage, Volltexte gelten prinzipiell als nützlich. Das ist insofern zu optimistisch, als die reine Verfügbarkeit von Information noch lange nicht fir deren sinnvolle Verwertung sorgt - die bloße Verfügbarkeit des Volltexts von Kants "Kritik der reinen Vernunft" enthebt nicht der Notwendigkeit, das Werk zu lesen und verstehen zu wollen. Lesen wird man besser auch nicht am Bildschirm sondern in der (neu-deutsch) "PrintAusgabe". Elektronische Volltexte von Büchern dienen nicht der Lektüre. Falls ihr Sinn nicht ohnehin ein rein verkaufsfördernder ist (das "Publishers Program" von Google Print erweckt in der Tat diesen Eindruck), bleibt ihr potenzieller Nutzen als Nachschlageinstrument. Nur der Volltext bietet die Möglichkeit, Informationen in einem Werk zu finden, die nicht explizit erschlossen wurden, durch ein Inhaltsverzeichnis etwa oder, eine noch günstigere Ausgangslage, durch ein Sachregister. Allerdings sind die meisten Werke nicht für einen solchen Zweck verfasst worden, d.h. es ist nicht zu erwarten, dass ein Werk über die "Geschichte des Römischen Reiches" im Volltextzugriff zu einem Lexikon zur Geschichte des Römischen Reiches wird. Entspricht also die hinter Google Print und zahllosen anderen Digitalisierungsinitiativen stehende Auffassung einem doch sehr naiven Bild von der Nützlichkeit gedruckter Information?
Seriöse Information darf erwarten, wer renommierte Nachschlagewerke befragt. Zumindest für die über die Primärordnung (Stichwort/Lemma) erschlossenen Sachverhalte ist für Buchausgaben ein gezielter Zugriff möglich, Verweisungen zwischen Artikeln sorgen für weitere Einstiege. Anzunehmen ist, dass sich der Nutzen von Nachschlagewerken in elektronischer Form noch deutlich erhöhen lässt: Produkte wie z.B. "Brockhaus multimedial" oder "Encyclopedia Britannica" sorgen mit leistungsfähigen Techniken über den wahlfreien Volltextzugriff hinaus für zahlreiche Navigations- und Recherchemöglichkeiten. Es liegt daher nahe, über eine Digitalisierung konventionell vorliegender Nachschlagewerke auch deren Anwendung zu verbessern, die im Print möglichen Zugriffsmöglichkeiten deutlich zu erweitern. Beispiele für diesen Ansatz sind die Digitalisierung der "Oekonomischen Encyklopädie" von Johann Georg Krünitz, die mit hohem Aufwand nicht maschinell (Scanning und OCR) sondern manuell realisiert wurde oder auch die im "Projekt Runeberg' , vorgenommenen zahlreichen Digitalisierungen u.a. auch von Nachschlagewerken. Ob die einfache Volltextindexierung derartig umfangreicher und - weil bereits als Nachschlagewerk konzipiert - gleichzeitig extrem verdichteter Quellen für einen größtmöglichen Nutzen der elektronischen Version ausreicht, darf zu Recht bezweifelt werden. In kommerziellen Produkten sorgen daher zusätzliche Techniken für einerseits thematisch gezielte Zugriffe auch über Nicht-Stichwörter, andererseits für Querverbindungen zu möglicherweise weiteren Artikeln von Interesse ("Wissensnetz" des Brockhaus, "Knowledge Navigator" der Britannica). Es darf angenommen werden, dass derartige Techniken dabei auf Informationen aufsetzen können (Strukturierung der Artikel, gekennzeichnete (getaggte) Personennamen, Querverweise etc.), die in den zu verarbeitenden Artikeln in nutzbarer Form vorliegen. Für digitalisierte Druckausgaben kommen derartige Verfahren nicht in Frage, weil lediglich flache, noch dazu in der Regel mit OCR-Fehlern behaftete Texte vorliegen. Die Zugriffsmöglichkeiten bewegen sich daher zwischen der 1:1-Umsetzung der Druckausgabe, d.h. dem Primärzugriff über Stichwort, und der Volltextsuche auf den vollständigen Lexikontext. Beides ist angesichts der im elektronischen Volltext liegenden Möglichkeiten sicher nicht die Methode der Wahl. Für die Digitalisierung des "Reallexikons zur Deutschen Kunstgeschichte" im Rahmen des von der Deutschen Forschungsgemeinschaft geförderten Projekts "RDKWeb" wird daher versucht, mit den Mitteln der Automatischen Indexierung eine Lösung zu erzielen, die über eine reine Volltextsuchmöglichkeit hinaus Suchunterstützungen bietet, die sich an den Fähigkeiten kommerzieller Produkte orientieren (nicht messen!).

Source

Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen

Type

a

Fuhr, N.: Rankingexperimente mit gewichteter Indexierung (1986) 0.05

0.051485084 = product of:
  0.10297017 = sum of:
    0.04530031 = weight(_text_:von in 2051) [ClassicSimilarity], result of:
      0.04530031 = score(doc=2051,freq=2.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.35372335 = fieldWeight in 2051, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.09375 = fieldNorm(doc=2051)
    0.057669856 = product of:
      0.08650478 = sum of:
        0.008461362 = weight(_text_:a in 2051) [ClassicSimilarity], result of:
          0.008461362 = score(doc=2051,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.15287387 = fieldWeight in 2051, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.09375 = fieldNorm(doc=2051)
        0.078043416 = weight(_text_:22 in 2051) [ClassicSimilarity], result of:
          0.078043416 = score(doc=2051,freq=2.0), product of:
            0.16809508 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.04800207 = queryNorm
            0.46428138 = fieldWeight in 2051, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=2051)
      0.6666667 = coord(2/3)
  0.5 = coord(2/4)

Abstract: Der Beitrag enthält eine Darstellung zur Frage der Konzeption von Rankingalgorithmen auf Grundlage gewichteter Indexierung mittels statistischer Verfahren.
Date: 14. 6.2015 22:12:56
Type: a

Lepsky, K.; Vorhauer, J.: Lingo - ein open source System für die Automatische Indexierung deutschsprachiger Dokumente (2006) 0.05

0.045377433 = product of:
  0.09075487 = sum of:
    0.0523083 = weight(_text_:von in 3581) [ClassicSimilarity], result of:
      0.0523083 = score(doc=3581,freq=6.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.40844458 = fieldWeight in 3581, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.0625 = fieldNorm(doc=3581)
    0.03844657 = product of:
      0.057669856 = sum of:
        0.005640907 = weight(_text_:a in 3581) [ClassicSimilarity], result of:
          0.005640907 = score(doc=3581,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.10191591 = fieldWeight in 3581, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.0625 = fieldNorm(doc=3581)
        0.052028947 = weight(_text_:22 in 3581) [ClassicSimilarity], result of:
          0.052028947 = score(doc=3581,freq=2.0), product of:
            0.16809508 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.04800207 = queryNorm
            0.30952093 = fieldWeight in 3581, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=3581)
      0.6666667 = coord(2/3)
  0.5 = coord(2/4)

Abstract: Lingo ist ein frei verfügbares System (open source) zur automatischen Indexierung der deutschen Sprache. Bei der Entwicklung von lingo standen hohe Konfigurierbarkeit und Flexibilität des Systems für unterschiedliche Einsatzmöglichkeiten im Vordergrund. Der Beitrag zeigt den Nutzen einer linguistisch basierten automatischen Indexierung für das Information Retrieval auf. Die für eine Retrievalverbesserung zur Verfügung stehende linguistische Funktionalität von lingo wird vorgestellt und an Beispielen erläutert: Grundformerkennung, Kompositumerkennung bzw. Kompositumzerlegung, Wortrelationierung, lexikalische und algorithmische Mehrwortgruppenerkennung, OCR-Fehlerkorrektur. Der offene Systemaufbau von lingo wird beschrieben, mögliche Einsatzszenarien und Anwendungsgrenzen werden benannt.
Date: 24. 3.2006 12:22:02
Type: a

Busch, D.: Domänenspezifische hybride automatische Indexierung von bibliographischen Metadaten (2019) 0.04

0.039741106 = product of:
  0.07948221 = sum of:
    0.05064729 = weight(_text_:von in 5628) [ClassicSimilarity], result of:
      0.05064729 = score(doc=5628,freq=10.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.39547473 = fieldWeight in 5628, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.046875 = fieldNorm(doc=5628)
    0.028834928 = product of:
      0.04325239 = sum of:
        0.004230681 = weight(_text_:a in 5628) [ClassicSimilarity], result of:
          0.004230681 = score(doc=5628,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.07643694 = fieldWeight in 5628, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.046875 = fieldNorm(doc=5628)
        0.039021708 = weight(_text_:22 in 5628) [ClassicSimilarity], result of:
          0.039021708 = score(doc=5628,freq=2.0), product of:
            0.16809508 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.04800207 = queryNorm
            0.23214069 = fieldWeight in 5628, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=5628)
      0.6666667 = coord(2/3)
  0.5 = coord(2/4)

Abstract: Im Fraunhofer-Informationszentrum Raum und Bau (IRB) wird Fachliteratur im Bereich Planen und Bauen bibliographisch erschlossen. Die daraus resultierenden Dokumente (Metadaten-Einträge) werden u.a. bei der Produktion der bibliographischen Datenbanken des IRB verwendet. In Abb. 1 ist ein Dokument dargestellt, das einen Zeitschriftenartikel beschreibt. Die Dokumente werden mit Deskriptoren von einer Nomenklatur (Schlagwortliste IRB) indexiert. Ein Deskriptor ist "eine Benennung., die für sich allein verwendbar, eindeutig zur Inhaltskennzeichnung geeignet und im betreffenden Dokumentationssystem zugelassen ist". Momentan wird die Indexierung intellektuell von menschlichen Experten durchgeführt. Die intellektuelle Indexierung ist zeitaufwendig und teuer. Eine Lösung des Problems besteht in der automatischen Indexierung, bei der die Zuordnung von Deskriptoren durch ein Computerprogramm erfolgt. Solche Computerprogramme werden im Folgenden auch als Klassifikatoren bezeichnet. In diesem Beitrag geht es um ein System zur automatischen Indexierung von deutschsprachigen Dokumenten im Bereich Bauwesen mit Deskriptoren aus der Schlagwortliste IRB.
Source: B.I.T.online. 22(2019) H.6, S.465-469
Type: a

Franke-Maier, M.: Anforderungen an die Qualität der Inhaltserschließung im Spannungsfeld von intellektuell und automatisch erzeugten Metadaten (2018) 0.04

0.039705254 = product of:
  0.07941051 = sum of:
    0.04576976 = weight(_text_:von in 5344) [ClassicSimilarity], result of:
      0.04576976 = score(doc=5344,freq=6.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.357389 = fieldWeight in 5344, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5344)
    0.03364075 = product of:
      0.05046112 = sum of:
        0.004935794 = weight(_text_:a in 5344) [ClassicSimilarity], result of:
          0.004935794 = score(doc=5344,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.089176424 = fieldWeight in 5344, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5344)
        0.045525327 = weight(_text_:22 in 5344) [ClassicSimilarity], result of:
          0.045525327 = score(doc=5344,freq=2.0), product of:
            0.16809508 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.04800207 = queryNorm
            0.2708308 = fieldWeight in 5344, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5344)
      0.6666667 = coord(2/3)
  0.5 = coord(2/4)

Abstract: Spätestens seit dem Deutschen Bibliothekartag 2018 hat sich die Diskussion zu den automatischen Verfahren der Inhaltserschließung der Deutschen Nationalbibliothek von einer politisch geführten Diskussion in eine Qualitätsdiskussion verwandelt. Der folgende Beitrag beschäftigt sich mit Fragen der Qualität von Inhaltserschließung in digitalen Zeiten, wo heterogene Erzeugnisse unterschiedlicher Verfahren aufeinandertreffen und versucht, wichtige Anforderungen an Qualität zu definieren. Dieser Tagungsbeitrag fasst die vom Autor als Impulse vorgetragenen Ideen beim Workshop der FAG "Erschließung und Informationsvermittlung" des GBV am 29. August 2018 in Kiel zusammen. Der Workshop fand im Rahmen der 22. Verbundkonferenz des GBV statt.
Type: a

Kasprzik, A.: Voraussetzungen und Anwendungspotentiale einer präzisen Sacherschließung aus Sicht der Wissenschaft (2018) 0.04

0.03618729 = product of:
  0.07237458 = sum of:
    0.03737085 = weight(_text_:von in 5195) [ClassicSimilarity], result of:
      0.03737085 = score(doc=5195,freq=4.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.29180688 = fieldWeight in 5195, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5195)
    0.03500373 = product of:
      0.052505594 = sum of:
        0.0069802674 = weight(_text_:a in 5195) [ClassicSimilarity], result of:
          0.0069802674 = score(doc=5195,freq=4.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.12611452 = fieldWeight in 5195, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5195)
        0.045525327 = weight(_text_:22 in 5195) [ClassicSimilarity], result of:
          0.045525327 = score(doc=5195,freq=2.0), product of:
            0.16809508 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.04800207 = queryNorm
            0.2708308 = fieldWeight in 5195, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5195)
      0.6666667 = coord(2/3)
  0.5 = coord(2/4)

Abstract: Große Aufmerksamkeit richtet sich im Moment auf das Potential von automatisierten Methoden in der Sacherschließung und deren Interaktionsmöglichkeiten mit intellektuellen Methoden. In diesem Kontext befasst sich der vorliegende Beitrag mit den folgenden Fragen: Was sind die Anforderungen an bibliothekarische Metadaten aus Sicht der Wissenschaft? Was wird gebraucht, um den Informationsbedarf der Fachcommunities zu bedienen? Und was bedeutet das entsprechend für die Automatisierung der Metadatenerstellung und -pflege? Dieser Beitrag fasst die von der Autorin eingenommene Position in einem Impulsvortrag und der Podiumsdiskussion beim Workshop der FAG "Erschließung und Informationsvermittlung" des GBV zusammen. Der Workshop fand im Rahmen der 22. Verbundkonferenz des GBV statt.
Type: a

Renz, M.: Automatische Inhaltserschließung im Zeichen von Wissensmanagement (2001) 0.04

0.0355058 = product of:
  0.0710116 = sum of:
    0.03737085 = weight(_text_:von in 5671) [ClassicSimilarity], result of:
      0.03737085 = score(doc=5671,freq=4.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.29180688 = fieldWeight in 5671, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5671)
    0.03364075 = product of:
      0.05046112 = sum of:
        0.004935794 = weight(_text_:a in 5671) [ClassicSimilarity], result of:
          0.004935794 = score(doc=5671,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.089176424 = fieldWeight in 5671, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5671)
        0.045525327 = weight(_text_:22 in 5671) [ClassicSimilarity], result of:
          0.045525327 = score(doc=5671,freq=2.0), product of:
            0.16809508 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.04800207 = queryNorm
            0.2708308 = fieldWeight in 5671, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5671)
      0.6666667 = coord(2/3)
  0.5 = coord(2/4)

Abstract: Methoden der automatischen Inhaltserschließung werden seit mehr als 30 Jahren entwickelt, ohne in luD-Kreisen auf merkliche Akzeptanz zu stoßen. Gegenwärtig führen jedoch die steigende Informationsflut und der Bedarf an effizienten Zugriffsverfahren im Informations- und Wissensmanagement in breiten Anwenderkreisen zu einem wachsenden Interesse an diesen Methoden, zu verstärkten Anstrengungen in Forschung und Entwicklung und zu neuen Produkten. In diesem Beitrag werden verschiedene Ansätze zu intelligentem und inhaltsbasiertem Retrieval und zur automatischen Inhaltserschließung diskutiert sowie kommerziell vertriebene Softwarewerkzeuge und Lösungen präsentiert. Abschließend wird festgestellt, dass in naher Zukunft mit einer zunehmenden Automatisierung von bestimmten Komponenten des Informations- und Wissensmanagements zu rechnen ist, indem Software-Werkzeuge zur automatischen Inhaltserschließung in den Workflow integriert werden
Date: 22. 3.2001 13:14:48
Type: a

Krause, J.; Womser-Hacker, C.: PADOK-II : Retrievaltests zur Bewertung von Volltextindexierungsvarianten für das deutsche Patentinformationssystem (1990) 0.03

0.03470501 = product of:
  0.06941002 = sum of:
    0.067529716 = weight(_text_:von in 2653) [ClassicSimilarity], result of:
      0.067529716 = score(doc=2653,freq=10.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.52729964 = fieldWeight in 2653, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.0625 = fieldNorm(doc=2653)
    0.0018803024 = product of:
      0.005640907 = sum of:
        0.005640907 = weight(_text_:a in 2653) [ClassicSimilarity], result of:
          0.005640907 = score(doc=2653,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.10191591 = fieldWeight in 2653, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.0625 = fieldNorm(doc=2653)
      0.33333334 = coord(1/3)
  0.5 = coord(2/4)

Abstract: Vorgestellt werden die Ergebnisse extensiver Retrievaltests von zwei Varianten von Inhalteserschließungen (Freitext und PASSAT) für das deutsche Patentinformationssystem auf der Basis von Volltexten. Die Tests führte die Fachgruppe Linguistische Informationswissenschaft der Universität Regensburg von 1986-1989 in Zusammenarbeit mit dem Deutschen Patentamt, dem Fachinformationszentrum Karlsruhe und meheren industrieellen Partnern durch. Der Schwerpunkt des Berichts liegt auf dem allgemeinen Ansatz der Bewertung der Ziele des Projekts und auf der Darstellung der statistischen Evaluierungsergebnisse.
Type: a

Probst, M.; Mittelbach, J.: Maschinelle Indexierung in der Sacherschließung wissenschaftlicher Bibliotheken (2006) 0.03

0.03432339 = product of:
  0.06864678 = sum of:
    0.030200208 = weight(_text_:von in 1755) [ClassicSimilarity], result of:
      0.030200208 = score(doc=1755,freq=2.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.23581557 = fieldWeight in 1755, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.0625 = fieldNorm(doc=1755)
    0.03844657 = product of:
      0.057669856 = sum of:
        0.005640907 = weight(_text_:a in 1755) [ClassicSimilarity], result of:
          0.005640907 = score(doc=1755,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.10191591 = fieldWeight in 1755, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.0625 = fieldNorm(doc=1755)
        0.052028947 = weight(_text_:22 in 1755) [ClassicSimilarity], result of:
          0.052028947 = score(doc=1755,freq=2.0), product of:
            0.16809508 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.04800207 = queryNorm
            0.30952093 = fieldWeight in 1755, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=1755)
      0.6666667 = coord(2/3)
  0.5 = coord(2/4)

Abstract: Obwohl fast alle größeren Bibliotheken intellektuelle Sacherschließung betreiben, sind elektronische Kataloge für die zielgerichtete sachliche Suche nur eingeschränkt nutzbar. Durch maschinelle Indexierung können ohne nennenswerten personellen Mehraufwand ausreichend große Datenmengen für Informationsretrievalsysteme erzeugt und somit die Auffindbarkeit von Dokumenten erhöht werden. Geeignete Sprachanalysetechniken zur Indextermerzeugung sind bekannt und bieten im Gegensatz zur gebräuchlichen Freitextinvertierung entscheidende Vorteile beim Retrieval. Im Fokus steht die Betrachtung der Vor- und Nachteile der gängigen Indexierungssysteme MILOS und intelligentCAPTURE.
Date: 22. 3.2008 12:35:19
Type: a

Gräbnitz, V.: PASSAT: Programm zur automatischen Selektion von Stichwörtern aus Texten (1987) 0.03

0.033442385 = product of:
  0.06688477 = sum of:
    0.06406432 = weight(_text_:von in 932) [ClassicSimilarity], result of:
      0.06406432 = score(doc=932,freq=4.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.5002404 = fieldWeight in 932, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.09375 = fieldNorm(doc=932)
    0.002820454 = product of:
      0.008461362 = sum of:
        0.008461362 = weight(_text_:a in 932) [ClassicSimilarity], result of:
          0.008461362 = score(doc=932,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.15287387 = fieldWeight in 932, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.09375 = fieldNorm(doc=932)
      0.33333334 = coord(1/3)
  0.5 = coord(2/4)

Source: Inhaltserschließung von Massendaten zur Wirksamkeit informationslinguistischer Verfahren am Beispiel des Deutschen Patentinformationssystems. Hrsg. J. Krause
Type: a

Junger, U.; Schwens, U.: ¬Die inhaltliche Erschließung des schriftlichen kulturellen Erbes auf dem Weg in die Zukunft : Automatische Vergabe von Schlagwörtern in der Deutschen Nationalbibliothek (2017) 0.03
```
0.028360896 = product of:
  0.05672179 = sum of:
    0.032692686 = weight(_text_:von in 3780) [ClassicSimilarity], result of:
      0.032692686 = score(doc=3780,freq=6.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.25527787 = fieldWeight in 3780, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3780)
    0.024029106 = product of:
      0.03604366 = sum of:
        0.003525567 = weight(_text_:a in 3780) [ClassicSimilarity], result of:
          0.003525567 = score(doc=3780,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.06369744 = fieldWeight in 3780, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.0390625 = fieldNorm(doc=3780)
        0.032518093 = weight(_text_:22 in 3780) [ClassicSimilarity], result of:
          0.032518093 = score(doc=3780,freq=2.0), product of:
            0.16809508 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.04800207 = queryNorm
            0.19345059 = fieldWeight in 3780, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0390625 = fieldNorm(doc=3780)
      0.6666667 = coord(2/3)
  0.5 = coord(2/4)
```
Abstract

Wir leben im 21. Jahrhundert, und vieles, was vor hundert und noch vor fünfzig Jahren als Science Fiction abgetan worden wäre, ist mittlerweile Realität. Raumsonden fliegen zum Mars, machen dort Experimente und liefern Daten zur Erde zurück. Roboter werden für Routineaufgaben eingesetzt, zum Beispiel in der Industrie oder in der Medizin. Digitalisierung, künstliche Intelligenz und automatisierte Verfahren sind kaum mehr aus unserem Alltag wegzudenken. Grundlage vieler Prozesse sind lernende Algorithmen. Die fortschreitende digitale Transformation ist global und umfasst alle Lebens- und Arbeitsbereiche: Wirtschaft, Gesellschaft und Politik. Sie eröffnet neue Möglichkeiten, von denen auch Bibliotheken profitieren. Der starke Anstieg digitaler Publikationen, die einen wichtigen und prozentual immer größer werdenden Teil des Kulturerbes darstellen, sollte für Bibliotheken Anlass sein, diese Möglichkeiten aktiv aufzugreifen und einzusetzen. Die Auswertbarkeit digitaler Inhalte, beispielsweise durch Text- and Data-Mining (TDM), und die Entwicklung technischer Verfahren, mittels derer Inhalte miteinander vernetzt und semantisch in Beziehung gesetzt werden können, bieten Raum, auch bibliothekarische Erschließungsverfahren neu zu denken. Daher beschäftigt sich die Deutsche Nationalbibliothek (DNB) seit einigen Jahren mit der Frage, wie sich die Prozesse bei der Erschließung von Medienwerken verbessern und maschinell unterstützen lassen. Sie steht dabei im regelmäßigen kollegialen Austausch mit anderen Bibliotheken, die sich ebenfalls aktiv mit dieser Fragestellung befassen, sowie mit europäischen Nationalbibliotheken, die ihrerseits Interesse an dem Thema und den Erfahrungen der DNB haben. Als Nationalbibliothek mit umfangreichen Beständen an digitalen Publikationen hat die DNB auch Expertise bei der digitalen Langzeitarchivierung aufgebaut und ist im Netzwerk ihrer Partner als kompetente Gesprächspartnerin geschätzt.

Date

19. 8.2017 9:24:22

Type

a

Seewald, U.: Semantische Analyse morphologisch komplexer Wörter : ein dreistufiges Verfahren zur maschinellen Inhaltserschließung von Wortableitungen und Komposita (1994) 0.03

0.028070446 = product of:
  0.056140892 = sum of:
    0.052850362 = weight(_text_:von in 2012) [ClassicSimilarity], result of:
      0.052850362 = score(doc=2012,freq=2.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.41267726 = fieldWeight in 2012, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.109375 = fieldNorm(doc=2012)
    0.0032905294 = product of:
      0.009871588 = sum of:
        0.009871588 = weight(_text_:a in 2012) [ClassicSimilarity], result of:
          0.009871588 = score(doc=2012,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.17835285 = fieldWeight in 2012, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.109375 = fieldNorm(doc=2012)
      0.33333334 = coord(1/3)
  0.5 = coord(2/4)

Type: a

Stock, M.; Stock, W.G.: Literaturnachweis- und Terminologiedatenbank : die Erfassung von Fachliteratur und Fachterminologie eines Fachgebiets in einer kombinierten Datenbank (1991) 0.03

0.027868655 = product of:
  0.05573731 = sum of:
    0.05338693 = weight(_text_:von in 3411) [ClassicSimilarity], result of:
      0.05338693 = score(doc=3411,freq=4.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.416867 = fieldWeight in 3411, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.078125 = fieldNorm(doc=3411)
    0.002350378 = product of:
      0.007051134 = sum of:
        0.007051134 = weight(_text_:a in 3411) [ClassicSimilarity], result of:
          0.007051134 = score(doc=3411,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.12739488 = fieldWeight in 3411, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.078125 = fieldNorm(doc=3411)
      0.33333334 = coord(1/3)
  0.5 = coord(2/4)

Abstract: In wissenschaftlichen Spezialgebieten kann über den Aufbau einer Literaturdatenbank gleichzeitig eine Terminologiedatenbank mit erstellt werden. Als Dokumentationsmethode eignet sich die Textwortmethode mit Übersetzungrelation. Mit dem Softwarepaket LBase aufgebaute Druckbildprogramme gestatten die Ausgabe von Bibliographien und Wörterbüchern
Type: a

Lepsky, K.: Automatische Indexierung (2013) 0.03

0.027868655 = product of:
  0.05573731 = sum of:
    0.05338693 = weight(_text_:von in 720) [ClassicSimilarity], result of:
      0.05338693 = score(doc=720,freq=4.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.416867 = fieldWeight in 720, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.078125 = fieldNorm(doc=720)
    0.002350378 = product of:
      0.007051134 = sum of:
        0.007051134 = weight(_text_:a in 720) [ClassicSimilarity], result of:
          0.007051134 = score(doc=720,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.12739488 = fieldWeight in 720, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.078125 = fieldNorm(doc=720)
      0.33333334 = coord(1/3)
  0.5 = coord(2/4)

Source: Grundlagen der praktischen Information und Dokumentation. Handbuch zur Einführung in die Informationswissenschaft und -praxis. 6., völlig neu gefaßte Ausgabe. Hrsg. von R. Kuhlen, W. Semar u. D. Strauch. Begründet von Klaus Laisiepen, Ernst Lutterbeck, Karl-Heinrich Meyer-Uhlenried
Type: a

Tzeras, K.: Zur Aufwandsabschätzung bei der Entwicklung eines Indexierungswörterbuches (1991) 0.03

0.027247813 = product of:
  0.054495625 = sum of:
    0.052850362 = weight(_text_:von in 792) [ClassicSimilarity], result of:
      0.052850362 = score(doc=792,freq=8.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.41267726 = fieldWeight in 792, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.0546875 = fieldNorm(doc=792)
    0.0016452647 = product of:
      0.004935794 = sum of:
        0.004935794 = weight(_text_:a in 792) [ClassicSimilarity], result of:
          0.004935794 = score(doc=792,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.089176424 = fieldWeight in 792, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.0546875 = fieldNorm(doc=792)
      0.33333334 = coord(1/3)
  0.5 = coord(2/4)

Abstract: Für die automatische Indexierung mit einem vorgegebenen Deskriptorensystem wird ein Wörterbuch benötigt, das möglichst viele Fachausdrücke des Anwendungsgebietes durch Relationen mit Deskriptoren verbindet. Werden die in einem solchen Indexierungswörterbuch erfaßten Relationen aus der Verarbeitung von Texten gewonnen, so ergibt sich eine Beziehung zwischen der Anzahl der Texte und der Größe und Leistungsfähigkeit des Wörterbuches. Die beschreibung derartiger Beziehungen ist besonders vor Beginn der Entwicklung eines automatischen Indexierungssystems von großem Interesse. H. Hüther hat sich in mehreren Arbeiten mit diesem Problem beschäftigt und verschiedene Schätzverfahren theoretische hergeleitet. Für eines der von ihm vorgeschlagenen Schätzverfahren zur Abschätzung der Größe eines Indexierungswörterbuches in Abhängigkeit von der Anzahl der zugrundeliegenden Texte werden im vorliegenden beitrag die Leistungsfähigkeit und die Anwendbarkeit untersucht
Type: a

Lustig, G.: Automatische Indexierung : Erfahrungen und Perspektiven (1989) 0.03

0.0270943 = product of:
  0.0541886 = sum of:
    0.0523083 = weight(_text_:von in 2323) [ClassicSimilarity], result of:
      0.0523083 = score(doc=2323,freq=6.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.40844458 = fieldWeight in 2323, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.0625 = fieldNorm(doc=2323)
    0.0018803024 = product of:
      0.005640907 = sum of:
        0.005640907 = weight(_text_:a in 2323) [ClassicSimilarity], result of:
          0.005640907 = score(doc=2323,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.10191591 = fieldWeight in 2323, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.0625 = fieldNorm(doc=2323)
      0.33333334 = coord(1/3)
  0.5 = coord(2/4)

Abstract: Es wird zunächst ein "ideales Information-Retrieval-System" beschrieben und diskutiert. Als Kernproblem für -selbst bescheidene - Entwicklungen in die dadurch aufgezeigte Richtung wird das "Verstehen" von Texten durch den Computer angesehen, wobei je nach der Aufgabenstellung einer Systemkomponente stets nur ein partielles Verstehen erforderlich ist. Ein relativ einfaches, aber keineswegs triviales Beispiel dieser Art ist die automatische Indexierung von Referatetexten bei vorgegebenen Deskriptorensystem. Von diesem Problem werden Ansätze, Ergebnisse und Erfahrungen mitgeteilt. Darauf aufbauend werden weitere Forschungsrichtungen und Entwicklungsmöglichkeiten mitgeteilt
Type: a

Lepsky, K.: Auf dem Weg zur automatischen Inhaltserschließung? : Das DFG-Projekt MILOS und seine Ergebnisse (1997) 0.03

0.0270943 = product of:
  0.0541886 = sum of:
    0.0523083 = weight(_text_:von in 11) [ClassicSimilarity], result of:
      0.0523083 = score(doc=11,freq=6.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.40844458 = fieldWeight in 11, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.0625 = fieldNorm(doc=11)
    0.0018803024 = product of:
      0.005640907 = sum of:
        0.005640907 = weight(_text_:a in 11) [ClassicSimilarity], result of:
          0.005640907 = score(doc=11,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.10191591 = fieldWeight in 11, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.0625 = fieldNorm(doc=11)
      0.33333334 = coord(1/3)
  0.5 = coord(2/4)

Abstract: Der Beitrag beschäftigt sich mit der Anwendung eines Verfahrens zur Automatischen Indexierung von Titeldaten in Bibliotheken. Die Arbeitsweise des Verfahrens und seine Nutzung innerhalb des von der Deutschen Forschungsgemeinschaft geförderten und an der Universitäts- und Landesbibliothek Düsseldorf durchgeführten Projekts MILOS werden geschildert. Die Ergebnisse eines Retrievaltests belegen die Tauglichkeit des Verfahrens für den Einsatz in Bibliotheken. Aufbauend auf diesen Ergebnissen werden Perspektiven für eine sinnvolle Verbindung von konventioneller bibliothekarischer Sacherschließung und automatischen Verfahren entworfen
Type: a

Lepsky, K.: Automatische Indexierung zur Erschließung deutschsprachiger Dokumente (1999) 0.03

0.0270943 = product of:
  0.0541886 = sum of:
    0.0523083 = weight(_text_:von in 4656) [ClassicSimilarity], result of:
      0.0523083 = score(doc=4656,freq=6.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.40844458 = fieldWeight in 4656, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.0625 = fieldNorm(doc=4656)
    0.0018803024 = product of:
      0.005640907 = sum of:
        0.005640907 = weight(_text_:a in 4656) [ClassicSimilarity], result of:
          0.005640907 = score(doc=4656,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.10191591 = fieldWeight in 4656, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.0625 = fieldNorm(doc=4656)
      0.33333334 = coord(1/3)
  0.5 = coord(2/4)

Abstract: Der Beitrag beschäftigt sich mit der Anwendung eines Verfahrens zur automatischen Indexierung deutschsprachiger Texte in Bibliotheken. Die Arbeitsweise des Verfahrens und seine Entwicklung innerhalb der von der Deutschen Forschungsgemeinschaft geförderte und an der ULB Düsseldorf gemeinsam mit der Fachrichtung Informationswissenschaft der Universität des Saarlandes durchgeführten Projekte MILOS I, MILOS II und KASCADE werden geschildert. Die Ergebnisse von Retrievaltests belegen die Tauglichkeit des Verfahrens für den Einsatz in Bibliotheken. Aufsetzend auf diesen Ergebnissen werden Perspektiven für die bibliothekarische Sacherschließung im Hinblick auf den Einsatz von automatischen Verfahren entworfen
Type: a

Bredack, J.; Lepsky, K.: Automatische Extraktion von Fachterminologie aus Volltexten (2014) 0.03

0.0270943 = product of:
  0.0541886 = sum of:
    0.0523083 = weight(_text_:von in 4872) [ClassicSimilarity], result of:
      0.0523083 = score(doc=4872,freq=6.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.40844458 = fieldWeight in 4872, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.0625 = fieldNorm(doc=4872)
    0.0018803024 = product of:
      0.005640907 = sum of:
        0.005640907 = weight(_text_:a in 4872) [ClassicSimilarity], result of:
          0.005640907 = score(doc=4872,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.10191591 = fieldWeight in 4872, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.0625 = fieldNorm(doc=4872)
      0.33333334 = coord(1/3)
  0.5 = coord(2/4)

Abstract: Fachterminologie in wissenschaftlichen Texten liegt häufig in Form von Phrasen oder Mehrwortgruppen vor. Vorgestellt wird ein algorithmisches Verfahren zur Identifikation und Extraktion fachterminologischer Mehrwortgruppen. Besonderer Schwerpunkt ist die Einbindung von Funktionswörtern der deutschen Sprache, um die Extraktion komplexer Mehrwortkonstruktionen zu ermöglichen. Eingesetzt wurde das automatische Indexierungssystem Lingo. Die Ergebnisse für eine Extraktion kunsthistorischer Fachterminologie aus dem Reallexikon zur Deutschen Kunstgeschichte belegen die Tauglichkeit des Verfahrens.
Type: a

Rapke, K.: Automatische Indexierung von Volltexten für die Gruner+Jahr Pressedatenbank (2001) 0.03
```
0.026028758 = product of:
  0.052057516 = sum of:
    0.05064729 = weight(_text_:von in 6386) [ClassicSimilarity], result of:
      0.05064729 = score(doc=6386,freq=10.0), product of:
        0.12806706 = queryWeight, product of:
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.04800207 = queryNorm
        0.39547473 = fieldWeight in 6386, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.6679487 = idf(docFreq=8340, maxDocs=44218)
          0.046875 = fieldNorm(doc=6386)
    0.001410227 = product of:
      0.004230681 = sum of:
        0.004230681 = weight(_text_:a in 6386) [ClassicSimilarity], result of:
          0.004230681 = score(doc=6386,freq=2.0), product of:
            0.055348642 = queryWeight, product of:
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.04800207 = queryNorm
            0.07643694 = fieldWeight in 6386, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.153047 = idf(docFreq=37942, maxDocs=44218)
              0.046875 = fieldNorm(doc=6386)
      0.33333334 = coord(1/3)
  0.5 = coord(2/4)
```
Abstract

Retrieval Tests sind die anerkannteste Methode, um neue Verfahren der Inhaltserschließung gegenüber traditionellen Verfahren zu rechtfertigen. Im Rahmen einer Diplomarbeit wurden zwei grundsätzlich unterschiedliche Systeme der automatischen inhaltlichen Erschließung anhand der Pressedatenbank des Verlagshauses Gruner + Jahr (G+J) getestet und evaluiert. Untersucht wurde dabei natürlichsprachliches Retrieval im Vergleich zu Booleschem Retrieval. Bei den beiden Systemen handelt es sich zum einen um Autonomy von Autonomy Inc. und DocCat, das von IBM an die Datenbankstruktur der G+J Pressedatenbank angepasst wurde. Ersteres ist ein auf natürlichsprachlichem Retrieval basierendes, probabilistisches System. DocCat demgegenüber basiert auf Booleschem Retrieval und ist ein lernendes System, das auf Grund einer intellektuell erstellten Trainingsvorlage indexiert. Methodisch geht die Evaluation vom realen Anwendungskontext der Textdokumentation von G+J aus. Die Tests werden sowohl unter statistischen wie auch qualitativen Gesichtspunkten bewertet. Ein Ergebnis der Tests ist, dass DocCat einige Mängel gegenüber der intellektuellen Inhaltserschließung aufweist, die noch behoben werden müssen, während das natürlichsprachliche Retrieval von Autonomy in diesem Rahmen und für die speziellen Anforderungen der G+J Textdokumentation so nicht einsetzbar ist

Type

a

Search (124 results, page 1 of 7)

Authors

Years

Themes