Search (21 results, page 1 of 2)

Rapke, K.: Automatische Indexierung von Volltexten für die Gruner+Jahr Pressedatenbank (2001) 0.04
```
0.039774638 = product of:
  0.09943659 = sum of:
    0.08609679 = weight(_text_:inc in 5863) [ClassicSimilarity], result of:
      0.08609679 = score(doc=5863,freq=2.0), product of:
        0.2573945 = queryWeight, product of:
          6.0549803 = idf(docFreq=281, maxDocs=44218)
          0.042509552 = queryNorm
        0.33449355 = fieldWeight in 5863, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.0549803 = idf(docFreq=281, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5863)
    0.013339795 = product of:
      0.02667959 = sum of:
        0.02667959 = weight(_text_:management in 5863) [ClassicSimilarity], result of:
          0.02667959 = score(doc=5863,freq=2.0), product of:
            0.14328322 = queryWeight, product of:
              3.3706124 = idf(docFreq=4130, maxDocs=44218)
              0.042509552 = queryNorm
            0.18620178 = fieldWeight in 5863, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.3706124 = idf(docFreq=4130, maxDocs=44218)
              0.0390625 = fieldNorm(doc=5863)
      0.5 = coord(1/2)
  0.4 = coord(2/5)
```
Abstract

Retrievaltests sind die anerkannteste Methode, um neue Verfahren der Inhaltserschließung gegenüber traditionellen Verfahren zu rechtfertigen. Im Rahmen einer Diplomarbeit wurden zwei grundsätzlich unterschiedliche Systeme der automatischen inhaltlichen Erschließung anhand der Pressedatenbank des Verlagshauses Gruner + Jahr (G+J) getestet und evaluiert. Untersucht wurde dabei natürlichsprachliches Retrieval im Vergleich zu Booleschem Retrieval. Bei den beiden Systemen handelt es sich zum einen um Autonomy von Autonomy Inc. und DocCat, das von IBM an die Datenbankstruktur der G+J Pressedatenbank angepasst wurde. Ersteres ist ein auf natürlichsprachlichem Retrieval basierendes, probabilistisches System. DocCat demgegenüber basiert auf Booleschem Retrieval und ist ein lernendes System, das aufgrund einer intellektuell erstellten Trainingsvorlage indexiert. Methodisch geht die Evaluation vom realen Anwendungskontext der Textdokumentation von G+J aus. Die Tests werden sowohl unter statistischen wie auch qualitativen Gesichtspunkten bewertet. Ein Ergebnis der Tests ist, dass DocCat einige Mängel gegenüber der intellektuellen Inhaltserschließung aufweist, die noch behoben werden müssen, während das natürlichsprachliche Retrieval von Autonomy in diesem Rahmen und für die speziellen Anforderungen der G+J Textdokumentation so nicht einsetzbar ist

Source

Information Research & Content Management: Orientierung, Ordnung und Organisation im Wissensmarkt; 23. DGI-Online-Tagung der DGI und 53. Jahrestagung der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis e.V. DGI, Frankfurt am Main, 8.-10.5.2001. Proceedings. Hrsg.: R. Schmidt

Fuhr, N.: Ranking-Experimente mit gewichteter Indexierung (1986) 0.03

0.026628902 = product of:
  0.13314451 = sum of:
    0.13314451 = sum of:
      0.06403102 = weight(_text_:management in 58) [ClassicSimilarity], result of:
        0.06403102 = score(doc=58,freq=2.0), product of:
          0.14328322 = queryWeight, product of:
            3.3706124 = idf(docFreq=4130, maxDocs=44218)
            0.042509552 = queryNorm
          0.44688427 = fieldWeight in 58, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.3706124 = idf(docFreq=4130, maxDocs=44218)
            0.09375 = fieldNorm(doc=58)
      0.06911349 = weight(_text_:22 in 58) [ClassicSimilarity], result of:
        0.06911349 = score(doc=58,freq=2.0), product of:
          0.14886121 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.042509552 = queryNorm
          0.46428138 = fieldWeight in 58, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.09375 = fieldNorm(doc=58)
  0.2 = coord(1/5)

Date: 14. 6.2015 22:12:44
Source: Deutscher Dokumentartag 1985, Nürnberg, 1.-4.10.1985: Fachinformation: Methodik - Management - Markt; neue Entwicklungen, Berufe, Produkte. Bearb.: H. Strohl-Goebel

Rapke, K.: Automatische Indexierung von Volltexten für die Gruner+Jahr Pressedatenbank (2001) 0.02
```
0.020663233 = product of:
  0.103316166 = sum of:
    0.103316166 = weight(_text_:inc in 6386) [ClassicSimilarity], result of:
      0.103316166 = score(doc=6386,freq=2.0), product of:
        0.2573945 = queryWeight, product of:
          6.0549803 = idf(docFreq=281, maxDocs=44218)
          0.042509552 = queryNorm
        0.40139228 = fieldWeight in 6386, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.0549803 = idf(docFreq=281, maxDocs=44218)
          0.046875 = fieldNorm(doc=6386)
  0.2 = coord(1/5)
```
Abstract

Retrieval Tests sind die anerkannteste Methode, um neue Verfahren der Inhaltserschließung gegenüber traditionellen Verfahren zu rechtfertigen. Im Rahmen einer Diplomarbeit wurden zwei grundsätzlich unterschiedliche Systeme der automatischen inhaltlichen Erschließung anhand der Pressedatenbank des Verlagshauses Gruner + Jahr (G+J) getestet und evaluiert. Untersucht wurde dabei natürlichsprachliches Retrieval im Vergleich zu Booleschem Retrieval. Bei den beiden Systemen handelt es sich zum einen um Autonomy von Autonomy Inc. und DocCat, das von IBM an die Datenbankstruktur der G+J Pressedatenbank angepasst wurde. Ersteres ist ein auf natürlichsprachlichem Retrieval basierendes, probabilistisches System. DocCat demgegenüber basiert auf Booleschem Retrieval und ist ein lernendes System, das auf Grund einer intellektuell erstellten Trainingsvorlage indexiert. Methodisch geht die Evaluation vom realen Anwendungskontext der Textdokumentation von G+J aus. Die Tests werden sowohl unter statistischen wie auch qualitativen Gesichtspunkten bewertet. Ein Ergebnis der Tests ist, dass DocCat einige Mängel gegenüber der intellektuellen Inhaltserschließung aufweist, die noch behoben werden müssen, während das natürlichsprachliche Retrieval von Autonomy in diesem Rahmen und für die speziellen Anforderungen der G+J Textdokumentation so nicht einsetzbar ist
Nohr, H.: Grundlagen der automatischen Indexierung : ein Lehrbuch (2003) 0.01
```
0.0088763 = product of:
  0.044381503 = sum of:
    0.044381503 = sum of:
      0.021343673 = weight(_text_:management in 1767) [ClassicSimilarity], result of:
        0.021343673 = score(doc=1767,freq=2.0), product of:
          0.14328322 = queryWeight, product of:
            3.3706124 = idf(docFreq=4130, maxDocs=44218)
            0.042509552 = queryNorm
          0.14896142 = fieldWeight in 1767, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.3706124 = idf(docFreq=4130, maxDocs=44218)
            0.03125 = fieldNorm(doc=1767)
      0.02303783 = weight(_text_:22 in 1767) [ClassicSimilarity], result of:
        0.02303783 = score(doc=1767,freq=2.0), product of:
          0.14886121 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.042509552 = queryNorm
          0.15476047 = fieldWeight in 1767, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.03125 = fieldNorm(doc=1767)
  0.2 = coord(1/5)
```
Date

22. 6.2009 12:46:51

Footnote

Rez. in: nfd 54(2003) H.5, S.314 (W. Ratzek): "Um entscheidungsrelevante Daten aus der ständig wachsenden Flut von mehr oder weniger relevanten Dokumenten zu extrahieren, müssen Unternehmen, öffentliche Verwaltung oder Einrichtungen der Fachinformation effektive und effiziente Filtersysteme entwickeln, einsetzen und pflegen. Das vorliegende Lehrbuch von Holger Nohr bietet erstmalig eine grundlegende Einführung in das Thema "automatische Indexierung". Denn: "Wie man Information sammelt, verwaltet und verwendet, wird darüber entscheiden, ob man zu den Gewinnern oder Verlierern gehört" (Bill Gates), heißt es einleitend. Im ersten Kapitel "Einleitung" stehen die Grundlagen im Mittelpunkt. Die Zusammenhänge zwischen Dokumenten-Management-Systeme, Information Retrieval und Indexierung für Planungs-, Entscheidungs- oder Innovationsprozesse, sowohl in Profit- als auch Non-Profit-Organisationen werden beschrieben. Am Ende des einleitenden Kapitels geht Nohr auf die Diskussion um die intellektuelle und automatische Indexierung ein und leitet damit über zum zweiten Kapitel "automatisches Indexieren. Hier geht der Autor überblickartig unter anderem ein auf - Probleme der automatischen Sprachverarbeitung und Indexierung - verschiedene Verfahren der automatischen Indexierung z.B. einfache Stichwortextraktion / Volltextinvertierung, - statistische Verfahren, Pattern-Matching-Verfahren. Die "Verfahren der automatischen Indexierung" behandelt Nohr dann vertiefend und mit vielen Beispielen versehen im umfangreichsten dritten Kapitel. Das vierte Kapitel "Keyphrase Extraction" nimmt eine Passpartout-Status ein: "Eine Zwischenstufe auf dem Weg von der automatischen Indexierung hin zur automatischen Generierung textueller Zusammenfassungen (Automatic Text Summarization) stellen Ansätze dar, die Schlüsselphrasen aus Dokumenten extrahieren (Keyphrase Extraction). Die Grenzen zwischen den automatischen Verfahren der Indexierung und denen des Text Summarization sind fließend." (S. 91). Am Beispiel NCR"s Extractor/Copernic Summarizer beschreibt Nohr die Funktionsweise.

Fuhr, N.; Niewelt, B.: ¬Ein Retrievaltest mit automatisch indexierten Dokumenten (1984) 0.01

0.008063241 = product of:
  0.0403162 = sum of:
    0.0403162 = product of:
      0.0806324 = sum of:
        0.0806324 = weight(_text_:22 in 262) [ClassicSimilarity], result of:
          0.0806324 = score(doc=262,freq=2.0), product of:
            0.14886121 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042509552 = queryNorm
            0.5416616 = fieldWeight in 262, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.109375 = fieldNorm(doc=262)
      0.5 = coord(1/2)
  0.2 = coord(1/5)

Date: 20.10.2000 12:22:23

Hauer, M.: Automatische Indexierung (2000) 0.01

0.0069113495 = product of:
  0.034556746 = sum of:
    0.034556746 = product of:
      0.06911349 = sum of:
        0.06911349 = weight(_text_:22 in 5887) [ClassicSimilarity], result of:
          0.06911349 = score(doc=5887,freq=2.0), product of:
            0.14886121 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042509552 = queryNorm
            0.46428138 = fieldWeight in 5887, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=5887)
      0.5 = coord(1/2)
  0.2 = coord(1/5)

Source: Wissen in Aktion: Wege des Knowledge Managements. 22. Online-Tagung der DGI, Frankfurt am Main, 2.-4.5.2000. Proceedings. Hrsg.: R. Schmidt

Fuhr, N.: Rankingexperimente mit gewichteter Indexierung (1986) 0.01

0.0069113495 = product of:
  0.034556746 = sum of:
    0.034556746 = product of:
      0.06911349 = sum of:
        0.06911349 = weight(_text_:22 in 2051) [ClassicSimilarity], result of:
          0.06911349 = score(doc=2051,freq=2.0), product of:
            0.14886121 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042509552 = queryNorm
            0.46428138 = fieldWeight in 2051, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=2051)
      0.5 = coord(1/2)
  0.2 = coord(1/5)

Date: 14. 6.2015 22:12:56

Hauer, M.: Tiefenindexierung im Bibliothekskatalog : 17 Jahre intelligentCAPTURE (2019) 0.01

0.0069113495 = product of:
  0.034556746 = sum of:
    0.034556746 = product of:
      0.06911349 = sum of:
        0.06911349 = weight(_text_:22 in 5629) [ClassicSimilarity], result of:
          0.06911349 = score(doc=5629,freq=2.0), product of:
            0.14886121 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042509552 = queryNorm
            0.46428138 = fieldWeight in 5629, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=5629)
      0.5 = coord(1/2)
  0.2 = coord(1/5)

Source: B.I.T.online. 22(2019) H.2, S.163-166

Hüther, H.: Selix im DFG-Projekt Kascade (1998) 0.01

0.005335918 = product of:
  0.02667959 = sum of:
    0.02667959 = product of:
      0.05335918 = sum of:
        0.05335918 = weight(_text_:management in 5151) [ClassicSimilarity], result of:
          0.05335918 = score(doc=5151,freq=2.0), product of:
            0.14328322 = queryWeight, product of:
              3.3706124 = idf(docFreq=4130, maxDocs=44218)
              0.042509552 = queryNorm
            0.37240356 = fieldWeight in 5151, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.3706124 = idf(docFreq=4130, maxDocs=44218)
              0.078125 = fieldNorm(doc=5151)
      0.5 = coord(1/2)
  0.2 = coord(1/5)

Source: Knowledge Management und Kommunikationssysteme: Proceedings des 6. Internationalen Symposiums für Informationswissenschaft (ISI '98) Prag, 3.-7. November 1998 / Hochschulverband für Informationswissenschaft (HI) e.V. Konstanz ; Fachrichtung Informationswissenschaft der Universität des Saarlandes, Saarbrücken. Hrsg.: Harald H. Zimmermann u. Volker Schramm

Lepsky, K.; Vorhauer, J.: Lingo - ein open source System für die Automatische Indexierung deutschsprachiger Dokumente (2006) 0.00

0.004607566 = product of:
  0.02303783 = sum of:
    0.02303783 = product of:
      0.04607566 = sum of:
        0.04607566 = weight(_text_:22 in 3581) [ClassicSimilarity], result of:
          0.04607566 = score(doc=3581,freq=2.0), product of:
            0.14886121 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042509552 = queryNorm
            0.30952093 = fieldWeight in 3581, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=3581)
      0.5 = coord(1/2)
  0.2 = coord(1/5)

Date: 24. 3.2006 12:22:02

Probst, M.; Mittelbach, J.: Maschinelle Indexierung in der Sacherschließung wissenschaftlicher Bibliotheken (2006) 0.00

0.004607566 = product of:
  0.02303783 = sum of:
    0.02303783 = product of:
      0.04607566 = sum of:
        0.04607566 = weight(_text_:22 in 1755) [ClassicSimilarity], result of:
          0.04607566 = score(doc=1755,freq=2.0), product of:
            0.14886121 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042509552 = queryNorm
            0.30952093 = fieldWeight in 1755, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=1755)
      0.5 = coord(1/2)
  0.2 = coord(1/5)

Date: 22. 3.2008 12:35:19

Glaesener, L.: Automatisches Indexieren einer informationswissenschaftlichen Datenbank mit Mehrwortgruppen (2012) 0.00

0.004607566 = product of:
  0.02303783 = sum of:
    0.02303783 = product of:
      0.04607566 = sum of:
        0.04607566 = weight(_text_:22 in 401) [ClassicSimilarity], result of:
          0.04607566 = score(doc=401,freq=2.0), product of:
            0.14886121 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042509552 = queryNorm
            0.30952093 = fieldWeight in 401, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=401)
      0.5 = coord(1/2)
  0.2 = coord(1/5)

Date: 11. 9.2012 19:43:22

Renz, M.: Automatische Inhaltserschließung im Zeichen von Wissensmanagement (2001) 0.00

0.0040316205 = product of:
  0.0201581 = sum of:
    0.0201581 = product of:
      0.0403162 = sum of:
        0.0403162 = weight(_text_:22 in 5671) [ClassicSimilarity], result of:
          0.0403162 = score(doc=5671,freq=2.0), product of:
            0.14886121 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042509552 = queryNorm
            0.2708308 = fieldWeight in 5671, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5671)
      0.5 = coord(1/2)
  0.2 = coord(1/5)

Date: 22. 3.2001 13:14:48

Kasprzik, A.: Voraussetzungen und Anwendungspotentiale einer präzisen Sacherschließung aus Sicht der Wissenschaft (2018) 0.00
```
0.0040316205 = product of:
  0.0201581 = sum of:
    0.0201581 = product of:
      0.0403162 = sum of:
        0.0403162 = weight(_text_:22 in 5195) [ClassicSimilarity], result of:
          0.0403162 = score(doc=5195,freq=2.0), product of:
            0.14886121 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042509552 = queryNorm
            0.2708308 = fieldWeight in 5195, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5195)
      0.5 = coord(1/2)
  0.2 = coord(1/5)
```
Abstract

Große Aufmerksamkeit richtet sich im Moment auf das Potential von automatisierten Methoden in der Sacherschließung und deren Interaktionsmöglichkeiten mit intellektuellen Methoden. In diesem Kontext befasst sich der vorliegende Beitrag mit den folgenden Fragen: Was sind die Anforderungen an bibliothekarische Metadaten aus Sicht der Wissenschaft? Was wird gebraucht, um den Informationsbedarf der Fachcommunities zu bedienen? Und was bedeutet das entsprechend für die Automatisierung der Metadatenerstellung und -pflege? Dieser Beitrag fasst die von der Autorin eingenommene Position in einem Impulsvortrag und der Podiumsdiskussion beim Workshop der FAG "Erschließung und Informationsvermittlung" des GBV zusammen. Der Workshop fand im Rahmen der 22. Verbundkonferenz des GBV statt.
Franke-Maier, M.: Anforderungen an die Qualität der Inhaltserschließung im Spannungsfeld von intellektuell und automatisch erzeugten Metadaten (2018) 0.00
```
0.0040316205 = product of:
  0.0201581 = sum of:
    0.0201581 = product of:
      0.0403162 = sum of:
        0.0403162 = weight(_text_:22 in 5344) [ClassicSimilarity], result of:
          0.0403162 = score(doc=5344,freq=2.0), product of:
            0.14886121 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042509552 = queryNorm
            0.2708308 = fieldWeight in 5344, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5344)
      0.5 = coord(1/2)
  0.2 = coord(1/5)
```
Abstract

Spätestens seit dem Deutschen Bibliothekartag 2018 hat sich die Diskussion zu den automatischen Verfahren der Inhaltserschließung der Deutschen Nationalbibliothek von einer politisch geführten Diskussion in eine Qualitätsdiskussion verwandelt. Der folgende Beitrag beschäftigt sich mit Fragen der Qualität von Inhaltserschließung in digitalen Zeiten, wo heterogene Erzeugnisse unterschiedlicher Verfahren aufeinandertreffen und versucht, wichtige Anforderungen an Qualität zu definieren. Dieser Tagungsbeitrag fasst die vom Autor als Impulse vorgetragenen Ideen beim Workshop der FAG "Erschließung und Informationsvermittlung" des GBV am 29. August 2018 in Kiel zusammen. Der Workshop fand im Rahmen der 22. Verbundkonferenz des GBV statt.

Lorenz, S.: Konzeption und prototypische Realisierung einer begriffsbasierten Texterschließung (2006) 0.00

0.0034556747 = product of:
  0.017278373 = sum of:
    0.017278373 = product of:
      0.034556746 = sum of:
        0.034556746 = weight(_text_:22 in 1746) [ClassicSimilarity], result of:
          0.034556746 = score(doc=1746,freq=2.0), product of:
            0.14886121 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042509552 = queryNorm
            0.23214069 = fieldWeight in 1746, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=1746)
      0.5 = coord(1/2)
  0.2 = coord(1/5)

Date: 22. 3.2015 9:17:30

Busch, D.: Domänenspezifische hybride automatische Indexierung von bibliographischen Metadaten (2019) 0.00

0.0034556747 = product of:
  0.017278373 = sum of:
    0.017278373 = product of:
      0.034556746 = sum of:
        0.034556746 = weight(_text_:22 in 5628) [ClassicSimilarity], result of:
          0.034556746 = score(doc=5628,freq=2.0), product of:
            0.14886121 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042509552 = queryNorm
            0.23214069 = fieldWeight in 5628, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=5628)
      0.5 = coord(1/2)
  0.2 = coord(1/5)

Source: B.I.T.online. 22(2019) H.6, S.465-469

Kempf, A.O.: Automatische Indexierung in der sozialwissenschaftlichen Fachinformation : eine Evaluationsstudie zur maschinellen Erschließung für die Datenbank SOLIS (2012) 0.00
```
0.003201551 = product of:
  0.016007755 = sum of:
    0.016007755 = product of:
      0.03201551 = sum of:
        0.03201551 = weight(_text_:management in 903) [ClassicSimilarity], result of:
          0.03201551 = score(doc=903,freq=2.0), product of:
            0.14328322 = queryWeight, product of:
              3.3706124 = idf(docFreq=4130, maxDocs=44218)
              0.042509552 = queryNorm
            0.22344214 = fieldWeight in 903, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.3706124 = idf(docFreq=4130, maxDocs=44218)
              0.046875 = fieldNorm(doc=903)
      0.5 = coord(1/2)
  0.2 = coord(1/5)
```
Abstract

Automatische Indexierungsverfahren werden mit Zunahme der digitalen Verfügbarkeit von Metadaten und Volltexten mehr und mehr als eine mögliche Antwort auf das Management unstrukturierter Daten diskutiert. In der sozialwissenschaftlichen Fachinformation existiert in diesem Zusammenhang seit einiger Zeit der Vorschlag eines sogenannten Schalenmodells (vgl. Krause, 1996) mit unterschiedlichen Qualitätsstufen bei der inhaltlichen Erschließung. Vor diesem Hintergrund beschreibt die Arbeit zunächst Methoden und Verfahren der inhaltlichen und automatischen Indexierung, bevor vier Testläufe eines automatischen Indexierungssystems (MindServer) zur automatischen Erschließung von Datensätzen der bibliographischen Literaturdatenbank SOLIS mit Deskriptoren des Thesaurus Sozialwissenschaften sowie der Klassifikation Sozialwissenschaften beschrieben und analysiert werden. Es erfolgt eine ausführliche Fehleranalyse mit Beispielen sowie eine abschließende Diskussion, inwieweit die automatische Erschließung in dieser Form für die Randbereiche der Datenbank SOLIS für die Zukunft einen gangbaren Weg darstellt.

Junger, U.; Schwens, U.: ¬Die inhaltliche Erschließung des schriftlichen kulturellen Erbes auf dem Weg in die Zukunft : Automatische Vergabe von Schlagwörtern in der Deutschen Nationalbibliothek (2017) 0.00

0.002879729 = product of:
  0.014398645 = sum of:
    0.014398645 = product of:
      0.02879729 = sum of:
        0.02879729 = weight(_text_:22 in 3780) [ClassicSimilarity], result of:
          0.02879729 = score(doc=3780,freq=2.0), product of:
            0.14886121 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.042509552 = queryNorm
            0.19345059 = fieldWeight in 3780, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0390625 = fieldNorm(doc=3780)
      0.5 = coord(1/2)
  0.2 = coord(1/5)

Date: 19. 8.2017 9:24:22

Nohr, H.: Theorie des Information Retrieval II : Automatische Indexierung (2004) 0.00
```
0.002667959 = product of:
  0.013339795 = sum of:
    0.013339795 = product of:
      0.02667959 = sum of:
        0.02667959 = weight(_text_:management in 8) [ClassicSimilarity], result of:
          0.02667959 = score(doc=8,freq=2.0), product of:
            0.14328322 = queryWeight, product of:
              3.3706124 = idf(docFreq=4130, maxDocs=44218)
              0.042509552 = queryNorm
            0.18620178 = fieldWeight in 8, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.3706124 = idf(docFreq=4130, maxDocs=44218)
              0.0390625 = fieldNorm(doc=8)
      0.5 = coord(1/2)
  0.2 = coord(1/5)
```
Abstract

Ein großer Teil der Informationen - Schätzungen zufolge bis zu 80% - liegt in Organisationen in unstrukturierten Dokumenten vor. In der Vergangenheit wurden Lösungen für das Management strukturierter Informationen entwickelt, die es nun auch zu erreichen gilt für unstrukturierte Informationen. Neben Verfahren des Data Mining für die Datenanalyse treten Versuche, Text Mining (Lit. 06) auf die Textanalyse anzuwenden. Um gezielt Dokumente im Repository suchen zu können, ist eine effektive Inhaltserkennung und -kennzeichnung erforderlich, d.h. eine Zuordnung der Dokumente zu Themengebieten bzw die Speicherung geeigneter Indexterme als Metadaten. Zu diesem Zweck müssen die Dokumenteninhalte repräsentiert, d.h. indexiert oder klassifiziert, werden. Dokumentanalyse dient auch der Steuerung des Informations- und Dokumentenflusses. Ziel ist die Einleitung eines "Workflow nach Posteingang". Eine Dokumentanalyse kann anhand erkannter Merkmale Eingangspost automatisch an den Sachbearbeiter oder die zuständige Organisationseinheit (Rechnungen in die Buchhaltung, Aufträge in den Vertrieb) im Unternehmen leiten. Dokumentanalysen werden auch benötigt, wenn Mitarbeiter über einen persönlichen Informationsfilter relevante Dokumente automatisch zugestellt bekommen sollen. Aufgrund der Systemintegration werden Indexierungslösungen in den Funktionsumfang von DMS- bzw. Workflow-Produkten integriert. Eine Architektur solcher Systeme zeigt Abb. 1. Die Architektur zeigt die Indexierungs- bzw. Klassifizierungsfunktion im Zentrum der Anwendung. Dabei erfüllt sie Aufgaben für die Repräsentation von Dokumenten (Metadaten) und das spätere Retrieval.

Search (21 results, page 1 of 2)

Authors

Years

Types

Themes