Search (218 results, page 1 of 11)

Kasprzik, A.: Voraussetzungen und Anwendungspotentiale einer präzisen Sacherschließung aus Sicht der Wissenschaft (2018) 0.16

0.15725508 = product of:
  0.25160813 = sum of:
    0.036616858 = weight(_text_:und in 5195) [ClassicSimilarity], result of:
      0.036616858 = score(doc=5195,freq=12.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.41987535 = fieldWeight in 5195, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5195)
    0.11557427 = weight(_text_:methoden in 5195) [ClassicSimilarity], result of:
      0.11557427 = score(doc=5195,freq=4.0), product of:
        0.20390649 = queryWeight, product of:
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.039347667 = queryNorm
        0.56680036 = fieldWeight in 5195, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5195)
    0.05036097 = weight(_text_:der in 5195) [ClassicSimilarity], result of:
      0.05036097 = score(doc=5195,freq=22.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.57297707 = fieldWeight in 5195, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5195)
    0.036616858 = weight(_text_:und in 5195) [ClassicSimilarity], result of:
      0.036616858 = score(doc=5195,freq=12.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.41987535 = fieldWeight in 5195, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5195)
    0.012439154 = product of:
      0.037317462 = sum of:
        0.037317462 = weight(_text_:22 in 5195) [ClassicSimilarity], result of:
          0.037317462 = score(doc=5195,freq=2.0), product of:
            0.13778883 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.039347667 = queryNorm
            0.2708308 = fieldWeight in 5195, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5195)
      0.33333334 = coord(1/3)
  0.625 = coord(5/8)

Abstract: Große Aufmerksamkeit richtet sich im Moment auf das Potential von automatisierten Methoden in der Sacherschließung und deren Interaktionsmöglichkeiten mit intellektuellen Methoden. In diesem Kontext befasst sich der vorliegende Beitrag mit den folgenden Fragen: Was sind die Anforderungen an bibliothekarische Metadaten aus Sicht der Wissenschaft? Was wird gebraucht, um den Informationsbedarf der Fachcommunities zu bedienen? Und was bedeutet das entsprechend für die Automatisierung der Metadatenerstellung und -pflege? Dieser Beitrag fasst die von der Autorin eingenommene Position in einem Impulsvortrag und der Podiumsdiskussion beim Workshop der FAG "Erschließung und Informationsvermittlung" des GBV zusammen. Der Workshop fand im Rahmen der 22. Verbundkonferenz des GBV statt.

Renz, M.: Automatische Inhaltserschließung im Zeichen von Wissensmanagement (2001) 0.15

0.14948753 = product of:
  0.23918003 = sum of:
    0.044846304 = weight(_text_:und in 5671) [ClassicSimilarity], result of:
      0.044846304 = score(doc=5671,freq=18.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.51424015 = fieldWeight in 5671, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5671)
    0.11557427 = weight(_text_:methoden in 5671) [ClassicSimilarity], result of:
      0.11557427 = score(doc=5671,freq=4.0), product of:
        0.20390649 = queryWeight, product of:
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.039347667 = queryNorm
        0.56680036 = fieldWeight in 5671, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5671)
    0.021473989 = weight(_text_:der in 5671) [ClassicSimilarity], result of:
      0.021473989 = score(doc=5671,freq=4.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.24431825 = fieldWeight in 5671, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5671)
    0.044846304 = weight(_text_:und in 5671) [ClassicSimilarity], result of:
      0.044846304 = score(doc=5671,freq=18.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.51424015 = fieldWeight in 5671, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5671)
    0.012439154 = product of:
      0.037317462 = sum of:
        0.037317462 = weight(_text_:22 in 5671) [ClassicSimilarity], result of:
          0.037317462 = score(doc=5671,freq=2.0), product of:
            0.13778883 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.039347667 = queryNorm
            0.2708308 = fieldWeight in 5671, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5671)
      0.33333334 = coord(1/3)
  0.625 = coord(5/8)

Abstract: Methoden der automatischen Inhaltserschließung werden seit mehr als 30 Jahren entwickelt, ohne in luD-Kreisen auf merkliche Akzeptanz zu stoßen. Gegenwärtig führen jedoch die steigende Informationsflut und der Bedarf an effizienten Zugriffsverfahren im Informations- und Wissensmanagement in breiten Anwenderkreisen zu einem wachsenden Interesse an diesen Methoden, zu verstärkten Anstrengungen in Forschung und Entwicklung und zu neuen Produkten. In diesem Beitrag werden verschiedene Ansätze zu intelligentem und inhaltsbasiertem Retrieval und zur automatischen Inhaltserschließung diskutiert sowie kommerziell vertriebene Softwarewerkzeuge und Lösungen präsentiert. Abschließend wird festgestellt, dass in naher Zukunft mit einer zunehmenden Automatisierung von bestimmten Komponenten des Informations- und Wissensmanagements zu rechnen ist, indem Software-Werkzeuge zur automatischen Inhaltserschließung in den Workflow integriert werden
Date: 22. 3.2001 13:14:48
Source: nfd Information - Wissenschaft und Praxis. 52(2001) H.2, S.69-78

Schöneberg, U.; Gödert, W.: Erschließung mathematischer Publikationen mittels linguistischer Verfahren (2012) 0.13

0.12779684 = product of:
  0.20447494 = sum of:
    0.031385876 = weight(_text_:und in 1055) [ClassicSimilarity], result of:
      0.031385876 = score(doc=1055,freq=12.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.35989314 = fieldWeight in 1055, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1055)
    0.099063665 = weight(_text_:methoden in 1055) [ClassicSimilarity], result of:
      0.099063665 = score(doc=1055,freq=4.0), product of:
        0.20390649 = queryWeight, product of:
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.039347667 = queryNorm
        0.48582888 = fieldWeight in 1055, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.046875 = fieldNorm(doc=1055)
    0.031880606 = weight(_text_:der in 1055) [ClassicSimilarity], result of:
      0.031880606 = score(doc=1055,freq=12.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.36271852 = fieldWeight in 1055, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=1055)
    0.031385876 = weight(_text_:und in 1055) [ClassicSimilarity], result of:
      0.031385876 = score(doc=1055,freq=12.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.35989314 = fieldWeight in 1055, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1055)
    0.010758916 = product of:
      0.032276746 = sum of:
        0.032276746 = weight(_text_:29 in 1055) [ClassicSimilarity], result of:
          0.032276746 = score(doc=1055,freq=2.0), product of:
            0.13841279 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.039347667 = queryNorm
            0.23319192 = fieldWeight in 1055, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.046875 = fieldNorm(doc=1055)
      0.33333334 = coord(1/3)
  0.625 = coord(5/8)

Abstract: Die Zahl der mathematik-relevanten Publikationn steigt von Jahr zu Jahr an. Referatedienste wie da Zentralblatt MATH und Mathematical Reviews erfassen die bibliographischen Daten, erschließen die Arbeiten inhaltlich und machen sie - heute über Datenbanken, früher in gedruckter Form - für den Nutzer suchbar. Keywords sind ein wesentlicher Bestandteil der inhaltlichen Erschließung der Publikationen. Keywords sind meist keine einzelnen Wörter, sondern Mehrwortphrasen. Das legt die Anwendung linguistischer Methoden und Verfahren nahe. Die an der FH Köln entwickelte Software 'Lingo' wurde für die speziellen Anforderungen mathematischer Texte angepasst und sowohl zum Aufbau eines kontrollierten Vokabulars als auch zur Extraction von Keywords aus mathematischen Publikationen genutzt. Es ist geplant, über eine Verknüpfung von kontrolliertem Vokabular und der Mathematical Subject Classification Methoden für die automatische Klassifikation für den Referatedienst Zentralblatt MATH zu entwickeln und zu erproben.
Date: 12. 9.2013 12:29:05
Footnote: Vortrag anlässlich der DMV-Tagung in Saarbrücken, 17.-20.09.2012.

Lustig, G.: Methoden der automatischen Indexierung (1970) 0.12

0.11821804 = product of:
  0.23643608 = sum of:
    0.02562646 = weight(_text_:und in 4999) [ClassicSimilarity], result of:
      0.02562646 = score(doc=4999,freq=2.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.29385152 = fieldWeight in 4999, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=4999)
    0.14009717 = weight(_text_:methoden in 4999) [ClassicSimilarity], result of:
      0.14009717 = score(doc=4999,freq=2.0), product of:
        0.20390649 = queryWeight, product of:
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.039347667 = queryNorm
        0.6870658 = fieldWeight in 4999, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.09375 = fieldNorm(doc=4999)
    0.04508599 = weight(_text_:der in 4999) [ClassicSimilarity], result of:
      0.04508599 = score(doc=4999,freq=6.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.5129615 = fieldWeight in 4999, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.09375 = fieldNorm(doc=4999)
    0.02562646 = weight(_text_:und in 4999) [ClassicSimilarity], result of:
      0.02562646 = score(doc=4999,freq=2.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.29385152 = fieldWeight in 4999, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=4999)
  0.5 = coord(4/8)

Source: Sprachliche Ansätze im Informations- und Dokumentationsbereich. Referate der Arbeitstagung des Komitees Automation der Dokumentation des DGD am 24.-25.2.1970 in Frankfurt

Kumpe, D.: Methoden zur automatischen Indexierung von Dokumenten (2006) 0.10

0.10331824 = product of:
  0.20663647 = sum of:
    0.047272157 = weight(_text_:und in 782) [ClassicSimilarity], result of:
      0.047272157 = score(doc=782,freq=20.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.54205674 = fieldWeight in 782, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=782)
    0.08172335 = weight(_text_:methoden in 782) [ClassicSimilarity], result of:
      0.08172335 = score(doc=782,freq=2.0), product of:
        0.20390649 = queryWeight, product of:
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.039347667 = queryNorm
        0.40078837 = fieldWeight in 782, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.0546875 = fieldNorm(doc=782)
    0.030368807 = weight(_text_:der in 782) [ClassicSimilarity], result of:
      0.030368807 = score(doc=782,freq=8.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.34551817 = fieldWeight in 782, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=782)
    0.047272157 = weight(_text_:und in 782) [ClassicSimilarity], result of:
      0.047272157 = score(doc=782,freq=20.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.54205674 = fieldWeight in 782, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=782)
  0.5 = coord(4/8)

Abstract: Diese Diplomarbeit handelt von der Indexierung von unstrukturierten und natürlichsprachigen Dokumenten. Die zunehmende Informationsflut und die Zahl an veröffentlichten wissenschaftlichen Berichten und Büchern machen eine maschinelle inhaltliche Erschließung notwendig. Um die Anforderungen hierfür besser zu verstehen, werden Probleme der natürlichsprachigen schriftlichen Kommunikation untersucht. Die manuellen Techniken der Indexierung und die Dokumentationssprachen werden vorgestellt. Die Indexierung wird thematisch in den Bereich der inhaltlichen Erschließung und des Information Retrieval eingeordnet. Weiterhin werden Vor- und Nachteile von ausgesuchten Algorithmen untersucht und Softwareprodukte im Bereich des Information Retrieval auf ihre Arbeitsweise hin evaluiert. Anhand von Beispiel-Dokumenten werden die Ergebnisse einzelner Verfahren vorgestellt. Mithilfe des Projekts European Migration Network werden Probleme und grundlegende Anforderungen an die Durchführung einer inhaltlichen Erschließung identifiziert und Lösungsmöglichkeiten vorgeschlagen.
Imprint: Berlin : Technische Universität Berlin / Institut für Softwaretechnik und Theoretische Informatik, Computergestützte Informationssysteme

Krüger, C.: Evaluation des WWW-Suchdienstes GERHARD unter besonderer Beachtung automatischer Indexierung (1999) 0.10

0.09644525 = product of:
  0.1928905 = sum of:
    0.03376583 = weight(_text_:und in 1777) [ClassicSimilarity], result of:
      0.03376583 = score(doc=1777,freq=20.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.3871834 = fieldWeight in 1777, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1777)
    0.101106435 = weight(_text_:methoden in 1777) [ClassicSimilarity], result of:
      0.101106435 = score(doc=1777,freq=6.0), product of:
        0.20390649 = queryWeight, product of:
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.039347667 = queryNorm
        0.49584705 = fieldWeight in 1777, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1777)
    0.0242524 = weight(_text_:der in 1777) [ClassicSimilarity], result of:
      0.0242524 = score(doc=1777,freq=10.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.27592933 = fieldWeight in 1777, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1777)
    0.03376583 = weight(_text_:und in 1777) [ClassicSimilarity], result of:
      0.03376583 = score(doc=1777,freq=20.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.3871834 = fieldWeight in 1777, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1777)
  0.5 = coord(4/8)

Abstract: Die vorliegende Arbeit beinhaltet eine Beschreibung und Evaluation des WWW - Suchdienstes GERHARD (German Harvest Automated Retrieval and Directory). GERHARD ist ein Such- und Navigationssystem für das deutsche World Wide Web, weiches ausschließlich wissenschaftlich relevante Dokumente sammelt, und diese auf der Basis computerlinguistischer und statistischer Methoden automatisch mit Hilfe eines bibliothekarischen Klassifikationssystems klassifiziert. Mit dem DFG - Projekt GERHARD ist der Versuch unternommen worden, mit einem auf einem automatischen Klassifizierungsverfahren basierenden World Wide Web - Dienst eine Alternative zu herkömmlichen Methoden der Interneterschließung zu entwickeln. GERHARD ist im deutschsprachigen Raum das einzige Verzeichnis von Internetressourcen, dessen Erstellung und Aktualisierung vollständig automatisch (also maschinell) erfolgt. GERHARD beschränkt sich dabei auf den Nachweis von Dokumenten auf wissenschaftlichen WWW - Servern. Die Grundidee dabei war, kostenintensive intellektuelle Erschließung und Klassifizierung von lnternetseiten durch computerlinguistische und statistische Methoden zu ersetzen, um auf diese Weise die nachgewiesenen Internetressourcen automatisch auf das Vokabular eines bibliothekarischen Klassifikationssystems abzubilden. GERHARD steht für German Harvest Automated Retrieval and Directory. Die WWW - Adresse (URL) von GERHARD lautet: http://www.gerhard.de. Im Rahmen der vorliegenden Diplomarbeit soll eine Beschreibung des Dienstes mit besonderem Schwerpunkt auf dem zugrundeliegenden Indexierungs- bzw. Klassifizierungssystem erfolgen und anschließend mit Hilfe eines kleinen Retrievaltests die Effektivität von GERHARD überprüft werden.
Footnote: Diplomarbeit im Fach Inhaltliche Erschließung, Studiengang Informationsmanagement der FH Stuttgart - Hochschule für Bibliotheks- und Informationswesen
Imprint: Stuttgart : FH - Hochschule für Bibliotheks- und Informationswesen

Qualität in der Inhaltserschließung (2021) 0.10
```
0.095295236 = product of:
  0.19059047 = sum of:
    0.044386335 = weight(_text_:und in 753) [ClassicSimilarity], result of:
      0.044386335 = score(doc=753,freq=54.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.5089658 = fieldWeight in 753, product of:
          7.3484693 = tf(freq=54.0), with freq of:
            54.0 = termFreq=54.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=753)
    0.06604244 = weight(_text_:methoden in 753) [ClassicSimilarity], result of:
      0.06604244 = score(doc=753,freq=4.0), product of:
        0.20390649 = queryWeight, product of:
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.039347667 = queryNorm
        0.32388592 = fieldWeight in 753, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.03125 = fieldNorm(doc=753)
    0.03577537 = weight(_text_:der in 753) [ClassicSimilarity], result of:
      0.03577537 = score(doc=753,freq=34.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.40703082 = fieldWeight in 753, product of:
          5.8309517 = tf(freq=34.0), with freq of:
            34.0 = termFreq=34.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=753)
    0.044386335 = weight(_text_:und in 753) [ClassicSimilarity], result of:
      0.044386335 = score(doc=753,freq=54.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.5089658 = fieldWeight in 753, product of:
          7.3484693 = tf(freq=54.0), with freq of:
            54.0 = termFreq=54.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=753)
  0.5 = coord(4/8)
```
Abstract

Der 70. Band der BIPRA-Reihe beschäftigt sich mit der Qualität in der Inhaltserschließung im Kontext etablierter Verfahren und technologischer Innovationen. Treffen heterogene Erzeugnisse unterschiedlicher Methoden und Systeme aufeinander, müssen minimale Anforderungen an die Qualität der Inhaltserschließung festgelegt werden. Die Qualitätsfrage wird zurzeit in verschiedenen Zusammenhängen intensiv diskutiert und im vorliegenden Band aufgegriffen. In diesem Themenfeld aktive Autor:innen beschreiben aus ihrem jeweiligen Blickwinkel unterschiedliche Aspekte zu Metadaten, Normdaten, Formaten, Erschließungsverfahren und Erschließungspolitik. Der Band versteht sich als Handreichung und Anregung für die Diskussion um die Qualität in der Inhaltserschließung.

Content

Inhalt: Editorial - Michael Franke-Maier, Anna Kasprzik, Andreas Ledl und Hans Schürmann Qualität in der Inhaltserschließung - Ein Überblick aus 50 Jahren (1970-2020) - Andreas Ledl Fit for Purpose - Standardisierung von inhaltserschließenden Informationen durch Richtlinien für Metadaten - Joachim Laczny Neue Wege und Qualitäten - Die Inhaltserschließungspolitik der Deutschen Nationalbibliothek - Ulrike Junger und Frank Scholze Wissensbasen für die automatische Erschließung und ihre Qualität am Beispiel von Wikidata - Lydia Pintscher, Peter Bourgonje, Julián Moreno Schneider, Malte Ostendorff und Georg Rehm Qualitätssicherung in der GND - Esther Scheven Qualitätskriterien und Qualitätssicherung in der inhaltlichen Erschließung - Thesenpapier des Expertenteams RDA-Anwendungsprofil für die verbale Inhaltserschließung (ET RAVI) Coli-conc - Eine Infrastruktur zur Nutzung und Erstellung von Konkordanzen - Uma Balakrishnan, Stefan Peters und Jakob Voß Methoden und Metriken zur Messung von OCR-Qualität für die Kuratierung von Daten und Metadaten - Clemens Neudecker, Karolina Zaczynska, Konstantin Baierer, Georg Rehm, Mike Gerber und Julián Moreno Schneider Datenqualität als Grundlage qualitativer Inhaltserschließung - Jakob Voß Bemerkungen zu der Qualitätsbewertung von MARC-21-Datensätzen - Rudolf Ungváry und Péter Király Named Entity Linking mit Wikidata und GND - Das Potenzial handkuratierter und strukturierter Datenquellen für die semantische Anreicherung von Volltexten - Sina Menzel, Hannes Schnaitter, Josefine Zinck, Vivien Petras, Clemens Neudecker, Kai Labusch, Elena Leitner und Georg Rehm Ein Protokoll für den Datenabgleich im Web am Beispiel von OpenRefine und der Gemeinsamen Normdatei (GND) - Fabian Steeg und Adrian Pohl Verbale Erschließung in Katalogen und Discovery-Systemen - Überlegungen zur Qualität - Heidrun Wiesenmüller Inhaltserschließung für Discovery-Systeme gestalten - Jan Frederik Maas Evaluierung von Verschlagwortung im Kontext des Information Retrievals - Christian Wartena und Koraljka Golub Die Qualität der Fremddatenanreicherung FRED - Cyrus Beck Quantität als Qualität - Was die Verbünde zur Verbesserung der Inhaltserschließung beitragen können - Rita Albrecht, Barbara Block, Mathias Kratzer und Peter Thiessen Hybride Künstliche Intelligenz in der automatisierten Inhaltserschließung - Harald Sack

Footnote

Vgl.: https://www.degruyter.com/document/doi/10.1515/9783110691597/html. DOI: https://doi.org/10.1515/9783110691597. Rez. in: Information - Wissenschaft und Praxis 73(2022) H.2-3, S.131-132 (B. Lorenz u. V. Steyer). Weitere Rezension in: o-bib 9(20229 Nr.3. (Martin Völkl) [https://www.o-bib.de/bib/article/view/5843/8714].

Series

Bibliotheks- und Informationspraxis; 70

Volk, M.; Mittermaier, H.; Schurig, A.; Biedassek, T.: Halbautomatische Volltextanalyse, Datenbankaufbau und Document Retrieval (1992) 0.09

0.09114939 = product of:
  0.18229878 = sum of:
    0.039550725 = weight(_text_:und in 2571) [ClassicSimilarity], result of:
      0.039550725 = score(doc=2571,freq=14.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.4535172 = fieldWeight in 2571, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=2571)
    0.08172335 = weight(_text_:methoden in 2571) [ClassicSimilarity], result of:
      0.08172335 = score(doc=2571,freq=2.0), product of:
        0.20390649 = queryWeight, product of:
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.039347667 = queryNorm
        0.40078837 = fieldWeight in 2571, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.0546875 = fieldNorm(doc=2571)
    0.021473989 = weight(_text_:der in 2571) [ClassicSimilarity], result of:
      0.021473989 = score(doc=2571,freq=4.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.24431825 = fieldWeight in 2571, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=2571)
    0.039550725 = weight(_text_:und in 2571) [ClassicSimilarity], result of:
      0.039550725 = score(doc=2571,freq=14.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.4535172 = fieldWeight in 2571, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=2571)
  0.5 = coord(4/8)

Abstract: In diesem Aufsatz beschreiben wir ein System zur Analyse von Kurzartikeln. Das System arbeitet halbautomatisch. Das heißt, zunächst wird der Artikel vom System analysiert und dann dem benutzer zur Nachberarbeitung vorgelegt. Die so gewonnene Information wird in einem Datenbankeintrag abgelegt. Über die Datenbank - in dBase IV implementiert - sind dann Abfragen und Zugriffe auf die Originaltexte effizient möglich. Der Kern dieses Aufsatzes betrifft die halbautomatische Analyse. Wir beschreiben unser Verfahren für parametrisiertes Pattern Matching sowie linguistische Heuristiken zur Ermittlung von Nominalphrasen und Präpositionalphrasen. Das System wurde für den praktischen Einsatz im Bonner Büro des 'Forums InformatikerInnen Für Frieden und gesellschaftliche Verantwortung e.V. (FIFF)' entwickelt
Source: Datenanalyse, Klassifikation und Informationsverarbeitung: Methoden und Anwendungen in verschiedenen Fachgebieten. Hrsg.: H. Goebl u. M. Schader

Grummann, M.: Sind Verfahren zur maschinellen Indexierung für Literaturbestände Öffentlicher Bibliotheken geeignet? : Retrievaltests von indexierten ekz-Daten mit der Software IDX (2000) 0.09

0.0885608 = product of:
  0.1771216 = sum of:
    0.02959089 = weight(_text_:und in 1879) [ClassicSimilarity], result of:
      0.02959089 = score(doc=1879,freq=6.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.33931053 = fieldWeight in 1879, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1879)
    0.09339812 = weight(_text_:methoden in 1879) [ClassicSimilarity], result of:
      0.09339812 = score(doc=1879,freq=2.0), product of:
        0.20390649 = queryWeight, product of:
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.039347667 = queryNorm
        0.45804384 = fieldWeight in 1879, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.0625 = fieldNorm(doc=1879)
    0.024541702 = weight(_text_:der in 1879) [ClassicSimilarity], result of:
      0.024541702 = score(doc=1879,freq=4.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.27922085 = fieldWeight in 1879, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=1879)
    0.02959089 = weight(_text_:und in 1879) [ClassicSimilarity], result of:
      0.02959089 = score(doc=1879,freq=6.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.33931053 = fieldWeight in 1879, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1879)
  0.5 = coord(4/8)

Abstract: Maschinelles Indexieren vereinheitlicht und vermehrt das Suchvokabular eines Bibliothekskatalogs durch verschiedene Methoden (u.a. Ermittlung der Grundform, Kompositazerlegung, Wortableitungen). Ein Retrievaltest mit einem für öffentliche Bibliotheken typischen Sachbuchbestand zeigt, dass dieses Verfahren die Ergebnisse von OPAC-Recherchen verbessert - trotz 'blumiger' Titelformulierungen. Im Vergleich zu herkömmlichen Erschließungsmethoden (Stich- und Schlagwörter) werden mehr relevante Titel gefunden, ohne gleichzeitig den 'Ballast' zu erhöhen. Das maschinelle Indexieren kann die Verschlagwortung jedoch nicht ersetzen, sondern nur ergänzen
Source: Bibliothek: Forschung und Praxis. 24(2000) H.3, S.297-318

Kasprzik, A.: Automatisierte und semiautomatisierte Klassifizierung : eine Analyse aktueller Projekte (2014) 0.09

0.08848308 = product of:
  0.17696616 = sum of:
    0.03624129 = weight(_text_:und in 2470) [ClassicSimilarity], result of:
      0.03624129 = score(doc=2470,freq=16.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.41556883 = fieldWeight in 2470, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=2470)
    0.070048586 = weight(_text_:methoden in 2470) [ClassicSimilarity], result of:
      0.070048586 = score(doc=2470,freq=2.0), product of:
        0.20390649 = queryWeight, product of:
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.039347667 = queryNorm
        0.3435329 = fieldWeight in 2470, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.046875 = fieldNorm(doc=2470)
    0.034434993 = weight(_text_:der in 2470) [ClassicSimilarity], result of:
      0.034434993 = score(doc=2470,freq=14.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.3917808 = fieldWeight in 2470, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=2470)
    0.03624129 = weight(_text_:und in 2470) [ClassicSimilarity], result of:
      0.03624129 = score(doc=2470,freq=16.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.41556883 = fieldWeight in 2470, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=2470)
  0.5 = coord(4/8)

Abstract: Das sprunghafte Anwachsen der Menge digital verfügbarer Dokumente gepaart mit dem Zeit- und Personalmangel an wissenschaftlichen Bibliotheken legt den Einsatz von halb- oder vollautomatischen Verfahren für die verbale und klassifikatorische Inhaltserschließung nahe. Nach einer kurzen allgemeinen Einführung in die gängige Methodik beleuchtet dieser Artikel eine Reihe von Projekten zur automatisierten Klassifizierung aus dem Zeitraum 2007-2012 und aus dem deutschsprachigen Raum. Ein Großteil der vorgestellten Projekte verwendet Methoden des Maschinellen Lernens aus der Künstlichen Intelligenz, arbeitet meist mit angepassten Versionen einer kommerziellen Software und bezieht sich in der Regel auf die Dewey Decimal Classification (DDC). Als Datengrundlage dienen Metadatensätze, Abstracs, Inhaltsverzeichnisse und Volltexte in diversen Datenformaten. Die abschließende Analyse enthält eine Anordnung der Projekte nach einer Reihe von verschiedenen Kriterien und eine Zusammenfassung der aktuellen Lage und der größten Herausfordungen für automatisierte Klassifizierungsverfahren.

Kempf, A.O.: Automatische Indexierung in der sozialwissenschaftlichen Fachinformation : eine Evaluationsstudie zur maschinellen Erschließung für die Datenbank SOLIS (2012) 0.09

0.08844772 = product of:
  0.17689544 = sum of:
    0.033900622 = weight(_text_:und in 903) [ClassicSimilarity], result of:
      0.033900622 = score(doc=903,freq=14.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.38872904 = fieldWeight in 903, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=903)
    0.070048586 = weight(_text_:methoden in 903) [ClassicSimilarity], result of:
      0.070048586 = score(doc=903,freq=2.0), product of:
        0.20390649 = queryWeight, product of:
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.039347667 = queryNorm
        0.3435329 = fieldWeight in 903, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.046875 = fieldNorm(doc=903)
    0.03904561 = weight(_text_:der in 903) [ClassicSimilarity], result of:
      0.03904561 = score(doc=903,freq=18.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.44423765 = fieldWeight in 903, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=903)
    0.033900622 = weight(_text_:und in 903) [ClassicSimilarity], result of:
      0.033900622 = score(doc=903,freq=14.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.38872904 = fieldWeight in 903, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=903)
  0.5 = coord(4/8)

Abstract: Automatische Indexierungsverfahren werden mit Zunahme der digitalen Verfügbarkeit von Metadaten und Volltexten mehr und mehr als eine mögliche Antwort auf das Management unstrukturierter Daten diskutiert. In der sozialwissenschaftlichen Fachinformation existiert in diesem Zusammenhang seit einiger Zeit der Vorschlag eines sogenannten Schalenmodells (vgl. Krause, 1996) mit unterschiedlichen Qualitätsstufen bei der inhaltlichen Erschließung. Vor diesem Hintergrund beschreibt die Arbeit zunächst Methoden und Verfahren der inhaltlichen und automatischen Indexierung, bevor vier Testläufe eines automatischen Indexierungssystems (MindServer) zur automatischen Erschließung von Datensätzen der bibliographischen Literaturdatenbank SOLIS mit Deskriptoren des Thesaurus Sozialwissenschaften sowie der Klassifikation Sozialwissenschaften beschrieben und analysiert werden. Es erfolgt eine ausführliche Fehleranalyse mit Beispielen sowie eine abschließende Diskussion, inwieweit die automatische Erschließung in dieser Form für die Randbereiche der Datenbank SOLIS für die Zukunft einen gangbaren Weg darstellt.
Imprint: Berlin : Humboldt-Universität zu Berlin, Philosophische Fakultät I, Institut für Bibliotheks- und Informationswissenschaft
Series: Berliner Handreichungen zur Bibliotheks- und Informationswissenschaft; 329

Schneider, C.; Womser-Hacker, C.: Inhaltserschließungssysteme für Patenttexte : Test und Systemvergleich im Projekt PADOK (1986) 0.08

0.07971741 = product of:
  0.21257976 = sum of:
    0.03624129 = weight(_text_:und in 2648) [ClassicSimilarity], result of:
      0.03624129 = score(doc=2648,freq=4.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.41556883 = fieldWeight in 2648, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=2648)
    0.14009717 = weight(_text_:methoden in 2648) [ClassicSimilarity], result of:
      0.14009717 = score(doc=2648,freq=2.0), product of:
        0.20390649 = queryWeight, product of:
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.039347667 = queryNorm
        0.6870658 = fieldWeight in 2648, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.09375 = fieldNorm(doc=2648)
    0.03624129 = weight(_text_:und in 2648) [ClassicSimilarity], result of:
      0.03624129 = score(doc=2648,freq=4.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.41556883 = fieldWeight in 2648, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=2648)
  0.375 = coord(3/8)

Source: Deutscher Dokumentartag 1986, Freiburg, 8.-10.10.1986: Bedarfsorientierte Fachinformation: Methoden und Techniken am Arbeitsplatz. Bearb.: H. Strohl-Goebel

Mittelbach, J.; Probst, M.: Möglichkeiten und Grenzen maschineller Indexierung in der Sacherschließung : Strategien für das Bibliothekssystem der Freien Universität Berlin (2006) 0.08

0.07920604 = product of:
  0.15841208 = sum of:
    0.032033075 = weight(_text_:und in 1411) [ClassicSimilarity], result of:
      0.032033075 = score(doc=1411,freq=18.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.3673144 = fieldWeight in 1411, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1411)
    0.058373824 = weight(_text_:methoden in 1411) [ClassicSimilarity], result of:
      0.058373824 = score(doc=1411,freq=2.0), product of:
        0.20390649 = queryWeight, product of:
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.039347667 = queryNorm
        0.2862774 = fieldWeight in 1411, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1411)
    0.035972122 = weight(_text_:der in 1411) [ClassicSimilarity], result of:
      0.035972122 = score(doc=1411,freq=22.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.40926933 = fieldWeight in 1411, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1411)
    0.032033075 = weight(_text_:und in 1411) [ClassicSimilarity], result of:
      0.032033075 = score(doc=1411,freq=18.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.3673144 = fieldWeight in 1411, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1411)
  0.5 = coord(4/8)

Abstract: Automatische Indexierung wird zunehmend als sinnvolle Möglichkeit erkannt, Daten für Informationsretrievalsysteme zu erzeugen und somit die Auffindbarkeit von Do-kumenten zu erhöhen. Die dafür geeigneten Methoden sind seit geraumer Zeit bekannt und umfassen statistische bzw. computerlinguistische Sprachanalysetechniken, die im Gegensatz zur gebräuchlichen Freitextinvertierung entscheidende Vor-teile hinsichtlich des Retrievals bieten. So bilden erst die Wortformenreduzierung und die semantische Zerlegung sowie die Gewichtung der ermittelten Indexterme die Grundlagen für die gezielte sachliche Suche im Online-Katalog. Entsprechende Ver-fahren, die sich für Bibliotheken eignen, stehen seit Mitte der neunziger Jahre auch für den praktischen Einsatz bereit und werden - nicht zuletzt aufgrund steigender Akzeptanz - ständig weiterentwickelt. Dabei geht es nicht nur um die Steigerung der allgemeinen Leistungsfähigkeit von maschinellen Indexierungssystemen, sondern auch um ihre Fähigkeit, die im Bibliothekswesen verfügbare, sehr heterogene Daten-grundlage optimal zu nutzen. Wichtige Kriterien sind zudem eine vertretbare Fehler-quote, die Integrierbarkeit in die Geschäftsgänge und die Darstellbarkeit der anfal-lenden Datenmengen in entsprechenden Datenrepräsentationsmodellen. Im Fokus der Untersuchung stehen die allgemeine Betrachtung der Vor- und Nachteile der beiden gängigen Indexierungssysteme MILOS und intelligentCAPTURE sowie die Möglichkeiten und Grenzen ihres Einsatzes im Bibliothekssystem der Freien Universität Berlin. Diese Veröffentlichung geht zurück auf eine Master-Arbeit im postgradualen Fernstudiengang Master of Arts (Library and Information Science) an der Humboldt-Universität zu Berlin. Online-Version: http://www.ib.hu-berlin.de/~kumlau/handreichungen/h183/

Giesselbach, S.; Estler-Ziegler, T.: Dokumente schneller analysieren mit Künstlicher Intelligenz (2021) 0.08

0.07830173 = product of:
  0.15660346 = sum of:
    0.036988612 = weight(_text_:und in 128) [ClassicSimilarity], result of:
      0.036988612 = score(doc=128,freq=24.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.42413816 = fieldWeight in 128, product of:
          4.8989797 = tf(freq=24.0), with freq of:
            24.0 = termFreq=24.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=128)
    0.058373824 = weight(_text_:methoden in 128) [ClassicSimilarity], result of:
      0.058373824 = score(doc=128,freq=2.0), product of:
        0.20390649 = queryWeight, product of:
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.039347667 = queryNorm
        0.2862774 = fieldWeight in 128, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.0390625 = fieldNorm(doc=128)
    0.0242524 = weight(_text_:der in 128) [ClassicSimilarity], result of:
      0.0242524 = score(doc=128,freq=10.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.27592933 = fieldWeight in 128, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=128)
    0.036988612 = weight(_text_:und in 128) [ClassicSimilarity], result of:
      0.036988612 = score(doc=128,freq=24.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.42413816 = fieldWeight in 128, product of:
          4.8989797 = tf(freq=24.0), with freq of:
            24.0 = termFreq=24.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=128)
  0.5 = coord(4/8)

Abstract: Künstliche Intelligenz (KI) und natürliches Sprachverstehen (natural language understanding/NLU) verändern viele Aspekte unseres Alltags und unserer Arbeitsweise. Besondere Prominenz erlangte NLU durch Sprachassistenten wie Siri, Alexa und Google Now. NLU bietet Firmen und Einrichtungen das Potential, Prozesse effizienter zu gestalten und Mehrwert aus textuellen Inhalten zu schöpfen. So sind NLU-Lösungen in der Lage, komplexe, unstrukturierte Dokumente inhaltlich zu erschließen. Für die semantische Textanalyse hat das NLU-Team des IAIS Sprachmodelle entwickelt, die mit Deep-Learning-Verfahren trainiert werden. Die NLU-Suite analysiert Dokumente, extrahiert Eckdaten und erstellt bei Bedarf sogar eine strukturierte Zusammenfassung. Mit diesen Ergebnissen, aber auch über den Inhalt der Dokumente selbst, lassen sich Dokumente vergleichen oder Texte mit ähnlichen Informationen finden. KI-basierten Sprachmodelle sind der klassischen Verschlagwortung deutlich überlegen. Denn sie finden nicht nur Texte mit vordefinierten Schlagwörtern, sondern suchen intelligent nach Begriffen, die in ähnlichem Zusammenhang auftauchen oder als Synonym gebraucht werden. Der Vortrag liefert eine Einordnung der Begriffe "Künstliche Intelligenz" und "Natural Language Understanding" und zeigt Möglichkeiten, Grenzen, aktuelle Forschungsrichtungen und Methoden auf. Anhand von Praxisbeispielen wird anschließend demonstriert, wie NLU zur automatisierten Belegverarbeitung, zur Katalogisierung von großen Datenbeständen wie Nachrichten und Patenten und zur automatisierten thematischen Gruppierung von Social Media Beiträgen und Publikationen genutzt werden kann.

Bredack, J.: Automatische Extraktion fachterminologischer Mehrwortbegriffe : ein Verfahrensvergleich (2016) 0.08

0.07748899 = product of:
  0.15497798 = sum of:
    0.032033075 = weight(_text_:und in 3194) [ClassicSimilarity], result of:
      0.032033075 = score(doc=3194,freq=18.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.3673144 = fieldWeight in 3194, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3194)
    0.058373824 = weight(_text_:methoden in 3194) [ClassicSimilarity], result of:
      0.058373824 = score(doc=3194,freq=2.0), product of:
        0.20390649 = queryWeight, product of:
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.039347667 = queryNorm
        0.2862774 = fieldWeight in 3194, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3194)
    0.032538008 = weight(_text_:der in 3194) [ClassicSimilarity], result of:
      0.032538008 = score(doc=3194,freq=18.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.37019804 = fieldWeight in 3194, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3194)
    0.032033075 = weight(_text_:und in 3194) [ClassicSimilarity], result of:
      0.032033075 = score(doc=3194,freq=18.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.3673144 = fieldWeight in 3194, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3194)
  0.5 = coord(4/8)

Abstract: In dieser Untersuchung wurden zwei Systeme eingesetzt, um MWT aus einer Dokumentkollektion mit fachsprachlichem Bezug (Volltexte des ACL Anthology Reference Corpus) automatisch zu extrahieren. Das thematische Spektrum umfasste alle Bereiche der natürlichen Sprachverarbeitung, im Speziellen die CL als interdisziplinäre Wissenschaft. Ziel war es MWT zu extrahieren, die als potentielle Indexterme im IR Verwendung finden können. Diese sollten auf Konzepte, Methoden, Verfahren und Algorithmen in der CL und angrenzenden Teilgebieten, wie Linguistik und Informatik hinweisen bzw. benennen.
Als Extraktionssysteme wurden der TreeTagger und die Indexierungssoftware Lingo verwendet. Der TreeTagger basiert auf einem statistischen Tagging- und Chunking- Algorithmus, mit dessen Hilfe NPs automatisch identifiziert und extrahiert werden. Er kann für verschiedene Anwendungsszenarien der natürlichen Sprachverarbeitung eingesetzt werden, in erster Linie als POS-Tagger für unterschiedliche Sprachen. Das Indexierungssystem Lingo arbeitet im Gegensatz zum TreeTagger mit elektronischen Wörterbüchern und einem musterbasierten Abgleich. Lingo ist ein auf automatische Indexierung ausgerichtetes System, was eine Vielzahl von Modulen mitliefert, die individuell auf eine bestimmte Aufgabenstellung angepasst und aufeinander abgestimmt werden können. Die unterschiedlichen Verarbeitungsweisen haben sich in den Ergebnismengen beider Systeme deutlich gezeigt. Die gering ausfallenden Übereinstimmungen der Ergebnismengen verdeutlichen die abweichende Funktionsweise und konnte mit einer qualitativen Analyse beispielhaft beschrieben werden. In der vorliegenden Arbeit kann abschließend nicht geklärt werden, welches der beiden Systeme bevorzugt für die Generierung von Indextermen eingesetzt werden sollte.
Content: Schriftliche Hausarbeit (Masterarbeit) zur Erlangung des Grades eines Master of Arts An der Universität Trier Fachbereich II Studiengang Computerlinguistik.

Franke-Maier, M.: Anforderungen an die Qualität der Inhaltserschließung im Spannungsfeld von intellektuell und automatisch erzeugten Metadaten (2018) 0.07

0.07235724 = product of:
  0.14471447 = sum of:
    0.025892027 = weight(_text_:und in 5344) [ClassicSimilarity], result of:
      0.025892027 = score(doc=5344,freq=6.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.2968967 = fieldWeight in 5344, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5344)
    0.042947978 = weight(_text_:der in 5344) [ClassicSimilarity], result of:
      0.042947978 = score(doc=5344,freq=16.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.4886365 = fieldWeight in 5344, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5344)
    0.025892027 = weight(_text_:und in 5344) [ClassicSimilarity], result of:
      0.025892027 = score(doc=5344,freq=6.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.2968967 = fieldWeight in 5344, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5344)
    0.04998244 = product of:
      0.07497366 = sum of:
        0.0376562 = weight(_text_:29 in 5344) [ClassicSimilarity], result of:
          0.0376562 = score(doc=5344,freq=2.0), product of:
            0.13841279 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.039347667 = queryNorm
            0.27205724 = fieldWeight in 5344, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5344)
        0.037317462 = weight(_text_:22 in 5344) [ClassicSimilarity], result of:
          0.037317462 = score(doc=5344,freq=2.0), product of:
            0.13778883 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.039347667 = queryNorm
            0.2708308 = fieldWeight in 5344, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5344)
      0.6666667 = coord(2/3)
  0.5 = coord(4/8)

Abstract: Spätestens seit dem Deutschen Bibliothekartag 2018 hat sich die Diskussion zu den automatischen Verfahren der Inhaltserschließung der Deutschen Nationalbibliothek von einer politisch geführten Diskussion in eine Qualitätsdiskussion verwandelt. Der folgende Beitrag beschäftigt sich mit Fragen der Qualität von Inhaltserschließung in digitalen Zeiten, wo heterogene Erzeugnisse unterschiedlicher Verfahren aufeinandertreffen und versucht, wichtige Anforderungen an Qualität zu definieren. Dieser Tagungsbeitrag fasst die vom Autor als Impulse vorgetragenen Ideen beim Workshop der FAG "Erschließung und Informationsvermittlung" des GBV am 29. August 2018 in Kiel zusammen. Der Workshop fand im Rahmen der 22. Verbundkonferenz des GBV statt.

Nohr, H.: Automatische Indexierung : Einführung in betriebliche Verfahren, Systeme und Anwendungen (2001) 0.07
```
0.07150231 = product of:
  0.14300463 = sum of:
    0.030799175 = weight(_text_:und in 2543) [ClassicSimilarity], result of:
      0.030799175 = score(doc=2543,freq=26.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.3531656 = fieldWeight in 2543, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.04669906 = weight(_text_:methoden in 2543) [ClassicSimilarity], result of:
      0.04669906 = score(doc=2543,freq=2.0), product of:
        0.20390649 = queryWeight, product of:
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.039347667 = queryNorm
        0.22902192 = fieldWeight in 2543, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.034707207 = weight(_text_:der in 2543) [ClassicSimilarity], result of:
      0.034707207 = score(doc=2543,freq=32.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.3948779 = fieldWeight in 2543, product of:
          5.656854 = tf(freq=32.0), with freq of:
            32.0 = termFreq=32.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
    0.030799175 = weight(_text_:und in 2543) [ClassicSimilarity], result of:
      0.030799175 = score(doc=2543,freq=26.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.3531656 = fieldWeight in 2543, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=2543)
  0.5 = coord(4/8)
```
Abstract

Das vorliegende Buch zur automatischen Indexierung trägt dem Umstand Rechnung, dass ein ständig wachsender Berg von Dokumenten in Unternehmen, öffentlichen Verwaltungen, Einrichtungen der Fachinformation oder dem Internet entscheidungsrelevante Informationen enthält, die mit manuellen Mitteln und Methoden kaum mehr beherrschbar und erschließbar sind. Diese unstrukturierten Informationen sind in einer zunehmend von der schnellen Verarbeitung der Ressource Information abhängigen Wirtschaft von größter Bedeutung, ihre Beherrschung ist unabdingbar für den Wettbewerbserfolg. Verfahren der automatischen Indexierung von Dokumenten sind damit eine Basistechnik der betrieblichen Informationswirtschaft geworden. Trotz dieses Urnstandes, liegt bis auf den heutigen Tag keine einführende Darstellung in die Thematik vor. Die Zielsetzung dieses Buches ist es, einführend die Grundlagen sowie die verschiedenen Ansätze und Verfahren der automatischen Indexierung von Dokumenten vorzustellen. Die Darstellung verzichtet dabei bewusst auf die allzu detaillierte Tiefendarstellung einzelner Verfahren und Indexierungssysteme zugunsten einer Übersicht der grundsätzlichen Ansätze mit ihren jeweiligen Voraussetzungen, ihren Möglichkeiten und ihren Beschränkungen. Soweit einzelne Verfahren und Indexierungssysteme behandelt werden, besitzen diese beispielhaften Charakter für den behandelten Ansatz. Bei der Darstellung war ich stets uni eine verständliche Sprache bemüht. Der Text dieses Buches ist entstanden aus Vorlesungen in entsprechenden Lehrveranstaltungen im Studiengang Informationswirtschaft an der Fachhochschule Stuttgart. Die Darstellung richtet sich an Studierende und Lehrende der Informationswirtschaft, des Informationsmanagements, der Dokumentation sowie der Wirtschaftsinformatik, zugleich aber auch an die interessierten und mit der Thernatik konfrontierten Praktiker, die weniger an der technischen Seite der automatischen Indexierung, als vielmehr einen grundsätzlichen Informationsbedarf über die Möglichkeiten und die Schwierigkeiten des Einsatzes entsprechender Verfahren haben

Classification

AN 95300 Allgemeines / Buch- und Bibliothekswesen, Informationswissenschaft / Informationswissenschaft / Informationspraxis / Automatisches Indexing (z.B. KWIC, KWOC)

RVK

AN 95300 Allgemeines / Buch- und Bibliothekswesen, Informationswissenschaft / Informationswissenschaft / Informationspraxis / Automatisches Indexing (z.B. KWIC, KWOC)

Series

Materialien zur Information und Dokumentation; Bd.13

Kugler, A.: Automatisierte Volltexterschließung von Retrodigitalisaten am Beispiel historischer Zeitungen (2018) 0.07

0.068488955 = product of:
  0.13697791 = sum of:
    0.022193167 = weight(_text_:und in 4595) [ClassicSimilarity], result of:
      0.022193167 = score(doc=4595,freq=6.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.2544829 = fieldWeight in 4595, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=4595)
    0.070048586 = weight(_text_:methoden in 4595) [ClassicSimilarity], result of:
      0.070048586 = score(doc=4595,freq=2.0), product of:
        0.20390649 = queryWeight, product of:
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.039347667 = queryNorm
        0.3435329 = fieldWeight in 4595, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.046875 = fieldNorm(doc=4595)
    0.022542994 = weight(_text_:der in 4595) [ClassicSimilarity], result of:
      0.022542994 = score(doc=4595,freq=6.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.25648075 = fieldWeight in 4595, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=4595)
    0.022193167 = weight(_text_:und in 4595) [ClassicSimilarity], result of:
      0.022193167 = score(doc=4595,freq=6.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.2544829 = fieldWeight in 4595, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=4595)
  0.5 = coord(4/8)

Abstract: Seit ein paar Jahren postuliert die DFG in ihren Praxisregeln "Digitalisierung", dass eine ausschließliche Bilddigitalisierung nicht mehr den wissenschaftlichen Ansprüchen Genüge leiste, sondern der digitale Volltext notwendig sei, da dieser die Basis für eine wissenschaftliche Nachnutzung darstellt. Um ein besseres Verständnis davon zu erlangen, was sich hinter dem Begriff "Volltext" verbirgt, wird im Folgenden ein kleiner Einblick in die technischen Verfahren zur automatisierten Volltexterschließung von Retrodigitalisaten geboten. Fortschritte und auch Grenzen der aktuellen Methoden werden vorgestellt und wie Qualität in diesem Zusammenhang überhaupt bemessen werden kann. Die automatisierten Verfahren zur Volltexterschließung werden am Beispiel historischer Zeitungen erläutert, da deren Zugänglichmachung gerade in den Geisteswissenschaften ein großes Desiderat ist und diese Quellengattung zugleich aufgrund der Spaltenstruktur besondere technische Herausforderungen mit sich bringt. 2016 wurde das DFG-Projekt zur Erstellung eines "Masterplan Zeitungsdigitalisierung" fertiggestellt, dessen Ergebnisse hier einfließen.

Junger, U.: Möglichkeiten und Probleme automatischer Erschließungsverfahren in Bibliotheken : Bericht vom KASCADE-Workshop in der Universitäts- und Landesbibliothek Düsseldorf (1999) 0.07

0.06816045 = product of:
  0.1363209 = sum of:
    0.044386335 = weight(_text_:und in 3645) [ClassicSimilarity], result of:
      0.044386335 = score(doc=3645,freq=6.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.5089658 = fieldWeight in 3645, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=3645)
    0.026030406 = weight(_text_:der in 3645) [ClassicSimilarity], result of:
      0.026030406 = score(doc=3645,freq=2.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.29615843 = fieldWeight in 3645, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.09375 = fieldNorm(doc=3645)
    0.044386335 = weight(_text_:und in 3645) [ClassicSimilarity], result of:
      0.044386335 = score(doc=3645,freq=6.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.5089658 = fieldWeight in 3645, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=3645)
    0.021517832 = product of:
      0.06455349 = sum of:
        0.06455349 = weight(_text_:29 in 3645) [ClassicSimilarity], result of:
          0.06455349 = score(doc=3645,freq=2.0), product of:
            0.13841279 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.039347667 = queryNorm
            0.46638384 = fieldWeight in 3645, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.09375 = fieldNorm(doc=3645)
      0.33333334 = coord(1/3)
  0.5 = coord(4/8)

Date: 23.10.1996 17:26:29
Source: Bibliothek: Forschung und Praxis. 23(1999) H.1, S.88-90

Halip, I.: Automatische Extrahierung von Schlagworten aus unstrukturierten Texten (2005) 0.07
```
0.066595 = product of:
  0.13319 = sum of:
    0.027012663 = weight(_text_:und in 861) [ClassicSimilarity], result of:
      0.027012663 = score(doc=861,freq=20.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.3097467 = fieldWeight in 861, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=861)
    0.04669906 = weight(_text_:methoden in 861) [ClassicSimilarity], result of:
      0.04669906 = score(doc=861,freq=2.0), product of:
        0.20390649 = queryWeight, product of:
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.039347667 = queryNorm
        0.22902192 = fieldWeight in 861, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1821747 = idf(docFreq=674, maxDocs=44218)
          0.03125 = fieldNorm(doc=861)
    0.032465618 = weight(_text_:der in 861) [ClassicSimilarity], result of:
      0.032465618 = score(doc=861,freq=28.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.36937445 = fieldWeight in 861, product of:
          5.2915025 = tf(freq=28.0), with freq of:
            28.0 = termFreq=28.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=861)
    0.027012663 = weight(_text_:und in 861) [ClassicSimilarity], result of:
      0.027012663 = score(doc=861,freq=20.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.3097467 = fieldWeight in 861, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=861)
  0.5 = coord(4/8)
```
Abstract

Durch die zunehmende Mediatisierung und Digitalisierung wird die moderne Gesellschaft immer mehr mit dem Thema der Informationsüberflutung konfrontiert. Erstaunlicherweise führt der Zuwachs an Informationen gleichzeitig zu einem Mangel an Wissen. Die Erklärung kann darin gefunden werden, dass ein großer Teil der existierenden Informationen nicht aufgefunden werden kann. Es handelt sich meistens um Informationen die auf semi- und nichtstrukturierte Daten beruhen. Schätzungen zufolge sind heute rund 80% der entscheidungsrelevanten Informationen in Unternehmen in unstrukturierter, d. h. meist textueller Form vorhanden. Die Unfähigkeit der Maschinen den Inhalt unstrukturierter Texte zu verstehen führt dazu, dass dokumentiertes Wissen schwer auffindbar ist und oft unentdeckt bleibt. Wegen des Informationsvolumens, das meistens zu groß ist, um gelesen, verstanden oder sogar benutzt zu werden, ergibt sich folgendes Problem, mit dem man konfrontiert wird: Informationen die nicht in Wissen umgewandelt werden können, bleiben als papiergebundene oder digitale Dokumente in Data-Repositories verschlossen. Angesichts der heute anfallenden Menge an Dokumenten erscheint eine manuelle Vergabe von Schlagworten nicht mehr realistisch. Deshalb entwickelt Wissensmanagement unterstützende Verfahren, die Informationen rechtzeitig, in der richtigen Qualität und den richtigen Personen verfügbar machen. Einige Schwerpunkte an denen zur Zeit geforscht wird, sind Modelle zur Repräsentation von Dokumenten, Methoden zur Ähnlichkeitsbestimmung von Anfragen zu Dokumenten und zur Indexierung von Dokumentenmengen, sowie die automatische Klassifikation. Vor diesem Hintergrund konzentriert sich diese Arbeit auf die unterschiedlichen Verfahren der automatischen Indexierung, hebt die algorithmischen Vor- und Nachteile hervor, mit dem Ziel die Funktionsweise im Bereich der unstrukturierten Texte zu analysieren. Hierfür erfolgt im 3. Kapitel eine genauere Untersuchung und Darstellung automatischer Indexierungsverfahren. Zuvor werden in Kapitel 2 grundlegende Begrifflichkeiten erklärt, eingeordnet und abgegrenzt. Abschließend werden anhand der theoretischen Darlegung Implementierungen der vorgestellten Verfahren kurz beschrieben. Die Ausarbeitung endet mit der Schlussfolgerung und dem Ausblick.

Content

Ausarbeitung im Rahmen des Seminars Suchmaschinen und Suchalgorithmen, Institut für Wirtschaftsinformatik Praktische Informatik in der Wirtschaft, Westfälische Wilhelms-Universität Münster

Imprint

Münster : Institut für Wirtschaftsinformatik der Westfälische Wilhelms-Universität Münster

Search (218 results, page 1 of 11)

Authors

Years

Languages

Types

Themes

Subjects

Classifications