Search (50 results, page 1 of 3)

Lepsky, K.; Vorhauer, J.: Lingo - ein open source System für die Automatische Indexierung deutschsprachiger Dokumente (2006) 0.09

0.08618581 = product of:
  0.17237163 = sum of:
    0.17237163 = sum of:
      0.11703885 = weight(_text_:dokumente in 3581) [ClassicSimilarity], result of:
        0.11703885 = score(doc=3581,freq=2.0), product of:
          0.25999573 = queryWeight, product of:
            5.092943 = idf(docFreq=737, maxDocs=44218)
            0.05105019 = queryNorm
          0.45015684 = fieldWeight in 3581, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            5.092943 = idf(docFreq=737, maxDocs=44218)
            0.0625 = fieldNorm(doc=3581)
      0.05533277 = weight(_text_:22 in 3581) [ClassicSimilarity], result of:
        0.05533277 = score(doc=3581,freq=2.0), product of:
          0.17876907 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.05105019 = queryNorm
          0.30952093 = fieldWeight in 3581, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.0625 = fieldNorm(doc=3581)
  0.5 = coord(1/2)

Date: 24. 3.2006 12:22:02

Busch, D.: Domänenspezifische hybride automatische Indexierung von bibliographischen Metadaten (2019) 0.08
```
0.082819015 = product of:
  0.16563803 = sum of:
    0.16563803 = sum of:
      0.12413845 = weight(_text_:dokumente in 5628) [ClassicSimilarity], result of:
        0.12413845 = score(doc=5628,freq=4.0), product of:
          0.25999573 = queryWeight, product of:
            5.092943 = idf(docFreq=737, maxDocs=44218)
            0.05105019 = queryNorm
          0.47746342 = fieldWeight in 5628, product of:
            2.0 = tf(freq=4.0), with freq of:
              4.0 = termFreq=4.0
            5.092943 = idf(docFreq=737, maxDocs=44218)
            0.046875 = fieldNorm(doc=5628)
      0.041499574 = weight(_text_:22 in 5628) [ClassicSimilarity], result of:
        0.041499574 = score(doc=5628,freq=2.0), product of:
          0.17876907 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.05105019 = queryNorm
          0.23214069 = fieldWeight in 5628, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.046875 = fieldNorm(doc=5628)
  0.5 = coord(1/2)
```
Abstract

Im Fraunhofer-Informationszentrum Raum und Bau (IRB) wird Fachliteratur im Bereich Planen und Bauen bibliographisch erschlossen. Die daraus resultierenden Dokumente (Metadaten-Einträge) werden u.a. bei der Produktion der bibliographischen Datenbanken des IRB verwendet. In Abb. 1 ist ein Dokument dargestellt, das einen Zeitschriftenartikel beschreibt. Die Dokumente werden mit Deskriptoren von einer Nomenklatur (Schlagwortliste IRB) indexiert. Ein Deskriptor ist "eine Benennung., die für sich allein verwendbar, eindeutig zur Inhaltskennzeichnung geeignet und im betreffenden Dokumentationssystem zugelassen ist". Momentan wird die Indexierung intellektuell von menschlichen Experten durchgeführt. Die intellektuelle Indexierung ist zeitaufwendig und teuer. Eine Lösung des Problems besteht in der automatischen Indexierung, bei der die Zuordnung von Deskriptoren durch ein Computerprogramm erfolgt. Solche Computerprogramme werden im Folgenden auch als Klassifikatoren bezeichnet. In diesem Beitrag geht es um ein System zur automatischen Indexierung von deutschsprachigen Dokumenten im Bereich Bauwesen mit Deskriptoren aus der Schlagwortliste IRB.

Source

B.I.T.online. 22(2019) H.6, S.465-469
Nohr, H.: Grundlagen der automatischen Indexierung : ein Lehrbuch (2003) 0.04
```
0.043092906 = product of:
  0.08618581 = sum of:
    0.08618581 = sum of:
      0.058519427 = weight(_text_:dokumente in 1767) [ClassicSimilarity], result of:
        0.058519427 = score(doc=1767,freq=2.0), product of:
          0.25999573 = queryWeight, product of:
            5.092943 = idf(docFreq=737, maxDocs=44218)
            0.05105019 = queryNorm
          0.22507842 = fieldWeight in 1767, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            5.092943 = idf(docFreq=737, maxDocs=44218)
            0.03125 = fieldNorm(doc=1767)
      0.027666384 = weight(_text_:22 in 1767) [ClassicSimilarity], result of:
        0.027666384 = score(doc=1767,freq=2.0), product of:
          0.17876907 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.05105019 = queryNorm
          0.15476047 = fieldWeight in 1767, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.03125 = fieldNorm(doc=1767)
  0.5 = coord(1/2)
```
Date

22. 6.2009 12:46:51

Footnote

Im fünften Kapitel "Information Extraction" geht Nohr auf eine Problemstellung ein, die in der Fachwelt eine noch stärkere Betonung verdiente: "Die stetig ansteigende Zahl elektronischer Dokumente macht neben einer automatischen Erschließung auch eine automatische Gewinnung der relevanten Informationen aus diesen Dokumenten wünschenswert, um diese z.B. für weitere Bearbeitungen oder Auswertungen in betriebliche Informationssysteme übernehmen zu können." (S. 103) "Indexierung und Retrievalverfahren" als voneinander abhängige Verfahren werden im sechsten Kapitel behandelt. Hier stehen Relevance Ranking und Relevance Feedback sowie die Anwendung informationslinguistischer Verfahren in der Recherche im Mittelpunkt. Die "Evaluation automatischer Indexierung" setzt den thematischen Schlusspunkt. Hier geht es vor allem um die Oualität einer Indexierung, um gängige Retrievalmaße in Retrievaltest und deren Einssatz. Weiterhin ist hervorzuheben, dass jedes Kapitel durch die Vorgabe von Lernzielen eingeleitet wird und zu den jeweiligen Kapiteln (im hinteren Teil des Buches) einige Kontrollfragen gestellt werden. Die sehr zahlreichen Beispiele aus der Praxis, ein Abkürzungsverzeichnis und ein Sachregister erhöhen den Nutzwert des Buches. Die Lektüre förderte beim Rezensenten das Verständnis für die Zusammenhänge von BID-Handwerkzeug, Wirtschaftsinformatik (insbesondere Data Warehousing) und Künstlicher Intelligenz. Die "Grundlagen der automatischen Indexierung" sollte auch in den bibliothekarischen Studiengängen zur Pflichtlektüre gehören. Holger Nohrs Lehrbuch ist auch für den BID-Profi geeignet, um die mehr oder weniger fundierten Kenntnisse auf dem Gebiet "automatisches Indexieren" schnell, leicht verständlich und informativ aufzufrischen."
Giesselbach, S.; Estler-Ziegler, T.: Dokumente schneller analysieren mit Künstlicher Intelligenz (2021) 0.04
```
0.040891692 = product of:
  0.081783384 = sum of:
    0.081783384 = product of:
      0.16356677 = sum of:
        0.16356677 = weight(_text_:dokumente in 128) [ClassicSimilarity], result of:
          0.16356677 = score(doc=128,freq=10.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.6291133 = fieldWeight in 128, product of:
              3.1622777 = tf(freq=10.0), with freq of:
                10.0 = termFreq=10.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.0390625 = fieldNorm(doc=128)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Künstliche Intelligenz (KI) und natürliches Sprachverstehen (natural language understanding/NLU) verändern viele Aspekte unseres Alltags und unserer Arbeitsweise. Besondere Prominenz erlangte NLU durch Sprachassistenten wie Siri, Alexa und Google Now. NLU bietet Firmen und Einrichtungen das Potential, Prozesse effizienter zu gestalten und Mehrwert aus textuellen Inhalten zu schöpfen. So sind NLU-Lösungen in der Lage, komplexe, unstrukturierte Dokumente inhaltlich zu erschließen. Für die semantische Textanalyse hat das NLU-Team des IAIS Sprachmodelle entwickelt, die mit Deep-Learning-Verfahren trainiert werden. Die NLU-Suite analysiert Dokumente, extrahiert Eckdaten und erstellt bei Bedarf sogar eine strukturierte Zusammenfassung. Mit diesen Ergebnissen, aber auch über den Inhalt der Dokumente selbst, lassen sich Dokumente vergleichen oder Texte mit ähnlichen Informationen finden. KI-basierten Sprachmodelle sind der klassischen Verschlagwortung deutlich überlegen. Denn sie finden nicht nur Texte mit vordefinierten Schlagwörtern, sondern suchen intelligent nach Begriffen, die in ähnlichem Zusammenhang auftauchen oder als Synonym gebraucht werden. Der Vortrag liefert eine Einordnung der Begriffe "Künstliche Intelligenz" und "Natural Language Understanding" und zeigt Möglichkeiten, Grenzen, aktuelle Forschungsrichtungen und Methoden auf. Anhand von Praxisbeispielen wird anschließend demonstriert, wie NLU zur automatisierten Belegverarbeitung, zur Katalogisierung von großen Datenbeständen wie Nachrichten und Patenten und zur automatisierten thematischen Gruppierung von Social Media Beiträgen und Publikationen genutzt werden kann.
Sack, H.: Hybride Künstliche Intelligenz in der automatisierten Inhaltserschließung (2021) 0.04
```
0.038009487 = product of:
  0.076018974 = sum of:
    0.076018974 = product of:
      0.15203795 = sum of:
        0.15203795 = weight(_text_:dokumente in 372) [ClassicSimilarity], result of:
          0.15203795 = score(doc=372,freq=6.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.5847709 = fieldWeight in 372, product of:
              2.4494898 = tf(freq=6.0), with freq of:
                6.0 = termFreq=6.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.046875 = fieldNorm(doc=372)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Effizienter (Online-)Zugang zu Bibliotheks- und Archivmaterialien erfordert eine qualitativ hinreichende inhaltliche Erschließung dieser Dokumente. Die passgenaue Verschlagwortung und Kategorisierung dieser unstrukturierten Dokumente ermöglichen einen strukturell gegliederten Zugang sowohl in der analogen als auch in der digitalen Welt. Darüber hinaus erweitert eine vollständige Transkription der Dokumente den Zugang über die Möglichkeiten der Volltextsuche. Angesichts der in jüngster Zeit erzielten spektakulären Erfolge der Künstlichen Intelligenz liegt die Schlussfolgerung nahe, dass auch das Problem der automatisierten Inhaltserschließung für Bibliotheken und Archive als mehr oder weniger gelöst anzusehen wäre. Allerdings lassen sich die oftmals nur in thematisch engen Teilbereichen erzielten Erfolge nicht immer problemlos verallgemeinern oder in einen neuen Kontext übertragen. Das Ziel der vorliegenden Darstellung liegt in der Diskussion des aktuellen Stands der Technik der automatisierten inhaltlichen Erschließung anhand ausgewählter Beispiele sowie möglicher Fortschritte und Prognosen basierend auf aktuellen Entwicklungen des maschinellen Lernens und der Künstlichen Intelligenz einschließlich deren Kritik.
Nohr, H.: Theorie des Information Retrieval II : Automatische Indexierung (2004) 0.03
```
0.03167457 = product of:
  0.06334914 = sum of:
    0.06334914 = product of:
      0.12669829 = sum of:
        0.12669829 = weight(_text_:dokumente in 8) [ClassicSimilarity], result of:
          0.12669829 = score(doc=8,freq=6.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.4873091 = fieldWeight in 8, product of:
              2.4494898 = tf(freq=6.0), with freq of:
                6.0 = termFreq=6.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.0390625 = fieldNorm(doc=8)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Ein großer Teil der Informationen - Schätzungen zufolge bis zu 80% - liegt in Organisationen in unstrukturierten Dokumenten vor. In der Vergangenheit wurden Lösungen für das Management strukturierter Informationen entwickelt, die es nun auch zu erreichen gilt für unstrukturierte Informationen. Neben Verfahren des Data Mining für die Datenanalyse treten Versuche, Text Mining (Lit. 06) auf die Textanalyse anzuwenden. Um gezielt Dokumente im Repository suchen zu können, ist eine effektive Inhaltserkennung und -kennzeichnung erforderlich, d.h. eine Zuordnung der Dokumente zu Themengebieten bzw die Speicherung geeigneter Indexterme als Metadaten. Zu diesem Zweck müssen die Dokumenteninhalte repräsentiert, d.h. indexiert oder klassifiziert, werden. Dokumentanalyse dient auch der Steuerung des Informations- und Dokumentenflusses. Ziel ist die Einleitung eines "Workflow nach Posteingang". Eine Dokumentanalyse kann anhand erkannter Merkmale Eingangspost automatisch an den Sachbearbeiter oder die zuständige Organisationseinheit (Rechnungen in die Buchhaltung, Aufträge in den Vertrieb) im Unternehmen leiten. Dokumentanalysen werden auch benötigt, wenn Mitarbeiter über einen persönlichen Informationsfilter relevante Dokumente automatisch zugestellt bekommen sollen. Aufgrund der Systemintegration werden Indexierungslösungen in den Funktionsumfang von DMS- bzw. Workflow-Produkten integriert. Eine Architektur solcher Systeme zeigt Abb. 1. Die Architektur zeigt die Indexierungs- bzw. Klassifizierungsfunktion im Zentrum der Anwendung. Dabei erfüllt sie Aufgaben für die Repräsentation von Dokumenten (Metadaten) und das spätere Retrieval.
Fuhr, N.: Klassifikationsverfahren bei der automatischen Indexierung (1983) 0.03
```
0.029259713 = product of:
  0.058519427 = sum of:
    0.058519427 = product of:
      0.11703885 = sum of:
        0.11703885 = weight(_text_:dokumente in 7697) [ClassicSimilarity], result of:
          0.11703885 = score(doc=7697,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.45015684 = fieldWeight in 7697, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.0625 = fieldNorm(doc=7697)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Nach einer kurzen Einführung in die Darmstädter Projekte WAI und AIR werden die folgenden Themen behandelt: Ein Ansatz zur automatischen Klassifikation. Statistische Relationen für die Klassifikation. Indexieren von Dokumenten als Spezialfall der automatischen Klassifikation. Klassifikation von Elementen der Relevanzbeschreibung. Klassifikation zur Verbesserung der Relevanzbeschreibungen. Automatische Dokumentklassifikation und Automatische Indexierung klassifizierter Dokumente. Das Projekt AIR wird in Zusammenarbeit mit der Datenbasis INKA-PHYS des Fachinformationszentrums Energie, Physik, Mathematik in Karlsruhe durchgeführt

Lepsky, K.: Automatische Indexierung zur Erschließung deutschsprachiger Dokumente (1999) 0.03

0.029259713 = product of:
  0.058519427 = sum of:
    0.058519427 = product of:
      0.11703885 = sum of:
        0.11703885 = weight(_text_:dokumente in 4656) [ClassicSimilarity], result of:
          0.11703885 = score(doc=4656,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.45015684 = fieldWeight in 4656, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.0625 = fieldNorm(doc=4656)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Beyer, C.; Trunk, D.: Automatische Verfahren für die Formalerschließung im Projekt PETRUS (2011) 0.03

0.029259713 = product of:
  0.058519427 = sum of:
    0.058519427 = product of:
      0.11703885 = sum of:
        0.11703885 = weight(_text_:dokumente in 1712) [ClassicSimilarity], result of:
          0.11703885 = score(doc=1712,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.45015684 = fieldWeight in 1712, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.0625 = fieldNorm(doc=1712)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Form: Elektronische Dokumente

Schöning-Walter, C.: Automatische Erschließungsverfahren für Netzpublikationen : zum Stand der Arbeiten im Projekt PETRUS (2011) 0.03

0.029259713 = product of:
  0.058519427 = sum of:
    0.058519427 = product of:
      0.11703885 = sum of:
        0.11703885 = weight(_text_:dokumente in 1714) [ClassicSimilarity], result of:
          0.11703885 = score(doc=1714,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.45015684 = fieldWeight in 1714, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.0625 = fieldNorm(doc=1714)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Theme: Elektronische Dokumente

Tavakolizadeh-Ravari, M.: Analysis of the long term dynamics in thesaurus developments and its consequences (2017) 0.03
```
0.029259713 = product of:
  0.058519427 = sum of:
    0.058519427 = product of:
      0.11703885 = sum of:
        0.11703885 = weight(_text_:dokumente in 3081) [ClassicSimilarity], result of:
          0.11703885 = score(doc=3081,freq=8.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.45015684 = fieldWeight in 3081, product of:
              2.828427 = tf(freq=8.0), with freq of:
                8.0 = termFreq=8.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.03125 = fieldNorm(doc=3081)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Die Arbeit analysiert die dynamische Entwicklung und den Gebrauch von Thesaurusbegriffen. Zusätzlich konzentriert sie sich auf die Faktoren, die die Zahl von Indexbegriffen pro Dokument oder Zeitschrift beeinflussen. Als Untersuchungsobjekt dienten der MeSH und die entsprechende Datenbank "MEDLINE". Die wichtigsten Konsequenzen sind: 1. Der MeSH-Thesaurus hat sich durch drei unterschiedliche Phasen jeweils logarithmisch entwickelt. Solch einen Thesaurus sollte folgenden Gleichung folgen: "T = 3.076,6 Ln (d) - 22.695 + 0,0039d" (T = Begriffe, Ln = natürlicher Logarithmus und d = Dokumente). Um solch einen Thesaurus zu konstruieren, muss man demnach etwa 1.600 Dokumente von unterschiedlichen Themen des Bereiches des Thesaurus haben. Die dynamische Entwicklung von Thesauri wie MeSH erfordert die Einführung eines neuen Begriffs pro Indexierung von 256 neuen Dokumenten. 2. Die Verteilung der Thesaurusbegriffe erbrachte drei Kategorien: starke, normale und selten verwendete Headings. Die letzte Gruppe ist in einer Testphase, während in der ersten und zweiten Kategorie die neu hinzukommenden Deskriptoren zu einem Thesauruswachstum führen. 3. Es gibt ein logarithmisches Verhältnis zwischen der Zahl von Index-Begriffen pro Aufsatz und dessen Seitenzahl für die Artikeln zwischen einer und einundzwanzig Seiten. 4. Zeitschriftenaufsätze, die in MEDLINE mit Abstracts erscheinen erhalten fast zwei Deskriptoren mehr. 5. Die Findablity der nicht-englisch sprachigen Dokumente in MEDLINE ist geringer als die englische Dokumente. 6. Aufsätze der Zeitschriften mit einem Impact Factor 0 bis fünfzehn erhalten nicht mehr Indexbegriffe als die der anderen von MEDINE erfassten Zeitschriften. 7. In einem Indexierungssystem haben unterschiedliche Zeitschriften mehr oder weniger Gewicht in ihrem Findability. Die Verteilung der Indexbegriffe pro Seite hat gezeigt, dass es bei MEDLINE drei Kategorien der Publikationen gibt. Außerdem gibt es wenige stark bevorzugten Zeitschriften."

Voorhees, E.M.: Implementing agglomerative hierarchic clustering algorithms for use in document retrieval (1986) 0.03

0.027666384 = product of:
  0.05533277 = sum of:
    0.05533277 = product of:
      0.11066554 = sum of:
        0.11066554 = weight(_text_:22 in 402) [ClassicSimilarity], result of:
          0.11066554 = score(doc=402,freq=2.0), product of:
            0.17876907 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.05105019 = queryNorm
            0.61904186 = fieldWeight in 402, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.125 = fieldNorm(doc=402)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Source: Information processing and management. 22(1986) no.6, S.465-476

Kaiser, A.: Computer-unterstütztes Indexieren in Intelligenten Information Retrieval Systemen : Ein Relevanz-Feedback orientierter Ansatz zur Informationserschließung in unformatierten Datenbanken (1993) 0.03
```
0.026876764 = product of:
  0.05375353 = sum of:
    0.05375353 = product of:
      0.10750706 = sum of:
        0.10750706 = weight(_text_:dokumente in 4284) [ClassicSimilarity], result of:
          0.10750706 = score(doc=4284,freq=12.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.41349548 = fieldWeight in 4284, product of:
              3.4641016 = tf(freq=12.0), with freq of:
                12.0 = termFreq=12.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.0234375 = fieldNorm(doc=4284)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Information ist in unserer Zeit zu einem sehr wichtigen Gut geworden. Sie ist Grundlage jeglicher seriösen Entscheidungsfindung. Die Informationsflut ist in den letzten Jahren stark angestiegen und auch in absehbarer Zeit wird die Menge der Informationen weiter anwachsen. Daher wird es immer wichtiger, sich ''Information über Information'' zu organisieren. Es ist nicht möglich, über alle Bereiche, mit denen man konfrontiert wird, im letzten Detail informiert zu sein. Notwendig und wichtig ist es aber zu wissen, wo man sich informieren kann. Relevante Informationen müssen möglichst rasch gefunden werden können. Im praktischen, EDV-unterstützten Einsatz findet man zu diesem Zweck Informationssysteme verschiedenster Art. Das Spektrum reicht dabei von Management-Informationssystemen, über Expertensysteme bis zu Datenbanksystemen und Information Retrieval Systemen (IR-Systemen). Obwohl die einzelnen Typen dieser informationsverarbeitenden Systeme für unterschiedliche Anwendergruppen und unterschiedliche Aufgabenarten konzipiert sind, ergeben sich beim Entwurf der Systeme doch sehr ähnlich gelagerte Problemkreise und Fragestellungen. * Die Darstellung und die Organisation von bestehendem Wissen und bekannten Fakten im Informationssystem (Informationserschließung). * Das (Wieder)finden relevanter Informationen aus dem Informationssystem und das Führen des Benutzers durch das Informationssystem. Ein Information Retrieval System beinhaltet unstrukturierte bibliographische oder textuelle Dokumente und unterscheidet sich dadurch wesentlich von Datenbanksystemen, die für gewöhnlich strukturierte Daten enthalten.
Konventionelle, formatierte Datenbanken sind heute in der Praxis bereits weit verbreitet. Dies nicht zuletzt auch deshalb, weil unter anderem die standardisierte Abfragesprache SQL existiert und insbesondere bei relationalen Datenbanksystemen die Forschung intensiv an Verbesserungen in Aufbau und Performance der Systeme arbeitet. Die Verbreitung und Akzeptanz von unformatierten Datenbanken, Information Retrieval Systemen, ist hingegen bei weitem nicht so weit gediehen. Ein Grund dafür ist in der mangelnden Benutzerfreundlichkeit der IR-Systeme und in unzulänglichen Methoden der Informationserschließung zu suchen. Mit der vorliegenden Arbeit soll eine Methode zur Informationserschliessung in Information Retrieval Systemen entwickelt werden, die die Bedürfnisse des Benutzers in den Mittelpunkt stellt und so einen Beitrag dazu leistet, die Akzeptanz und Verbreitung von Information Retrieval Systemen, insbesondere für den Bürobereich, zu erhöhen. Die Fragestellung lautet somit: Ist es möglich, den Benutzer bereits im Stadium der Indexierung von Dokumenten in verstärktem Maße miteinzubeziehen, ohne dabei aber auf die maschinelle Unterstützung völlig zu verzichten, wie dies bei der manuellen Indexierung der Fall ist. Jedes Retrievalsystem kann als ein System beschrieben werden, das aus einer Menge von Dokumenten und einer Menge von Suchfragen besteht und das einen Mechanismus enthält, der die für eine Suchanfrage relevanten Dokumente bestimmt.
Dazu sind folgende Teile eines IR-Systems notwendig: * Informationserschließung Eine Komponente zur Erschließung und Darstellung der gespeicherten Informationen. Dieser Teil dient dazu, den Inhalt der Dokumente zu beschreiben und so darzustellen, daß aufgrund dieser Merkmale ein Dokument gefunden werden kann. Eine Möglichkeit dazu besteht darin, den Dokumenten inhaltsbeschreibende Deskriptoren zuzuordnen. Durch den Prozeß der Indexierung werden die Dokumente in eine Indexierungssprache übersetzt. * Query-Language (Abfragesprache) Eine Komponente zur Formulierung der Suchanfragen des Benutzers. Dieser Teil dient dazu, die Suchanfrage des Benutzers so zu verarbeiten, daß mit der aus der Frage gewonnenen Information über die Bedürfnisse des Benutzers die passenden Dokumente gefunden werden können. * Informationsausgabe - Informationsaufbereitung Eine Komponente zur Ausgabe der auf Grund der Suchanfrage gefundenen Informationen. Dieser Teil stellt das Ergebnis der Suchanfrage dem Benutzer zur Verfügung.
Es würde den Rahmen der Arbeit sprengen, alle Komponenten eines Information Retrieval Systems zu untersuchen. Daher wird ein Schwerpunkt auf die Informationserschließung gelegt. Dabei wird die (semi)automatische Indexierung von Dokumenten zum Zwecke des Information Retrievals, also der Vorgang der Übersetzung der Dokumente in eine Indexierungssprache genauer behandelt. Dieser Schwerpunkt wurde unter anderem deshalb gewählt, weil meiner Ansicht nach die festzustellende mangelnde Akzeptanz von Information Retrieval Systemen auch damit zu begründen ist, daß die in der Praxis eingesetzten Indexierungskomponenten der Systeme zur Zeit noch nicht den Leistungsumfang erbringen, den der Benutzer von einem ''Intelligenten Information Retrieval System'' erwartet. Ziel der Arbeit ist es, ein Modell zur automatischen Indexierung schrittweise zu entwickeln, das den Benutzer in stärkerem Maße in die Indexierung mit einbezieht, als dies bei den in Literatur und Praxis beschriebenen Verfahren der Fall ist.
Lepsky, K.: Automatisches Indexieren (2023) 0.03
```
0.02560225 = product of:
  0.0512045 = sum of:
    0.0512045 = product of:
      0.102409 = sum of:
        0.102409 = weight(_text_:dokumente in 781) [ClassicSimilarity], result of:
          0.102409 = score(doc=781,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.39388722 = fieldWeight in 781, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.0546875 = fieldNorm(doc=781)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Unter Indexierung versteht man die Zuordnung von inhaltskennzeichnenden Ausdrücken (Indextermen, Indexaten, Erschließungsmerkmalen) zu Dokumenten. Über die zugeteilten Indexterme soll ein gezieltes Auffinden der Dokumente ermöglicht werden. Indexterme können inhaltsbeschreibende Merkmale wie Notationen, Deskriptoren, kontrollierte oder freie Schlagwörter sein; es kann sich auch um reine Stichwörter handeln, die aus dem Text des Dokuments gewonnen werden. Eine Indexierung kann intellektuell, computerunterstützt oder automatisch erfolgen. Computerunterstützte Indexierungsverfahren kombinieren die intellektuelle Indexierung mit automatischen Vorarbeiten. Bei der automatischen Indexierung werden die Indexterme automatisch aus dem Dokumenttext ermittelt und dem Dokument zugeordnet. Automatische Indexierung bedient sich für die Verarbeitung der Zeichenketten im Dokument linguistischer und statistischer Verfahren.

Fuhr, N.; Niewelt, B.: ¬Ein Retrievaltest mit automatisch indexierten Dokumenten (1984) 0.02

0.024208086 = product of:
  0.04841617 = sum of:
    0.04841617 = product of:
      0.09683234 = sum of:
        0.09683234 = weight(_text_:22 in 262) [ClassicSimilarity], result of:
          0.09683234 = score(doc=262,freq=2.0), product of:
            0.17876907 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.05105019 = queryNorm
            0.5416616 = fieldWeight in 262, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.109375 = fieldNorm(doc=262)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Date: 20.10.2000 12:22:23

Hlava, M.M.K.: Automatic indexing : comparing rule-based and statistics-based indexing systems (2005) 0.02

0.024208086 = product of:
  0.04841617 = sum of:
    0.04841617 = product of:
      0.09683234 = sum of:
        0.09683234 = weight(_text_:22 in 6265) [ClassicSimilarity], result of:
          0.09683234 = score(doc=6265,freq=2.0), product of:
            0.17876907 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.05105019 = queryNorm
            0.5416616 = fieldWeight in 6265, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.109375 = fieldNorm(doc=6265)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Source: Information outlook. 9(2005) no.8, S.22-23

Kasprzik, A.: Automatisierte und semiautomatisierte Klassifizierung : eine Analyse aktueller Projekte (2014) 0.02
```
0.021944785 = product of:
  0.04388957 = sum of:
    0.04388957 = product of:
      0.08777914 = sum of:
        0.08777914 = weight(_text_:dokumente in 2470) [ClassicSimilarity], result of:
          0.08777914 = score(doc=2470,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.33761764 = fieldWeight in 2470, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.046875 = fieldNorm(doc=2470)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Das sprunghafte Anwachsen der Menge digital verfügbarer Dokumente gepaart mit dem Zeit- und Personalmangel an wissenschaftlichen Bibliotheken legt den Einsatz von halb- oder vollautomatischen Verfahren für die verbale und klassifikatorische Inhaltserschließung nahe. Nach einer kurzen allgemeinen Einführung in die gängige Methodik beleuchtet dieser Artikel eine Reihe von Projekten zur automatisierten Klassifizierung aus dem Zeitraum 2007-2012 und aus dem deutschsprachigen Raum. Ein Großteil der vorgestellten Projekte verwendet Methoden des Maschinellen Lernens aus der Künstlichen Intelligenz, arbeitet meist mit angepassten Versionen einer kommerziellen Software und bezieht sich in der Regel auf die Dewey Decimal Classification (DDC). Als Datengrundlage dienen Metadatensätze, Abstracs, Inhaltsverzeichnisse und Volltexte in diversen Datenformaten. Die abschließende Analyse enthält eine Anordnung der Projekte nach einer Reihe von verschiedenen Kriterien und eine Zusammenfassung der aktuellen Lage und der größten Herausfordungen für automatisierte Klassifizierungsverfahren.

Fuhr, N.: Ranking-Experimente mit gewichteter Indexierung (1986) 0.02

0.020749787 = product of:
  0.041499574 = sum of:
    0.041499574 = product of:
      0.08299915 = sum of:
        0.08299915 = weight(_text_:22 in 58) [ClassicSimilarity], result of:
          0.08299915 = score(doc=58,freq=2.0), product of:
            0.17876907 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.05105019 = queryNorm
            0.46428138 = fieldWeight in 58, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=58)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Date: 14. 6.2015 22:12:44

Hauer, M.: Automatische Indexierung (2000) 0.02

0.020749787 = product of:
  0.041499574 = sum of:
    0.041499574 = product of:
      0.08299915 = sum of:
        0.08299915 = weight(_text_:22 in 5887) [ClassicSimilarity], result of:
          0.08299915 = score(doc=5887,freq=2.0), product of:
            0.17876907 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.05105019 = queryNorm
            0.46428138 = fieldWeight in 5887, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=5887)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Source: Wissen in Aktion: Wege des Knowledge Managements. 22. Online-Tagung der DGI, Frankfurt am Main, 2.-4.5.2000. Proceedings. Hrsg.: R. Schmidt

Fuhr, N.: Rankingexperimente mit gewichteter Indexierung (1986) 0.02

0.020749787 = product of:
  0.041499574 = sum of:
    0.041499574 = product of:
      0.08299915 = sum of:
        0.08299915 = weight(_text_:22 in 2051) [ClassicSimilarity], result of:
          0.08299915 = score(doc=2051,freq=2.0), product of:
            0.17876907 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.05105019 = queryNorm
            0.46428138 = fieldWeight in 2051, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=2051)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Date: 14. 6.2015 22:12:56

Search (50 results, page 1 of 3)

Authors

Years

Languages

Types

Themes

Subjects

Classifications