Document (#28976)

Title
Automatische Klassifikation und Extraktion in Documentum
Source
Information - Wissenschaft und Praxis. 56(2005) H.5/6, S.276
Year
2005
Content
"LCI Comprend ist ab sofort als integriertes Modul für EMCs Content Management System Documentum verfügbar. LCI (Learning Computers International GmbH) hat mit Unterstützung von neeb & partner diese Technologie zur Dokumentenautomation transparent in Documentum integriert. Dies ist die erste bekannte Lösung für automatische, lernende Klassifikation und Extraktion, die direkt auf dem Documentum Datenbestand arbeitet und ohne zusätzliche externe Steuerung auskommt. Die LCI Information Capture Services (ICS) dienen dazu, jegliche Art von Dokument zu klassifizieren und Information daraus zu extrahieren. Das Dokument kann strukturiert, halbstrukturiert oder unstrukturiert sein. Somit können beispielsweise gescannte Formulare genauso verarbeitet werden wie Rechnungen oder E-Mails. Die Extraktions- und Klassifikationsvorschriften und die zu lernenden Beispieldokumente werden einfach interaktiv zusammengestellt und als XML-Struktur gespeichert. Zur Laufzeit wird das Projekt angewendet, um unbekannte Dokumente aufgrund von Regeln und gelernten Beispielen automatisch zu indexieren. Dokumente können damit entweder innerhalb von Documentum oder während des Imports verarbeitet werden. Der neue Server erlaubt das Einlesen von Dateien aus dem Dateisystem oder direkt von POPS-Konten, die Analyse der Dokumente und die automatische Erzeugung von Indexwerten bei der Speicherung in einer Documentum Ablageumgebung. Diese Indexwerte, die durch inhaltsbasierte, auch mehrthematische Klassifikation oder durch Extraktion gewonnen wurden, werden als vordefinierte Attribute mit dem Documentum-Objekt abgelegt. Handelt es sich um ein gescanntes Dokument oder ein Fax, wird automatisch die integrierte Volltext-Texterkennung durchgeführt."
Footnote
Kontakt: LCI GmbH, Freiburger Str. 16, 16,79199 Kirchzarten, Tel.: (0 76 61) 9 89 961o, Fax: (01212) 5 37 48 29 36, info@lci-software.com, www.lci-software.com
Theme
Dokumentenmanagement
Automatisches Klassifizieren
Object
LCI Comprend
Documentum

Similar documents (content)

  1. Bredack, J.; Lepsky, K.: Automatische Extraktion von Fachterminologie aus Volltexten (2014) 1.10
    1.099263 = sum of:
      1.099263 = product of:
        1.6488943 = sum of:
          0.37233645 = weight(abstract_txt:automatische in 873) [ClassicSimilarity], result of:
            0.37233645 = score(doc=873,freq=1.0), product of:
              0.4904496 = queryWeight, product of:
                1.1045122 = boost
                6.9410167 = idf(docFreq=111, maxDocs=42596)
                0.0639736 = queryNorm
              0.7591737 = fieldWeight in 873, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.9410167 = idf(docFreq=111, maxDocs=42596)
                0.109375 = fieldNorm(doc=873)
          1.2765578 = weight(abstract_txt:extraktion in 873) [ClassicSimilarity], result of:
            1.2765578 = score(doc=873,freq=3.0), product of:
              0.7731978 = queryWeight, product of:
                1.3868153 = boost
                8.715076 = idf(docFreq=18, maxDocs=42596)
                0.0639736 = queryNorm
              1.6510106 = fieldWeight in 873, product of:
                1.7320508 = tf(freq=3.0), with freq of:
                  3.0 = termFreq=3.0
                8.715076 = idf(docFreq=18, maxDocs=42596)
                0.109375 = fieldNorm(doc=873)
        0.6666667 = coord(2/3)
    
  2. Dahlberg, I.: Klassifikation (1993) 0.84
    0.8421408 = sum of:
      0.8421408 = product of:
        2.5264223 = sum of:
          2.5264223 = weight(title_txt:klassifikation in 3284) [ClassicSimilarity], result of:
            2.5264223 = score(doc=3284,freq=1.0), product of:
              0.40202528 = queryWeight, product of:
                6.2842374 = idf(docFreq=215, maxDocs=42596)
                0.0639736 = queryNorm
              6.2842374 = fieldWeight in 3284, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.2842374 = idf(docFreq=215, maxDocs=42596)
                1.0 = fieldNorm(doc=3284)
        0.33333334 = coord(1/3)
    
  3. Lehmann, K.: Klassifikation (1984) 0.84
    0.8421408 = sum of:
      0.8421408 = product of:
        2.5264223 = sum of:
          2.5264223 = weight(title_txt:klassifikation in 3392) [ClassicSimilarity], result of:
            2.5264223 = score(doc=3392,freq=1.0), product of:
              0.40202528 = queryWeight, product of:
                6.2842374 = idf(docFreq=215, maxDocs=42596)
                0.0639736 = queryNorm
              6.2842374 = fieldWeight in 3392, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.2842374 = idf(docFreq=215, maxDocs=42596)
                1.0 = fieldNorm(doc=3392)
        0.33333334 = coord(1/3)
    
  4. Klassifikation (1984 ff) 0.84
    0.8421408 = sum of:
      0.8421408 = product of:
        2.5264223 = sum of:
          2.5264223 = weight(title_txt:klassifikation in 3586) [ClassicSimilarity], result of:
            2.5264223 = score(doc=3586,freq=1.0), product of:
              0.40202528 = queryWeight, product of:
                6.2842374 = idf(docFreq=215, maxDocs=42596)
                0.0639736 = queryNorm
              6.2842374 = fieldWeight in 3586, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.2842374 = idf(docFreq=215, maxDocs=42596)
                1.0 = fieldNorm(doc=3586)
        0.33333334 = coord(1/3)
    
  5. Dorn, G.J.W.: Klassifikation (1980) 0.84
    0.8421408 = sum of:
      0.8421408 = product of:
        2.5264223 = sum of:
          2.5264223 = weight(title_txt:klassifikation in 4375) [ClassicSimilarity], result of:
            2.5264223 = score(doc=4375,freq=1.0), product of:
              0.40202528 = queryWeight, product of:
                6.2842374 = idf(docFreq=215, maxDocs=42596)
                0.0639736 = queryNorm
              6.2842374 = fieldWeight in 4375, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                6.2842374 = idf(docFreq=215, maxDocs=42596)
                1.0 = fieldNorm(doc=4375)
        0.33333334 = coord(1/3)