Search (3 results, page 1 of 1)

  • × author_ss:"Lepsky, K."
  • × theme_ss:"Automatisches Indexieren"
  1. Lepsky, K.; Vorhauer, J.: Lingo - ein open source System für die Automatische Indexierung deutschsprachiger Dokumente (2006) 0.04
    0.03960762 = product of:
      0.15843049 = sum of:
        0.15843049 = sum of:
          0.108901896 = weight(_text_:sprache in 3581) [ClassicSimilarity], result of:
            0.108901896 = score(doc=3581,freq=2.0), product of:
              0.23727702 = queryWeight, product of:
                5.192599 = idf(docFreq=667, maxDocs=44218)
                0.045695234 = queryNorm
              0.4589652 = fieldWeight in 3581, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                5.192599 = idf(docFreq=667, maxDocs=44218)
                0.0625 = fieldNorm(doc=3581)
          0.049528588 = weight(_text_:22 in 3581) [ClassicSimilarity], result of:
            0.049528588 = score(doc=3581,freq=2.0), product of:
              0.16001692 = queryWeight, product of:
                3.5018296 = idf(docFreq=3622, maxDocs=44218)
                0.045695234 = queryNorm
              0.30952093 = fieldWeight in 3581, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                3.5018296 = idf(docFreq=3622, maxDocs=44218)
                0.0625 = fieldNorm(doc=3581)
      0.25 = coord(1/4)
    
    Abstract
    Lingo ist ein frei verfügbares System (open source) zur automatischen Indexierung der deutschen Sprache. Bei der Entwicklung von lingo standen hohe Konfigurierbarkeit und Flexibilität des Systems für unterschiedliche Einsatzmöglichkeiten im Vordergrund. Der Beitrag zeigt den Nutzen einer linguistisch basierten automatischen Indexierung für das Information Retrieval auf. Die für eine Retrievalverbesserung zur Verfügung stehende linguistische Funktionalität von lingo wird vorgestellt und an Beispielen erläutert: Grundformerkennung, Kompositumerkennung bzw. Kompositumzerlegung, Wortrelationierung, lexikalische und algorithmische Mehrwortgruppenerkennung, OCR-Fehlerkorrektur. Der offene Systemaufbau von lingo wird beschrieben, mögliche Einsatzszenarien und Anwendungsgrenzen werden benannt.
    Date
    24. 3.2006 12:22:02
  2. Bredack, J.; Lepsky, K.: Automatische Extraktion von Fachterminologie aus Volltexten (2014) 0.01
    0.013612737 = product of:
      0.054450948 = sum of:
        0.054450948 = product of:
          0.108901896 = sum of:
            0.108901896 = weight(_text_:sprache in 4872) [ClassicSimilarity], result of:
              0.108901896 = score(doc=4872,freq=2.0), product of:
                0.23727702 = queryWeight, product of:
                  5.192599 = idf(docFreq=667, maxDocs=44218)
                  0.045695234 = queryNorm
                0.4589652 = fieldWeight in 4872, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  5.192599 = idf(docFreq=667, maxDocs=44218)
                  0.0625 = fieldNorm(doc=4872)
          0.5 = coord(1/2)
      0.25 = coord(1/4)
    
    Abstract
    Fachterminologie in wissenschaftlichen Texten liegt häufig in Form von Phrasen oder Mehrwortgruppen vor. Vorgestellt wird ein algorithmisches Verfahren zur Identifikation und Extraktion fachtermi­nologischer Mehrwortgruppen. Besonderer Schwerpunkt ist die Einbindung von Funktionswörtern der deutschen Sprache, um die Extraktion komplexer Mehrwortkonstruktionen zu ermöglichen. Eingesetzt wurde das automatische Indexierungssystem Lingo. Die Ergebnisse für eine Extraktion kunsthistorischer Fachterminologie aus dem Reallexikon zur Deutschen Kunstgeschichte belegen die Tauglichkeit des Verfahrens.
  3. Lepsky, K.: Automatische Indexierung des Reallexikons zur Deutschen Kunstgeschichte (2006) 0.01
    0.0059555722 = product of:
      0.023822289 = sum of:
        0.023822289 = product of:
          0.047644578 = sum of:
            0.047644578 = weight(_text_:sprache in 6080) [ClassicSimilarity], result of:
              0.047644578 = score(doc=6080,freq=2.0), product of:
                0.23727702 = queryWeight, product of:
                  5.192599 = idf(docFreq=667, maxDocs=44218)
                  0.045695234 = queryNorm
                0.20079727 = fieldWeight in 6080, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  5.192599 = idf(docFreq=667, maxDocs=44218)
                  0.02734375 = fieldNorm(doc=6080)
          0.5 = coord(1/2)
      0.25 = coord(1/4)
    
    Source
    Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen