Search (372 results, page 1 of 19)

Hotho, A.; Bloehdorn, S.: Data Mining 2004 : Text classification by boosting weak learners based on terms and concepts (2004) 0.14

0.1421113 = product of:
  0.5826563 = sum of:
    0.026000304 = product of:
      0.07800091 = sum of:
        0.07800091 = weight(_text_:3a in 562) [ClassicSimilarity], result of:
          0.07800091 = score(doc=562,freq=2.0), product of:
            0.1387872 = queryWeight, product of:
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.016370254 = queryNorm
            0.56201804 = fieldWeight in 562, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.046875 = fieldNorm(doc=562)
      0.33333334 = coord(1/3)
    0.07800091 = weight(_text_:2f in 562) [ClassicSimilarity], result of:
      0.07800091 = score(doc=562,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 562, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=562)
    0.07800091 = weight(_text_:2f in 562) [ClassicSimilarity], result of:
      0.07800091 = score(doc=562,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 562, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=562)
    0.0039958097 = product of:
      0.007991619 = sum of:
        0.007991619 = weight(_text_:4 in 562) [ClassicSimilarity], result of:
          0.007991619 = score(doc=562,freq=2.0), product of:
            0.04442393 = queryWeight, product of:
              2.7136984 = idf(docFreq=7967, maxDocs=44218)
              0.016370254 = queryNorm
            0.17989448 = fieldWeight in 562, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.7136984 = idf(docFreq=7967, maxDocs=44218)
              0.046875 = fieldNorm(doc=562)
      0.5 = coord(1/2)
    0.07800091 = weight(_text_:2f in 562) [ClassicSimilarity], result of:
      0.07800091 = score(doc=562,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 562, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=562)
    0.07800091 = weight(_text_:2f in 562) [ClassicSimilarity], result of:
      0.07800091 = score(doc=562,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 562, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=562)
    0.07800091 = weight(_text_:2f in 562) [ClassicSimilarity], result of:
      0.07800091 = score(doc=562,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 562, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=562)
    0.07800091 = weight(_text_:2f in 562) [ClassicSimilarity], result of:
      0.07800091 = score(doc=562,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 562, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=562)
    0.07800091 = weight(_text_:2f in 562) [ClassicSimilarity], result of:
      0.07800091 = score(doc=562,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 562, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=562)
    0.00665383 = product of:
      0.01330766 = sum of:
        0.01330766 = weight(_text_:22 in 562) [ClassicSimilarity], result of:
          0.01330766 = score(doc=562,freq=2.0), product of:
            0.05732584 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.016370254 = queryNorm
            0.23214069 = fieldWeight in 562, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=562)
      0.5 = coord(1/2)
  0.24390244 = coord(10/41)

Content: Vgl.: http://www.google.de/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&ved=0CEAQFjAA&url=http%3A%2F%2Fciteseerx.ist.psu.edu%2Fviewdoc%2Fdownload%3Fdoi%3D10.1.1.91.4940%26rep%3Drep1%26type%3Dpdf&ei=dOXrUMeIDYHDtQahsIGACg&usg=AFQjCNHFWVh6gNPvnOrOS9R3rkrXCNVD-A&sig2=5I2F5evRfMnsttSgFF9g7Q&bvm=bv.1357316858,d.Yms.
Date: 8. 1.2013 10:22:32
Source: Proceedings of the 4th IEEE International Conference on Data Mining (ICDM 2004), 1-4 November 2004, Brighton, UK

Noever, D.; Ciolino, M.: ¬The Turing deception (2022) 0.11

0.111611046 = product of:
  0.57200664 = sum of:
    0.026000304 = product of:
      0.07800091 = sum of:
        0.07800091 = weight(_text_:3a in 862) [ClassicSimilarity], result of:
          0.07800091 = score(doc=862,freq=2.0), product of:
            0.1387872 = queryWeight, product of:
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.016370254 = queryNorm
            0.56201804 = fieldWeight in 862, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.046875 = fieldNorm(doc=862)
      0.33333334 = coord(1/3)
    0.07800091 = weight(_text_:2f in 862) [ClassicSimilarity], result of:
      0.07800091 = score(doc=862,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 862, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=862)
    0.07800091 = weight(_text_:2f in 862) [ClassicSimilarity], result of:
      0.07800091 = score(doc=862,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 862, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=862)
    0.07800091 = weight(_text_:2f in 862) [ClassicSimilarity], result of:
      0.07800091 = score(doc=862,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 862, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=862)
    0.07800091 = weight(_text_:2f in 862) [ClassicSimilarity], result of:
      0.07800091 = score(doc=862,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 862, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=862)
    0.07800091 = weight(_text_:2f in 862) [ClassicSimilarity], result of:
      0.07800091 = score(doc=862,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 862, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=862)
    0.07800091 = weight(_text_:2f in 862) [ClassicSimilarity], result of:
      0.07800091 = score(doc=862,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 862, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=862)
    0.07800091 = weight(_text_:2f in 862) [ClassicSimilarity], result of:
      0.07800091 = score(doc=862,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 862, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=862)
  0.19512194 = coord(8/41)

Source: https%3A%2F%2Farxiv.org%2Fabs%2F2212.06721&usg=AOvVaw3i_9pZm9y_dQWoHi6uv0EN

Huo, W.: Automatic multi-word term extraction and its application to Web-page summarization (2012) 0.11

0.107836135 = product of:
  0.5526602 = sum of:
    0.07800091 = weight(_text_:2f in 563) [ClassicSimilarity], result of:
      0.07800091 = score(doc=563,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 563, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=563)
    0.07800091 = weight(_text_:2f in 563) [ClassicSimilarity], result of:
      0.07800091 = score(doc=563,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 563, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=563)
    0.07800091 = weight(_text_:2f in 563) [ClassicSimilarity], result of:
      0.07800091 = score(doc=563,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 563, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=563)
    0.07800091 = weight(_text_:2f in 563) [ClassicSimilarity], result of:
      0.07800091 = score(doc=563,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 563, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=563)
    0.07800091 = weight(_text_:2f in 563) [ClassicSimilarity], result of:
      0.07800091 = score(doc=563,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 563, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=563)
    0.07800091 = weight(_text_:2f in 563) [ClassicSimilarity], result of:
      0.07800091 = score(doc=563,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 563, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=563)
    0.07800091 = weight(_text_:2f in 563) [ClassicSimilarity], result of:
      0.07800091 = score(doc=563,freq=2.0), product of:
        0.1387872 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.016370254 = queryNorm
        0.56201804 = fieldWeight in 563, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=563)
    0.00665383 = product of:
      0.01330766 = sum of:
        0.01330766 = weight(_text_:22 in 563) [ClassicSimilarity], result of:
          0.01330766 = score(doc=563,freq=2.0), product of:
            0.05732584 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.016370254 = queryNorm
            0.23214069 = fieldWeight in 563, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=563)
      0.5 = coord(1/2)
  0.19512194 = coord(8/41)

Content: A Thesis presented to The University of Guelph In partial fulfilment of requirements for the degree of Master of Science in Computer Science. Vgl. Unter: http://www.inf.ufrgs.br%2F~ceramisch%2Fdownload_files%2Fpublications%2F2009%2Fp01.pdf.
Date: 10. 1.2013 19:22:47

Lobin, H: Computerlinguistik und Texttechnologie (2010) 0.02

0.019594226 = product of:
  0.13389388 = sum of:
    0.014104058 = weight(_text_:und in 564) [ClassicSimilarity], result of:
      0.014104058 = score(doc=564,freq=14.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.38872904 = fieldWeight in 564, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=564)
    0.021185279 = product of:
      0.042370558 = sum of:
        0.042370558 = weight(_text_:allgemein in 564) [ClassicSimilarity], result of:
          0.042370558 = score(doc=564,freq=4.0), product of:
            0.08601499 = queryWeight, product of:
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.016370254 = queryNorm
            0.49259502 = fieldWeight in 564, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.046875 = fieldNorm(doc=564)
      0.5 = coord(1/2)
    0.04921114 = weight(_text_:einzelner in 564) [ClassicSimilarity], result of:
      0.04921114 = score(doc=564,freq=2.0), product of:
        0.110237986 = queryWeight, product of:
          6.7340426 = idf(docFreq=142, maxDocs=44218)
          0.016370254 = queryNorm
        0.44640818 = fieldWeight in 564, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.7340426 = idf(docFreq=142, maxDocs=44218)
          0.046875 = fieldNorm(doc=564)
    0.014104058 = weight(_text_:und in 564) [ClassicSimilarity], result of:
      0.014104058 = score(doc=564,freq=14.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.38872904 = fieldWeight in 564, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=564)
    0.014104058 = weight(_text_:und in 564) [ClassicSimilarity], result of:
      0.014104058 = score(doc=564,freq=14.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.38872904 = fieldWeight in 564, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=564)
    0.021185279 = product of:
      0.042370558 = sum of:
        0.042370558 = weight(_text_:allgemein in 564) [ClassicSimilarity], result of:
          0.042370558 = score(doc=564,freq=4.0), product of:
            0.08601499 = queryWeight, product of:
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.016370254 = queryNorm
            0.49259502 = fieldWeight in 564, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.046875 = fieldNorm(doc=564)
      0.5 = coord(1/2)
  0.14634146 = coord(6/41)

Abstract: Computerlinguistik (die Verarbeitung von Sprache mit dem Computer) und Texttechnologie (die automatisierte Handhabung elektronischer Texte) haben im letzten Jahrzehnt unterschiedliche Richtungen eingeschlagen. Beide Disziplinen speisen sich jedoch aus der gleichen Quelle: der formalen Grammatik. Deshalb ist eine gemeinsame Darstellung sinnvoll. Der Bezug auf die gemeinsamen Grundlagen und die kontrastierende Gegenüberstellung einzelner Teilbereiche fördern das Verständnis der jeweils anderen Disziplin und eröffnen interessante Querbezüge. Erstmals wird die Verknüpfung von Computerlinguistik und Texttechnologie mit dieser Einführung in knapper Form systematisch vollzogen, was sie insbesondere für Module im Bachelor-Studium geeignet macht.
BK: 18.00 Einzelne Sprachen und Literaturen allgemein
Classification: 18.00 Einzelne Sprachen und Literaturen allgemein

Semantik, Lexikographie und Computeranwendungen : Workshop ... (Bonn) : 1995.01.27-28 (1996) 0.02

0.018001067 = product of:
  0.1230073 = sum of:
    0.02738455 = weight(_text_:und in 190) [ClassicSimilarity], result of:
      0.02738455 = score(doc=190,freq=76.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.7547594 = fieldWeight in 190, product of:
          8.717798 = tf(freq=76.0), with freq of:
            76.0 = termFreq=76.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=190)
    0.017654398 = product of:
      0.035308797 = sum of:
        0.035308797 = weight(_text_:allgemein in 190) [ClassicSimilarity], result of:
          0.035308797 = score(doc=190,freq=4.0), product of:
            0.08601499 = queryWeight, product of:
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.016370254 = queryNorm
            0.41049585 = fieldWeight in 190, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.0390625 = fieldNorm(doc=190)
      0.5 = coord(1/2)
    0.02738455 = weight(_text_:und in 190) [ClassicSimilarity], result of:
      0.02738455 = score(doc=190,freq=76.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.7547594 = fieldWeight in 190, product of:
          8.717798 = tf(freq=76.0), with freq of:
            76.0 = termFreq=76.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=190)
    0.02738455 = weight(_text_:und in 190) [ClassicSimilarity], result of:
      0.02738455 = score(doc=190,freq=76.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.7547594 = fieldWeight in 190, product of:
          8.717798 = tf(freq=76.0), with freq of:
            76.0 = termFreq=76.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=190)
    0.017654398 = product of:
      0.035308797 = sum of:
        0.035308797 = weight(_text_:allgemein in 190) [ClassicSimilarity], result of:
          0.035308797 = score(doc=190,freq=4.0), product of:
            0.08601499 = queryWeight, product of:
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.016370254 = queryNorm
            0.41049585 = fieldWeight in 190, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.0390625 = fieldNorm(doc=190)
      0.5 = coord(1/2)
    0.0055448585 = product of:
      0.011089717 = sum of:
        0.011089717 = weight(_text_:22 in 190) [ClassicSimilarity], result of:
          0.011089717 = score(doc=190,freq=2.0), product of:
            0.05732584 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.016370254 = queryNorm
            0.19345059 = fieldWeight in 190, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0390625 = fieldNorm(doc=190)
      0.5 = coord(1/2)
  0.14634146 = coord(6/41)

BK: 18.00 Einzelne Sprachen und Literaturen allgemein
Classification: ES 940 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft / Datenverarbeitung und Sprachwissenschaft. Computerlinguistik / Maschinelle Sprachanalyse
ET 400 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Einzelgebiete der Sprachwissenschaft, Sprachbeschreibung / Semantik und Lexikologie / Allgemeines
ES 945 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft / Datenverarbeitung und Sprachwissenschaft. Computerlinguistik / Spracherkennung
ET 580 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Einzelgebiete der Sprachwissenschaft, Sprachbeschreibung / Semantik und Lexikologie / Lexikologie (diachrone und synchrone) / Lexikographie
18.00 Einzelne Sprachen und Literaturen allgemein
Date: 14. 4.2007 10:04:22
RVK: ES 940 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft / Datenverarbeitung und Sprachwissenschaft. Computerlinguistik / Maschinelle Sprachanalyse
ET 400 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Einzelgebiete der Sprachwissenschaft, Sprachbeschreibung / Semantik und Lexikologie / Allgemeines
ES 945 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft / Datenverarbeitung und Sprachwissenschaft. Computerlinguistik / Spracherkennung
ET 580 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Einzelgebiete der Sprachwissenschaft, Sprachbeschreibung / Semantik und Lexikologie / Lexikologie (diachrone und synchrone) / Lexikographie
Series: Sprache und Information ; 33

Informationslinguistische Texterschließung (1986) 0.02

0.015460218 = product of:
  0.12677379 = sum of:
    0.070135616 = product of:
      0.14027123 = sum of:
        0.14027123 = weight(_text_:morphologie in 186) [ClassicSimilarity], result of:
          0.14027123 = score(doc=186,freq=8.0), product of:
            0.14416489 = queryWeight, product of:
              8.806516 = idf(docFreq=17, maxDocs=44218)
              0.016370254 = queryNorm
            0.97299165 = fieldWeight in 186, product of:
              2.828427 = tf(freq=8.0), with freq of:
                8.0 = termFreq=8.0
              8.806516 = idf(docFreq=17, maxDocs=44218)
              0.0390625 = fieldNorm(doc=186)
      0.5 = coord(1/2)
    0.017769443 = weight(_text_:und in 186) [ClassicSimilarity], result of:
      0.017769443 = score(doc=186,freq=32.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.48975256 = fieldWeight in 186, product of:
          5.656854 = tf(freq=32.0), with freq of:
            32.0 = termFreq=32.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=186)
    0.017769443 = weight(_text_:und in 186) [ClassicSimilarity], result of:
      0.017769443 = score(doc=186,freq=32.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.48975256 = fieldWeight in 186, product of:
          5.656854 = tf(freq=32.0), with freq of:
            32.0 = termFreq=32.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=186)
    0.003329842 = product of:
      0.006659684 = sum of:
        0.006659684 = weight(_text_:4 in 186) [ClassicSimilarity], result of:
          0.006659684 = score(doc=186,freq=2.0), product of:
            0.04442393 = queryWeight, product of:
              2.7136984 = idf(docFreq=7967, maxDocs=44218)
              0.016370254 = queryNorm
            0.14991207 = fieldWeight in 186, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.7136984 = idf(docFreq=7967, maxDocs=44218)
              0.0390625 = fieldNorm(doc=186)
      0.5 = coord(1/2)
    0.017769443 = weight(_text_:und in 186) [ClassicSimilarity], result of:
      0.017769443 = score(doc=186,freq=32.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.48975256 = fieldWeight in 186, product of:
          5.656854 = tf(freq=32.0), with freq of:
            32.0 = termFreq=32.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=186)
  0.12195122 = coord(5/41)

Classification: ES 940 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft / Datenverarbeitung und Sprachwissenschaft. Computerlinguistik / Maschinelle Sprachanalyse
ES 935 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft / Datenverarbeitung und Sprachwissenschaft. Computerlinguistik / Textverarbeitung
RSWK: Automatische Sprachanalyse / Morphologie / Aufsatzsammlung (SBB / GBV)
Automatische Sprachanalyse / Morphologie <Linguistik> / Aufsatzsammlung (DNB)
RVK: ES 940 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft / Datenverarbeitung und Sprachwissenschaft. Computerlinguistik / Maschinelle Sprachanalyse
ES 935 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft / Datenverarbeitung und Sprachwissenschaft. Computerlinguistik / Textverarbeitung
Series: Linguistische Datenverarbeitung ; Bd. 4
Subject: Automatische Sprachanalyse / Morphologie / Aufsatzsammlung (SBB / GBV)
Automatische Sprachanalyse / Morphologie <Linguistik> / Aufsatzsammlung (DNB)

Lezius, W.: Morphy - Morphologie und Tagging für das Deutsche (2013) 0.01

0.014294091 = product of:
  0.11721154 = sum of:
    0.056108493 = product of:
      0.11221699 = sum of:
        0.11221699 = weight(_text_:morphologie in 1490) [ClassicSimilarity], result of:
          0.11221699 = score(doc=1490,freq=2.0), product of:
            0.14416489 = queryWeight, product of:
              8.806516 = idf(docFreq=17, maxDocs=44218)
              0.016370254 = queryNorm
            0.7783933 = fieldWeight in 1490, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.806516 = idf(docFreq=17, maxDocs=44218)
              0.0625 = fieldNorm(doc=1490)
      0.5 = coord(1/2)
    0.017410427 = weight(_text_:und in 1490) [ClassicSimilarity], result of:
      0.017410427 = score(doc=1490,freq=12.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.47985753 = fieldWeight in 1490, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1490)
    0.017410427 = weight(_text_:und in 1490) [ClassicSimilarity], result of:
      0.017410427 = score(doc=1490,freq=12.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.47985753 = fieldWeight in 1490, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1490)
    0.017410427 = weight(_text_:und in 1490) [ClassicSimilarity], result of:
      0.017410427 = score(doc=1490,freq=12.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.47985753 = fieldWeight in 1490, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1490)
    0.008871773 = product of:
      0.017743547 = sum of:
        0.017743547 = weight(_text_:22 in 1490) [ClassicSimilarity], result of:
          0.017743547 = score(doc=1490,freq=2.0), product of:
            0.05732584 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.016370254 = queryNorm
            0.30952093 = fieldWeight in 1490, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=1490)
      0.5 = coord(1/2)
  0.12195122 = coord(5/41)

Abstract: Morphy ist ein frei verfügbares Softwarepaket für die morphologische Analyse und Synthese und die kontextsensitive Wortartenbestimmung des Deutschen. Die Verwendung der Software unterliegt keinen Beschränkungen. Da die Weiterentwicklung eingestellt worden ist, verwenden Sie Morphy as is, d.h. auf eigenes Risiko, ohne jegliche Haftung und Gewährleistung und vor allem ohne Support. Morphy ist nur für die Windows-Plattform verfügbar und nur auf Standalone-PCs lauffähig.
Date: 22. 3.2015 9:30:24

Computerlinguistik und Sprachtechnologie : Eine Einführung (2010) 0.01

0.0142820105 = product of:
  0.09759374 = sum of:
    0.028054247 = product of:
      0.056108493 = sum of:
        0.056108493 = weight(_text_:morphologie in 1735) [ClassicSimilarity], result of:
          0.056108493 = score(doc=1735,freq=2.0), product of:
            0.14416489 = queryWeight, product of:
              8.806516 = idf(docFreq=17, maxDocs=44218)
              0.016370254 = queryNorm
            0.38919666 = fieldWeight in 1735, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.806516 = idf(docFreq=17, maxDocs=44218)
              0.03125 = fieldNorm(doc=1735)
      0.5 = coord(1/2)
    0.013764151 = weight(_text_:und in 1735) [ClassicSimilarity], result of:
      0.013764151 = score(doc=1735,freq=30.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.3793607 = fieldWeight in 1735, product of:
          5.477226 = tf(freq=30.0), with freq of:
            30.0 = termFreq=30.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=1735)
    0.014123519 = product of:
      0.028247038 = sum of:
        0.028247038 = weight(_text_:allgemein in 1735) [ClassicSimilarity], result of:
          0.028247038 = score(doc=1735,freq=4.0), product of:
            0.08601499 = queryWeight, product of:
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.016370254 = queryNorm
            0.32839668 = fieldWeight in 1735, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.03125 = fieldNorm(doc=1735)
      0.5 = coord(1/2)
    0.013764151 = weight(_text_:und in 1735) [ClassicSimilarity], result of:
      0.013764151 = score(doc=1735,freq=30.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.3793607 = fieldWeight in 1735, product of:
          5.477226 = tf(freq=30.0), with freq of:
            30.0 = termFreq=30.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=1735)
    0.013764151 = weight(_text_:und in 1735) [ClassicSimilarity], result of:
      0.013764151 = score(doc=1735,freq=30.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.3793607 = fieldWeight in 1735, product of:
          5.477226 = tf(freq=30.0), with freq of:
            30.0 = termFreq=30.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=1735)
    0.014123519 = product of:
      0.028247038 = sum of:
        0.028247038 = weight(_text_:allgemein in 1735) [ClassicSimilarity], result of:
          0.028247038 = score(doc=1735,freq=4.0), product of:
            0.08601499 = queryWeight, product of:
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.016370254 = queryNorm
            0.32839668 = fieldWeight in 1735, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.03125 = fieldNorm(doc=1735)
      0.5 = coord(1/2)
  0.14634146 = coord(6/41)

Abstract: Dieses Lehrbuch bietet eine umfassende Einführung in Grundlagen und Methoden der Computerlinguistik und stellt die wichtigsten Anwendungsgebiete in der Sprachtechnologie vor. Es richtet sich gleichermaßen an Studierende der Computerlinguistik und verwandter Fächer mit Bezug zur Verarbeitung natürlicher Sprache wie an Entwickler sprachverarbeitender Systeme. Nach einem Überblick über Aufgaben und Ziele der Computerlinguistik werden die erforderlichen theoretischen Grundlagen zur Logik, den Formalen Sprachen, der Graphentheorie, den statistischen Verfahren sowie der Texttechnologie beispielbezogen erläutert. Es schließt sich eine Darstellung der verschiedenen Methoden für die Verarbeitung auf den linguistischen Beschreibungsebenen an. Dabei werden zunächst die grundlegenden Begriffe und Konzepte der Phonetik und Phonologie, Morphologie, Syntax, Semantik sowie der Pragmatik vermittelt und darauf aufbauend die Prinzipien der sprachtechnologischen Umsetzung behandelt. Die drei letzten Teile des Buchs geben Überblicke über die verwendeten sprachtechnologischen Informationsquellen, die vielfältigen Anwendungen in der Praxis sowie über Evaluationsverfahren für sprachverarbeitende Systeme. Anhand konkreter Fragestellungen - von der Entwicklung von Korrekturprogrammen über das Informationsmanagement bis zur Maschinellen Übersetzung - wird das Zusammenwirken der einzelnen Methoden aufgezeigt. Für die dritte Auflage wurden sämtliche Kapitel überarbeitet und aktualisiert sowie zum Teil zu eigenständigen, neuen Kapiteln zusammengeführt. Insbesondere trägt die dritte Auflage der rasanten Entwicklung in der Computerlinguistik und Sprachtechnologie durch eine stärkere Fokussierung auf statistische Grundlagen und Methoden Rechnung. "Durch dieses Handbuch wird für den deutschsprachigen Raum eine empfindliche Lücke geschlossen. Es umfasst die relevanten Aspekte computerlinguistischer Grundlagenwissenschaft und sprachtechnologischer Anwendung in eindrucksvoller Breite und auf aktuellem Stand." [Manfred Pinkal]
BK: 18.00 Einzelne Sprachen und Literaturen allgemein
Classification: 18.00 Einzelne Sprachen und Literaturen allgemein

Weber, N.: ¬Die Semantik von Bedeutungsexplikationen (1999) 0.01

0.014104559 = product of:
  0.11565738 = sum of:
    0.024428943 = weight(_text_:und in 1399) [ClassicSimilarity], result of:
      0.024428943 = score(doc=1399,freq=42.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.6732984 = fieldWeight in 1399, product of:
          6.4807405 = tf(freq=42.0), with freq of:
            42.0 = termFreq=42.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1399)
    0.021185279 = product of:
      0.042370558 = sum of:
        0.042370558 = weight(_text_:allgemein in 1399) [ClassicSimilarity], result of:
          0.042370558 = score(doc=1399,freq=4.0), product of:
            0.08601499 = queryWeight, product of:
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.016370254 = queryNorm
            0.49259502 = fieldWeight in 1399, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.046875 = fieldNorm(doc=1399)
      0.5 = coord(1/2)
    0.024428943 = weight(_text_:und in 1399) [ClassicSimilarity], result of:
      0.024428943 = score(doc=1399,freq=42.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.6732984 = fieldWeight in 1399, product of:
          6.4807405 = tf(freq=42.0), with freq of:
            42.0 = termFreq=42.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1399)
    0.024428943 = weight(_text_:und in 1399) [ClassicSimilarity], result of:
      0.024428943 = score(doc=1399,freq=42.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.6732984 = fieldWeight in 1399, product of:
          6.4807405 = tf(freq=42.0), with freq of:
            42.0 = termFreq=42.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1399)
    0.021185279 = product of:
      0.042370558 = sum of:
        0.042370558 = weight(_text_:allgemein in 1399) [ClassicSimilarity], result of:
          0.042370558 = score(doc=1399,freq=4.0), product of:
            0.08601499 = queryWeight, product of:
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.016370254 = queryNorm
            0.49259502 = fieldWeight in 1399, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.046875 = fieldNorm(doc=1399)
      0.5 = coord(1/2)
  0.12195122 = coord(5/41)

BK: 18.00 Einzelne Sprachen und Literaturen allgemein
Classification: ES 950 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft / Datenverarbeitung und Sprachwissenschaft. Computerlinguistik / Maschinelle Redeanlyse
ES 965 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft / Datenverarbeitung und Sprachwissenschaft. Computerlinguistik / Datenverarbeitung und Einzelgebiete der Grammatik
18.00 Einzelne Sprachen und Literaturen allgemein
RVK: ES 950 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft / Datenverarbeitung und Sprachwissenschaft. Computerlinguistik / Maschinelle Redeanlyse
ES 965 Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft / Datenverarbeitung und Sprachwissenschaft. Computerlinguistik / Datenverarbeitung und Einzelgebiete der Grammatik
Series: Sprache, Sprechen und Computer ; 3

Strube, M.: Kreativ durch Analogien (2011) 0.01

0.013254967 = product of:
  0.13586341 = sum of:
    0.015234124 = weight(_text_:und in 4805) [ClassicSimilarity], result of:
      0.015234124 = score(doc=4805,freq=12.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.41987535 = fieldWeight in 4805, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4805)
    0.015234124 = weight(_text_:und in 4805) [ClassicSimilarity], result of:
      0.015234124 = score(doc=4805,freq=12.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.41987535 = fieldWeight in 4805, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4805)
    0.09016103 = weight(_text_:reiz in 4805) [ClassicSimilarity], result of:
      0.09016103 = score(doc=4805,freq=2.0), product of:
        0.13814513 = queryWeight, product of:
          8.43879 = idf(docFreq=25, maxDocs=44218)
          0.016370254 = queryNorm
        0.6526544 = fieldWeight in 4805, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.43879 = idf(docFreq=25, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4805)
    0.015234124 = weight(_text_:und in 4805) [ClassicSimilarity], result of:
      0.015234124 = score(doc=4805,freq=12.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.41987535 = fieldWeight in 4805, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4805)
  0.09756097 = coord(4/41)

Content: "Die Computerlinguistik vereinigt Elemente von Informatik und Linguistik; sie verwendet darüber hinaus Methoden aus weiteren Gebieten wie Mathematik, Psychologie, Statistik und künstliche Intelligenz. Der Reiz und die Herausforderung einer solchen interdisziplinären Wissenschaft liegen darin, Analogien zwischen Konzepten aus weit entfernten Teilgebieten zu erkennen und zu nutzen. Paradebeispiel dafür ist einer der entscheidenden Durchbrüche, welche die Computerlinguistik prägten. Es geht um das »Parsing«: Ein Computerprogramm, genauer gesagt ein Compiler, nimmt Zeichen für Zeichen den Input des Benutzers entgegen, der in diesem Fall seinerseits aus dem Text eines Computerprogramms besteht, und ermittelt dessen Struktur. Im Prinzip dasselbe tut ein Mensch, der einen gesprochenen Satz hört und versteht."

Information und Sprache : Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen (2006) 0.01
```
0.013145118 = product of:
  0.07699283 = sum of:
    0.014544915 = weight(_text_:und in 91) [ClassicSimilarity], result of:
      0.014544915 = score(doc=91,freq=134.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.40087974 = fieldWeight in 91, product of:
          11.575837 = tf(freq=134.0), with freq of:
            134.0 = termFreq=134.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.015625 = fieldNorm(doc=91)
    0.0070617595 = product of:
      0.014123519 = sum of:
        0.014123519 = weight(_text_:allgemein in 91) [ClassicSimilarity], result of:
          0.014123519 = score(doc=91,freq=4.0), product of:
            0.08601499 = queryWeight, product of:
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.016370254 = queryNorm
            0.16419834 = fieldWeight in 91, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.015625 = fieldNorm(doc=91)
      0.5 = coord(1/2)
    0.014544915 = weight(_text_:und in 91) [ClassicSimilarity], result of:
      0.014544915 = score(doc=91,freq=134.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.40087974 = fieldWeight in 91, product of:
          11.575837 = tf(freq=134.0), with freq of:
            134.0 = termFreq=134.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.015625 = fieldNorm(doc=91)
    0.014544915 = weight(_text_:und in 91) [ClassicSimilarity], result of:
      0.014544915 = score(doc=91,freq=134.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.40087974 = fieldWeight in 91, product of:
          11.575837 = tf(freq=134.0), with freq of:
            134.0 = termFreq=134.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.015625 = fieldNorm(doc=91)
    0.0070617595 = product of:
      0.014123519 = sum of:
        0.014123519 = weight(_text_:allgemein in 91) [ClassicSimilarity], result of:
          0.014123519 = score(doc=91,freq=4.0), product of:
            0.08601499 = queryWeight, product of:
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.016370254 = queryNorm
            0.16419834 = fieldWeight in 91, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.015625 = fieldNorm(doc=91)
      0.5 = coord(1/2)
    0.006411523 = product of:
      0.012823046 = sum of:
        0.012823046 = weight(_text_:insgesamt in 91) [ClassicSimilarity], result of:
          0.012823046 = score(doc=91,freq=2.0), product of:
            0.097466595 = queryWeight, product of:
              5.953884 = idf(docFreq=311, maxDocs=44218)
              0.016370254 = queryNorm
            0.1315635 = fieldWeight in 91, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.953884 = idf(docFreq=311, maxDocs=44218)
              0.015625 = fieldNorm(doc=91)
      0.5 = coord(1/2)
    0.012823046 = weight(_text_:insgesamt in 91) [ClassicSimilarity], result of:
      0.012823046 = score(doc=91,freq=2.0), product of:
        0.097466595 = queryWeight, product of:
          5.953884 = idf(docFreq=311, maxDocs=44218)
          0.016370254 = queryNorm
        0.1315635 = fieldWeight in 91, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.953884 = idf(docFreq=311, maxDocs=44218)
          0.015625 = fieldNorm(doc=91)
  0.17073171 = coord(7/41)
```
Abstract

Der vorliegende Band enthält Beiträge namhafter Autoren aus den Bereichen Informationswissenschaft, Computerlinguistik, Kommunikationswissenschaft, Bibliothekswesen und verwandten Fächern. Es werden sowohl aktuelle theoretische Themen behandelt, etwa zu Medientheorie und Internet, zum Verhältnis von Information und kulturellem Gedächtnis oder über Information im Museum, als auch praktische Anwendungen und Vorschläge gegeben, wie z.B. zur Automatischen Indexierung und zur Wissensrepräsentation.

BK

18.00 Einzelne Sprachen und Literaturen allgemein

Classification

18.00 Einzelne Sprachen und Literaturen allgemein

Content

Inhalt: Information und Sprache und mehr - eine Einleitung - Information und Kommunikation Wolf Rauch: Auch Information ist eine Tochter der Zeit Winfried Lenders: Information und kulturelles Gedächtnis Rainer Hammwöhner: Anmerkungen zur Grundlegung der Informationsethik Hans W. Giessen: Ehrwürdig stille Informationen Gernot Wersig: Vereinheitlichte Medientheorie und ihre Sicht auf das Internet Johann Haller, Anja Rütten: Informationswissenschaft und Translationswissenschaft: Spielarten oder Schwestern? Rainer Kuhlen: In Richtung Summarizing für Diskurse in K3 Werner Schweibenz: Sprache, Information und Bedeutung im Museum. Narrative Vermittlung durch Storytelling - Sprache und Computer, insbesondere Information Retrieval und Automatische Indexierung Manfred Thiel: Bedingt wahrscheinliche Syntaxbäume Jürgen Krause: Shell Model, Semantic Web and Web Information Retrieval Elisabeth Niggemann: Wer suchet, der findet? Verbesserung der inhaltlichen Suchmöglichkeiten im Informationssystem Der Deutschen Bibliothek Christa Womser-Hacker: Zur Rolle von Eigennamen im Cross-Language Information Retrieval Klaus-Dirk Schmitz: Wörterbuch, Thesaurus, Terminologie, Ontologie. Was tragen Terminologiewissenschaft und Informationswissenschaft zur Wissensordnung bei?
Jiri Panyr: Thesauri, Semantische Netze, Frames, Topic Maps, Taxonomien, Ontologien - begriffliche Verwirrung oder konzeptionelle Vielfalt? Heinz-Dieter Maas: Indexieren mit AUTINDEX Wilhelm Gaus, Rainer Kaluscha: Maschinelle inhaltliche Erschließung von Arztbriefen und Auswertung von Reha-Entlassungsberichten Klaus Lepsky: Automatische Indexierung des Reallexikons zur Deutschen Kunstgeschichte - Analysen und Entwicklungen Ilse Harms: Die computervermittelte Kommunikation als ein Instrument des Wissensmanagements in Organisationen August- Wilhelm Scheer, Dirk Werth: Geschäftsregel-basiertes Geschäftsprozessmanagement Thomas Seeger: Akkreditierung und Evaluierung von Hochschullehre und -forschung in Großbritannien. Hinweise für die Situation in Deutschland Bernd Hagenau: Gehabte Sorgen hab' ich gern? Ein Blick zurück auf die Deutschen Bibliothekartage 1975 bis 1980 - Persönliches Jorgo Chatzimarkakis: Sprache und Information in Europa Alfred Gulden: 7 Briefe und eine Anmerkung Günter Scholdt: Der Weg nach Europa im Spiegel von Mundartgedichten Alfred Guldens Wolfgang Müller: Prof. Dr. Harald H. Zimmermann - Seit 45 Jahren der Universität des Saarlandes verbunden Heinz-Dirk Luckhardt: Computerlinguistik und Informationswissenschaft: Facetten des wissenschaftlichen Wirkens von Harald H. Zimmermann Schriftenverzeichnis Harald H. Zimmermanns 1967-2005 - Projekte in Verantwortung von Harald H. Zimmermann - Adressen der Beiträgerinnen und Beiträger

Footnote

Rez. in Mitt. VÖB 59(2006) Nr.3, S.75-78 (O. Oberhauser): "Beim vorliegenden Buch handelt es sich um die Festschrift zum 65. Geburtstag des mit Ende des Sommersemesters 2006 in den Ruhestand getretenen Universitätsprofessors für Informationswissenschaft, Harald H. Zimmermann, jenes 1941 in Völklingen geborenen Computerlinguisten, der die Informationswissenschaft als akademische Disziplin in Deutschland mitbegründet und seit 1980 an der Universität des Saarlandes vertreten hat. Die insgesamt 26 Beiträge des von Professor Zimmermanns Mitarbeitern betreuten, optisch gediegen anmutenden Saur-Bandes gliedern sich - so das Inhaltsverzeichnis - in vier Themenschwerpunkte: - Information und Kommunikation - Sprache und Computer, insbesondere Information Retrieval und Automatische Indexierung - Analysen und Entwicklungen - Persönliches Die Aufsätze selbst variieren, wie bei Festschriften üblich bzw. unvermeidbar, hinsichtlich Länge, Stil, thematischem Detail und Anspruchsniveau. Neben wissenschaftlichen Beiträgen findet man hier auch Reminiszenzen und Literarisches. Die nachfolgende Auswahl zeigt, was mich selbst an diesem Buch interessiert hat:
In Information und kulturelles Gedächtnis (S. 7-15) plädiert der Kommunikationswissenschaftler Winfried Lenders (Bonn) dafür, Information nicht mit dem zu identifizieren, was heute als (kulturelles) Gedächtnis bezeichnet wird. Information ist ein Prozess bzw. Vorgang und kein manifestes Substrat; sie setzt aber ein solches Substrat, nämlich das im (kulturellen) Gedächtnis abgespeicherte Wissen, voraus. Allerdings führt nicht jedes Informieren zu einer Vermehrung des kulturellen Gedächtnisses - das notwendige Auswahlkriterium liegt jedoch nicht in der grundsätzliche Möglichkeit zum Speichern von Inhalten. Es liegt auch nicht ausschliesslich in formalisierten Aussonderungsmechanismen wie Skartieren, Zitationsindizes und Relevanzrangreihen, sondern in der gesellschaftlichen Kommunikation schlechthin. Auch an die Verfügbarkeit des Schriftlichen ist das kulturelle Gedächtnis nicht gebunden, zumal ja auch in Kulturen der Oralität gesellschaftlich Wichtiges aufbewahrt wird. Rainer Hammwöhner (Regensburg) geht in Anmerkungen zur Grundlegung der Informationsethik (S. 17-27) zunächst auf die "Überversorgung" des Informationssektors mit Spezialethiken ein, wobei er neben der (als breiter angesehenen) Informationsethik konkurrierende Bereichsethiken wie Medienethik, Computerethik und Netzethik/Cyberethik thematisiert und Überlappungen, Abgrenzung, Hierarchisierung etc. diskutiert. Versuche einer diskursethischen wie einer normenethischen Begründung der Informationsethik sind nach Hammwöhner zum Scheitern verurteilt, sodass er einen pragmatistischen Standpunkt einnimmt, wonach Informationsethik ganz einfach "die Analyse und Systematisierung der im Zusammenhang der digitalen Kommunikation etablierten normativen Handlungsmuster" zu leisten habe. In diesem Konnex werden Fragen wie jene nach dem Guten, aber auch Aspekte wie die Bewahrung des kulturellen Erbes für spätere Generationen und der Erhalt der kulturellen Mannigfaltigkeit angesprochen. Der Beitrag des vor kurzem verstorbenen Gründungsvaters der deutschen Informationswissenschaft, Gernot Wersig (Berlin), ist mit Vereinheitlichte Medientheorie und ihre Sicht auf das Internet (S. 35-46) überschrieben. Der Autor gibt darin einen kurzen Überblick über bisherige medientheoretische Ansätze und versucht sodann - ausgehend von den Werken Niklas Luhmanns und Herbert Stachowiaks - eine "vereinheitlichte Medientheorie" zu entwickeln. Dabei werden die Faktoren Kommunikation, Medien, Medienplattformen und -typologien, Medienevolution und schließlich die digitale Revolution diskutiert. Das Internet, so folgert Wersig, sei eine Medienplattform mit dem Potential, eine ganze Epoche zu gestalten. In Anlehnung an den bekannten Begriff "Gutenberg-Galaxis" spricht er hier auch von einer "Internet-Galaxie". Obwohl dieser Artikel viele interessante Gedanken enthält, erschließt er sich dem Leser leider nur schwer, da vieles vorausgesetzt wird und auch der gewählte Soziologenjargon nicht jedermanns Sache ist.
In Thesauri, Semantische Netze, Frames, Topic Maps, Taxonomien, Ontologien - begriffliche Verwirrung oder konzeptionelle Vielfalt? (S. 139-151) gibt Jiri Panyr (München/Saarbrücken) eine gut lesbare und nützliche Übersicht über die im Titel des Beitrags genannten semantischen Repräsentationsformen, die im Zusammenhang mit dem Internet und insbesondere mit dem vorgeschlagenen Semantic Web immer wieder - und zwar häufig unpräzise oder gar unrichtig - Anwendung finden. Insbesondere die Ausführungen zum Modebegriff Ontologie zeigen, dass dieser nicht leichtfertig als Quasi-Synonym zu Thesaurus oder Klassifikation verwendet werden darf. Panyrs Beitrag ist übrigens thematisch verwandt mit jenem von K.-D. Schmitz (Köln), Wörterbuch, Thesaurus, Terminologie, Ontologie (S. 129-137). Abgesehen von dem einfallslosen Titel Wer suchet, der findet? (S. 107- 118) - zum Glück mit dem Untertitel Verbesserung der inhaltlichen Suchmöglichkeiten im Informationssystem Der Deutschen Bibliothek versehen - handelt es sich bei diesem Artikel von Elisabeth Niggemann (Frankfurt am Main) zwar um keinen wissenschaftlichen, doch sicherlich den praktischsten, lesbarsten und aus bibliothekarischer Sicht interessantesten des Buches. Niggemann gibt einen Überblick über die bisherige sachliche Erschliessung der bibliographischen Daten der inzwischen zur Deutschen Nationalbibliothek mutierten DDB, sowie einen Statusbericht nebst Ausblick über gegenwärtige bzw. geplante Verbesserungen der inhaltlichen Suche. Dazu zählen der breite Einsatz eines automatischen Indexierungsverfahrens (MILOS/IDX) ebenso wie Aktivitäten im klassifikatorischen Bereich (DDC), die Vernetzung nationaler Schlagwortsysteme (Projekt MACS) sowie die Beschäftigung mit Crosskonkordanzen (CARMEN) und Ansätzen zur Heterogenitätsbehandlung. Das hier von zentraler Stelle deklarierte "commitment" hinsichtlich der Verbesserung der sachlichen Erschließung des nationalen Online-Informationssystems erfüllt den eher nur Kleinmut und Gleichgültigkeit gewohnten phäakischen Beobachter mit Respekt und wehmutsvollem Neid.
Mit automatischer Indexierung beschäftigen sich auch zwei weitere Beiträge. Indexieren mit AUTINDEX von H.-D. Mass (Saarbrücken) ist leider knapp und ohne didaktische Ambition verfasst, sodass man sich nicht wirklich vorstellen kann, wie dieses System funktioniert. Übersichtlicher stellt sich der Werkstattbericht Automatische Indexierung des Reallexikons zur deutschen Kunstgeschichte von K. Lepsky (Köln) dar, der zeigt, welche Probleme und Schritte bei der Digitalisierung, Indexierung und Web-Präsentation der Volltexte eines grossen fachlichen Nachschlagewerkes anfallen. Weitere interessante Beiträge befassen sich z.B. mit Summarizing-Leistungen im Rahmen eines e-Learning-Projektes (R. Kuhlen), mit dem Schalenmodell und dem Semantischen Web (J. Krause; aus nicht näher dargelegten Gründen in englischer Sprache) und mit der Akkreditierung/ Evaluierung von Hochschullehre und -forschung in Großbritannien (T. Seeger). In Summe liegt hier eine würdige Festschrift vor, über die sich der Gefeierte sicherlich gefreut haben wird. Für informationswissenschaftliche Spezialsammlungen und größere Bibliotheken ist der Band allemal eine Bereicherung. Ein Wermutstropfen aber doch: Obzwar mit Information und Sprache ein optisch ansprechend gestaltetes Buch produziert wurde, enthüllt eine nähere Betrachtung leider allzu viele Druckfehler, mangelhafte Worttrennungen, unkorrigierte grammatikalische Fehler, sowie auch Inkonsistenzen bei Kursivdruck und Satzzeichen. Lektoren und Korrektoren sind, so muss man wieder einmal schmerzlich zur Kenntnis nehmen, ein aussterbender Berufsstand."

RSWK

Informations- und Dokumentationswissenschaft / Aufsatzsammlung

Subject

Informations- und Dokumentationswissenschaft / Aufsatzsammlung

Computerlinguistik und Sprachtechnologie : Eine Einführung (2001) 0.01

0.012651091 = product of:
  0.10373895 = sum of:
    0.04208137 = product of:
      0.08416274 = sum of:
        0.08416274 = weight(_text_:morphologie in 1749) [ClassicSimilarity], result of:
          0.08416274 = score(doc=1749,freq=2.0), product of:
            0.14416489 = queryWeight, product of:
              8.806516 = idf(docFreq=17, maxDocs=44218)
              0.016370254 = queryNorm
            0.583795 = fieldWeight in 1749, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.806516 = idf(docFreq=17, maxDocs=44218)
              0.046875 = fieldNorm(doc=1749)
      0.5 = coord(1/2)
    0.01922059 = weight(_text_:und in 1749) [ClassicSimilarity], result of:
      0.01922059 = score(doc=1749,freq=26.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.5297484 = fieldWeight in 1749, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1749)
    0.01922059 = weight(_text_:und in 1749) [ClassicSimilarity], result of:
      0.01922059 = score(doc=1749,freq=26.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.5297484 = fieldWeight in 1749, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1749)
    0.0039958097 = product of:
      0.007991619 = sum of:
        0.007991619 = weight(_text_:4 in 1749) [ClassicSimilarity], result of:
          0.007991619 = score(doc=1749,freq=2.0), product of:
            0.04442393 = queryWeight, product of:
              2.7136984 = idf(docFreq=7967, maxDocs=44218)
              0.016370254 = queryNorm
            0.17989448 = fieldWeight in 1749, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.7136984 = idf(docFreq=7967, maxDocs=44218)
              0.046875 = fieldNorm(doc=1749)
      0.5 = coord(1/2)
    0.01922059 = weight(_text_:und in 1749) [ClassicSimilarity], result of:
      0.01922059 = score(doc=1749,freq=26.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.5297484 = fieldWeight in 1749, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1749)
  0.12195122 = coord(5/41)

Abstract: Dieses Lehrbuch bietet eine umfassende Einführung in Grundlagen und Methoden der Computerlinguistik und stellt die wichtigsten Anwendungsgebiete in der Sprachtechnologie vor. Es richtet sich gleichermaßen an Studierende der Computerlinguistik und verwandter Fächer mit Bezug zur Verarbeitung natürlicher Sprache wie an Entwickler sprachverarbeitender Systeme. Nach einem Überblick über Aufgaben und Ziele der Computerlinguistik werden die erforderlichen theoretischen Grundlagen zur Logik, den Formalen Sprachen und statistischen Verfahren ausführlich und beispielbezogen erläutert. Es schließt sich eine Darstellung der verschiedenen Methoden für die Verarbeitung auf den linguistischen Beschreibungsebenen an. Dabei werden zunächst die grundlegenden Begriffe und Konzepte der Phonetik, Morphologie, Syntax, Semantik sowie der Pragmatik vermittelt und darauf aufbauend die Prinzipien der sprachtechnologischen Umsetzung behandelt. Der letzte Teil des Buchs gibt einen Überblick über die sprachtechnologischen Anwendungen in der Praxis und zeigt anhand einer Vielzahl konkreter Fragestellungen - von Spracherkennung über Sprachsynthese, Information Retrieval bis hin zu Dialogsystemen und automatischer Übersetzung - das Zusammenwirken der einzelnen Methoden auf. "Durch dieses Handbuch wird für den deutschsprachigen Raum eine empfindliche Lücke geschlossen. Es umfasst die relevanten Aspekte computerlinguistischer Grundlagenwissenschaft und sprachtechnologischer Anwendung in eindrucksvoller Breite und auf aktuellem Stand" [Manfred Pinkal]
Isbn: 3-8274-1027-4

¬Die Bibel als Stilkompass (2019) 0.01

0.011927405 = product of:
  0.097804725 = sum of:
    0.0099334195 = weight(_text_:und in 5331) [ClassicSimilarity], result of:
      0.0099334195 = score(doc=5331,freq=10.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.27378 = fieldWeight in 5331, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5331)
    0.0099334195 = weight(_text_:und in 5331) [ClassicSimilarity], result of:
      0.0099334195 = score(doc=5331,freq=10.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.27378 = fieldWeight in 5331, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5331)
    0.0099334195 = weight(_text_:und in 5331) [ClassicSimilarity], result of:
      0.0099334195 = score(doc=5331,freq=10.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.27378 = fieldWeight in 5331, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5331)
    0.022668157 = product of:
      0.045336314 = sum of:
        0.045336314 = weight(_text_:insgesamt in 5331) [ClassicSimilarity], result of:
          0.045336314 = score(doc=5331,freq=4.0), product of:
            0.097466595 = queryWeight, product of:
              5.953884 = idf(docFreq=311, maxDocs=44218)
              0.016370254 = queryNorm
            0.4651472 = fieldWeight in 5331, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.953884 = idf(docFreq=311, maxDocs=44218)
              0.0390625 = fieldNorm(doc=5331)
      0.5 = coord(1/2)
    0.045336314 = weight(_text_:insgesamt in 5331) [ClassicSimilarity], result of:
      0.045336314 = score(doc=5331,freq=4.0), product of:
        0.097466595 = queryWeight, product of:
          5.953884 = idf(docFreq=311, maxDocs=44218)
          0.016370254 = queryNorm
        0.4651472 = fieldWeight in 5331, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.953884 = idf(docFreq=311, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5331)
  0.12195122 = coord(5/41)

Content: "Die Heilige Schrift gibt es nicht nur in mehreren hundert Sprachen, sondern oft innerhalb eines Sprachraums auch in mehreren Varianten. Britische Leser konnen unter anderem zwischen der bewusst sehr einfach geschriebenen Bible in Basic English und der linguistisch komplexen King James Version aus dem 17. Jahrhundert wahlen. Die Fassungen unterscheiden sich in Satzlänge, Wortwahl sowie Förmlichkeit und sprechen so Menschen aus verschiedenen Kulturen und mit unterschiedlichem Bildungsstand an. Ein Team um Keith Carlson vom Dartmouth College will die insgesamt 34 englischsprachigen Versionen der Bibel nun dazu nutzen, um Computern unterschiedliche Stilformen beizubringen Bisher übersetzen entsprechende Programme zwar Fremdsprachen, zum Teil mit beeindruckender Genauigkeit. Oft scheitern sie aber, wenn sie einen Text zielsicher stilistisch verändern sollen, vor allem wenn es dabei um mehr als ein einzelnes Merkmal wie beispielsweise die Komplexität geht. Die Bibel eigne sich mit ihren rund 31 000 Versen wie kein anderes Werk für das Training von Übersetzungsprogrammen, argumentiert das Team um Carlson. Schließlich seien alle Fassungen sehr gewissenhaft von Menschen übersetzt und außerdem Vers für Vers durchnummeriert worden. Das erleichtere einer Maschine die Zuordnung und sei bei anderen umfangreichen Schriftquellen wie dem Werk von William Shakespeare oder der Wikipedia nicht zwangsläufig der Fall. Als erste Demonstration haben die Forscher zwei Algorithmen, von denen einer auf neuronalen Netzen basierte, mit acht frei im Internet verfügbaren Bibelversionen trainiert. Anschließend testeten sie, wie gut die beiden Programme Verse der Vorlagen in einen gewünschten Stil übertrugen, ohne dass die Software auf die anvisierte Fassung der Bibel zugreifen konnte. Insgesamt seien die automatischen Übersetzer dem Ziel schon recht nahegekommen, berichten die Forscher. Sie sehen ihre Arbeit aber erst als Startpunkt bei der Entwicklung einer künstlichen Intelligenz, die souverän zwischen verschiedenen Sprachstilen wechseln kann."

Kummer, N.: Indexierungstechniken für das japanische Retrieval (2006) 0.01

0.011053197 = product of:
  0.11329527 = sum of:
    0.015893472 = weight(_text_:und in 5979) [ClassicSimilarity], result of:
      0.015893472 = score(doc=5979,freq=10.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.438048 = fieldWeight in 5979, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=5979)
    0.06561485 = weight(_text_:einzelner in 5979) [ClassicSimilarity], result of:
      0.06561485 = score(doc=5979,freq=2.0), product of:
        0.110237986 = queryWeight, product of:
          6.7340426 = idf(docFreq=142, maxDocs=44218)
          0.016370254 = queryNorm
        0.5952109 = fieldWeight in 5979, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.7340426 = idf(docFreq=142, maxDocs=44218)
          0.0625 = fieldNorm(doc=5979)
    0.015893472 = weight(_text_:und in 5979) [ClassicSimilarity], result of:
      0.015893472 = score(doc=5979,freq=10.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.438048 = fieldWeight in 5979, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=5979)
    0.015893472 = weight(_text_:und in 5979) [ClassicSimilarity], result of:
      0.015893472 = score(doc=5979,freq=10.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.438048 = fieldWeight in 5979, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=5979)
  0.09756097 = coord(4/41)

Abstract: Der vorliegende Artikel beschreibt die Herausforderungen, die die japanische Sprache aufgrund der besonderen Struktur ihres Schriftsystems an das Information Retrieval stellt und präsentiert Strategien und Ansätze für die Indexierung japanischer Dokumente. Im Besonderen soll auf die Effektivität aussprachebasierter (yomi-based) Indexierung sowie Fusion verschiedener einzelner Indexierungsansätze eingegangen werden.
Source: Effektive Information Retrieval Verfahren in Theorie und Praxis: ausgewählte und erweiterte Beiträge des Vierten Hildesheimer Evaluierungs- und Retrievalworkshop (HIER 2005), Hildesheim, 20.7.2005. Hrsg.: T. Mandl u. C. Womser-Hacker

Sparck Jones, K.; Kay, M.: Linguistik und Informationswissenschaft (1976) 0.01

0.010125747 = product of:
  0.10378891 = sum of:
    0.056108493 = product of:
      0.11221699 = sum of:
        0.11221699 = weight(_text_:morphologie in 3) [ClassicSimilarity], result of:
          0.11221699 = score(doc=3,freq=2.0), product of:
            0.14416489 = queryWeight, product of:
              8.806516 = idf(docFreq=17, maxDocs=44218)
              0.016370254 = queryNorm
            0.7783933 = fieldWeight in 3, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.806516 = idf(docFreq=17, maxDocs=44218)
              0.0625 = fieldNorm(doc=3)
      0.5 = coord(1/2)
    0.015893472 = weight(_text_:und in 3) [ClassicSimilarity], result of:
      0.015893472 = score(doc=3,freq=10.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.438048 = fieldWeight in 3, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=3)
    0.015893472 = weight(_text_:und in 3) [ClassicSimilarity], result of:
      0.015893472 = score(doc=3,freq=10.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.438048 = fieldWeight in 3, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=3)
    0.015893472 = weight(_text_:und in 3) [ClassicSimilarity], result of:
      0.015893472 = score(doc=3,freq=10.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.438048 = fieldWeight in 3, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=3)
  0.09756097 = coord(4/41)

Abstract: Diese Arbeit befaßt sich mit den sprachlichen Aspekten der Informationswissenschaft, insbesondere mit den sprachlichen Komponenten der Analyse, der beschreibung und dem Retrieval von Dokumenten. Dabei wird erforscht, welche linguistischen Verfahren und Theorien von der Informationswissenschaft genützt werden können. Unter anderem werden untersucht die Anwendung der Sprachtheorie auf die Struktur der Erkenntnis, die Verwertung der Phonologie, Morphologie, Syntax und Semantik in der Organisation, der Speicherung und in der Überbringung von Informationen

Kuhlen, R.: Experimentelle Morphologie in der Informationswissenschaft (1977) 0.01

0.010116374 = product of:
  0.10369284 = sum of:
    0.08503492 = product of:
      0.17006984 = sum of:
        0.17006984 = weight(_text_:morphologie in 4253) [ClassicSimilarity], result of:
          0.17006984 = score(doc=4253,freq=6.0), product of:
            0.14416489 = queryWeight, product of:
              8.806516 = idf(docFreq=17, maxDocs=44218)
              0.016370254 = queryNorm
            1.1796898 = fieldWeight in 4253, product of:
              2.4494898 = tf(freq=6.0), with freq of:
                6.0 = termFreq=6.0
              8.806516 = idf(docFreq=17, maxDocs=44218)
              0.0546875 = fieldNorm(doc=4253)
      0.5 = coord(1/2)
    0.0062193046 = weight(_text_:und in 4253) [ClassicSimilarity], result of:
      0.0062193046 = score(doc=4253,freq=2.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.17141339 = fieldWeight in 4253, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4253)
    0.0062193046 = weight(_text_:und in 4253) [ClassicSimilarity], result of:
      0.0062193046 = score(doc=4253,freq=2.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.17141339 = fieldWeight in 4253, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4253)
    0.0062193046 = weight(_text_:und in 4253) [ClassicSimilarity], result of:
      0.0062193046 = score(doc=4253,freq=2.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.17141339 = fieldWeight in 4253, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4253)
  0.09756097 = coord(4/41)

Content: Zugl.: Regensburg, Univ., Diss. u.d.T.: Kuhlen, Rainer: Flexine und Derivative in der maschinellen Verarbeitung englischer Texte
RSWK: Automatische Sprachanalyse / Morphologie <Linguistik>
Subject: Automatische Sprachanalyse / Morphologie <Linguistik>

Rötzer, F.: Computer ergooglen die Bedeutung von Worten (2005) 0.01
```
0.008217714 = product of:
  0.05615438 = sum of:
    0.012782888 = weight(_text_:und in 3385) [ClassicSimilarity], result of:
      0.012782888 = score(doc=3385,freq=46.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.3523156 = fieldWeight in 3385, product of:
          6.78233 = tf(freq=46.0), with freq of:
            46.0 = termFreq=46.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0234375 = fieldNorm(doc=3385)
    0.007490127 = product of:
      0.014980254 = sum of:
        0.014980254 = weight(_text_:allgemein in 3385) [ClassicSimilarity], result of:
          0.014980254 = score(doc=3385,freq=2.0), product of:
            0.08601499 = queryWeight, product of:
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.016370254 = queryNorm
            0.17415863 = fieldWeight in 3385, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.0234375 = fieldNorm(doc=3385)
      0.5 = coord(1/2)
    0.012782888 = weight(_text_:und in 3385) [ClassicSimilarity], result of:
      0.012782888 = score(doc=3385,freq=46.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.3523156 = fieldWeight in 3385, product of:
          6.78233 = tf(freq=46.0), with freq of:
            46.0 = termFreq=46.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0234375 = fieldNorm(doc=3385)
    0.0028254644 = product of:
      0.0056509287 = sum of:
        0.0056509287 = weight(_text_:4 in 3385) [ClassicSimilarity], result of:
          0.0056509287 = score(doc=3385,freq=4.0), product of:
            0.04442393 = queryWeight, product of:
              2.7136984 = idf(docFreq=7967, maxDocs=44218)
              0.016370254 = queryNorm
            0.12720461 = fieldWeight in 3385, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              2.7136984 = idf(docFreq=7967, maxDocs=44218)
              0.0234375 = fieldNorm(doc=3385)
      0.5 = coord(1/2)
    0.012782888 = weight(_text_:und in 3385) [ClassicSimilarity], result of:
      0.012782888 = score(doc=3385,freq=46.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.3523156 = fieldWeight in 3385, product of:
          6.78233 = tf(freq=46.0), with freq of:
            46.0 = termFreq=46.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0234375 = fieldNorm(doc=3385)
    0.007490127 = product of:
      0.014980254 = sum of:
        0.014980254 = weight(_text_:allgemein in 3385) [ClassicSimilarity], result of:
          0.014980254 = score(doc=3385,freq=2.0), product of:
            0.08601499 = queryWeight, product of:
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.016370254 = queryNorm
            0.17415863 = fieldWeight in 3385, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.0234375 = fieldNorm(doc=3385)
      0.5 = coord(1/2)
  0.14634146 = coord(6/41)
```
Content

"Wie könnten Computer Sprache lernen und dabei auch die Bedeutung von Worten sowie die Beziehungen zwischen ihnen verstehen? Dieses Problem der Semantik stellt eine gewaltige, bislang nur ansatzweise bewältigte Aufgabe dar, da Worte und Wortverbindungen oft mehrere oder auch viele Bedeutungen haben, die zudem vom außersprachlichen Kontext abhängen. Die beiden holländischen (Ein künstliches Bewusstsein aus einfachen Aussagen (1)). Paul Vitanyi (2) und Rudi Cilibrasi vom Nationalen Institut für Mathematik und Informatik (3) in Amsterdam schlagen eine elegante Lösung vor: zum Nachschlagen im Internet, der größten Datenbank, die es gibt, wird einfach Google benutzt. Objekte wie eine Maus können mit ihren Namen "Maus" benannt werden, die Bedeutung allgemeiner Begriffe muss aus ihrem Kontext gelernt werden. Ein semantisches Web zur Repräsentation von Wissen besteht aus den möglichen Verbindungen, die Objekte und ihre Namen eingehen können. Natürlich können in der Wirklichkeit neue Namen, aber auch neue Bedeutungen und damit neue Verknüpfungen geschaffen werden. Sprache ist lebendig und flexibel. Um einer Künstlichen Intelligenz alle Wortbedeutungen beizubringen, müsste mit der Hilfe von menschlichen Experten oder auch vielen Mitarbeitern eine riesige Datenbank mit den möglichen semantischen Netzen aufgebaut und dazu noch ständig aktualisiert werden. Das aber müsste gar nicht notwendig sein, denn mit dem Web gibt es nicht nur die größte und weitgehend kostenlos benutzbare semantische Datenbank, sie wird auch ständig von zahllosen Internetnutzern aktualisiert. Zudem gibt es Suchmaschinen wie Google, die Verbindungen zwischen Worten und damit deren Bedeutungskontext in der Praxis in ihrer Wahrscheinlichkeit quantitativ mit der Angabe der Webseiten, auf denen sie gefunden wurden, messen.
Mit einem bereits zuvor von Paul Vitanyi und anderen entwickeltem Verfahren, das den Zusammenhang von Objekten misst (normalized information distance - NID ), kann die Nähe zwischen bestimmten Objekten (Bilder, Worte, Muster, Intervalle, Genome, Programme etc.) anhand aller Eigenschaften analysiert und aufgrund der dominanten gemeinsamen Eigenschaft bestimmt werden. Ähnlich können auch die allgemein verwendeten, nicht unbedingt "wahren" Bedeutungen von Namen mit der Google-Suche erschlossen werden. 'At this moment one database stands out as the pinnacle of computer-accessible human knowledge and the most inclusive summary of statistical information: the Google search engine. There can be no doubt that Google has already enabled science to accelerate tremendously and revolutionized the research process. It has dominated the attention of internet users for years, and has recently attracted substantial attention of many Wall Street investors, even reshaping their ideas of company financing.' (Paul Vitanyi und Rudi Cilibrasi) Gibt man ein Wort ein wie beispielsweise "Pferd", erhält man bei Google 4.310.000 indexierte Seiten. Für "Reiter" sind es 3.400.000 Seiten. Kombiniert man beide Begriffe, werden noch 315.000 Seiten erfasst. Für das gemeinsame Auftreten beispielsweise von "Pferd" und "Bart" werden zwar noch immer erstaunliche 67.100 Seiten aufgeführt, aber man sieht schon, dass "Pferd" und "Reiter" enger zusammen hängen. Daraus ergibt sich eine bestimmte Wahrscheinlichkeit für das gemeinsame Auftreten von Begriffen. Aus dieser Häufigkeit, die sich im Vergleich mit der maximalen Menge (5.000.000.000) an indexierten Seiten ergibt, haben die beiden Wissenschaftler eine statistische Größe entwickelt, die sie "normalised Google distance" (NGD) nennen und die normalerweise zwischen 0 und 1 liegt. Je geringer NGD ist, desto enger hängen zwei Begriffe zusammen. "Das ist eine automatische Bedeutungsgenerierung", sagt Vitanyi gegenüber dern New Scientist (4). "Das könnte gut eine Möglichkeit darstellen, einen Computer Dinge verstehen und halbintelligent handeln zu lassen." Werden solche Suchen immer wieder durchgeführt, lässt sich eine Karte für die Verbindungen von Worten erstellen. Und aus dieser Karte wiederum kann ein Computer, so die Hoffnung, auch die Bedeutung der einzelnen Worte in unterschiedlichen natürlichen Sprachen und Kontexten erfassen. So habe man über einige Suchen realisiert, dass ein Computer zwischen Farben und Zahlen unterscheiden, holländische Maler aus dem 17. Jahrhundert und Notfälle sowie Fast-Notfälle auseinander halten oder elektrische oder religiöse Begriffe verstehen könne. Überdies habe eine einfache automatische Übersetzung Englisch-Spanisch bewerkstelligt werden können. Auf diese Weise ließe sich auch, so hoffen die Wissenschaftler, die Bedeutung von Worten erlernen, könne man Spracherkennung verbessern oder ein semantisches Web erstellen und natürlich endlich eine bessere automatische Übersetzung von einer Sprache in die andere realisieren.
Links (1) http://www.telepolis.de/r4/artikel/8/8653/1.html (2) http://homepages.cwi.nl/ paulv/ (3) http://www.cwi.nl/ (4) http://www.newscientist.com/
Winterschladen, S.; Gurevych, I.: ¬Die perfekte Suchmaschine : Forschungsgruppe entwickelt ein System, das artverwandte Begriffe finden soll (2006) 0.01
```
0.007990315 = product of:
  0.06552058 = sum of:
    0.01800991 = weight(_text_:medizin in 5912) [ClassicSimilarity], result of:
      0.01800991 = score(doc=5912,freq=2.0), product of:
        0.087316625 = queryWeight, product of:
          5.333859 = idf(docFreq=579, maxDocs=44218)
          0.016370254 = queryNorm
        0.2062598 = fieldWeight in 5912, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.333859 = idf(docFreq=579, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5912)
    0.01800991 = weight(_text_:medizin in 5912) [ClassicSimilarity], result of:
      0.01800991 = score(doc=5912,freq=2.0), product of:
        0.087316625 = queryWeight, product of:
          5.333859 = idf(docFreq=579, maxDocs=44218)
          0.016370254 = queryNorm
        0.2062598 = fieldWeight in 5912, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.333859 = idf(docFreq=579, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5912)
    0.009833585 = weight(_text_:und in 5912) [ClassicSimilarity], result of:
      0.009833585 = score(doc=5912,freq=20.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.27102837 = fieldWeight in 5912, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5912)
    0.009833585 = weight(_text_:und in 5912) [ClassicSimilarity], result of:
      0.009833585 = score(doc=5912,freq=20.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.27102837 = fieldWeight in 5912, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5912)
    0.009833585 = weight(_text_:und in 5912) [ClassicSimilarity], result of:
      0.009833585 = score(doc=5912,freq=20.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.27102837 = fieldWeight in 5912, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5912)
  0.12195122 = coord(5/41)
```
Content

"KÖLNER STADT-ANZEIGER: Frau Gurevych, Sie entwickeln eine Suchmaschine der nächsten Generation? Wie kann man sich diese vorstellen? IRYNA GUREVYCH Jeder kennt die herkömmlichen Suchmaschinen wie Google, Yahoo oder Altavista. Diese sind aber nicht perfekt, weil sie nur nach dem Prinzip der Zeichenerkennung funktionieren. Das steigende Informationsbedürfnis können herkömmliche Suchmaschinen nicht befriedigen. KStA: Wieso nicht? GUREVYCH Nehmen wir mal ein konkretes Beispiel: Sie suchen bei Google nach einem Rezept für einen Kuchen, der aber kein Obst enthalten soll. Keine Suchmaschine der Welt kann bisher sinnvoll solche oder ähnliche Anfragen ausführen. Meistens kommen Tausende von Ergebnissen, in denen der Nutzer die relevanten Informationen wie eine Nadel im Heuhaufen suchen muss. KStA: Und Sie können dieses Problem lösen? GUREVYCH Wir entwickeln eine Suchmaschine, die sich nicht nur auf das System der Zeichenerkennung verlässt, sondern auch linguistische Merkmale nutzt. Unsere Suchmaschine soll also auch artverwandte Begriffe zeigen. KStA: Wie weit sind Sie mit Ihrer Forschung? GUREVYCH Das Projekt ist auf zwei Jahre angelegt. Wir haben vor einem halben Jahr begonnen, haben also noch einen großen Teil vor uns. Trotzdem sind die ersten Zwischenergebnisse schon sehr beachtlich. KStA: Und wann geht die Suchmaschine ins Internet? GUREVYCH Da es sich um ein Projekt der Deutschen Forschungsgemeinschaft handelt, wird die Suchmaschine vorerst nicht veröffentlicht. Wir sehen es als unsere Aufgabe an, Verbesserungsmöglichkeiten durch schlaue Such-Algorithmen mit unseren Forschungsarbeiten nachzuweisen und Fehler der bekannten Suchmaschinen zu beseitigen. Und da sind wir auf einem guten Weg. KStA: Arbeiten Sie auch an einem ganz speziellen Projekt? GUREVYCH Ja, ihre erste Bewährungsprobe muss die neue Technologie auf einem auf den ersten Blick ungewöhnlichen Feld bestehen: Unsere Forschungsgruppe an der Technischen Universität Darmstadt entwickelt derzeit ein neuartiges System zur Unterstützung Jugendlicher bei der Berufsauswahl. Dazu stellt uns die Bundesagentur für Arbeit die Beschreibungen von 5800 Berufen in Deutschland zur Verfügung. KStA: Und was sollen Sie dann mit diesen konkreten Informationen machen? GUREVYCH Jugendliche sollen unsere Suchmaschine mit einem Aufsatz über ihre beruflichen Vorlieben flittern. Das System soll dann eine Suchabfrage starten und mögliche Berufe anhand des Interesses des Jugendlichen heraussuchen. Die persönliche Beratung durch die Bundesagentur für Arbeit kann dadurch auf alternative Angebote ausgeweitet werden. Ein erster Prototyp soll Ende des Jahres bereitstehen. KStA: Es geht also zunächst einmal nicht darum, einen Jobfür den Jugendlichen zu finden, sondern den perfekten Beruf für ihn zu ermitteln? GUREVYCH Ja, anhand der Beschreibung des Jugendlichen startet die Suchmaschine eine semantische Abfrage und sucht den passenden Beruf heraus. KStA: Gab es schon weitere Anfragen seitens der Industrie? GUREVYCH Nein, wir haben bisher noch keine Werbung betrieben. Meine Erfahrung zeigt, dass angesehene Kongresse die beste Plattform sind, um die Ergebnisse zu präsentieren und auf sich aufmerksam zu machen. Einige erste Veröffentlichungen sind bereits unterwegs und werden 2006 noch erscheinen. KStA: Wie sieht denn Ihrer Meinung nach die Suchmaschine der Zukunft aus? GUREVYCH Suchmaschinen werden immer spezieller. Das heißt, dass es etwa in der Medizin, bei den Krankenkassen oder im Sport eigene Suchmaschinen geben wird. Außerdem wird die Tendenz verstärkt zu linguistischen Suchmaschinen gehen, die nach artverwandten Begriffen fahnden. Die perfekte Suchmaschine wird wohl eine Kombination aus statistischem und linguistisch-semantischem Suchverhalten sein. Algorithmen, die wir am Fachgebiet Telekooperation an der TU Darmstadt entwickeln, werden für den nächsten qualitativen Sprung bei der Entwicklung der Suchmaschinen von größter Bedeutung sein."

Manning, C.D.; Schütze, H.: Foundations of statistical natural language processing (2000) 0.01

0.007925289 = product of:
  0.06498737 = sum of:
    0.007538936 = weight(_text_:und in 1603) [ClassicSimilarity], result of:
      0.007538936 = score(doc=1603,freq=4.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.20778441 = fieldWeight in 1603, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1603)
    0.021185279 = product of:
      0.042370558 = sum of:
        0.042370558 = weight(_text_:allgemein in 1603) [ClassicSimilarity], result of:
          0.042370558 = score(doc=1603,freq=4.0), product of:
            0.08601499 = queryWeight, product of:
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.016370254 = queryNorm
            0.49259502 = fieldWeight in 1603, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.046875 = fieldNorm(doc=1603)
      0.5 = coord(1/2)
    0.007538936 = weight(_text_:und in 1603) [ClassicSimilarity], result of:
      0.007538936 = score(doc=1603,freq=4.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.20778441 = fieldWeight in 1603, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1603)
    0.007538936 = weight(_text_:und in 1603) [ClassicSimilarity], result of:
      0.007538936 = score(doc=1603,freq=4.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.20778441 = fieldWeight in 1603, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1603)
    0.021185279 = product of:
      0.042370558 = sum of:
        0.042370558 = weight(_text_:allgemein in 1603) [ClassicSimilarity], result of:
          0.042370558 = score(doc=1603,freq=4.0), product of:
            0.08601499 = queryWeight, product of:
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.016370254 = queryNorm
            0.49259502 = fieldWeight in 1603, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.046875 = fieldNorm(doc=1603)
      0.5 = coord(1/2)
  0.12195122 = coord(5/41)

BK: 18.00 (Einzelne Sprachen und Literaturen allgemein)
Classification: 18.00 (Einzelne Sprachen und Literaturen allgemein)

Thiel, M.: Bedingt wahrscheinliche Syntaxbäume (2006) 0.01
```
0.0076137604 = product of:
  0.07804105 = sum of:
    0.015077872 = weight(_text_:und in 6069) [ClassicSimilarity], result of:
      0.015077872 = score(doc=6069,freq=36.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.41556883 = fieldWeight in 6069, product of:
          6.0 = tf(freq=36.0), with freq of:
            36.0 = termFreq=36.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=6069)
    0.032807425 = weight(_text_:einzelner in 6069) [ClassicSimilarity], result of:
      0.032807425 = score(doc=6069,freq=2.0), product of:
        0.110237986 = queryWeight, product of:
          6.7340426 = idf(docFreq=142, maxDocs=44218)
          0.016370254 = queryNorm
        0.29760545 = fieldWeight in 6069, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.7340426 = idf(docFreq=142, maxDocs=44218)
          0.03125 = fieldNorm(doc=6069)
    0.015077872 = weight(_text_:und in 6069) [ClassicSimilarity], result of:
      0.015077872 = score(doc=6069,freq=36.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.41556883 = fieldWeight in 6069, product of:
          6.0 = tf(freq=36.0), with freq of:
            36.0 = termFreq=36.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=6069)
    0.015077872 = weight(_text_:und in 6069) [ClassicSimilarity], result of:
      0.015077872 = score(doc=6069,freq=36.0), product of:
        0.03628249 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.016370254 = queryNorm
        0.41556883 = fieldWeight in 6069, product of:
          6.0 = tf(freq=36.0), with freq of:
            36.0 = termFreq=36.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=6069)
  0.09756097 = coord(4/41)
```
Abstract

Es wird argumentiert, dass die Ansätze der probabilistischen kontextfreien Grammatiken und anderer Modelle nicht ausreichend sind für die Lösung der im Parsing auftretenden Probleme. Zu deren Lösung wird folgende Hypothese aufgestellt: Die Wahrscheinlichkeiten einzelner Lesarten und verschiedener Knoten in einem Syntaxbaum sind voneinander abhängig. Vereindeutigt man eine Lesart bzw. einen Knoten, hat dies Auswirkungen auf die Wahrscheinlichkeit anderer Lesarten bzw. Knoten. Daher werden alle Lesarten und Syntaxbäume in einen Graphen integriert. Wenn die Wahrscheinlichkeiten also voneinander abhängig sind, wird angenommen, dass die Theorie der bedingten Wahrscheinlichkeiten von Bayes als Basis eine Lösung produzieren sollte. An einem Beispiel wird dies nachvollzogen und die Hypothese konnte bestätigt werden.
Die Tendenz ist eindeutig: wo immer es sinnvoll ist, werden hart' programmierte Lösungen durch Ansätze des Softcomputing ersetzt. Vor allem technische und kommerzielle Bereiche profitieren davon. So finden wir Kransteuerungen und viele andere Anwendungen mit Fuzzy Expertensystemen sowie Bilderkennungssysteme und Entscheidungen über die Kreditvergabe mit Neuronalen Netzen oder auch Methoden des Maschinellen Lernens (vgl. Jafar-Shaghaghi 1994). Ein Prinzip dieser Ansätze ist, dass die Software sich automatisch an die spezielle Situation und Datengrundlage der Anwendung anpasst. Flexibilität der Anpassung und die Fähigkeit zur Verallgemeinerung auf bislang ungesehene Fälle sind implizit in den Methoden vorhanden. Gerade dies ist auch ein typisches Problem, das bei der Beschreibung und vor allem beim Parsen natürlicher Sprache auftritt. Bei der Verarbeitung natürlicher Sprache kommt das leidige Problem der Ambiguität auf verschiedenen Ebenen hinzu. Alternative Regeln schließen sich in ihrer Anwendung in einem Satz meistens gegenseitig aus und sind nicht alle an der aktuellen Stelle gleich wahrscheinlich. Auf diese Problematik wurde schon früh hingewiesen (Thiel 1987, 137 ff.), wo versucht wurde, mit Gewichtungen die Wahrscheinlichkeit von Regeln, Syntaxbäumen, Kategorien und Wortsemantik in den Griff zu bekommen. Das Gewicht eines Syntaxbaumes kann z.B. einfach zugewiesen werden oder berechnet werden als Funktion des Baumes, aus dem er abgeleitet wird, und der angewandten Regel. Ein solches Verfahren wird (Thiel 1987, 152) am Beispiel einer Heuristik für die Inferenzmaschine eines Expertensystems gezeigt. Aber auch bereits in einer sehr frühen Veröffentlichung zur Analyse natürlicher Sprache, an der Zimmermann maßgeblich beteiligt war, wurde auf Vorkommenswahrscheinlichkeiten hingewiesen: "Statistische Auswertung von Typen des Satzbaus, Bau nominaler und verbaler Gruppen ..." (Eggers et al. 1969, 18). Derzeit konzentrieren sich die Ansätze von Vagheit in der Verarbeitung von natürlicher Sprache vor allem auf die Filterung von Texten z.B. in Spam-Filtern und auf probabilistische kontextfreie Grammatiken.

Source

Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen

Search (372 results, page 1 of 19)

Authors

Years

Languages

Types

Themes

Subjects

Classifications