Search (129 results, page 1 of 7)

Hotho, A.; Bloehdorn, S.: Data Mining 2004 : Text classification by boosting weak learners based on terms and concepts (2004) 0.17

0.16541429 = product of:
  0.56713474 = sum of:
    0.034887902 = product of:
      0.10466371 = sum of:
        0.10466371 = weight(_text_:3a in 562) [ClassicSimilarity], result of:
          0.10466371 = score(doc=562,freq=2.0), product of:
            0.18622838 = queryWeight, product of:
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.021966046 = queryNorm
            0.56201804 = fieldWeight in 562, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.046875 = fieldNorm(doc=562)
      0.33333334 = coord(1/3)
    0.10466371 = weight(_text_:2f in 562) [ClassicSimilarity], result of:
      0.10466371 = score(doc=562,freq=2.0), product of:
        0.18622838 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.021966046 = queryNorm
        0.56201804 = fieldWeight in 562, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=562)
    0.10466371 = weight(_text_:2f in 562) [ClassicSimilarity], result of:
      0.10466371 = score(doc=562,freq=2.0), product of:
        0.18622838 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.021966046 = queryNorm
        0.56201804 = fieldWeight in 562, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=562)
    0.10466371 = weight(_text_:2f in 562) [ClassicSimilarity], result of:
      0.10466371 = score(doc=562,freq=2.0), product of:
        0.18622838 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.021966046 = queryNorm
        0.56201804 = fieldWeight in 562, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=562)
    0.10466371 = weight(_text_:2f in 562) [ClassicSimilarity], result of:
      0.10466371 = score(doc=562,freq=2.0), product of:
        0.18622838 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.021966046 = queryNorm
        0.56201804 = fieldWeight in 562, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=562)
    0.10466371 = weight(_text_:2f in 562) [ClassicSimilarity], result of:
      0.10466371 = score(doc=562,freq=2.0), product of:
        0.18622838 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.021966046 = queryNorm
        0.56201804 = fieldWeight in 562, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=562)
    0.008928288 = product of:
      0.017856576 = sum of:
        0.017856576 = weight(_text_:22 in 562) [ClassicSimilarity], result of:
          0.017856576 = score(doc=562,freq=2.0), product of:
            0.07692135 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.021966046 = queryNorm
            0.23214069 = fieldWeight in 562, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=562)
      0.5 = coord(1/2)
  0.29166666 = coord(7/24)

Content: Vgl.: http://www.google.de/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&ved=0CEAQFjAA&url=http%3A%2F%2Fciteseerx.ist.psu.edu%2Fviewdoc%2Fdownload%3Fdoi%3D10.1.1.91.4940%26rep%3Drep1%26type%3Dpdf&ei=dOXrUMeIDYHDtQahsIGACg&usg=AFQjCNHFWVh6gNPvnOrOS9R3rkrXCNVD-A&sig2=5I2F5evRfMnsttSgFF9g7Q&bvm=bv.1357316858,d.Yms.
Date: 8. 1.2013 10:22:32

Schmidt, R.: Maschinelle Text-Ton-Synchronisation in Wissenschaft und Wirtschaft (2000) 0.07

0.06729669 = product of:
  0.23073153 = sum of:
    0.017882636 = weight(_text_:und in 5559) [ClassicSimilarity], result of:
      0.017882636 = score(doc=5559,freq=18.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.3673144 = fieldWeight in 5559, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5559)
    0.06344847 = weight(_text_:methodik in 5559) [ClassicSimilarity], result of:
      0.06344847 = score(doc=5559,freq=2.0), product of:
        0.15883602 = queryWeight, product of:
          7.230979 = idf(docFreq=86, maxDocs=44218)
          0.021966046 = queryNorm
        0.39945894 = fieldWeight in 5559, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          7.230979 = idf(docFreq=86, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5559)
    0.013160862 = weight(_text_:des in 5559) [ClassicSimilarity], result of:
      0.013160862 = score(doc=5559,freq=4.0), product of:
        0.06083074 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.021966046 = queryNorm
        0.21635216 = fieldWeight in 5559, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5559)
    0.031458188 = weight(_text_:fragen in 5559) [ClassicSimilarity], result of:
      0.031458188 = score(doc=5559,freq=2.0), product of:
        0.11184209 = queryWeight, product of:
          5.0915895 = idf(docFreq=738, maxDocs=44218)
          0.021966046 = queryNorm
        0.28127325 = fieldWeight in 5559, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0915895 = idf(docFreq=738, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5559)
    0.02345029 = weight(_text_:der in 5559) [ClassicSimilarity], result of:
      0.02345029 = score(doc=5559,freq=30.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.47792363 = fieldWeight in 5559, product of:
          5.477226 = tf(freq=30.0), with freq of:
            30.0 = termFreq=30.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5559)
    0.06344847 = weight(_text_:methodik in 5559) [ClassicSimilarity], result of:
      0.06344847 = score(doc=5559,freq=2.0), product of:
        0.15883602 = queryWeight, product of:
          7.230979 = idf(docFreq=86, maxDocs=44218)
          0.021966046 = queryNorm
        0.39945894 = fieldWeight in 5559, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          7.230979 = idf(docFreq=86, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5559)
    0.017882636 = weight(_text_:und in 5559) [ClassicSimilarity], result of:
      0.017882636 = score(doc=5559,freq=18.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.3673144 = fieldWeight in 5559, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5559)
  0.29166666 = coord(7/24)

Abstract: Tonmaterial in Form von Audio- oder Videoaufnahmen spielt in Bereichen der Wissenschaft, die sich mit verbaler Interaktion beschäftigen, eine bedeutende Rolle. Solche Gebiete sind u,a. die Linguistik, Psychologie, Soziologie und Kriminalistik. Gegenstand der Untersuchung können dabei z.B. die Formen des sprachlichen Handelns und der Sprachvariation in Abhängigkeit von der Situation oder die Ausprägung und Entwicklung von Sprachunterschieden vor dem sozialen Hintergrund sein. Im Rahmen der Analyse eines Gesprächsverlaufs kann beispielsweise die Form der Rederechtsicherung von Interesse sein. In diesem Zusammenhang stellen sich Fragen wie z.B. "Wie bringen Gesprächsteilnehrner Gesprächsbeteiligte dazu, ihre Rede zu unterbrechen?" oder "Wie wehren Gesprächsteilnehmer Unterbrechungsversuche voll anderen Teilnehmern ab?". Denkbar ist hier u.a. nach dem Vorkommen von "ausreden lassen" zu suchen, wobei diese beiden Wörter nicht unbedingt nebeneinander auftreten müssen. Bei der Suche nach Stellen an denen ein Gesprächsteilnehmer Ansprüche oder Forderungen an einen Gesprächspartner stellt, können die flektierten Formen der Modalverben wie z.B. "müssen", "sollen" oder "dürfen" für die Anfrage wichtig sein, während Konnektiva wie "aber", "ja aber" oder "doch" auf oppositive Gesprächsabschnitte verweisen können. Näheres zur gesprächsanalytischen Methodik kann Deppermann (1999) und Brünner et al. (1999) entnommen werden. In dem Bereich der Linguistik, die den Gebrauch von gesprochener Sprache in offiziellen und privaten Situationen zum Gegenstand hat, sind u.a. auch Aussprachevarianten von großem Interesse. Von der Untersuchung der Sprachfärbungen erhofft man sich detaillierte Aussagen über die Sprechersituation und die regionale (König (1988)) und soziale Herkunft des Sprechers machen zu können. In der Kriminalistik wirken solche Ergebnisse unterstützend bei der Identifizierung von Personen
Source: Sprachtechnologie für eine dynamische Wirtschaft im Medienzeitalter - Language technologies for dynamic business in the age of the media - L'ingénierie linguistique au service de la dynamisation économique à l'ère du multimédia: Tagungsakten der XXVI. Jahrestagung der Internationalen Vereinigung Sprache und Wirtschaft e.V., 23.-25.11.2000, Fachhochschule Köln. Hrsg.: K.-D. Schmitz

Helbig, H.: Wissensverarbeitung und die Semantik der natürlichen Sprache : Wissensrepräsentation mit MultiNet (2008) 0.06

0.06264259 = product of:
  0.25057036 = sum of:
    0.015771002 = weight(_text_:und in 2731) [ClassicSimilarity], result of:
      0.015771002 = score(doc=2731,freq=14.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.32394084 = fieldWeight in 2731, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2731)
    0.08972968 = weight(_text_:methodik in 2731) [ClassicSimilarity], result of:
      0.08972968 = score(doc=2731,freq=4.0), product of:
        0.15883602 = queryWeight, product of:
          7.230979 = idf(docFreq=86, maxDocs=44218)
          0.021966046 = queryNorm
        0.56492025 = fieldWeight in 2731, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          7.230979 = idf(docFreq=86, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2731)
    0.016118698 = weight(_text_:des in 2731) [ClassicSimilarity], result of:
      0.016118698 = score(doc=2731,freq=6.0), product of:
        0.06083074 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.021966046 = queryNorm
        0.2649762 = fieldWeight in 2731, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2731)
    0.02345029 = weight(_text_:der in 2731) [ClassicSimilarity], result of:
      0.02345029 = score(doc=2731,freq=30.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.47792363 = fieldWeight in 2731, product of:
          5.477226 = tf(freq=30.0), with freq of:
            30.0 = termFreq=30.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2731)
    0.08972968 = weight(_text_:methodik in 2731) [ClassicSimilarity], result of:
      0.08972968 = score(doc=2731,freq=4.0), product of:
        0.15883602 = queryWeight, product of:
          7.230979 = idf(docFreq=86, maxDocs=44218)
          0.021966046 = queryNorm
        0.56492025 = fieldWeight in 2731, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          7.230979 = idf(docFreq=86, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2731)
    0.015771002 = weight(_text_:und in 2731) [ClassicSimilarity], result of:
      0.015771002 = score(doc=2731,freq=14.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.32394084 = fieldWeight in 2731, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2731)
  0.25 = coord(6/24)

Abstract: Das Buch gibt eine umfassende Darstellung einer Methodik zur Interpretation und Bedeutungsrepräsentation natürlichsprachlicher Ausdrücke. Diese Methodik der "Mehrschichtigen Erweiterten Semantischen Netze", das sogenannte MultiNet-Paradigma, ist sowohl für theoretische Untersuchungen als auch für die automatische Verarbeitung natürlicher Sprache auf dem Rechner geeignet. Im ersten Teil des zweiteiligen Buches werden grundlegende Probleme der semantischen Repräsentation von Wissen bzw. der semantischen Interpretation natürlichsprachlicher Phänomene behandelt. Der zweite Teil enthält eine systematische Zusammenstellung des gesamten Repertoires von Darstellungsmitteln, die jeweils nach einem einheitlichen Schema beschrieben werden. Er dient als Kompendium der im Buch verwendeten formalen Beschreibungsmittel von MultiNet. Die vorgestellten Ergebnisse sind eingebettet in ein System von Software-Werkzeugen, die eine praktische Nutzung der MultiNet-Darstellungsmittel als Formalismus zur Bedeutungsrepräsentation im Rahmen der automatischen Sprachverarbeitung sichern. Hierzu gehören: eine Werkbank für den Wissensingenieur, ein Übersetzungssystem zur automatischen Gewinnung von Bedeutungsdarstellungen natürlichsprachlicher Sätze und eine Werkbank für den Computerlexikographen. Der Inhalt des Buches beruht auf jahrzehntelanger Forschung auf dem Gebiet der automatischen Sprachverarbeitung und wurde mit Vorlesungen zur Künstlichen Intelligenz und Wissensverarbeitung an der TU Dresden und der FernUniversität Hagen wiederholt in der Hochschullehre eingesetzt. Als Vorkenntnisse werden beim Leser lediglich Grundlagen der traditionellen Grammatik und elementare Kenntnisse der Prädikatenlogik vorausgesetzt.

Helbig, H.: ¬Die semantische Struktur natürlicher Sprache : Wissensrepräsentation mit MultiNet (2001) 0.05

0.04976866 = product of:
  0.23888958 = sum of:
    0.009537406 = weight(_text_:und in 7072) [ClassicSimilarity], result of:
      0.009537406 = score(doc=7072,freq=2.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.19590102 = fieldWeight in 7072, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=7072)
    0.10151755 = weight(_text_:methodik in 7072) [ClassicSimilarity], result of:
      0.10151755 = score(doc=7072,freq=2.0), product of:
        0.15883602 = queryWeight, product of:
          7.230979 = idf(docFreq=86, maxDocs=44218)
          0.021966046 = queryNorm
        0.6391343 = fieldWeight in 7072, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          7.230979 = idf(docFreq=86, maxDocs=44218)
          0.0625 = fieldNorm(doc=7072)
    0.016779663 = weight(_text_:der in 7072) [ClassicSimilarity], result of:
      0.016779663 = score(doc=7072,freq=6.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.34197432 = fieldWeight in 7072, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=7072)
    0.10151755 = weight(_text_:methodik in 7072) [ClassicSimilarity], result of:
      0.10151755 = score(doc=7072,freq=2.0), product of:
        0.15883602 = queryWeight, product of:
          7.230979 = idf(docFreq=86, maxDocs=44218)
          0.021966046 = queryNorm
        0.6391343 = fieldWeight in 7072, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          7.230979 = idf(docFreq=86, maxDocs=44218)
          0.0625 = fieldNorm(doc=7072)
    0.009537406 = weight(_text_:und in 7072) [ClassicSimilarity], result of:
      0.009537406 = score(doc=7072,freq=2.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.19590102 = fieldWeight in 7072, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=7072)
  0.20833333 = coord(5/24)

Abstract: Die Methodik der 'Mehrschichtigen Erweiterung Semantischer Netze' (MultiNet) ist sowohl für theoretische Untersuchungen als auch für die automatische Verarbeitung natürlicher Sprache auf dem Rechner geeignet. Die vorgestellten Ergebnisse sind eingebettet in ein System von Software-Werkzeugen, die eine praktische Nutzung der MultiNet-Darstellungsmittel als Formalismus zur Bedeutungsrepräsentation sichern
Footnote: 2. Aufl. 2008 u.d.T.: Wissensverarbeitung und die Semantik der natürlichen Sprache

Zimmermann, H.H.: Maschinelle und Computergestützte Übersetzung (2004) 0.02

0.024744404 = product of:
  0.11877315 = sum of:
    0.0143061085 = weight(_text_:und in 2943) [ClassicSimilarity], result of:
      0.0143061085 = score(doc=2943,freq=8.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.29385152 = fieldWeight in 2943, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=2943)
    0.011167361 = weight(_text_:des in 2943) [ClassicSimilarity], result of:
      0.011167361 = score(doc=2943,freq=2.0), product of:
        0.06083074 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.021966046 = queryNorm
        0.18358089 = fieldWeight in 2943, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.046875 = fieldNorm(doc=2943)
    0.06446196 = weight(_text_:spezielle in 2943) [ClassicSimilarity], result of:
      0.06446196 = score(doc=2943,freq=2.0), product of:
        0.14615025 = queryWeight, product of:
          6.653462 = idf(docFreq=154, maxDocs=44218)
          0.021966046 = queryNorm
        0.44106638 = fieldWeight in 2943, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.653462 = idf(docFreq=154, maxDocs=44218)
          0.046875 = fieldNorm(doc=2943)
    0.014531613 = weight(_text_:der in 2943) [ClassicSimilarity], result of:
      0.014531613 = score(doc=2943,freq=8.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.29615843 = fieldWeight in 2943, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=2943)
    0.0143061085 = weight(_text_:und in 2943) [ClassicSimilarity], result of:
      0.0143061085 = score(doc=2943,freq=8.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.29385152 = fieldWeight in 2943, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=2943)
  0.20833333 = coord(5/24)

Abstract: Unter Maschineller Übersetzung (Machine Translation, MT) wird im Folgenden die vollautomatische Übersetzung eines Textes in natürlicher Sprache in eine andere natürliche Sprache verstanden. Unter Human-Übersetzung (Human Translation, HT) wird die intellektuelle Übersetzung eines Textes mit oder ohne maschinelle lexikalische Hilfen mit oder ohne Textverarbeitung verstanden. Unter computergestützter bzw computerunterstützter Übersetzung (CAT) wird einerseits eine intellektuelle Übersetzung verstanden, die auf einer maschinellen Vorübersetzung/Rohübersetzung (MT) aufbaut, die nachfolgend intellektuell nachbereitet wird (Postedition); andererseits wird darunter eine intellektuelle Übersetzung verstanden, bei der vor oder während des intellektuellen Übersetzungsprozesses ein Translation Memory und/ oder eine Terminologie-Bank verwendet werden. Unter ICAT wird eine spezielle Variante von CAT verstanden, bei der ein Nutzer ohne (hinreichende) Kenntnis der Zielsprache bei einer Übersetzung aus seiner Muttersprache so unterstützt wird, dass das zielsprachige Äquivalent relativ fehlerfrei ist.
Source: Grundlagen der praktischen Information und Dokumentation. 5., völlig neu gefaßte Ausgabe. 2 Bde. Hrsg. von R. Kuhlen, Th. Seeger u. D. Strauch. Begründet von Klaus Laisiepen, Ernst Lutterbeck, Karl-Heinrich Meyer-Uhlenried. Bd.1: Handbuch zur Einführung in die Informationswissenschaft und -praxis

Thiel, M.: Bedingt wahrscheinliche Syntaxbäume (2006) 0.02
```
0.023980813 = product of:
  0.1151079 = sum of:
    0.020231893 = weight(_text_:und in 6069) [ClassicSimilarity], result of:
      0.020231893 = score(doc=6069,freq=36.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.41556883 = fieldWeight in 6069, product of:
          6.0 = tf(freq=36.0), with freq of:
            36.0 = termFreq=36.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=6069)
    0.014889815 = weight(_text_:des in 6069) [ClassicSimilarity], result of:
      0.014889815 = score(doc=6069,freq=8.0), product of:
        0.06083074 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.021966046 = queryNorm
        0.24477452 = fieldWeight in 6069, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.03125 = fieldNorm(doc=6069)
    0.04297464 = weight(_text_:spezielle in 6069) [ClassicSimilarity], result of:
      0.04297464 = score(doc=6069,freq=2.0), product of:
        0.14615025 = queryWeight, product of:
          6.653462 = idf(docFreq=154, maxDocs=44218)
          0.021966046 = queryNorm
        0.29404426 = fieldWeight in 6069, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.653462 = idf(docFreq=154, maxDocs=44218)
          0.03125 = fieldNorm(doc=6069)
    0.016779663 = weight(_text_:der in 6069) [ClassicSimilarity], result of:
      0.016779663 = score(doc=6069,freq=24.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.34197432 = fieldWeight in 6069, product of:
          4.8989797 = tf(freq=24.0), with freq of:
            24.0 = termFreq=24.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=6069)
    0.020231893 = weight(_text_:und in 6069) [ClassicSimilarity], result of:
      0.020231893 = score(doc=6069,freq=36.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.41556883 = fieldWeight in 6069, product of:
          6.0 = tf(freq=36.0), with freq of:
            36.0 = termFreq=36.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=6069)
  0.20833333 = coord(5/24)
```
Abstract

Es wird argumentiert, dass die Ansätze der probabilistischen kontextfreien Grammatiken und anderer Modelle nicht ausreichend sind für die Lösung der im Parsing auftretenden Probleme. Zu deren Lösung wird folgende Hypothese aufgestellt: Die Wahrscheinlichkeiten einzelner Lesarten und verschiedener Knoten in einem Syntaxbaum sind voneinander abhängig. Vereindeutigt man eine Lesart bzw. einen Knoten, hat dies Auswirkungen auf die Wahrscheinlichkeit anderer Lesarten bzw. Knoten. Daher werden alle Lesarten und Syntaxbäume in einen Graphen integriert. Wenn die Wahrscheinlichkeiten also voneinander abhängig sind, wird angenommen, dass die Theorie der bedingten Wahrscheinlichkeiten von Bayes als Basis eine Lösung produzieren sollte. An einem Beispiel wird dies nachvollzogen und die Hypothese konnte bestätigt werden.
Die Tendenz ist eindeutig: wo immer es sinnvoll ist, werden hart' programmierte Lösungen durch Ansätze des Softcomputing ersetzt. Vor allem technische und kommerzielle Bereiche profitieren davon. So finden wir Kransteuerungen und viele andere Anwendungen mit Fuzzy Expertensystemen sowie Bilderkennungssysteme und Entscheidungen über die Kreditvergabe mit Neuronalen Netzen oder auch Methoden des Maschinellen Lernens (vgl. Jafar-Shaghaghi 1994). Ein Prinzip dieser Ansätze ist, dass die Software sich automatisch an die spezielle Situation und Datengrundlage der Anwendung anpasst. Flexibilität der Anpassung und die Fähigkeit zur Verallgemeinerung auf bislang ungesehene Fälle sind implizit in den Methoden vorhanden. Gerade dies ist auch ein typisches Problem, das bei der Beschreibung und vor allem beim Parsen natürlicher Sprache auftritt. Bei der Verarbeitung natürlicher Sprache kommt das leidige Problem der Ambiguität auf verschiedenen Ebenen hinzu. Alternative Regeln schließen sich in ihrer Anwendung in einem Satz meistens gegenseitig aus und sind nicht alle an der aktuellen Stelle gleich wahrscheinlich. Auf diese Problematik wurde schon früh hingewiesen (Thiel 1987, 137 ff.), wo versucht wurde, mit Gewichtungen die Wahrscheinlichkeit von Regeln, Syntaxbäumen, Kategorien und Wortsemantik in den Griff zu bekommen. Das Gewicht eines Syntaxbaumes kann z.B. einfach zugewiesen werden oder berechnet werden als Funktion des Baumes, aus dem er abgeleitet wird, und der angewandten Regel. Ein solches Verfahren wird (Thiel 1987, 152) am Beispiel einer Heuristik für die Inferenzmaschine eines Expertensystems gezeigt. Aber auch bereits in einer sehr frühen Veröffentlichung zur Analyse natürlicher Sprache, an der Zimmermann maßgeblich beteiligt war, wurde auf Vorkommenswahrscheinlichkeiten hingewiesen: "Statistische Auswertung von Typen des Satzbaus, Bau nominaler und verbaler Gruppen ..." (Eggers et al. 1969, 18). Derzeit konzentrieren sich die Ansätze von Vagheit in der Verarbeitung von natürlicher Sprache vor allem auf die Filterung von Texten z.B. in Spam-Filtern und auf probabilistische kontextfreie Grammatiken.

Source

Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen

Strötgen, R.; Mandl, T.; Schneider, R.: Entwicklung und Evaluierung eines Question Answering Systems im Rahmen des Cross Language Evaluation Forum (CLEF) (2006) 0.02

0.022720445 = product of:
  0.10905814 = sum of:
    0.022619944 = weight(_text_:und in 5981) [ClassicSimilarity], result of:
      0.022619944 = score(doc=5981,freq=20.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.46462005 = fieldWeight in 5981, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5981)
    0.015793033 = weight(_text_:des in 5981) [ClassicSimilarity], result of:
      0.015793033 = score(doc=5981,freq=4.0), product of:
        0.06083074 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.021966046 = queryNorm
        0.25962257 = fieldWeight in 5981, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.046875 = fieldNorm(doc=5981)
    0.037749823 = weight(_text_:fragen in 5981) [ClassicSimilarity], result of:
      0.037749823 = score(doc=5981,freq=2.0), product of:
        0.11184209 = queryWeight, product of:
          5.0915895 = idf(docFreq=738, maxDocs=44218)
          0.021966046 = queryNorm
        0.33752787 = fieldWeight in 5981, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0915895 = idf(docFreq=738, maxDocs=44218)
          0.046875 = fieldNorm(doc=5981)
    0.010275402 = weight(_text_:der in 5981) [ClassicSimilarity], result of:
      0.010275402 = score(doc=5981,freq=4.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.20941564 = fieldWeight in 5981, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=5981)
    0.022619944 = weight(_text_:und in 5981) [ClassicSimilarity], result of:
      0.022619944 = score(doc=5981,freq=20.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.46462005 = fieldWeight in 5981, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5981)
  0.20833333 = coord(5/24)

Abstract: Question Answering Systeme versuchen, zu konkreten Fragen eine korrekte Antwort zu liefern. Dazu durchsuchen sie einen Dokumentenbestand und extrahieren einen Bruchteil eines Dokuments. Dieser Beitrag beschreibt die Entwicklung eines modularen Systems zum multilingualen Question Answering. Die Strategie bei der Entwicklung zielte auf eine schnellstmögliche Verwendbarkeit eines modularen Systems, das auf viele frei verfügbare Ressourcen zugreift. Das System integriert Module zur Erkennung von Eigennamen, zu Indexierung und Retrieval, elektronische Wörterbücher, Online-Übersetzungswerkzeuge sowie Textkorpora zu Trainings- und Testzwecken und implementiert eigene Ansätze zu den Bereichen der Frage- und AntwortTaxonomien, zum Passagenretrieval und zum Ranking alternativer Antworten.
Source: Effektive Information Retrieval Verfahren in Theorie und Praxis: ausgewählte und erweiterte Beiträge des Vierten Hildesheimer Evaluierungs- und Retrievalworkshop (HIER 2005), Hildesheim, 20.7.2005. Hrsg.: T. Mandl u. C. Womser-Hacker

Information und Sprache : Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen (2006) 0.02
```
0.022666894 = product of:
  0.090667576 = sum of:
    0.019516759 = weight(_text_:und in 91) [ClassicSimilarity], result of:
      0.019516759 = score(doc=91,freq=134.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.40087974 = fieldWeight in 91, product of:
          11.575837 = tf(freq=134.0), with freq of:
            134.0 = termFreq=134.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.015625 = fieldNorm(doc=91)
    0.01534807 = weight(_text_:des in 91) [ClassicSimilarity], result of:
      0.01534807 = score(doc=91,freq=34.0), product of:
        0.06083074 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.021966046 = queryNorm
        0.2523078 = fieldWeight in 91, product of:
          5.8309517 = tf(freq=34.0), with freq of:
            34.0 = termFreq=34.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.015625 = fieldNorm(doc=91)
    0.012583274 = weight(_text_:fragen in 91) [ClassicSimilarity], result of:
      0.012583274 = score(doc=91,freq=2.0), product of:
        0.11184209 = queryWeight, product of:
          5.0915895 = idf(docFreq=738, maxDocs=44218)
          0.021966046 = queryNorm
        0.112509295 = fieldWeight in 91, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0915895 = idf(docFreq=738, maxDocs=44218)
          0.015625 = fieldNorm(doc=91)
    0.015695935 = weight(_text_:der in 91) [ClassicSimilarity], result of:
      0.015695935 = score(doc=91,freq=84.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.31988767 = fieldWeight in 91, product of:
          9.165152 = tf(freq=84.0), with freq of:
            84.0 = termFreq=84.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.015625 = fieldNorm(doc=91)
    0.019516759 = weight(_text_:und in 91) [ClassicSimilarity], result of:
      0.019516759 = score(doc=91,freq=134.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.40087974 = fieldWeight in 91, product of:
          11.575837 = tf(freq=134.0), with freq of:
            134.0 = termFreq=134.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.015625 = fieldNorm(doc=91)
    0.00800678 = product of:
      0.01601356 = sum of:
        0.01601356 = weight(_text_:deutschland in 91) [ClassicSimilarity], result of:
          0.01601356 = score(doc=91,freq=4.0), product of:
            0.10609499 = queryWeight, product of:
              4.829954 = idf(docFreq=959, maxDocs=44218)
              0.021966046 = queryNorm
            0.15093607 = fieldWeight in 91, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.829954 = idf(docFreq=959, maxDocs=44218)
              0.015625 = fieldNorm(doc=91)
      0.5 = coord(1/2)
  0.25 = coord(6/24)
```
Abstract

Der vorliegende Band enthält Beiträge namhafter Autoren aus den Bereichen Informationswissenschaft, Computerlinguistik, Kommunikationswissenschaft, Bibliothekswesen und verwandten Fächern. Es werden sowohl aktuelle theoretische Themen behandelt, etwa zu Medientheorie und Internet, zum Verhältnis von Information und kulturellem Gedächtnis oder über Information im Museum, als auch praktische Anwendungen und Vorschläge gegeben, wie z.B. zur Automatischen Indexierung und zur Wissensrepräsentation.

BK

18.00 Einzelne Sprachen und Literaturen allgemein

Classification

18.00 Einzelne Sprachen und Literaturen allgemein

Content

Inhalt: Information und Sprache und mehr - eine Einleitung - Information und Kommunikation Wolf Rauch: Auch Information ist eine Tochter der Zeit Winfried Lenders: Information und kulturelles Gedächtnis Rainer Hammwöhner: Anmerkungen zur Grundlegung der Informationsethik Hans W. Giessen: Ehrwürdig stille Informationen Gernot Wersig: Vereinheitlichte Medientheorie und ihre Sicht auf das Internet Johann Haller, Anja Rütten: Informationswissenschaft und Translationswissenschaft: Spielarten oder Schwestern? Rainer Kuhlen: In Richtung Summarizing für Diskurse in K3 Werner Schweibenz: Sprache, Information und Bedeutung im Museum. Narrative Vermittlung durch Storytelling - Sprache und Computer, insbesondere Information Retrieval und Automatische Indexierung Manfred Thiel: Bedingt wahrscheinliche Syntaxbäume Jürgen Krause: Shell Model, Semantic Web and Web Information Retrieval Elisabeth Niggemann: Wer suchet, der findet? Verbesserung der inhaltlichen Suchmöglichkeiten im Informationssystem Der Deutschen Bibliothek Christa Womser-Hacker: Zur Rolle von Eigennamen im Cross-Language Information Retrieval Klaus-Dirk Schmitz: Wörterbuch, Thesaurus, Terminologie, Ontologie. Was tragen Terminologiewissenschaft und Informationswissenschaft zur Wissensordnung bei?
Jiri Panyr: Thesauri, Semantische Netze, Frames, Topic Maps, Taxonomien, Ontologien - begriffliche Verwirrung oder konzeptionelle Vielfalt? Heinz-Dieter Maas: Indexieren mit AUTINDEX Wilhelm Gaus, Rainer Kaluscha: Maschinelle inhaltliche Erschließung von Arztbriefen und Auswertung von Reha-Entlassungsberichten Klaus Lepsky: Automatische Indexierung des Reallexikons zur Deutschen Kunstgeschichte - Analysen und Entwicklungen Ilse Harms: Die computervermittelte Kommunikation als ein Instrument des Wissensmanagements in Organisationen August- Wilhelm Scheer, Dirk Werth: Geschäftsregel-basiertes Geschäftsprozessmanagement Thomas Seeger: Akkreditierung und Evaluierung von Hochschullehre und -forschung in Großbritannien. Hinweise für die Situation in Deutschland Bernd Hagenau: Gehabte Sorgen hab' ich gern? Ein Blick zurück auf die Deutschen Bibliothekartage 1975 bis 1980 - Persönliches Jorgo Chatzimarkakis: Sprache und Information in Europa Alfred Gulden: 7 Briefe und eine Anmerkung Günter Scholdt: Der Weg nach Europa im Spiegel von Mundartgedichten Alfred Guldens Wolfgang Müller: Prof. Dr. Harald H. Zimmermann - Seit 45 Jahren der Universität des Saarlandes verbunden Heinz-Dirk Luckhardt: Computerlinguistik und Informationswissenschaft: Facetten des wissenschaftlichen Wirkens von Harald H. Zimmermann Schriftenverzeichnis Harald H. Zimmermanns 1967-2005 - Projekte in Verantwortung von Harald H. Zimmermann - Adressen der Beiträgerinnen und Beiträger

Footnote

Rez. in Mitt. VÖB 59(2006) Nr.3, S.75-78 (O. Oberhauser): "Beim vorliegenden Buch handelt es sich um die Festschrift zum 65. Geburtstag des mit Ende des Sommersemesters 2006 in den Ruhestand getretenen Universitätsprofessors für Informationswissenschaft, Harald H. Zimmermann, jenes 1941 in Völklingen geborenen Computerlinguisten, der die Informationswissenschaft als akademische Disziplin in Deutschland mitbegründet und seit 1980 an der Universität des Saarlandes vertreten hat. Die insgesamt 26 Beiträge des von Professor Zimmermanns Mitarbeitern betreuten, optisch gediegen anmutenden Saur-Bandes gliedern sich - so das Inhaltsverzeichnis - in vier Themenschwerpunkte: - Information und Kommunikation - Sprache und Computer, insbesondere Information Retrieval und Automatische Indexierung - Analysen und Entwicklungen - Persönliches Die Aufsätze selbst variieren, wie bei Festschriften üblich bzw. unvermeidbar, hinsichtlich Länge, Stil, thematischem Detail und Anspruchsniveau. Neben wissenschaftlichen Beiträgen findet man hier auch Reminiszenzen und Literarisches. Die nachfolgende Auswahl zeigt, was mich selbst an diesem Buch interessiert hat:
In Information und kulturelles Gedächtnis (S. 7-15) plädiert der Kommunikationswissenschaftler Winfried Lenders (Bonn) dafür, Information nicht mit dem zu identifizieren, was heute als (kulturelles) Gedächtnis bezeichnet wird. Information ist ein Prozess bzw. Vorgang und kein manifestes Substrat; sie setzt aber ein solches Substrat, nämlich das im (kulturellen) Gedächtnis abgespeicherte Wissen, voraus. Allerdings führt nicht jedes Informieren zu einer Vermehrung des kulturellen Gedächtnisses - das notwendige Auswahlkriterium liegt jedoch nicht in der grundsätzliche Möglichkeit zum Speichern von Inhalten. Es liegt auch nicht ausschliesslich in formalisierten Aussonderungsmechanismen wie Skartieren, Zitationsindizes und Relevanzrangreihen, sondern in der gesellschaftlichen Kommunikation schlechthin. Auch an die Verfügbarkeit des Schriftlichen ist das kulturelle Gedächtnis nicht gebunden, zumal ja auch in Kulturen der Oralität gesellschaftlich Wichtiges aufbewahrt wird. Rainer Hammwöhner (Regensburg) geht in Anmerkungen zur Grundlegung der Informationsethik (S. 17-27) zunächst auf die "Überversorgung" des Informationssektors mit Spezialethiken ein, wobei er neben der (als breiter angesehenen) Informationsethik konkurrierende Bereichsethiken wie Medienethik, Computerethik und Netzethik/Cyberethik thematisiert und Überlappungen, Abgrenzung, Hierarchisierung etc. diskutiert. Versuche einer diskursethischen wie einer normenethischen Begründung der Informationsethik sind nach Hammwöhner zum Scheitern verurteilt, sodass er einen pragmatistischen Standpunkt einnimmt, wonach Informationsethik ganz einfach "die Analyse und Systematisierung der im Zusammenhang der digitalen Kommunikation etablierten normativen Handlungsmuster" zu leisten habe. In diesem Konnex werden Fragen wie jene nach dem Guten, aber auch Aspekte wie die Bewahrung des kulturellen Erbes für spätere Generationen und der Erhalt der kulturellen Mannigfaltigkeit angesprochen. Der Beitrag des vor kurzem verstorbenen Gründungsvaters der deutschen Informationswissenschaft, Gernot Wersig (Berlin), ist mit Vereinheitlichte Medientheorie und ihre Sicht auf das Internet (S. 35-46) überschrieben. Der Autor gibt darin einen kurzen Überblick über bisherige medientheoretische Ansätze und versucht sodann - ausgehend von den Werken Niklas Luhmanns und Herbert Stachowiaks - eine "vereinheitlichte Medientheorie" zu entwickeln. Dabei werden die Faktoren Kommunikation, Medien, Medienplattformen und -typologien, Medienevolution und schließlich die digitale Revolution diskutiert. Das Internet, so folgert Wersig, sei eine Medienplattform mit dem Potential, eine ganze Epoche zu gestalten. In Anlehnung an den bekannten Begriff "Gutenberg-Galaxis" spricht er hier auch von einer "Internet-Galaxie". Obwohl dieser Artikel viele interessante Gedanken enthält, erschließt er sich dem Leser leider nur schwer, da vieles vorausgesetzt wird und auch der gewählte Soziologenjargon nicht jedermanns Sache ist.
In Thesauri, Semantische Netze, Frames, Topic Maps, Taxonomien, Ontologien - begriffliche Verwirrung oder konzeptionelle Vielfalt? (S. 139-151) gibt Jiri Panyr (München/Saarbrücken) eine gut lesbare und nützliche Übersicht über die im Titel des Beitrags genannten semantischen Repräsentationsformen, die im Zusammenhang mit dem Internet und insbesondere mit dem vorgeschlagenen Semantic Web immer wieder - und zwar häufig unpräzise oder gar unrichtig - Anwendung finden. Insbesondere die Ausführungen zum Modebegriff Ontologie zeigen, dass dieser nicht leichtfertig als Quasi-Synonym zu Thesaurus oder Klassifikation verwendet werden darf. Panyrs Beitrag ist übrigens thematisch verwandt mit jenem von K.-D. Schmitz (Köln), Wörterbuch, Thesaurus, Terminologie, Ontologie (S. 129-137). Abgesehen von dem einfallslosen Titel Wer suchet, der findet? (S. 107- 118) - zum Glück mit dem Untertitel Verbesserung der inhaltlichen Suchmöglichkeiten im Informationssystem Der Deutschen Bibliothek versehen - handelt es sich bei diesem Artikel von Elisabeth Niggemann (Frankfurt am Main) zwar um keinen wissenschaftlichen, doch sicherlich den praktischsten, lesbarsten und aus bibliothekarischer Sicht interessantesten des Buches. Niggemann gibt einen Überblick über die bisherige sachliche Erschliessung der bibliographischen Daten der inzwischen zur Deutschen Nationalbibliothek mutierten DDB, sowie einen Statusbericht nebst Ausblick über gegenwärtige bzw. geplante Verbesserungen der inhaltlichen Suche. Dazu zählen der breite Einsatz eines automatischen Indexierungsverfahrens (MILOS/IDX) ebenso wie Aktivitäten im klassifikatorischen Bereich (DDC), die Vernetzung nationaler Schlagwortsysteme (Projekt MACS) sowie die Beschäftigung mit Crosskonkordanzen (CARMEN) und Ansätzen zur Heterogenitätsbehandlung. Das hier von zentraler Stelle deklarierte "commitment" hinsichtlich der Verbesserung der sachlichen Erschließung des nationalen Online-Informationssystems erfüllt den eher nur Kleinmut und Gleichgültigkeit gewohnten phäakischen Beobachter mit Respekt und wehmutsvollem Neid.
Mit automatischer Indexierung beschäftigen sich auch zwei weitere Beiträge. Indexieren mit AUTINDEX von H.-D. Mass (Saarbrücken) ist leider knapp und ohne didaktische Ambition verfasst, sodass man sich nicht wirklich vorstellen kann, wie dieses System funktioniert. Übersichtlicher stellt sich der Werkstattbericht Automatische Indexierung des Reallexikons zur deutschen Kunstgeschichte von K. Lepsky (Köln) dar, der zeigt, welche Probleme und Schritte bei der Digitalisierung, Indexierung und Web-Präsentation der Volltexte eines grossen fachlichen Nachschlagewerkes anfallen. Weitere interessante Beiträge befassen sich z.B. mit Summarizing-Leistungen im Rahmen eines e-Learning-Projektes (R. Kuhlen), mit dem Schalenmodell und dem Semantischen Web (J. Krause; aus nicht näher dargelegten Gründen in englischer Sprache) und mit der Akkreditierung/ Evaluierung von Hochschullehre und -forschung in Großbritannien (T. Seeger). In Summe liegt hier eine würdige Festschrift vor, über die sich der Gefeierte sicherlich gefreut haben wird. Für informationswissenschaftliche Spezialsammlungen und größere Bibliotheken ist der Band allemal eine Bereicherung. Ein Wermutstropfen aber doch: Obzwar mit Information und Sprache ein optisch ansprechend gestaltetes Buch produziert wurde, enthüllt eine nähere Betrachtung leider allzu viele Druckfehler, mangelhafte Worttrennungen, unkorrigierte grammatikalische Fehler, sowie auch Inkonsistenzen bei Kursivdruck und Satzzeichen. Lektoren und Korrektoren sind, so muss man wieder einmal schmerzlich zur Kenntnis nehmen, ein aussterbender Berufsstand."

RSWK

Informations- und Dokumentationswissenschaft / Aufsatzsammlung

Subject

Informations- und Dokumentationswissenschaft / Aufsatzsammlung
Heyer, G.; Quasthoff, U.; Wittig, T.: Text Mining : Wissensrohstoff Text. Konzepte, Algorithmen, Ergebnisse (2006) 0.02
```
0.020477887 = product of:
  0.09829386 = sum of:
    0.021852942 = weight(_text_:und in 5218) [ClassicSimilarity], result of:
      0.021852942 = score(doc=5218,freq=42.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.44886562 = fieldWeight in 5218, product of:
          6.4807405 = tf(freq=42.0), with freq of:
            42.0 = termFreq=42.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=5218)
    0.014889815 = weight(_text_:des in 5218) [ClassicSimilarity], result of:
      0.014889815 = score(doc=5218,freq=8.0), product of:
        0.06083074 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.021966046 = queryNorm
        0.24477452 = fieldWeight in 5218, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.03125 = fieldNorm(doc=5218)
    0.025166549 = weight(_text_:fragen in 5218) [ClassicSimilarity], result of:
      0.025166549 = score(doc=5218,freq=2.0), product of:
        0.11184209 = queryWeight, product of:
          5.0915895 = idf(docFreq=738, maxDocs=44218)
          0.021966046 = queryNorm
        0.22501859 = fieldWeight in 5218, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0915895 = idf(docFreq=738, maxDocs=44218)
          0.03125 = fieldNorm(doc=5218)
    0.014531613 = weight(_text_:der in 5218) [ClassicSimilarity], result of:
      0.014531613 = score(doc=5218,freq=18.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.29615843 = fieldWeight in 5218, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=5218)
    0.021852942 = weight(_text_:und in 5218) [ClassicSimilarity], result of:
      0.021852942 = score(doc=5218,freq=42.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.44886562 = fieldWeight in 5218, product of:
          6.4807405 = tf(freq=42.0), with freq of:
            42.0 = termFreq=42.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=5218)
  0.20833333 = coord(5/24)
```
Abstract

Ein großer Teil des Weltwissens befindet sich in Form digitaler Texte im Internet oder in Intranets. Heutige Suchmaschinen nutzen diesen Wissensrohstoff nur rudimentär: Sie können semantische Zusammen-hänge nur bedingt erkennen. Alle warten auf das semantische Web, in dem die Ersteller von Text selbst die Semantik einfügen. Das wird aber noch lange dauern. Es gibt jedoch eine Technologie, die es bereits heute ermöglicht semantische Zusammenhänge in Rohtexten zu analysieren und aufzubereiten. Das Forschungsgebiet "Text Mining" ermöglicht es mit Hilfe statistischer und musterbasierter Verfahren, Wissen aus Texten zu extrahieren, zu verarbeiten und zu nutzen. Hier wird die Basis für die Suchmaschinen der Zukunft gelegt. Das erste deutsche Lehrbuch zu einer bahnbrechenden Technologie: Text Mining: Wissensrohstoff Text Konzepte, Algorithmen, Ergebnisse Ein großer Teil des Weltwissens befindet sich in Form digitaler Texte im Internet oder in Intranets. Heutige Suchmaschinen nutzen diesen Wissensrohstoff nur rudimentär: Sie können semantische Zusammen-hänge nur bedingt erkennen. Alle warten auf das semantische Web, in dem die Ersteller von Text selbst die Semantik einfügen. Das wird aber noch lange dauern. Es gibt jedoch eine Technologie, die es bereits heute ermöglicht semantische Zusammenhänge in Rohtexten zu analysieren und aufzubereiten. Das For-schungsgebiet "Text Mining" ermöglicht es mit Hilfe statistischer und musterbasierter Verfahren, Wissen aus Texten zu extrahieren, zu verarbeiten und zu nutzen. Hier wird die Basis für die Suchmaschinen der Zukunft gelegt. Was fällt Ihnen bei dem Wort "Stich" ein? Die einen denken an Tennis, die anderen an Skat. Die verschiedenen Zusammenhänge können durch Text Mining automatisch ermittelt und in Form von Wortnetzen dargestellt werden. Welche Begriffe stehen am häufigsten links und rechts vom Wort "Festplatte"? Welche Wortformen und Eigennamen treten seit 2001 neu in der deutschen Sprache auf? Text Mining beantwortet diese und viele weitere Fragen. Tauchen Sie mit diesem Lehrbuch ein in eine neue, faszinierende Wissenschaftsdisziplin und entdecken Sie neue, bisher unbekannte Zusammenhänge und Sichtweisen. Sehen Sie, wie aus dem Wissensrohstoff Text Wissen wird! Dieses Lehrbuch richtet sich sowohl an Studierende als auch an Praktiker mit einem fachlichen Schwerpunkt in der Informatik, Wirtschaftsinformatik und/oder Linguistik, die sich über die Grundlagen, Verfahren und Anwendungen des Text Mining informieren möchten und Anregungen für die Implementierung eigener Anwendungen suchen. Es basiert auf Arbeiten, die während der letzten Jahre an der Abteilung Automatische Sprachverarbeitung am Institut für Informatik der Universität Leipzig unter Leitung von Prof. Dr. Heyer entstanden sind. Eine Fülle praktischer Beispiele von Text Mining-Konzepten und -Algorithmen verhelfen dem Leser zu einem umfassenden, aber auch detaillierten Verständnis der Grundlagen und Anwendungen des Text Mining. Folgende Themen werden behandelt: Wissen und Text Grundlagen der Bedeutungsanalyse Textdatenbanken Sprachstatistik Clustering Musteranalyse Hybride Verfahren Beispielanwendungen Anhänge: Statistik und linguistische Grundlagen 360 Seiten, 54 Abb., 58 Tabellen und 95 Glossarbegriffe Mit kostenlosen e-learning-Kurs "Schnelleinstieg: Sprachstatistik" Zusätzlich zum Buch gibt es in Kürze einen Online-Zertifikats-Kurs mit Mentor- und Tutorunterstützung.
Schürmann, H.: Software scannt Radio- und Fernsehsendungen : Recherche in Nachrichtenarchiven erleichtert (2001) 0.02
```
0.019411027 = product of:
  0.09317293 = sum of:
    0.018188007 = weight(_text_:und in 5759) [ClassicSimilarity], result of:
      0.018188007 = score(doc=5759,freq=38.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.3735868 = fieldWeight in 5759, product of:
          6.164414 = tf(freq=38.0), with freq of:
            38.0 = termFreq=38.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5759)
    0.011283089 = weight(_text_:des in 5759) [ClassicSimilarity], result of:
      0.011283089 = score(doc=5759,freq=6.0), product of:
        0.06083074 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.021966046 = queryNorm
        0.18548335 = fieldWeight in 5759, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5759)
    0.015281722 = weight(_text_:der in 5759) [ClassicSimilarity], result of:
      0.015281722 = score(doc=5759,freq=26.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.31144586 = fieldWeight in 5759, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5759)
    0.018188007 = weight(_text_:und in 5759) [ClassicSimilarity], result of:
      0.018188007 = score(doc=5759,freq=38.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.3735868 = fieldWeight in 5759, product of:
          6.164414 = tf(freq=38.0), with freq of:
            38.0 = termFreq=38.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5759)
    0.030232107 = sum of:
      0.01981577 = weight(_text_:deutschland in 5759) [ClassicSimilarity], result of:
        0.01981577 = score(doc=5759,freq=2.0), product of:
          0.10609499 = queryWeight, product of:
            4.829954 = idf(docFreq=959, maxDocs=44218)
            0.021966046 = queryNorm
          0.18677385 = fieldWeight in 5759, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            4.829954 = idf(docFreq=959, maxDocs=44218)
            0.02734375 = fieldNorm(doc=5759)
      0.010416336 = weight(_text_:22 in 5759) [ClassicSimilarity], result of:
        0.010416336 = score(doc=5759,freq=2.0), product of:
          0.07692135 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.021966046 = queryNorm
          0.1354154 = fieldWeight in 5759, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.02734375 = fieldNorm(doc=5759)
  0.20833333 = coord(5/24)
```
Abstract

Computer müssen lernen, die Sprache des Menschen zu verstehen. Forscher an der Uni Duisburg haben eine Methode entwickelt, mit der ein Rechner Informationen aus Radiobeiträgen herausfiltern kann.

Content

Um Firmen und Agenturen die Beobachtungen von Medien zu erleichtern, entwickeln Forscher an der Duisburger Hochschule zurzeit ein System zur automatischen Themenerkennung in Rundfunk und Fernsehen. Das so genannte Alert-System soll dem Nutzer helfen, die für ihn relevanten Sprachinformationen aus Nachrichtensendungen herauszufiltem und weiterzuverarbeiten. Durch die automatische Analyse durch den Computer können mehrere Programme rund um die Uhr beobachtet werden. Noch erfolgt die Informationsgewinnung aus TV- und Radiosendungen auf klassischem Wege: Ein Mensch sieht, hört, liest und wertet aus. Das ist enorm zeitaufwendig und für eine Firma, die beispielsweise die Konkurrenz beobachten oder ihre Medienpräsenz dokumentieren lassen möchte, auch sehr teuer. Diese Arbeit ließe sich mit einem Spracherkenner automatisieren, sagten sich die Duisburger Forscher. Sie arbeiten nun zusammen mit Partnern aus Deutschland, Frankreich und Portugal in einem europaweiten Projekt an der Entwicklung einer entsprechenden Technologie (http://alert.uni-duisburg.de). An dem Projekt sind auch zwei Medienbeobachtungsuntemehmen beteiligt, die Oberserver Argus Media GmbH aus Baden-Baden und das französische Unternehmen Secodip. Unsere Arbeit würde schon dadurch erleichtert, wenn Informationen, die über unsere Kunden in den Medien erscheinen, vorselektiert würden", beschreibt Simone Holderbach, Leiterin der Produktentwicklung bei Oberserver, ihr Interesse an der Technik. Und wie funktioniert Alert? Das Spracherkennungssystem wird darauf getrimmt, Nachrichtensendungen in Radio und Fernsehen zu überwachen: Alles, was gesagt wird - sei es vom Nachrichtensprecher, Reporter oder Interviewten -, wird durch die automatische Spracherkennung in Text umgewandelt. Dabei werden Themen und Schlüsselwörter erkannt und gespeichert. Diese werden mit den Suchbegriffen des Nutzers verglichen. Gefundene Übereinstimmungen werden angezeigt und dem Benutzer automatisch mitgeteilt. Konventionelle Spracherkennungstechnik sei für die Medienbeobachtung nicht einsetzbar, da diese für einen anderen Zweck entwickelt worden sei, betont Prof. Gerhard Rigoll, Leiter des Fachgebiets Technische Informatik an der Duisburger Hochschule. Für die Umwandlung von Sprache in Text wurde die Alert-Software gründlich trainiert. Aus Zeitungstexten, Audio- und Video-Material wurden bislang rund 3 50 Millionen Wörter verarbeitet. Das System arbeitet in drei Sprachen. Doch so ganz fehlerfrei sei der automatisch gewonnene Text nicht, räumt Rigoll ein. Zurzeit liegt die Erkennungsrate bei 40 bis 70 Prozent. Und das wird sich in absehbarer Zeit auch nicht ändern." Musiküberlagerungen oder starke Hintergrundgeräusche bei Reportagen führen zu Ungenauigkeiten bei der Textumwandlung. Deshalb haben die, Duisburger Wissenschaftler Methoden entwickelt, die über die herkömmliche Suche nach Schlüsselwörtern hinausgehen und eine inhaltsorientierte Zuordnung ermöglichen. Dadurch erhält der Nutzer dann auch solche Nachrichten, die zwar zum Thema passen, in denen das Stichwort aber gar nicht auftaucht", bringt Rigoll den Vorteil der Technik auf den Punkt. Wird beispielsweise "Ölpreis" als Suchbegriff eingegeben, werden auch solche Nachrichten angezeigt, in denen Olkonzerne und Energieagenturen eine Rolle spielen. Rigoll: Das Alert-System liest sozusagen zwischen den Zeilen!' Das Forschungsprojekt wurde vor einem Jahr gestartet und läuft noch bis Mitte 2002. Wer sich über den Stand der Technik informieren möchte, kann dies in dieser Woche auf der Industriemesse in Hannover. Das Alert-System wird auf dem Gemeinschaftsstand "Forschungsland NRW" in Halle 18, Stand M12, präsentiert

Source

Handelsblatt. Nr.79 vom 24.4.2001, S.22

Lorenz, S.: Konzeption und prototypische Realisierung einer begriffsbasierten Texterschließung (2006) 0.02

0.016613223 = product of:
  0.079743475 = sum of:
    0.018925203 = weight(_text_:und in 1746) [ClassicSimilarity], result of:
      0.018925203 = score(doc=1746,freq=14.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.38872904 = fieldWeight in 1746, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1746)
    0.011167361 = weight(_text_:des in 1746) [ClassicSimilarity], result of:
      0.011167361 = score(doc=1746,freq=2.0), product of:
        0.06083074 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.021966046 = queryNorm
        0.18358089 = fieldWeight in 1746, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.046875 = fieldNorm(doc=1746)
    0.021797419 = weight(_text_:der in 1746) [ClassicSimilarity], result of:
      0.021797419 = score(doc=1746,freq=18.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.44423765 = fieldWeight in 1746, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=1746)
    0.018925203 = weight(_text_:und in 1746) [ClassicSimilarity], result of:
      0.018925203 = score(doc=1746,freq=14.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.38872904 = fieldWeight in 1746, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1746)
    0.008928288 = product of:
      0.017856576 = sum of:
        0.017856576 = weight(_text_:22 in 1746) [ClassicSimilarity], result of:
          0.017856576 = score(doc=1746,freq=2.0), product of:
            0.07692135 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.021966046 = queryNorm
            0.23214069 = fieldWeight in 1746, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=1746)
      0.5 = coord(1/2)
  0.20833333 = coord(5/24)

Abstract: Im Rahmen dieser Arbeit wird eine Vorgehensweise entwickelt, die die Fixierung auf das Wort und die damit verbundenen Schwächen überwindet. Sie gestattet die Extraktion von Informationen anhand der repräsentierten Begriffe und bildet damit die Basis einer inhaltlichen Texterschließung. Die anschließende prototypische Realisierung dient dazu, die Konzeption zu überprüfen sowie ihre Möglichkeiten und Grenzen abzuschätzen und zu bewerten. Arbeiten zum Information Extraction widmen sich fast ausschließlich dem Englischen, wobei insbesondere im Bereich der Named Entities sehr gute Ergebnisse erzielt werden. Deutlich schlechter sehen die Resultate für weniger regelmäßige Sprachen wie beispielsweise das Deutsche aus. Aus diesem Grund sowie praktischen Erwägungen wie insbesondere der Vertrautheit des Autors damit, soll diese Sprache primär Gegenstand der Untersuchungen sein. Die Lösung von einer engen Termorientierung bei gleichzeitiger Betonung der repräsentierten Begriffe legt nahe, dass nicht nur die verwendeten Worte sekundär werden sondern auch die verwendete Sprache. Um den Rahmen dieser Arbeit nicht zu sprengen wird bei der Untersuchung dieses Punktes das Augenmerk vor allem auf die mit unterschiedlichen Sprachen verbundenen Schwierigkeiten und Besonderheiten gelegt.
Content: Dissertation an der Universität Trier - Fachbereich IV - zur Erlangung der Würde eines Doktors der Wirtschafts- und Sozialwissenschaften. Vgl.: http://ubt.opus.hbz-nrw.de/volltexte/2006/377/pdf/LorenzSaschaDiss.pdf.
Date: 22. 3.2015 9:17:30

Rösener, C.: ¬Die Stecknadel im Heuhaufen : Natürlichsprachlicher Zugang zu Volltextdatenbanken (2005) 0.02

0.016095867 = product of:
  0.07726017 = sum of:
    0.017193804 = weight(_text_:und in 548) [ClassicSimilarity], result of:
      0.017193804 = score(doc=548,freq=26.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.3531656 = fieldWeight in 548, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=548)
    0.022334723 = weight(_text_:des in 548) [ClassicSimilarity], result of:
      0.022334723 = score(doc=548,freq=18.0), product of:
        0.06083074 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.021966046 = queryNorm
        0.36716178 = fieldWeight in 548, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.03125 = fieldNorm(doc=548)
    0.014531613 = weight(_text_:der in 548) [ClassicSimilarity], result of:
      0.014531613 = score(doc=548,freq=18.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.29615843 = fieldWeight in 548, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=548)
    0.0060062218 = product of:
      0.0120124435 = sum of:
        0.0120124435 = weight(_text_:29 in 548) [ClassicSimilarity], result of:
          0.0120124435 = score(doc=548,freq=2.0), product of:
            0.07726968 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.021966046 = queryNorm
            0.15546128 = fieldWeight in 548, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.03125 = fieldNorm(doc=548)
      0.5 = coord(1/2)
    0.017193804 = weight(_text_:und in 548) [ClassicSimilarity], result of:
      0.017193804 = score(doc=548,freq=26.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.3531656 = fieldWeight in 548, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=548)
  0.20833333 = coord(5/24)

Abstract: Die Möglichkeiten, die der heutigen Informations- und Wissensgesellschaft für die Beschaffung und den Austausch von Information zur Verfügung stehen, haben kurioserweise gleichzeitig ein immer akuter werdendes, neues Problem geschaffen: Es wird für jeden Einzelnen immer schwieriger, aus der gewaltigen Fülle der angebotenen Informationen die tatsächlich relevanten zu selektieren. Diese Arbeit untersucht die Möglichkeit, mit Hilfe von natürlichsprachlichen Schnittstellen den Zugang des Informationssuchenden zu Volltextdatenbanken zu verbessern. Dabei werden zunächst die wissenschaftlichen Fragestellungen ausführlich behandelt. Anschließend beschreibt der Autor verschiedene Lösungsansätze und stellt anhand einer natürlichsprachlichen Schnittstelle für den Brockhaus Multimedial 2004 deren erfolgreiche Implementierung vor
Content: Enthält die Kapitel: 2: Wissensrepräsentation 2.1 Deklarative Wissensrepräsentation 2.2 Klassifikationen des BMM 2.3 Thesauri und Ontologien: existierende kommerzielle Software 2.4 Erstellung eines Thesaurus im Rahmen des LeWi-Projektes 3: Analysekomponenten 3.1 Sprachliche Phänomene in der maschinellen Textanalyse 3.2 Analysekomponenten: Lösungen und Forschungsansätze 3.3 Die Analysekomponenten im LeWi-Projekt 4: Information Retrieval 4.1 Grundlagen des Information Retrieval 4.2 Automatische Indexierungsmethoden und -verfahren 4.3 Automatische Indexierung des BMM im Rahmen des LeWi-Projektes 4.4 Suchstrategien und Suchablauf im LeWi-Kontext
5: Interaktion 5.1 Frage-Antwort- bzw. Dialogsysteme: Forschungen und Projekte 5.2 Darstellung und Visualisierung von Wissen 5.3 Das Dialogsystem im Rahmen des LeWi-Projektes 5.4 Ergebnisdarstellung und Antwortpräsentation im LeWi-Kontext 6: Testumgebungen und -ergebnisse 7: Ergebnisse und Ausblick 7.1 Ausgangssituation 7.2 Schlussfolgerungen 7.3 Ausblick Anhang A Auszüge aus der Grob- bzw. Feinklassifikation des BMM Anhang B MPRO - Formale Beschreibung der wichtigsten Merkmale ... Anhang C Fragentypologie mit Beispielsätzen (Auszug) Anhang D Semantische Merkmale im morphologischen Lexikon (Auszug) Anhang E Regelbeispiele für die Fragentypzuweisung Anhang F Aufstellung der möglichen Suchen im LeWi-Dialogmodul (Auszug) Anhang G Vollständiger Dialogbaum zu Beginn des Projektes Anhang H Statuszustände zur Ermittlung der Folgefragen (Auszug)
Date: 29. 3.2009 11:11:45
Series: Saarbrücker Beiträge zur Sprach- und Translationswissenschaft; Bd.8

Schneider, R.: Web 3.0 ante portas? : Integration von Social Web und Semantic Web (2008) 0.02

0.015899168 = product of:
  0.07631601 = sum of:
    0.020441556 = weight(_text_:und in 4184) [ClassicSimilarity], result of:
      0.020441556 = score(doc=4184,freq=12.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.41987535 = fieldWeight in 4184, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4184)
    0.013028587 = weight(_text_:des in 4184) [ClassicSimilarity], result of:
      0.013028587 = score(doc=4184,freq=2.0), product of:
        0.06083074 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.021966046 = queryNorm
        0.2141777 = fieldWeight in 4184, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4184)
    0.011987969 = weight(_text_:der in 4184) [ClassicSimilarity], result of:
      0.011987969 = score(doc=4184,freq=4.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.24431825 = fieldWeight in 4184, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4184)
    0.020441556 = weight(_text_:und in 4184) [ClassicSimilarity], result of:
      0.020441556 = score(doc=4184,freq=12.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.41987535 = fieldWeight in 4184, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4184)
    0.010416336 = product of:
      0.020832673 = sum of:
        0.020832673 = weight(_text_:22 in 4184) [ClassicSimilarity], result of:
          0.020832673 = score(doc=4184,freq=2.0), product of:
            0.07692135 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.021966046 = queryNorm
            0.2708308 = fieldWeight in 4184, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=4184)
      0.5 = coord(1/2)
  0.20833333 = coord(5/24)

Abstract: Das Medium Internet ist im Wandel, und mit ihm ändern sich seine Publikations- und Rezeptionsbedingungen. Welche Chancen bieten die momentan parallel diskutierten Zukunftsentwürfe von Social Web und Semantic Web? Zur Beantwortung dieser Frage beschäftigt sich der Beitrag mit den Grundlagen beider Modelle unter den Aspekten Anwendungsbezug und Technologie, beleuchtet darüber hinaus jedoch auch deren Unzulänglichkeiten sowie den Mehrwert einer mediengerechten Kombination. Am Beispiel des grammatischen Online-Informationssystems grammis wird eine Strategie zur integrativen Nutzung der jeweiligen Stärken skizziert.
Date: 22. 1.2011 10:38:28
Source: Kommunikation, Partizipation und Wirkungen im Social Web, Band 1. Hrsg.: A. Zerfaß u.a

Monnerjahn, P.: Vorsprung ohne Technik : Übersetzen: Computer und Qualität (2000) 0.02

0.015322969 = product of:
  0.073550254 = sum of:
    0.01254985 = product of:
      0.03764955 = sum of:
        0.03764955 = weight(_text_:p in 5429) [ClassicSimilarity], result of:
          0.03764955 = score(doc=5429,freq=2.0), product of:
            0.078979194 = queryWeight, product of:
              3.5955126 = idf(docFreq=3298, maxDocs=44218)
              0.021966046 = queryNorm
            0.47670212 = fieldWeight in 5429, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5955126 = idf(docFreq=3298, maxDocs=44218)
              0.09375 = fieldNorm(doc=5429)
      0.33333334 = coord(1/3)
    0.0143061085 = weight(_text_:und in 5429) [ClassicSimilarity], result of:
      0.0143061085 = score(doc=5429,freq=2.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.29385152 = fieldWeight in 5429, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=5429)
    0.014531613 = weight(_text_:der in 5429) [ClassicSimilarity], result of:
      0.014531613 = score(doc=5429,freq=2.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.29615843 = fieldWeight in 5429, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.09375 = fieldNorm(doc=5429)
    0.0143061085 = weight(_text_:und in 5429) [ClassicSimilarity], result of:
      0.0143061085 = score(doc=5429,freq=2.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.29385152 = fieldWeight in 5429, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=5429)
    0.017856576 = product of:
      0.03571315 = sum of:
        0.03571315 = weight(_text_:22 in 5429) [ClassicSimilarity], result of:
          0.03571315 = score(doc=5429,freq=2.0), product of:
            0.07692135 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.021966046 = queryNorm
            0.46428138 = fieldWeight in 5429, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=5429)
      0.5 = coord(1/2)
  0.20833333 = coord(5/24)

Abstract: Noch immer ist der menschliche Übersetzer dem Computer in sprachlicher Hinsicht überlegen. Zwar ist die Übersetzungssoftware besser geworden, aber die systembedingten Probleme bleiben
Source: c't. 2000, H.22, S.230-231

Rahmstorf, G.: Rückkehr von Ordnung in die Informationstechnik? (2000) 0.01

0.014764643 = product of:
  0.08858786 = sum of:
    0.023723999 = weight(_text_:und in 5504) [ClassicSimilarity], result of:
      0.023723999 = score(doc=5504,freq=22.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.48729765 = fieldWeight in 5504, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5504)
    0.01934244 = weight(_text_:des in 5504) [ClassicSimilarity], result of:
      0.01934244 = score(doc=5504,freq=6.0), product of:
        0.06083074 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.021966046 = queryNorm
        0.31797147 = fieldWeight in 5504, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.046875 = fieldNorm(doc=5504)
    0.021797419 = weight(_text_:der in 5504) [ClassicSimilarity], result of:
      0.021797419 = score(doc=5504,freq=18.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.44423765 = fieldWeight in 5504, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=5504)
    0.023723999 = weight(_text_:und in 5504) [ClassicSimilarity], result of:
      0.023723999 = score(doc=5504,freq=22.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.48729765 = fieldWeight in 5504, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5504)
  0.16666667 = coord(4/24)

Abstract: Im Zuge der aktuellen Informationstechnik, der weltweiten Kommunikation und des elektronischen Publizierens scheinen die herkömmlichen Instrumente der Ordnungsstiftung - bibliothekarische Klassifikationssysteme und Thesauren - an den Rand gedrängt zu werden oder sogar ganz zu verschwinden. Andererseits sind die Endbenutzer oft unzufrieden mit dem Ergebnis des Recherchierens im Bestand des unabsehbar wachsenden Informationsangebotes. Ist eine präzise und vollständige Recherche bei den gegebenen technischen und Ökonomischen Verhältnissen überhaupt noch realisierbar'?
Series: Gemeinsamer Kongress der Bundesvereinigung Deutscher Bibliotheksverbände e.V. (BDB) und der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis e.V. (DGI); Bd.1)(Tagungen der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis e.V.; Bd.3
Source: Information und Öffentlichkeit: 1. Gemeinsamer Kongress der Bundesvereinigung Deutscher Bibliotheksverbände e.V. (BDB) und der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis e.V. (DGI), Leipzig, 20.-23.3.2000. Zugleich 90. Deutscher Bibliothekartag, 52. Jahrestagung der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis e.V. (DGI). Hrsg.: G. Ruppelt u. H. Neißer

Sprachtechnologie, mobile Kommunikation und linguistische Ressourcen : Beiträge zur GLDV Tagung 2005 in Bonn (2005) 0.01
```
0.014596508 = product of:
  0.07006324 = sum of:
    0.0118619995 = weight(_text_:und in 3578) [ClassicSimilarity], result of:
      0.0118619995 = score(doc=3578,freq=22.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.24364883 = fieldWeight in 3578, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0234375 = fieldNorm(doc=3578)
    0.012485489 = weight(_text_:des in 3578) [ClassicSimilarity], result of:
      0.012485489 = score(doc=3578,freq=10.0), product of:
        0.06083074 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.021966046 = queryNorm
        0.20524967 = fieldWeight in 3578, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.0234375 = fieldNorm(doc=3578)
    0.018874912 = weight(_text_:fragen in 3578) [ClassicSimilarity], result of:
      0.018874912 = score(doc=3578,freq=2.0), product of:
        0.11184209 = queryWeight, product of:
          5.0915895 = idf(docFreq=738, maxDocs=44218)
          0.021966046 = queryNorm
        0.16876394 = fieldWeight in 3578, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.0915895 = idf(docFreq=738, maxDocs=44218)
          0.0234375 = fieldNorm(doc=3578)
    0.014978844 = weight(_text_:der in 3578) [ClassicSimilarity], result of:
      0.014978844 = score(doc=3578,freq=34.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.30527312 = fieldWeight in 3578, product of:
          5.8309517 = tf(freq=34.0), with freq of:
            34.0 = termFreq=34.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0234375 = fieldNorm(doc=3578)
    0.0118619995 = weight(_text_:und in 3578) [ClassicSimilarity], result of:
      0.0118619995 = score(doc=3578,freq=22.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.24364883 = fieldWeight in 3578, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0234375 = fieldNorm(doc=3578)
  0.20833333 = coord(5/24)
```
Abstract

Die Sprachtechnologie wird mobil. Sprachtechnologische Anwendungen begegnen uns zunehmend außerhalb des Büros oder der eigenen vier Wände. Mit gesprochener Sprache steuern Benutzer ihre Mobiltelefone, fragen Datenbanken ab oder führen Geschäftsvorgänge durch. In diesen Bereichen finden eklektisch sprachwissenschaftliche Modelle Anwendung, vor allem solche, die auf linguistischen Ressourcen - wie Wortnetzen oder Ontologien - trainiert werden müssen, aber auch Modelle der Dialog-Repräsentation und -Struktur wie etwa des Turn Taking. Dieser Tagungsband vereint die Beiträge zum Hauptprogramm der Jahrestagung 2005 der Gesellschaftfür Linguistische Datenverarbeitung (GLDV), zu den Workshops GermaNetHund Turn Taking sowie die Beiträge zum GLDV Preis 2005 für die beste Abschlussarbeit.

Content

INHALT: Chris Biemann/Rainer Osswald: Automatische Erweiterung eines semantikbasierten Lexikons durch Bootstrapping auf großen Korpora - Ernesto William De Luca/Andreas Nürnberger: Supporting Mobile Web Search by Ontology-based Categorization - Rüdiger Gleim: HyGraph - Ein Framework zur Extraktion, Repräsentation und Analyse webbasierter Hypertextstrukturen - Felicitas Haas/Bernhard Schröder: Freges Grundgesetze der Arithmetik: Dokumentbaum und Formelwald - Ulrich Held/ Andre Blessing/Bettina Säuberlich/Jürgen Sienel/Horst Rößler/Dieter Kopp: A personalized multimodal news service -Jürgen Hermes/Christoph Benden: Fusion von Annotation und Präprozessierung als Vorschlag zur Behebung des Rohtextproblems - Sonja Hüwel/Britta Wrede/Gerhard Sagerer: Semantisches Parsing mit Frames für robuste multimodale Mensch-Maschine-Kommunikation - Brigitte Krenn/Stefan Evert: Separating the wheat from the chaff- Corpus-driven evaluation of statistical association measures for collocation extraction - Jörn Kreutel: An application-centered Perspective an Multimodal Dialogue Systems - Jonas Kuhn: An Architecture for Prallel Corpusbased Grammar Learning - Thomas Mandl/Rene Schneider/Pia Schnetzler/Christa Womser-Hacker: Evaluierung von Systemen für die Eigennamenerkennung im crosslingualen Information Retrieval - Alexander Mehler/Matthias Dehmer/Rüdiger Gleim: Zur Automatischen Klassifikation von Webgenres - Charlotte Merz/Martin Volk: Requirements for a Parallel Treebank Search Tool - Sally YK. Mok: Multilingual Text Retrieval an the Web: The Case of a Cantonese-Dagaare-English Trilingual e-Lexicon -
Darja Mönke: Ein Parser für natürlichsprachlich formulierte mathematische Beweise - Martin Müller: Ontologien für mathematische Beweistexte - Moritz Neugebauer: The status of functional phonological classification in statistical speech recognition - Uwe Quasthoff: Kookkurrenzanalyse und korpusbasierte Sachgruppenlexikographie - Reinhard Rapp: On the Relationship between Word Frequency and Word Familiarity - Ulrich Schade/Miloslaw Frey/Sebastian Becker: Computerlinguistische Anwendungen zur Verbesserung der Kommunikation zwischen militärischen Einheiten und deren Führungsinformationssystemen - David Schlangen/Thomas Hanneforth/Manfred Stede: Weaving the Semantic Web: Extracting and Representing the Content of Pathology Reports - Thomas Schmidt: Modellbildung und Modellierungsparadigmen in der computergestützten Korpuslinguistik - Sabine Schröder/Martina Ziefle: Semantic transparency of cellular phone menus - Thorsten Trippel/Thierry Declerck/Ulrich Held: Standardisierung von Sprachressourcen: Der aktuelle Stand - Charlotte Wollermann: Evaluation der audiovisuellen Kongruenz bei der multimodalen Sprachsynsthese - Claudia Kunze/Lothar Lemnitzer: Anwendungen des GermaNet II: Einleitung - Claudia Kunze/Lothar Lemnitzer: Die Zukunft der Wortnetze oder die Wortnetze der Zukunft - ein Roadmap-Beitrag -
Karel Pala: The Balkanet Experience - Peter M. Kruse/Andre Nauloks/Dietmar Rösner/Manuela Kunze: Clever Search: A WordNet Based Wrapper for Internet Search Engines - Rosmary Stegmann/Wolfgang Woerndl: Using GermaNet to Generate Individual Customer Profiles - Ingo Glöckner/Sven Hartrumpf/Rainer Osswald: From GermaNet Glosses to Formal Meaning Postulates -Aljoscha Burchardt/ Katrin Erk/Anette Frank: A WordNet Detour to FrameNet - Daniel Naber: OpenThesaurus: ein offenes deutsches Wortnetz - Anke Holler/Wolfgang Grund/Heinrich Petith: Maschinelle Generierung assoziativer Termnetze für die Dokumentensuche - Stefan Bordag/Hans Friedrich Witschel/Thomas Wittig: Evaluation of Lexical Acquisition Algorithms - Iryna Gurevych/Hendrik Niederlich: Computing Semantic Relatedness of GermaNet Concepts - Roland Hausser: Turn-taking als kognitive Grundmechanik der Datenbanksemantik - Rodolfo Delmonte: Parsing Overlaps - Melanie Twiggs: Behandlung des Passivs im Rahmen der Datenbanksemantik- Sandra Hohmann: Intention und Interaktion - Anmerkungen zur Relevanz der Benutzerabsicht - Doris Helfenbein: Verwendung von Pronomina im Sprecher- und Hörmodus - Bayan Abu Shawar/Eric Atwell: Modelling turn-taking in a corpus-trained chatbot - Barbara März: Die Koordination in der Datenbanksemantik - Jens Edlund/Mattias Heldner/Joakim Gustafsson: Utterance segmentation and turn-taking in spoken dialogue systems - Ekaterina Buyko: Numerische Repräsentation von Textkorpora für Wissensextraktion - Bernhard Fisseni: ProofML - eine Annotationssprache für natürlichsprachliche mathematische Beweise - Iryna Schenk: Auflösung der Pronomen mit Nicht-NP-Antezedenten in spontansprachlichen Dialogen - Stephan Schwiebert: Entwurf eines agentengestützten Systems zur Paradigmenbildung - Ingmar Steiner: On the analysis of speech rhythm through acoustic parameters - Hans Friedrich Witschel: Text, Wörter, Morpheme - Möglichkeiten einer automatischen Terminologie-Extraktion.

Series

Sprache, Sprechen und Computer. Bd. 8

Pinker, S.: Wörter und Regeln : Die Natur der Sprache (2000) 0.01

0.014502766 = product of:
  0.06961328 = sum of:
    0.016859911 = weight(_text_:und in 734) [ClassicSimilarity], result of:
      0.016859911 = score(doc=734,freq=16.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.34630734 = fieldWeight in 734, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=734)
    0.009306135 = weight(_text_:des in 734) [ClassicSimilarity], result of:
      0.009306135 = score(doc=734,freq=2.0), product of:
        0.06083074 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.021966046 = queryNorm
        0.15298408 = fieldWeight in 734, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.0390625 = fieldNorm(doc=734)
    0.019147081 = weight(_text_:der in 734) [ClassicSimilarity], result of:
      0.019147081 = score(doc=734,freq=20.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.390223 = fieldWeight in 734, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=734)
    0.016859911 = weight(_text_:und in 734) [ClassicSimilarity], result of:
      0.016859911 = score(doc=734,freq=16.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.34630734 = fieldWeight in 734, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=734)
    0.00744024 = product of:
      0.01488048 = sum of:
        0.01488048 = weight(_text_:22 in 734) [ClassicSimilarity], result of:
          0.01488048 = score(doc=734,freq=2.0), product of:
            0.07692135 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.021966046 = queryNorm
            0.19345059 = fieldWeight in 734, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0390625 = fieldNorm(doc=734)
      0.5 = coord(1/2)
  0.20833333 = coord(5/24)

Abstract: Wie lernen Kinder sprechen? Welche Hinweise geben gerade ihre Fehler beim Spracherwerb auf den Ablauf des Lernprozesses - getreu dem Motto: "Kinder sagen die töllsten Sachen«? Und wie helfen beziehungsweise warum scheitern bislang Computer bei der Simulation neuronaler Netzwerke, die am komplizierten Gewebe der menschlichen Sprache mitwirken? In seinem neuen Buch Wörter und Regeln hat der bekannte US-amerikanische Kognitionswissenschaftler Steven Pinker (Der Sprachinstinkt) wieder einmal eine ebenso informative wie kurzweifige Erkundungstour ins Reich der Sprache unternommen. Was die Sache besonders spannend und lesenswert macht: Souverän beleuchtet der Professor am Massachusetts Institute of Technology sowohl natur- als auch geisteswissenschaftliche Aspekte. So vermittelt er einerseits linguistische Grundlagen in den Fußspuren Ferdinand de Saussures, etwa die einer generativen Grammatik, liefert einen Exkurs durch die Sprachgeschichte und widmet ein eigenes Kapitel den Schrecken der deutschen Sprache". Andererseits lässt er aber auch die neuesten bildgebenden Verfahren nicht außen vor, die zeigen, was im Gehirn bei der Sprachverarbeitung abläuft. Pinkers Theorie, die sich in diesem Puzzle verschiedenster Aspekte wiederfindet: Sprache besteht im Kein aus zwei Bestandteilen - einem mentalen Lexikon aus erinnerten Wörtern und einer mentalen Grammatik aus verschiedenen kombinatorischen Regeln. Konkret heißt das: Wir prägen uns bekannte Größen und ihre abgestuften, sich kreuzenden Merkmale ein, aber wir erzeugen auch neue geistige Produkte, in dem wir Regeln anwenden. Gerade daraus, so schließt Pinker, erschließt sich der Reichtum und die ungeheure Ausdruckskraft unserer Sprache
Date: 19. 7.2002 14:22:31

Computerlinguistik und Sprachtechnologie : Eine Einführung (2001) 0.01

0.014474454 = product of:
  0.086846724 = sum of:
    0.025790704 = weight(_text_:und in 1749) [ClassicSimilarity], result of:
      0.025790704 = score(doc=1749,freq=26.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.5297484 = fieldWeight in 1749, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1749)
    0.011167361 = weight(_text_:des in 1749) [ClassicSimilarity], result of:
      0.011167361 = score(doc=1749,freq=2.0), product of:
        0.06083074 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.021966046 = queryNorm
        0.18358089 = fieldWeight in 1749, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.046875 = fieldNorm(doc=1749)
    0.024097953 = weight(_text_:der in 1749) [ClassicSimilarity], result of:
      0.024097953 = score(doc=1749,freq=22.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.4911232 = fieldWeight in 1749, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=1749)
    0.025790704 = weight(_text_:und in 1749) [ClassicSimilarity], result of:
      0.025790704 = score(doc=1749,freq=26.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.5297484 = fieldWeight in 1749, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1749)
  0.16666667 = coord(4/24)

Abstract: Dieses Lehrbuch bietet eine umfassende Einführung in Grundlagen und Methoden der Computerlinguistik und stellt die wichtigsten Anwendungsgebiete in der Sprachtechnologie vor. Es richtet sich gleichermaßen an Studierende der Computerlinguistik und verwandter Fächer mit Bezug zur Verarbeitung natürlicher Sprache wie an Entwickler sprachverarbeitender Systeme. Nach einem Überblick über Aufgaben und Ziele der Computerlinguistik werden die erforderlichen theoretischen Grundlagen zur Logik, den Formalen Sprachen und statistischen Verfahren ausführlich und beispielbezogen erläutert. Es schließt sich eine Darstellung der verschiedenen Methoden für die Verarbeitung auf den linguistischen Beschreibungsebenen an. Dabei werden zunächst die grundlegenden Begriffe und Konzepte der Phonetik, Morphologie, Syntax, Semantik sowie der Pragmatik vermittelt und darauf aufbauend die Prinzipien der sprachtechnologischen Umsetzung behandelt. Der letzte Teil des Buchs gibt einen Überblick über die sprachtechnologischen Anwendungen in der Praxis und zeigt anhand einer Vielzahl konkreter Fragestellungen - von Spracherkennung über Sprachsynthese, Information Retrieval bis hin zu Dialogsystemen und automatischer Übersetzung - das Zusammenwirken der einzelnen Methoden auf. "Durch dieses Handbuch wird für den deutschsprachigen Raum eine empfindliche Lücke geschlossen. Es umfasst die relevanten Aspekte computerlinguistischer Grundlagenwissenschaft und sprachtechnologischer Anwendung in eindrucksvoller Breite und auf aktuellem Stand" [Manfred Pinkal]

Jensen, N.: Evaluierung von mehrsprachigem Web-Retrieval : Experimente mit dem EuroGOV-Korpus im Rahmen des Cross Language Evaluation Forum (CLEF) (2006) 0.01

0.014018601 = product of:
  0.0841116 = sum of:
    0.017521333 = weight(_text_:und in 5964) [ClassicSimilarity], result of:
      0.017521333 = score(doc=5964,freq=12.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.35989314 = fieldWeight in 5964, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5964)
    0.024970978 = weight(_text_:des in 5964) [ClassicSimilarity], result of:
      0.024970978 = score(doc=5964,freq=10.0), product of:
        0.06083074 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.021966046 = queryNorm
        0.41049933 = fieldWeight in 5964, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.046875 = fieldNorm(doc=5964)
    0.024097953 = weight(_text_:der in 5964) [ClassicSimilarity], result of:
      0.024097953 = score(doc=5964,freq=22.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.4911232 = fieldWeight in 5964, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=5964)
    0.017521333 = weight(_text_:und in 5964) [ClassicSimilarity], result of:
      0.017521333 = score(doc=5964,freq=12.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.35989314 = fieldWeight in 5964, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5964)
  0.16666667 = coord(4/24)

Abstract: Der vorliegende Artikel beschreibt die Experimente der Universität Hildesheim im Rahmen des ersten Web Track der CLEF-Initiative (WebCLEF) im Jahr 2005. Bei der Teilnahme konnten Erfahrungen mit einem multilingualen Web-Korpus (EuroGOV) bei der Vorverarbeitung, der Topic- bzw. Query-Entwicklung, bei sprachunabhängigen Indexierungsmethoden und multilingualen Retrieval-Strategien gesammelt werden. Aufgrund des großen Um-fangs des Korpus und der zeitlichen Einschränkungen wurden multilinguale Indizes aufgebaut. Der Artikel beschreibt die Vorgehensweise bei der Teilnahme der Universität Hildesheim und die Ergebnisse der offiziell eingereichten sowie weiterer Experimente. Für den Multilingual Task konnte das beste Ergebnis in CLEF erzielt werden.
Source: Effektive Information Retrieval Verfahren in Theorie und Praxis: ausgewählte und erweiterte Beiträge des Vierten Hildesheimer Evaluierungs- und Retrievalworkshop (HIER 2005), Hildesheim, 20.7.2005. Hrsg.: T. Mandl u. C. Womser-Hacker

Winterschladen, S.; Gurevych, I.: ¬Die perfekte Suchmaschine : Forschungsgruppe entwickelt ein System, das artverwandte Begriffe finden soll (2006) 0.01
```
0.013917024 = product of:
  0.06680172 = sum of:
    0.013194968 = weight(_text_:und in 5912) [ClassicSimilarity], result of:
      0.013194968 = score(doc=5912,freq=20.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.27102837 = fieldWeight in 5912, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5912)
    0.013028587 = weight(_text_:des in 5912) [ClassicSimilarity], result of:
      0.013028587 = score(doc=5912,freq=8.0), product of:
        0.06083074 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.021966046 = queryNorm
        0.2141777 = fieldWeight in 5912, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5912)
    0.017475316 = weight(_text_:der in 5912) [ClassicSimilarity], result of:
      0.017475316 = score(doc=5912,freq=34.0), product of:
        0.049067024 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.021966046 = queryNorm
        0.35615197 = fieldWeight in 5912, product of:
          5.8309517 = tf(freq=34.0), with freq of:
            34.0 = termFreq=34.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5912)
    0.013194968 = weight(_text_:und in 5912) [ClassicSimilarity], result of:
      0.013194968 = score(doc=5912,freq=20.0), product of:
        0.04868482 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.021966046 = queryNorm
        0.27102837 = fieldWeight in 5912, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5912)
    0.009907885 = product of:
      0.01981577 = sum of:
        0.01981577 = weight(_text_:deutschland in 5912) [ClassicSimilarity], result of:
          0.01981577 = score(doc=5912,freq=2.0), product of:
            0.10609499 = queryWeight, product of:
              4.829954 = idf(docFreq=959, maxDocs=44218)
              0.021966046 = queryNorm
            0.18677385 = fieldWeight in 5912, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.829954 = idf(docFreq=959, maxDocs=44218)
              0.02734375 = fieldNorm(doc=5912)
      0.5 = coord(1/2)
  0.20833333 = coord(5/24)
```
Content

"KÖLNER STADT-ANZEIGER: Frau Gurevych, Sie entwickeln eine Suchmaschine der nächsten Generation? Wie kann man sich diese vorstellen? IRYNA GUREVYCH Jeder kennt die herkömmlichen Suchmaschinen wie Google, Yahoo oder Altavista. Diese sind aber nicht perfekt, weil sie nur nach dem Prinzip der Zeichenerkennung funktionieren. Das steigende Informationsbedürfnis können herkömmliche Suchmaschinen nicht befriedigen. KStA: Wieso nicht? GUREVYCH Nehmen wir mal ein konkretes Beispiel: Sie suchen bei Google nach einem Rezept für einen Kuchen, der aber kein Obst enthalten soll. Keine Suchmaschine der Welt kann bisher sinnvoll solche oder ähnliche Anfragen ausführen. Meistens kommen Tausende von Ergebnissen, in denen der Nutzer die relevanten Informationen wie eine Nadel im Heuhaufen suchen muss. KStA: Und Sie können dieses Problem lösen? GUREVYCH Wir entwickeln eine Suchmaschine, die sich nicht nur auf das System der Zeichenerkennung verlässt, sondern auch linguistische Merkmale nutzt. Unsere Suchmaschine soll also auch artverwandte Begriffe zeigen. KStA: Wie weit sind Sie mit Ihrer Forschung? GUREVYCH Das Projekt ist auf zwei Jahre angelegt. Wir haben vor einem halben Jahr begonnen, haben also noch einen großen Teil vor uns. Trotzdem sind die ersten Zwischenergebnisse schon sehr beachtlich. KStA: Und wann geht die Suchmaschine ins Internet? GUREVYCH Da es sich um ein Projekt der Deutschen Forschungsgemeinschaft handelt, wird die Suchmaschine vorerst nicht veröffentlicht. Wir sehen es als unsere Aufgabe an, Verbesserungsmöglichkeiten durch schlaue Such-Algorithmen mit unseren Forschungsarbeiten nachzuweisen und Fehler der bekannten Suchmaschinen zu beseitigen. Und da sind wir auf einem guten Weg. KStA: Arbeiten Sie auch an einem ganz speziellen Projekt? GUREVYCH Ja, ihre erste Bewährungsprobe muss die neue Technologie auf einem auf den ersten Blick ungewöhnlichen Feld bestehen: Unsere Forschungsgruppe an der Technischen Universität Darmstadt entwickelt derzeit ein neuartiges System zur Unterstützung Jugendlicher bei der Berufsauswahl. Dazu stellt uns die Bundesagentur für Arbeit die Beschreibungen von 5800 Berufen in Deutschland zur Verfügung. KStA: Und was sollen Sie dann mit diesen konkreten Informationen machen? GUREVYCH Jugendliche sollen unsere Suchmaschine mit einem Aufsatz über ihre beruflichen Vorlieben flittern. Das System soll dann eine Suchabfrage starten und mögliche Berufe anhand des Interesses des Jugendlichen heraussuchen. Die persönliche Beratung durch die Bundesagentur für Arbeit kann dadurch auf alternative Angebote ausgeweitet werden. Ein erster Prototyp soll Ende des Jahres bereitstehen. KStA: Es geht also zunächst einmal nicht darum, einen Jobfür den Jugendlichen zu finden, sondern den perfekten Beruf für ihn zu ermitteln? GUREVYCH Ja, anhand der Beschreibung des Jugendlichen startet die Suchmaschine eine semantische Abfrage und sucht den passenden Beruf heraus. KStA: Gab es schon weitere Anfragen seitens der Industrie? GUREVYCH Nein, wir haben bisher noch keine Werbung betrieben. Meine Erfahrung zeigt, dass angesehene Kongresse die beste Plattform sind, um die Ergebnisse zu präsentieren und auf sich aufmerksam zu machen. Einige erste Veröffentlichungen sind bereits unterwegs und werden 2006 noch erscheinen. KStA: Wie sieht denn Ihrer Meinung nach die Suchmaschine der Zukunft aus? GUREVYCH Suchmaschinen werden immer spezieller. Das heißt, dass es etwa in der Medizin, bei den Krankenkassen oder im Sport eigene Suchmaschinen geben wird. Außerdem wird die Tendenz verstärkt zu linguistischen Suchmaschinen gehen, die nach artverwandten Begriffen fahnden. Die perfekte Suchmaschine wird wohl eine Kombination aus statistischem und linguistisch-semantischem Suchverhalten sein. Algorithmen, die wir am Fachgebiet Telekooperation an der TU Darmstadt entwickeln, werden für den nächsten qualitativen Sprung bei der Entwicklung der Suchmaschinen von größter Bedeutung sein."

Search (129 results, page 1 of 7)

Authors

Languages

Types

Themes

Subjects

Classifications