Search (170 results, page 1 of 9)

  • × theme_ss:"Computerlinguistik"
  1. Hotho, A.; Bloehdorn, S.: Data Mining 2004 : Text classification by boosting weak learners based on terms and concepts (2004) 0.18
    0.1823518 = product of:
      0.24313574 = sum of:
        0.059267204 = product of:
          0.17780161 = sum of:
            0.17780161 = weight(_text_:3a in 562) [ClassicSimilarity], result of:
              0.17780161 = score(doc=562,freq=2.0), product of:
                0.31636283 = queryWeight, product of:
                  8.478011 = idf(docFreq=24, maxDocs=44218)
                  0.03731569 = queryNorm
                0.56201804 = fieldWeight in 562, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  8.478011 = idf(docFreq=24, maxDocs=44218)
                  0.046875 = fieldNorm(doc=562)
          0.33333334 = coord(1/3)
        0.17780161 = weight(_text_:2f in 562) [ClassicSimilarity], result of:
          0.17780161 = score(doc=562,freq=2.0), product of:
            0.31636283 = queryWeight, product of:
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.03731569 = queryNorm
            0.56201804 = fieldWeight in 562, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.046875 = fieldNorm(doc=562)
        0.006066913 = product of:
          0.030334564 = sum of:
            0.030334564 = weight(_text_:22 in 562) [ClassicSimilarity], result of:
              0.030334564 = score(doc=562,freq=2.0), product of:
                0.13067318 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03731569 = queryNorm
                0.23214069 = fieldWeight in 562, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.046875 = fieldNorm(doc=562)
          0.2 = coord(1/5)
      0.75 = coord(3/4)
    
    Content
    Vgl.: http://www.google.de/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&ved=0CEAQFjAA&url=http%3A%2F%2Fciteseerx.ist.psu.edu%2Fviewdoc%2Fdownload%3Fdoi%3D10.1.1.91.4940%26rep%3Drep1%26type%3Dpdf&ei=dOXrUMeIDYHDtQahsIGACg&usg=AFQjCNHFWVh6gNPvnOrOS9R3rkrXCNVD-A&sig2=5I2F5evRfMnsttSgFF9g7Q&bvm=bv.1357316858,d.Yms.
    Date
    8. 1.2013 10:22:32
  2. Noever, D.; Ciolino, M.: ¬The Turing deception (2022) 0.12
    0.11853441 = product of:
      0.23706882 = sum of:
        0.059267204 = product of:
          0.17780161 = sum of:
            0.17780161 = weight(_text_:3a in 862) [ClassicSimilarity], result of:
              0.17780161 = score(doc=862,freq=2.0), product of:
                0.31636283 = queryWeight, product of:
                  8.478011 = idf(docFreq=24, maxDocs=44218)
                  0.03731569 = queryNorm
                0.56201804 = fieldWeight in 862, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  8.478011 = idf(docFreq=24, maxDocs=44218)
                  0.046875 = fieldNorm(doc=862)
          0.33333334 = coord(1/3)
        0.17780161 = weight(_text_:2f in 862) [ClassicSimilarity], result of:
          0.17780161 = score(doc=862,freq=2.0), product of:
            0.31636283 = queryWeight, product of:
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.03731569 = queryNorm
            0.56201804 = fieldWeight in 862, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.046875 = fieldNorm(doc=862)
      0.5 = coord(2/4)
    
    Source
    https%3A%2F%2Farxiv.org%2Fabs%2F2212.06721&usg=AOvVaw3i_9pZm9y_dQWoHi6uv0EN
  3. Huo, W.: Automatic multi-word term extraction and its application to Web-page summarization (2012) 0.09
    0.09193426 = product of:
      0.18386853 = sum of:
        0.17780161 = weight(_text_:2f in 563) [ClassicSimilarity], result of:
          0.17780161 = score(doc=563,freq=2.0), product of:
            0.31636283 = queryWeight, product of:
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.03731569 = queryNorm
            0.56201804 = fieldWeight in 563, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.046875 = fieldNorm(doc=563)
        0.006066913 = product of:
          0.030334564 = sum of:
            0.030334564 = weight(_text_:22 in 563) [ClassicSimilarity], result of:
              0.030334564 = score(doc=563,freq=2.0), product of:
                0.13067318 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03731569 = queryNorm
                0.23214069 = fieldWeight in 563, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.046875 = fieldNorm(doc=563)
          0.2 = coord(1/5)
      0.5 = coord(2/4)
    
    Content
    A Thesis presented to The University of Guelph In partial fulfilment of requirements for the degree of Master of Science in Computer Science. Vgl. Unter: http://www.inf.ufrgs.br%2F~ceramisch%2Fdownload_files%2Fpublications%2F2009%2Fp01.pdf.
    Date
    10. 1.2013 19:22:47
  4. Geißler, S.: Maschinelles Lernen und NLP : Reif für die industrielle Anwendung! (2019) 0.04
    0.04189464 = product of:
      0.08378928 = sum of:
        0.077667296 = weight(_text_:lernen in 3547) [ClassicSimilarity], result of:
          0.077667296 = score(doc=3547,freq=2.0), product of:
            0.20909165 = queryWeight, product of:
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.03731569 = queryNorm
            0.37145096 = fieldWeight in 3547, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.046875 = fieldNorm(doc=3547)
        0.006121984 = product of:
          0.03060992 = sum of:
            0.03060992 = weight(_text_:29 in 3547) [ClassicSimilarity], result of:
              0.03060992 = score(doc=3547,freq=2.0), product of:
                0.13126493 = queryWeight, product of:
                  3.5176873 = idf(docFreq=3565, maxDocs=44218)
                  0.03731569 = queryNorm
                0.23319192 = fieldWeight in 3547, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5176873 = idf(docFreq=3565, maxDocs=44218)
                  0.046875 = fieldNorm(doc=3547)
          0.2 = coord(1/5)
      0.5 = coord(2/4)
    
    Date
    2. 9.2019 19:29:24
  5. Pinker, S.: Wörter und Regeln : Die Natur der Sprache (2000) 0.03
    0.034889255 = product of:
      0.06977851 = sum of:
        0.06472275 = weight(_text_:lernen in 734) [ClassicSimilarity], result of:
          0.06472275 = score(doc=734,freq=2.0), product of:
            0.20909165 = queryWeight, product of:
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.03731569 = queryNorm
            0.30954248 = fieldWeight in 734, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.0390625 = fieldNorm(doc=734)
        0.005055761 = product of:
          0.025278805 = sum of:
            0.025278805 = weight(_text_:22 in 734) [ClassicSimilarity], result of:
              0.025278805 = score(doc=734,freq=2.0), product of:
                0.13067318 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03731569 = queryNorm
                0.19345059 = fieldWeight in 734, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0390625 = fieldNorm(doc=734)
          0.2 = coord(1/5)
      0.5 = coord(2/4)
    
    Abstract
    Wie lernen Kinder sprechen? Welche Hinweise geben gerade ihre Fehler beim Spracherwerb auf den Ablauf des Lernprozesses - getreu dem Motto: "Kinder sagen die töllsten Sachen«? Und wie helfen beziehungsweise warum scheitern bislang Computer bei der Simulation neuronaler Netzwerke, die am komplizierten Gewebe der menschlichen Sprache mitwirken? In seinem neuen Buch Wörter und Regeln hat der bekannte US-amerikanische Kognitionswissenschaftler Steven Pinker (Der Sprachinstinkt) wieder einmal eine ebenso informative wie kurzweifige Erkundungstour ins Reich der Sprache unternommen. Was die Sache besonders spannend und lesenswert macht: Souverän beleuchtet der Professor am Massachusetts Institute of Technology sowohl natur- als auch geisteswissenschaftliche Aspekte. So vermittelt er einerseits linguistische Grundlagen in den Fußspuren Ferdinand de Saussures, etwa die einer generativen Grammatik, liefert einen Exkurs durch die Sprachgeschichte und widmet ein eigenes Kapitel den Schrecken der deutschen Sprache". Andererseits lässt er aber auch die neuesten bildgebenden Verfahren nicht außen vor, die zeigen, was im Gehirn bei der Sprachverarbeitung abläuft. Pinkers Theorie, die sich in diesem Puzzle verschiedenster Aspekte wiederfindet: Sprache besteht im Kein aus zwei Bestandteilen - einem mentalen Lexikon aus erinnerten Wörtern und einer mentalen Grammatik aus verschiedenen kombinatorischen Regeln. Konkret heißt das: Wir prägen uns bekannte Größen und ihre abgestuften, sich kreuzenden Merkmale ein, aber wir erzeugen auch neue geistige Produkte, in dem wir Regeln anwenden. Gerade daraus, so schließt Pinker, erschließt sich der Reichtum und die ungeheure Ausdruckskraft unserer Sprache
    Date
    19. 7.2002 14:22:31
  6. Heyer, G.; Quasthoff, U.; Wittig, T.: Text Mining : Wissensrohstoff Text. Konzepte, Algorithmen, Ergebnisse (2006) 0.03
    0.02800537 = product of:
      0.05601074 = sum of:
        0.051778197 = weight(_text_:lernen in 5218) [ClassicSimilarity], result of:
          0.051778197 = score(doc=5218,freq=2.0), product of:
            0.20909165 = queryWeight, product of:
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.03731569 = queryNorm
            0.24763398 = fieldWeight in 5218, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.03125 = fieldNorm(doc=5218)
        0.004232544 = product of:
          0.02116272 = sum of:
            0.02116272 = weight(_text_:28 in 5218) [ClassicSimilarity], result of:
              0.02116272 = score(doc=5218,freq=2.0), product of:
                0.13367462 = queryWeight, product of:
                  3.5822632 = idf(docFreq=3342, maxDocs=44218)
                  0.03731569 = queryNorm
                0.15831517 = fieldWeight in 5218, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5822632 = idf(docFreq=3342, maxDocs=44218)
                  0.03125 = fieldNorm(doc=5218)
          0.2 = coord(1/5)
      0.5 = coord(2/4)
    
    Date
    19. 7.2006 20:28:27
    Series
    IT lernen
  7. Schürmann, H.: Software scannt Radio- und Fernsehsendungen : Recherche in Nachrichtenarchiven erleichtert (2001) 0.02
    0.024422478 = product of:
      0.048844956 = sum of:
        0.045305923 = weight(_text_:lernen in 5759) [ClassicSimilarity], result of:
          0.045305923 = score(doc=5759,freq=2.0), product of:
            0.20909165 = queryWeight, product of:
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.03731569 = queryNorm
            0.21667974 = fieldWeight in 5759, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.02734375 = fieldNorm(doc=5759)
        0.0035390325 = product of:
          0.017695162 = sum of:
            0.017695162 = weight(_text_:22 in 5759) [ClassicSimilarity], result of:
              0.017695162 = score(doc=5759,freq=2.0), product of:
                0.13067318 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03731569 = queryNorm
                0.1354154 = fieldWeight in 5759, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.02734375 = fieldNorm(doc=5759)
          0.2 = coord(1/5)
      0.5 = coord(2/4)
    
    Abstract
    Computer müssen lernen, die Sprache des Menschen zu verstehen. Forscher an der Uni Duisburg haben eine Methode entwickelt, mit der ein Rechner Informationen aus Radiobeiträgen herausfiltern kann.
    Source
    Handelsblatt. Nr.79 vom 24.4.2001, S.22
  8. Maschinelle Sprachsynthese (1996) 0.02
    0.022652961 = product of:
      0.090611845 = sum of:
        0.090611845 = weight(_text_:lernen in 5872) [ClassicSimilarity], result of:
          0.090611845 = score(doc=5872,freq=2.0), product of:
            0.20909165 = queryWeight, product of:
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.03731569 = queryNorm
            0.43335947 = fieldWeight in 5872, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5872)
      0.25 = coord(1/4)
    
    Abstract
    Kinder lernen es schon auf der Grundschule, aber für einen Computer ist es nach wie vor etwas vom SChwersten: Vorlesen. Es ist nicht nur die Produktion von Lauten durch die menschlichen Sprechorgane ein äußerst komplexer Vorgang, der vereinfachender Modellierung nur schwer zugänglich ist; um einen Satz richtig auszusprechen, muß man auch von seinem Sinn einen erheblichen Teil erfaßt haben. Gleichwohl macht die maschinelle Nachbildung dieses Prozesses Fortschritte, von einer linguistischen Vorverarbeitung des geschriebenen Textes bis hin zu einem marktfähigen Produkt: dem sprechenden Autoradio
  9. Witschel, H.F.: Text, Wörter, Morpheme : Möglichkeiten einer automatischen Terminologie-Extraktion (2004) 0.02
    0.016180687 = product of:
      0.06472275 = sum of:
        0.06472275 = weight(_text_:lernen in 126) [ClassicSimilarity], result of:
          0.06472275 = score(doc=126,freq=2.0), product of:
            0.20909165 = queryWeight, product of:
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.03731569 = queryNorm
            0.30954248 = fieldWeight in 126, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.0390625 = fieldNorm(doc=126)
      0.25 = coord(1/4)
    
    Abstract
    Die vorliegende Arbeit beschäftigt sich mit einem Teilgebiet des TextMining, versucht also Information (in diesem Fall Fachterminologie) aus natürlichsprachlichem Text zu extrahieren. Die der Arbeit zugrundeliegende These besagt, daß in vielen Gebieten des Text Mining die Kombination verschiedener Methoden sinnvoll sein kann, um dem Facettenreichtum natürlicher Sprache gerecht zu werden. Die bei der Terminologie-Extraktion angewandten Methoden sind statistischer und linguistischer (bzw. musterbasierter) Natur. Um sie herzuleiten, wurden einige Eigenschaften von Fachtermini herausgearbeitet, die für deren Extraktion relevant sind. So läßt sich z.B. die Tatsache, daß viele Fachbegriffe Nominalphrasen einer bestimmten Form sind, direkt für eine Suche nach gewissen POS-Mustern ausnützen, die Verteilung von Termen in Fachtexten führte zu einem statistischen Ansatz - der Differenzanalyse. Zusammen mit einigen weiteren wurden diese Ansätze in ein Verfahren integriert, welches in der Lage ist, aus dem Feedback eines Anwenders zu lernen und in mehreren Schritten die Suche nach Terminologie zu verfeinern. Dabei wurden mehrere Parameter des Verfahrens veränderlich belassen, d.h. der Anwender kann sie beliebig anpassen. Bei der Untersuchung der Ergebnisse anhand von zwei Fachtexten aus unterschiedlichen Domänen wurde deutlich, daß sich zwar die verschiedenen Verfahren gut ergänzen, daß aber die optimalen Werte der veränderbaren Parameter, ja selbst die Auswahl der angewendeten Verfahren text- und domänenabhängig sind.
  10. Ruge, G.: ¬A spreading activation network for automatic generation of thesaurus relationships (1991) 0.01
    0.014485016 = product of:
      0.057940066 = sum of:
        0.057940066 = product of:
          0.14485016 = sum of:
            0.07406952 = weight(_text_:28 in 4506) [ClassicSimilarity], result of:
              0.07406952 = score(doc=4506,freq=2.0), product of:
                0.13367462 = queryWeight, product of:
                  3.5822632 = idf(docFreq=3342, maxDocs=44218)
                  0.03731569 = queryNorm
                0.5541031 = fieldWeight in 4506, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5822632 = idf(docFreq=3342, maxDocs=44218)
                  0.109375 = fieldNorm(doc=4506)
            0.07078065 = weight(_text_:22 in 4506) [ClassicSimilarity], result of:
              0.07078065 = score(doc=4506,freq=2.0), product of:
                0.13067318 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03731569 = queryNorm
                0.5416616 = fieldWeight in 4506, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.109375 = fieldNorm(doc=4506)
          0.4 = coord(2/5)
      0.25 = coord(1/4)
    
    Date
    8.10.2000 11:52:22
    Source
    Library science with a slant to documentation. 28(1991) no.4, S.125-130
  11. Baayen, R.H.; Lieber, H.: Word frequency distributions and lexical semantics (1997) 0.01
    0.014485016 = product of:
      0.057940066 = sum of:
        0.057940066 = product of:
          0.14485016 = sum of:
            0.07406952 = weight(_text_:28 in 3117) [ClassicSimilarity], result of:
              0.07406952 = score(doc=3117,freq=2.0), product of:
                0.13367462 = queryWeight, product of:
                  3.5822632 = idf(docFreq=3342, maxDocs=44218)
                  0.03731569 = queryNorm
                0.5541031 = fieldWeight in 3117, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5822632 = idf(docFreq=3342, maxDocs=44218)
                  0.109375 = fieldNorm(doc=3117)
            0.07078065 = weight(_text_:22 in 3117) [ClassicSimilarity], result of:
              0.07078065 = score(doc=3117,freq=2.0), product of:
                0.13067318 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03731569 = queryNorm
                0.5416616 = fieldWeight in 3117, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.109375 = fieldNorm(doc=3117)
          0.4 = coord(2/5)
      0.25 = coord(1/4)
    
    Date
    28. 2.1999 10:48:22
  12. Doszkocs, T.E.; Zamora, A.: Dictionary services and spelling aids for Web searching (2004) 0.01
    0.013156694 = product of:
      0.052626777 = sum of:
        0.052626777 = product of:
          0.08771129 = sum of:
            0.0264534 = weight(_text_:28 in 2541) [ClassicSimilarity], result of:
              0.0264534 = score(doc=2541,freq=2.0), product of:
                0.13367462 = queryWeight, product of:
                  3.5822632 = idf(docFreq=3342, maxDocs=44218)
                  0.03731569 = queryNorm
                0.19789396 = fieldWeight in 2541, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5822632 = idf(docFreq=3342, maxDocs=44218)
                  0.0390625 = fieldNorm(doc=2541)
            0.025508268 = weight(_text_:29 in 2541) [ClassicSimilarity], result of:
              0.025508268 = score(doc=2541,freq=2.0), product of:
                0.13126493 = queryWeight, product of:
                  3.5176873 = idf(docFreq=3565, maxDocs=44218)
                  0.03731569 = queryNorm
                0.19432661 = fieldWeight in 2541, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5176873 = idf(docFreq=3565, maxDocs=44218)
                  0.0390625 = fieldNorm(doc=2541)
            0.035749625 = weight(_text_:22 in 2541) [ClassicSimilarity], result of:
              0.035749625 = score(doc=2541,freq=4.0), product of:
                0.13067318 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03731569 = queryNorm
                0.27358043 = fieldWeight in 2541, product of:
                  2.0 = tf(freq=4.0), with freq of:
                    4.0 = termFreq=4.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0390625 = fieldNorm(doc=2541)
          0.6 = coord(3/5)
      0.25 = coord(1/4)
    
    Date
    14. 8.2004 17:22:56
    Source
    Online. 28(2004) no.3, S.22-29
  13. Kiss, T.: Anmerkungen zur scheinbaren Konkurrenz von numerischen und symbolischen Verfahren in der Computerlinguistik (2002) 0.01
    0.012944549 = product of:
      0.051778197 = sum of:
        0.051778197 = weight(_text_:lernen in 1752) [ClassicSimilarity], result of:
          0.051778197 = score(doc=1752,freq=2.0), product of:
            0.20909165 = queryWeight, product of:
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.03731569 = queryNorm
            0.24763398 = fieldWeight in 1752, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.03125 = fieldNorm(doc=1752)
      0.25 = coord(1/4)
    
    Abstract
    Man kann wohl abschließend festhalten, dass von einer Überlegenheit statistischer Verfahren zumindest im Bereich des Tagging eigentlich nicht gesprochen werden sollte. Darüber hinaus muss die Opposition zwischen regelbasierten und numerischen Verfahren hier aufgeweicht werden, denn auch die statistischen Verfahren verwenden Regelsysteme. Selbst beim Lernen ohne Referenzkorpus ist ja zumindest eine Zuordnung der Wörter zu einem Lexikon bzw. auch eine heuristische Erkennung unbekannter Wörter nach Regeln notwendig. Statistische Verfahren haben - und dies wurde hier wahrscheinlich nicht ausreichend betont - durchaus ihre Berechtigung, sie sind nützlich; sie gestatten, insbesondere im Vergleich zur Introspektion, eine unmittelbarere und breitere Heranführung an das Phänomen Sprache. Die vorhandenen umfangreichen elektronischen Korpora verlangen nahezu danach, Sprache auch mit statistischen Mitteln zu untersuchen. Allerdings können die statistischen Verfahren die regelbasierten Verfahren nicht ersetzen. Somit muss dem Diktum vom "Es geht nicht anders" deutlich widersprochen werden. Dass die statistischen Verfahren zur Zeit so en vogue sind und die regelbasierten Verfahren aussehen lassen wie eine alte Dallas-Folge, mag wohl auch daran liegen, dass zu viele Vertreter des alten Paradigmas nicht die Energie aufbringen, sich dem neuen Paradigma so weit zu öffnen, dass eine kritische Auseinandersetzung mit dem neuen auf der Basis des alten möglich wird. Die Mathematik ist eine geachtete, weil schwierige Wissenschaft, die statistische Sprachverarbeitung ist eine gefürchtete, weil in ihren Eigenschaften oftmals nicht gründlich genug betrachtete Disziplin.
  14. Weßels, D.: ChatGPT - ein Meilenstein der KI-Entwicklung (2022) 0.01
    0.012944549 = product of:
      0.051778197 = sum of:
        0.051778197 = weight(_text_:lernen in 929) [ClassicSimilarity], result of:
          0.051778197 = score(doc=929,freq=2.0), product of:
            0.20909165 = queryWeight, product of:
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.03731569 = queryNorm
            0.24763398 = fieldWeight in 929, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.03125 = fieldNorm(doc=929)
      0.25 = coord(1/4)
    
    Content
    "Seit dem 30. November 2022 ist meine Welt - und die vieler Bildungsexpertinnen und Bildungsexperten - gefühlt eine andere Welt, die uns in eine "Neuzeit" führt, von der wir noch nicht wissen, ob wir sie lieben oder fürchten sollen. Der Ableger und Prototyp ChatGPT des derzeit (zumindest in der westlichen Welt) führenden generativen KI-Sprachmodells GPT-3 von OpenAI wurde am 30. November veröffentlicht und ist seit dieser Zeit für jeden frei zugänglich und kostenlos. Was zunächst als unspektakuläre Ankündigung von OpenAI anmutete, nämlich das seit 2020 bereits verfügbare KI-Sprachmodell GPT-3 nun in leicht modifizierter Version (GPT-3,5) als Chat-Variante für die Echtzeit-Kommunikation bereitzustellen, entpuppt sich in der Anwendung - aus Sicht der Nutzerinnen und Nutzer - als Meilenstein der KI-Entwicklung. Fakt ist, dass die Leistungsvielfalt und -stärke von ChatGPT selbst IT-Expertinnen und -Experten überrascht hat und sie zu einer Fülle von Superlativen in der Bewertung veranlasst, jedoch immer in Kombination mit Hinweisen zur fehlenden Faktentreue und Verlässlichkeit derartiger generativer KI-Modelle. Mit WebGPT von OpenAI steht aber bereits ein Forschungsprototyp bereit, der mit integrierter Internetsuchfunktion die "Halluzinationen" aktueller GPT-Varianten ausmerzen könnte. Für den Bildungssektor stellt sich die Frage, wie sich das Lehren und Lernen an Hochschulen (und nicht nur dort) verändern wird, wenn derartige KI-Werkzeuge omnipräsent sind und mit ihrer Hilfe nicht nur die Hausarbeit "per Knopfdruck" erstellt werden kann. Beeindruckend ist zudem die fachliche Bandbreite von ChatGPT, siehe den Tweet von @davidtsong, der ChatGPT dem Studierfähigkeitstest SAT unterzogen hat."
  15. Mustafa El Hadi, W.: Evaluating human language technology : general applications to information access and management (2002) 0.01
    0.0124707995 = product of:
      0.049883198 = sum of:
        0.049883198 = product of:
          0.124708 = sum of:
            0.063488156 = weight(_text_:28 in 1840) [ClassicSimilarity], result of:
              0.063488156 = score(doc=1840,freq=2.0), product of:
                0.13367462 = queryWeight, product of:
                  3.5822632 = idf(docFreq=3342, maxDocs=44218)
                  0.03731569 = queryNorm
                0.4749455 = fieldWeight in 1840, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5822632 = idf(docFreq=3342, maxDocs=44218)
                  0.09375 = fieldNorm(doc=1840)
            0.06121984 = weight(_text_:29 in 1840) [ClassicSimilarity], result of:
              0.06121984 = score(doc=1840,freq=2.0), product of:
                0.13126493 = queryWeight, product of:
                  3.5176873 = idf(docFreq=3565, maxDocs=44218)
                  0.03731569 = queryNorm
                0.46638384 = fieldWeight in 1840, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5176873 = idf(docFreq=3565, maxDocs=44218)
                  0.09375 = fieldNorm(doc=1840)
          0.4 = coord(2/5)
      0.25 = coord(1/4)
    
    Date
    6. 1.1997 18:30:28
    Source
    Knowledge organization. 29(2002) nos.3/4, S.124-134
  16. Koch, C.: ¬Die Schreibmaschine : Die SMS-Worterkennung T9 soll unser Leben erleichtern - das gelingt ihr nicht immer (2005) 0.01
    0.011326481 = product of:
      0.045305923 = sum of:
        0.045305923 = weight(_text_:lernen in 4098) [ClassicSimilarity], result of:
          0.045305923 = score(doc=4098,freq=2.0), product of:
            0.20909165 = queryWeight, product of:
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.03731569 = queryNorm
            0.21667974 = fieldWeight in 4098, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.02734375 = fieldNorm(doc=4098)
      0.25 = coord(1/4)
    
    Content
    Manche Rechtschreibfehler lassen die Programmierer absichtlich drin - schließlich ist ein SMS-Schreiber frustriert, wenn das Programm ein Wort hartnäckig verweigert, von dem er fest glaubt, dass es existieren müsse. So kommt es, dass T9 sogar ein Wort »Rhytmuß« kennt. »Andere Wörter ergänzen wir, Imperative zum Beispiel wie :gib9 oder :nimm9. Die kommen in gedruckten Texten nur selten vor, in Kurzmitteilungen dafür ziemlich oft«, sagt Lisa Nathan. Aber wie kommt es, dass die Worterkennung zwar den Nazi-Jargon von Hitler bis Euthanasie im Programm hat, Wörter, die den Sex beschreiben oder das Einnehmen von Drogen, häufig aber nicht erkennt und die üblichsten Flüche einfach fehlen? »Wir zensieren nicht«, sagt Lisa Nathan. »in unserer Datenbank stehen alle Wörter - sofern sie häufig genug vorkommen. Aber fast alle Handyhersteller lassen Schimpfwörter und Wörter mit sexueller Bedeutung ausblenden.« Der Nazi-Jargon scheint niemand zu stören. Weil Flüche, Spitznamen oder nette Abkürzungen im Programm fehlen, ist T9 neuerdings lernfähig geworden: Wer Wörter vermisst, kann sie der Worterkennung beibringen. Die neuesten Handys lernen sogar automatisch, indem sie die eingehenden SMS nach neuen Wörtern durchsuchen. Am meisten Zeit spart man durch die Funktionen »Wortkomplettierung« oder »Wortvorhersage«, die nicht nur vorschlagen, wie das angefangene Wort enden könnte, sondern auch, welches wohl als nächstes kommt. »Ich bin kein sehr pünktlicher Mensch«, gesteht Lisa Nathan, »und wenn ich das Wort :komme9 tippe, schlägt mir T9 automatisch :etwas später9 als folgende Wörter vor.« Das kann sehr praktisch sein - aber auch sehr nervig. Denn wer will schon ständig an den Namen der Exfreundin Natalie erinnert werden, wenn er nur »nat« für »natürlich« eingegeben hat?"
  17. Whitelock, P.; Kilby, K.: Linguistic and computational techniques in machine translation system design : 2nd ed (1995) 0.01
    0.010392333 = product of:
      0.041569334 = sum of:
        0.041569334 = product of:
          0.103923336 = sum of:
            0.0529068 = weight(_text_:28 in 1750) [ClassicSimilarity], result of:
              0.0529068 = score(doc=1750,freq=2.0), product of:
                0.13367462 = queryWeight, product of:
                  3.5822632 = idf(docFreq=3342, maxDocs=44218)
                  0.03731569 = queryNorm
                0.39578792 = fieldWeight in 1750, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5822632 = idf(docFreq=3342, maxDocs=44218)
                  0.078125 = fieldNorm(doc=1750)
            0.051016536 = weight(_text_:29 in 1750) [ClassicSimilarity], result of:
              0.051016536 = score(doc=1750,freq=2.0), product of:
                0.13126493 = queryWeight, product of:
                  3.5176873 = idf(docFreq=3565, maxDocs=44218)
                  0.03731569 = queryNorm
                0.38865322 = fieldWeight in 1750, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5176873 = idf(docFreq=3565, maxDocs=44218)
                  0.078125 = fieldNorm(doc=1750)
          0.4 = coord(2/5)
      0.25 = coord(1/4)
    
    Date
    29. 3.1996 18:28:09
  18. Rötzer, F.: Computer ergooglen die Bedeutung von Worten (2005) 0.01
    0.009708412 = product of:
      0.038833648 = sum of:
        0.038833648 = weight(_text_:lernen in 3385) [ClassicSimilarity], result of:
          0.038833648 = score(doc=3385,freq=2.0), product of:
            0.20909165 = queryWeight, product of:
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.03731569 = queryNorm
            0.18572548 = fieldWeight in 3385, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.6033173 = idf(docFreq=442, maxDocs=44218)
              0.0234375 = fieldNorm(doc=3385)
      0.25 = coord(1/4)
    
    Content
    "Wie könnten Computer Sprache lernen und dabei auch die Bedeutung von Worten sowie die Beziehungen zwischen ihnen verstehen? Dieses Problem der Semantik stellt eine gewaltige, bislang nur ansatzweise bewältigte Aufgabe dar, da Worte und Wortverbindungen oft mehrere oder auch viele Bedeutungen haben, die zudem vom außersprachlichen Kontext abhängen. Die beiden holländischen (Ein künstliches Bewusstsein aus einfachen Aussagen (1)). Paul Vitanyi (2) und Rudi Cilibrasi vom Nationalen Institut für Mathematik und Informatik (3) in Amsterdam schlagen eine elegante Lösung vor: zum Nachschlagen im Internet, der größten Datenbank, die es gibt, wird einfach Google benutzt. Objekte wie eine Maus können mit ihren Namen "Maus" benannt werden, die Bedeutung allgemeiner Begriffe muss aus ihrem Kontext gelernt werden. Ein semantisches Web zur Repräsentation von Wissen besteht aus den möglichen Verbindungen, die Objekte und ihre Namen eingehen können. Natürlich können in der Wirklichkeit neue Namen, aber auch neue Bedeutungen und damit neue Verknüpfungen geschaffen werden. Sprache ist lebendig und flexibel. Um einer Künstlichen Intelligenz alle Wortbedeutungen beizubringen, müsste mit der Hilfe von menschlichen Experten oder auch vielen Mitarbeitern eine riesige Datenbank mit den möglichen semantischen Netzen aufgebaut und dazu noch ständig aktualisiert werden. Das aber müsste gar nicht notwendig sein, denn mit dem Web gibt es nicht nur die größte und weitgehend kostenlos benutzbare semantische Datenbank, sie wird auch ständig von zahllosen Internetnutzern aktualisiert. Zudem gibt es Suchmaschinen wie Google, die Verbindungen zwischen Worten und damit deren Bedeutungskontext in der Praxis in ihrer Wahrscheinlichkeit quantitativ mit der Angabe der Webseiten, auf denen sie gefunden wurden, messen.
  19. Gomez, F.: Learning word syntactic subcategorizations interactively (1995) 0.01
    0.0072746337 = product of:
      0.029098535 = sum of:
        0.029098535 = product of:
          0.07274634 = sum of:
            0.03703476 = weight(_text_:28 in 3130) [ClassicSimilarity], result of:
              0.03703476 = score(doc=3130,freq=2.0), product of:
                0.13367462 = queryWeight, product of:
                  3.5822632 = idf(docFreq=3342, maxDocs=44218)
                  0.03731569 = queryNorm
                0.27705154 = fieldWeight in 3130, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5822632 = idf(docFreq=3342, maxDocs=44218)
                  0.0546875 = fieldNorm(doc=3130)
            0.03571157 = weight(_text_:29 in 3130) [ClassicSimilarity], result of:
              0.03571157 = score(doc=3130,freq=2.0), product of:
                0.13126493 = queryWeight, product of:
                  3.5176873 = idf(docFreq=3565, maxDocs=44218)
                  0.03731569 = queryNorm
                0.27205724 = fieldWeight in 3130, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5176873 = idf(docFreq=3565, maxDocs=44218)
                  0.0546875 = fieldNorm(doc=3130)
          0.4 = coord(2/5)
      0.25 = coord(1/4)
    
    Date
    29. 1.1996 18:28:58
  20. Chen, K.-H.: Evaluating Chinese text retrieval with multilingual queries (2002) 0.01
    0.0072746337 = product of:
      0.029098535 = sum of:
        0.029098535 = product of:
          0.07274634 = sum of:
            0.03703476 = weight(_text_:28 in 1851) [ClassicSimilarity], result of:
              0.03703476 = score(doc=1851,freq=2.0), product of:
                0.13367462 = queryWeight, product of:
                  3.5822632 = idf(docFreq=3342, maxDocs=44218)
                  0.03731569 = queryNorm
                0.27705154 = fieldWeight in 1851, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5822632 = idf(docFreq=3342, maxDocs=44218)
                  0.0546875 = fieldNorm(doc=1851)
            0.03571157 = weight(_text_:29 in 1851) [ClassicSimilarity], result of:
              0.03571157 = score(doc=1851,freq=2.0), product of:
                0.13126493 = queryWeight, product of:
                  3.5176873 = idf(docFreq=3565, maxDocs=44218)
                  0.03731569 = queryNorm
                0.27205724 = fieldWeight in 1851, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5176873 = idf(docFreq=3565, maxDocs=44218)
                  0.0546875 = fieldNorm(doc=1851)
          0.4 = coord(2/5)
      0.25 = coord(1/4)
    
    Date
    6. 1.1997 18:30:28
    Source
    Knowledge organization. 29(2002) nos.3/4, S.156-170

Years

Languages

Types

  • a 134
  • el 21
  • m 18
  • s 6
  • x 5
  • p 2
  • b 1
  • d 1
  • More… Less…

Subjects

Classifications