Search (49 results, page 2 of 3)

Scherer Auberson, K.: Counteracting concept drift in natural language classifiers : proposal for an automated method (2018) 0.03

0.031175073 = product of:
  0.083133526 = sum of:
    0.02562646 = weight(_text_:und in 2849) [ClassicSimilarity], result of:
      0.02562646 = score(doc=2849,freq=8.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.29385152 = fieldWeight in 2849, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=2849)
    0.031880606 = weight(_text_:der in 2849) [ClassicSimilarity], result of:
      0.031880606 = score(doc=2849,freq=12.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.36271852 = fieldWeight in 2849, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=2849)
    0.02562646 = weight(_text_:und in 2849) [ClassicSimilarity], result of:
      0.02562646 = score(doc=2849,freq=8.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.29385152 = fieldWeight in 2849, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=2849)
  0.375 = coord(3/8)

Abstract: Natural Language Classifier helfen Unternehmen zunehmend dabei die Flut von Textdaten zu überwinden. Aber diese Classifier, einmal trainiert, verlieren mit der Zeit ihre Nützlichkeit. Sie bleiben statisch, aber die zugrundeliegende Domäne der Textdaten verändert sich: Ihre Genauigkeit nimmt aufgrund eines Phänomens ab, das als Konzeptdrift bekannt ist. Die Frage ist ob Konzeptdrift durch die Ausgabe eines Classifiers zuverlässig erkannt werden kann, und falls ja: ist es möglich dem durch nachtrainieren des Classifiers entgegenzuwirken. Es wird eine System-Implementierung mittels Proof-of-Concept vorgestellt, bei der das Konfidenzmass des Classifiers zur Erkennung von Konzeptdrift verwendet wird. Der Classifier wird dann iterativ neu trainiert, indem er Stichproben mit niedrigem Konfidenzmass auswählt, sie korrigiert und im Trainingsset der nächsten Iteration verwendet. Die Leistung des Classifiers wird über die Zeit gemessen, und die Leistung des Systems beobachtet. Basierend darauf werden schließlich Empfehlungen gegeben, die sich bei der Implementierung solcher Systeme als nützlich erweisen können.
Imprint: Chur : Hochschule für Technik und Wirtschaft / Arbeitsbereich Informationswissenschaft

Renker, L.: Exploration von Textkorpora : Topic Models als Grundlage der Interaktion (2015) 0.03
```
0.030282537 = product of:
  0.08075343 = sum of:
    0.028250515 = weight(_text_:und in 2380) [ClassicSimilarity], result of:
      0.028250515 = score(doc=2380,freq=14.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.32394084 = fieldWeight in 2380, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2380)
    0.0242524 = weight(_text_:der in 2380) [ClassicSimilarity], result of:
      0.0242524 = score(doc=2380,freq=10.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.27592933 = fieldWeight in 2380, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2380)
    0.028250515 = weight(_text_:und in 2380) [ClassicSimilarity], result of:
      0.028250515 = score(doc=2380,freq=14.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.32394084 = fieldWeight in 2380, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2380)
  0.375 = coord(3/8)
```
Abstract

Das Internet birgt schier endlose Informationen. Ein zentrales Problem besteht heutzutage darin diese auch zugänglich zu machen. Es ist ein fundamentales Domänenwissen erforderlich, um in einer Volltextsuche die korrekten Suchanfragen zu formulieren. Das ist jedoch oftmals nicht vorhanden, so dass viel Zeit aufgewandt werden muss, um einen Überblick des behandelten Themas zu erhalten. In solchen Situationen findet sich ein Nutzer in einem explorativen Suchvorgang, in dem er sich schrittweise an ein Thema heranarbeiten muss. Für die Organisation von Daten werden mittlerweile ganz selbstverständlich Verfahren des Machine Learnings verwendet. In den meisten Fällen bleiben sie allerdings für den Anwender unsichtbar. Die interaktive Verwendung in explorativen Suchprozessen könnte die menschliche Urteilskraft enger mit der maschinellen Verarbeitung großer Datenmengen verbinden. Topic Models sind ebensolche Verfahren. Sie finden in einem Textkorpus verborgene Themen, die sich relativ gut von Menschen interpretieren lassen und sind daher vielversprechend für die Anwendung in explorativen Suchprozessen. Nutzer können damit beim Verstehen unbekannter Quellen unterstützt werden. Bei der Betrachtung entsprechender Forschungsarbeiten fiel auf, dass Topic Models vorwiegend zur Erzeugung statischer Visualisierungen verwendet werden. Das Sensemaking ist ein wesentlicher Bestandteil der explorativen Suche und wird dennoch nur in sehr geringem Umfang genutzt, um algorithmische Neuerungen zu begründen und in einen umfassenden Kontext zu setzen. Daraus leitet sich die Vermutung ab, dass die Verwendung von Modellen des Sensemakings und die nutzerzentrierte Konzeption von explorativen Suchen, neue Funktionen für die Interaktion mit Topic Models hervorbringen und einen Kontext für entsprechende Forschungsarbeiten bieten können.

Footnote

Masterthesis zur Erlangung des akademischen Grades Master of Science (M.Sc.) vorgelegt an der Fachhochschule Köln / Fakultät für Informatik und Ingenieurswissenschaften im Studiengang Medieninformatik.

Imprint

Gummersbach : Fakultät für Informatik und Ingenieurswissenschaften
¬Die Bibel als Stilkompass (2019) 0.03
```
0.030108785 = product of:
  0.080290094 = sum of:
    0.023876045 = weight(_text_:und in 5331) [ClassicSimilarity], result of:
      0.023876045 = score(doc=5331,freq=10.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.27378 = fieldWeight in 5331, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5331)
    0.032538008 = weight(_text_:der in 5331) [ClassicSimilarity], result of:
      0.032538008 = score(doc=5331,freq=18.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.37019804 = fieldWeight in 5331, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5331)
    0.023876045 = weight(_text_:und in 5331) [ClassicSimilarity], result of:
      0.023876045 = score(doc=5331,freq=10.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.27378 = fieldWeight in 5331, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5331)
  0.375 = coord(3/8)
```
Content

"Die Heilige Schrift gibt es nicht nur in mehreren hundert Sprachen, sondern oft innerhalb eines Sprachraums auch in mehreren Varianten. Britische Leser konnen unter anderem zwischen der bewusst sehr einfach geschriebenen Bible in Basic English und der linguistisch komplexen King James Version aus dem 17. Jahrhundert wahlen. Die Fassungen unterscheiden sich in Satzlänge, Wortwahl sowie Förmlichkeit und sprechen so Menschen aus verschiedenen Kulturen und mit unterschiedlichem Bildungsstand an. Ein Team um Keith Carlson vom Dartmouth College will die insgesamt 34 englischsprachigen Versionen der Bibel nun dazu nutzen, um Computern unterschiedliche Stilformen beizubringen Bisher übersetzen entsprechende Programme zwar Fremdsprachen, zum Teil mit beeindruckender Genauigkeit. Oft scheitern sie aber, wenn sie einen Text zielsicher stilistisch verändern sollen, vor allem wenn es dabei um mehr als ein einzelnes Merkmal wie beispielsweise die Komplexität geht. Die Bibel eigne sich mit ihren rund 31 000 Versen wie kein anderes Werk für das Training von Übersetzungsprogrammen, argumentiert das Team um Carlson. Schließlich seien alle Fassungen sehr gewissenhaft von Menschen übersetzt und außerdem Vers für Vers durchnummeriert worden. Das erleichtere einer Maschine die Zuordnung und sei bei anderen umfangreichen Schriftquellen wie dem Werk von William Shakespeare oder der Wikipedia nicht zwangsläufig der Fall. Als erste Demonstration haben die Forscher zwei Algorithmen, von denen einer auf neuronalen Netzen basierte, mit acht frei im Internet verfügbaren Bibelversionen trainiert. Anschließend testeten sie, wie gut die beiden Programme Verse der Vorlagen in einen gewünschten Stil übertrugen, ohne dass die Software auf die anvisierte Fassung der Bibel zugreifen konnte. Insgesamt seien die automatischen Übersetzer dem Ziel schon recht nahegekommen, berichten die Forscher. Sie sehen ihre Arbeit aber erst als Startpunkt bei der Entwicklung einer künstlichen Intelligenz, die souverän zwischen verschiedenen Sprachstilen wechseln kann."

Source

Spektrum der Wissenschaft. 2019, H.2, S.11
Sprachtechnologie : ein Überblick (2012) 0.03
```
0.029578865 = product of:
  0.07887697 = sum of:
    0.026154898 = weight(_text_:und in 1750) [ClassicSimilarity], result of:
      0.026154898 = score(doc=1750,freq=12.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.29991096 = fieldWeight in 1750, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1750)
    0.026567172 = weight(_text_:der in 1750) [ClassicSimilarity], result of:
      0.026567172 = score(doc=1750,freq=12.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.30226544 = fieldWeight in 1750, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1750)
    0.026154898 = weight(_text_:und in 1750) [ClassicSimilarity], result of:
      0.026154898 = score(doc=1750,freq=12.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.29991096 = fieldWeight in 1750, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1750)
  0.375 = coord(3/8)
```
Abstract

Seit mehr als einem halben Jahrhundert existieren ernsthafte und ernst zu nehmende Versuche, menschliche Sprache maschinell zu verarbeiten. Maschinelle Übersetzung oder "natürliche" Dialoge mit Computern gehören zu den ersten Ideen, die den Bereich der späteren Computerlinguistik oder Sprachtechnologie abgesteckt und deren Vorhaben geleitet haben. Heute ist dieser auch maschinelle Sprachverarbeitung (natural language processing, NLP) genannte Bereich stark ausdiversifiziert: Durch die rapide Entwicklung der Informatik ist vieles vorher Unvorstellbare Realität (z. B. automatische Telefonauskunft), einiges früher Unmögliche immerhin möglich geworden (z. B. Handhelds mit Sprachein- und -ausgabe als digitale persönliche (Informations-)Assistenten). Es gibt verschiedene Anwendungen der Computerlinguistik, von denen einige den Sprung in die kommerzielle Nutzung geschafft haben (z. B. Diktiersysteme, Textklassifikation, maschinelle Übersetzung). Immer noch wird an natürlichsprachlichen Systemen (natural language systems, NLS) verschiedenster Funktionalität (z. B. zur Beantwortung beliebiger Fragen oder zur Generierung komplexer Texte) intensiv geforscht, auch wenn die hoch gesteckten Ziele von einst längst nicht erreicht sind (und deshalb entsprechend "heruntergefahren" wurden). Wo die maschinelle Sprachverarbeitung heute steht, ist allerdings angesichts der vielfältigen Aktivitäten in der Computerlinguistik und Sprachtechnologie weder offensichtlich noch leicht in Erfahrung zu bringen (für Studierende des Fachs und erst recht für Laien). Ein Ziel dieses Buches ist, es, die aktuelle Literaturlage in dieser Hinsicht zu verbessern, indem spezifisch systembezogene Aspekte der Computerlinguistik als Überblick über die Sprachtechnologie zusammengetragen werden.
Menge-Sonnentag, R.: Google veröffentlicht einen Parser für natürliche Sprache (2016) 0.03
```
0.029462636 = product of:
  0.07856703 = sum of:
    0.027012663 = weight(_text_:und in 2941) [ClassicSimilarity], result of:
      0.027012663 = score(doc=2941,freq=20.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.3097467 = fieldWeight in 2941, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=2941)
    0.024541702 = weight(_text_:der in 2941) [ClassicSimilarity], result of:
      0.024541702 = score(doc=2941,freq=16.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.27922085 = fieldWeight in 2941, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=2941)
    0.027012663 = weight(_text_:und in 2941) [ClassicSimilarity], result of:
      0.027012663 = score(doc=2941,freq=20.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.3097467 = fieldWeight in 2941, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=2941)
  0.375 = coord(3/8)
```
Abstract

SyntaxNet zerlegt Sätze in ihre grammatikalischen Bestandteile und bestimmt die syntaktischen Beziehungen der Wörter untereinander. Das Framework ist Open Source und als TensorFlow Model implementiert. Ein Parser für natürliche Sprache ist eine Software, die Sätze in ihre grammatikalischen Bestandteile zerlegt. Diese Zerlegung ist notwendig, damit Computer Befehle verstehen oder Texte übersetzen können. Die digitalen Helfer wie Microsofts Cortana, Apples Siri und Google Now verwenden Parser, um Sätze wie "Stell den Wecker auf 5 Uhr!" richtig umzusetzen. SyntaxNet ist ein solcher Parser, den Google als TensorFlow Model veröffentlicht hat. Entwickler können eigene Modelle erstellen, und SnytaxNet bringt einen vortrainierten Parser für die englische Sprache mit, den seine Macher Parsey McParseface genannt haben.

Content

"Syntaktische Beziehungen Der Parser teilt den Wörtern eine syntaktische Funktion zu und untersucht die syntaktischen Beziehungen zwischen den Einzelteilen. Den englischen Beispielsatz aus dem Blog-Beitrag "Alice saw Bob" analysiert er folgendermaßen: "Alice" und "Bob" sind Substantive, und "saw" ist ein Verb. Letzteres ist gleichzeitig die Wurzel (ROOT), von der die restlichen Beziehungen ausgehen. Alice ist das zugehörige Subjekt (nsubj) und Bob das Objekt (dobj). Längere Sätze werden leicht mehrdeutig. Beispielsweise ist im Satz "Alice sah Bob mit dem Fernglas" nicht erkennbar, wer von den beiden das Fernglas in der Hand hält. Rein syntaktisch ist auch der Satz "Peter schneidet das Brot mit Sonnenblumenkernen" mehrdeutig. Das menschliche Gehirn erkennt die richtige Bedeutung recht zuverlässig, aber für maschinelle Parser stellen sie eine Herausforderung dar.
SyntaxNet nutzt zur Entscheidung neuronale Netze und versucht die Abhängigkeiten richtig zuzuordnen. Damit "lernt" der Parser, dass es schwierig ist, Sonnenblumenkerne zum Schneiden einzusetzen, und sie somit wohl eher Bestandteil des Brots als ein Werkzeug sind. Die Analyse beschränkt sich jedoch auf den Satz selbst. Semantische Zusammenhänge berücksichtigt das Modell nicht. So lösen sich manche Mehrdeutigkeiten durch den Kontext auf: Wenn Alice im obigen Beispiel das Fernglas beim Verlassen des Hauses eingepackt hat, wird sie es vermutlich benutzen. Trefferquote Mensch vs. Maschine Laut dem Blog-Beitrag kommt Parsey McParseface auf eine Genauigkeit von gut 94 Prozent für Sätze aus dem Penn Treebank Project. Die menschliche Quote soll laut Linguisten bei 96 bis 97 Prozent liegen. Allerdings weist der Beitrag auch darauf hin, dass es sich bei den Testsätzen um wohlgeformte Texte handelt. Im Test mit Googles WebTreebank erreicht der Parser eine Genauigkeit von knapp 90 Prozent."

Engerer, V.: Indexierungstheorie für Linguisten : zu einigen natürlichsprachlichen Zügen in künstlichen Indexsprachen (2014) 0.03

0.028981246 = product of:
  0.07728332 = sum of:
    0.02562646 = weight(_text_:und in 3339) [ClassicSimilarity], result of:
      0.02562646 = score(doc=3339,freq=2.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.29385152 = fieldWeight in 3339, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=3339)
    0.026030406 = weight(_text_:der in 3339) [ClassicSimilarity], result of:
      0.026030406 = score(doc=3339,freq=2.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.29615843 = fieldWeight in 3339, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.09375 = fieldNorm(doc=3339)
    0.02562646 = weight(_text_:und in 3339) [ClassicSimilarity], result of:
      0.02562646 = score(doc=3339,freq=2.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.29385152 = fieldWeight in 3339, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=3339)
  0.375 = coord(3/8)

Source: Dialekte, Konzepte, Kontakte. Ergebnisse des Arbeitstreffens der Gesellschaft für Sprache und Sprachen, GeSuS e.V., 31. Mai - 1. Juni 2013 in Freiburg/Breisgau. Hrsg.: V. Schönenberger et al

Rötzer, F.: Kann KI mit KI generierte Texte erkennen? (2019) 0.03

0.028117303 = product of:
  0.07497948 = sum of:
    0.029897537 = weight(_text_:und in 3977) [ClassicSimilarity], result of:
      0.029897537 = score(doc=3977,freq=8.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.34282678 = fieldWeight in 3977, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3977)
    0.015184403 = weight(_text_:der in 3977) [ClassicSimilarity], result of:
      0.015184403 = score(doc=3977,freq=2.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.17275909 = fieldWeight in 3977, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3977)
    0.029897537 = weight(_text_:und in 3977) [ClassicSimilarity], result of:
      0.029897537 = score(doc=3977,freq=8.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.34282678 = fieldWeight in 3977, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3977)
  0.375 = coord(3/8)

Abstract: OpenAI hat einen Algorithmus zur Textgenerierung angeblich nicht vollständig veröffentlicht, weil er so gut sei und Missbrauch und Täuschung ermöglicht. Das u.a. von Elon Musk und Peter Thiel gegründete KI-Unternehmen OpenAI hatte im Februar erklärt, man habe den angeblich am weitesten fortgeschrittenen Algorithmus zur Sprachverarbeitung entwickelt. Der Algorithmus wurde lediglich anhand von 40 Gigabyte an Texten oder an 8 Millionen Webseiten trainiert, das nächste Wort in einem vorgegebenen Textausschnitt vorherzusagen. Damit könne man zusammenhängende, sinnvolle Texte erzeugen, die vielen Anforderungen genügen, zudem könne damit rudimentär Leseverständnis, Antworten auf Fragen, Zusammenfassungen und Übersetzungen erzeugt werden, ohne dies trainiert zu haben.

Holland, M.: Erstes wissenschaftliches Buch eines Algorithmus' veröffentlicht (2019) 0.03

0.025718123 = product of:
  0.06858166 = sum of:
    0.021140752 = weight(_text_:und in 5227) [ClassicSimilarity], result of:
      0.021140752 = score(doc=5227,freq=4.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.24241515 = fieldWeight in 5227, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5227)
    0.02630016 = weight(_text_:der in 5227) [ClassicSimilarity], result of:
      0.02630016 = score(doc=5227,freq=6.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.29922754 = fieldWeight in 5227, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5227)
    0.021140752 = weight(_text_:und in 5227) [ClassicSimilarity], result of:
      0.021140752 = score(doc=5227,freq=4.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.24241515 = fieldWeight in 5227, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5227)
  0.375 = coord(3/8)

Abstract: Der Wissenschaftsverlag Springer Nature hat nach eigenen Angaben das erste Buch veröffentlicht, das von einem Algorithmus verfasst wurde. Bei Springer Nature ist das nach Angaben des Wissenschaftsverlags erste maschinengenerierte Buch erschienen: "Lithium-Ion Batteries - A Machine-Generated Summary of Current Research" biete einen Überblick über die neuesten Forschungspublikationen über Lithium-Ionen-Batterien, erklärte die Goethe-Universität Frankfurt am Main. Dort wurde im Bereich Angewandte Computerlinguistik unter der Leitung von Christian Chiarcos jenes Verfahren entwickelt, das Textinhalte automatisch analysiert und relevante Publikationen auswählen kann. Es heißt "Beta Writer" und steht als Autor über dem Buch.
Content: Das Buch enthält eine Einleitung, in der die Vorgehensweise zur Erstellung des Buches geschildert wird.

Schmolz, H.: Anaphora resolution and text retrieval : a lnguistic analysis of hypertexts (2013) 0.02

0.02415104 = product of:
  0.064402774 = sum of:
    0.021355385 = weight(_text_:und in 1810) [ClassicSimilarity], result of:
      0.021355385 = score(doc=1810,freq=2.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.24487628 = fieldWeight in 1810, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=1810)
    0.021692004 = weight(_text_:der in 1810) [ClassicSimilarity], result of:
      0.021692004 = score(doc=1810,freq=2.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.2467987 = fieldWeight in 1810, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.078125 = fieldNorm(doc=1810)
    0.021355385 = weight(_text_:und in 1810) [ClassicSimilarity], result of:
      0.021355385 = score(doc=1810,freq=2.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.24487628 = fieldWeight in 1810, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=1810)
  0.375 = coord(3/8)

Content: Trägerin des VFI-Dissertationspreises 2014: "Überzeugende gründliche linguistische und quantitative Analyse eines im Information Retrieval bisher wenig beachteten Textelementes anhand eines eigens erstellten grossen Hypertextkorpus, einschliesslich der Evaluation selbsterstellter Auflösungsregeln für die Nutzung in künftigen IR-Systemen.".

Endres-Niggemeyer, B.: Thinkie: Lautes Denken mit Spracherkennung (mobil) (2013) 0.02

0.021525577 = product of:
  0.057401538 = sum of:
    0.022193167 = weight(_text_:und in 1145) [ClassicSimilarity], result of:
      0.022193167 = score(doc=1145,freq=6.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.2544829 = fieldWeight in 1145, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1145)
    0.013015203 = weight(_text_:der in 1145) [ClassicSimilarity], result of:
      0.013015203 = score(doc=1145,freq=2.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.14807922 = fieldWeight in 1145, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=1145)
    0.022193167 = weight(_text_:und in 1145) [ClassicSimilarity], result of:
      0.022193167 = score(doc=1145,freq=6.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.2544829 = fieldWeight in 1145, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1145)
  0.375 = coord(3/8)

Abstract: Lautes Denken ist eine bewährte Methode zum Erforschen kognitiver Prozesse. Es wird in vielen Disziplinen benutzt, z. B. um aufzudecken, welche Erfahrungen Benutzer bei der Interaktion mit Computerschnittstellen machen. Nach einer kurzen Erklärung des Lauten Denkens wird die App Thinkie vorgestellt. Thinkie ist eine mobile Lösung für das Laute Denken auf iPhone und iPad. Die Testperson nimmt auf dem iPhone den Ton auf. Die Spracherkennungssoftware Siri (http://www.apple.com/de/ios/siri/) transkribiert ihn. Parallel wird auf dem iPad oder einem anderen Gerät gefilmt. Auf dem iPad kann man - mit Video im Blick - das Transkript aufarbeiten und interpretieren. Die Textdateien transportiert Thinkie über eine Cloud-Kollektion, die Filme werden mit iTunes übertragen. Thinkie ist noch nicht tauglich für den praktischen Gebrauch. Noch sind die Sequenzen zu kurz, die Siri verarbeiten kann. Das wird sich ändern.
Source: Information - Wissenschaft und Praxis. 64(2013) H.6, S.311-322

Voss, O.: Übersetzer überflüssig? : Sprachsoftware DeepL und Acrolinx (2019) 0.02

0.018120645 = product of:
  0.07248258 = sum of:
    0.03624129 = weight(_text_:und in 4981) [ClassicSimilarity], result of:
      0.03624129 = score(doc=4981,freq=4.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.41556883 = fieldWeight in 4981, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=4981)
    0.03624129 = weight(_text_:und in 4981) [ClassicSimilarity], result of:
      0.03624129 = score(doc=4981,freq=4.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.41556883 = fieldWeight in 4981, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.09375 = fieldNorm(doc=4981)
  0.25 = coord(2/8)

Source: https://www.tagesspiegel.de/wirtschaft/sprachsoftware-deepl-und-acrolinx-uebersetzer-ueberfluessig/23884348.html

Wolfangel, E.: Ich verstehe (2017) 0.01

0.0106776925 = product of:
  0.04271077 = sum of:
    0.021355385 = weight(_text_:und in 3976) [ClassicSimilarity], result of:
      0.021355385 = score(doc=3976,freq=2.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.24487628 = fieldWeight in 3976, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=3976)
    0.021355385 = weight(_text_:und in 3976) [ClassicSimilarity], result of:
      0.021355385 = score(doc=3976,freq=2.0), product of:
        0.087208875 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.039347667 = queryNorm
        0.24487628 = fieldWeight in 3976, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=3976)
  0.25 = coord(2/8)

Abstract: Computer werden immer besser darin, den Sinn von Sprache zu entschlüsseln. Das ist zwar bequem, wenn man seinem Handy einfach sagen kann, was es tun soll, ohne tippen zu müssen. Aber das bedeutet auch, dass sich E-Mails und andere Botschaften maschinell auswerten lassen. Da wird inzwischen sogar den Forschern mulmig.

Schmolz, H.: Anaphora resolution and text retrieval : a lnguistic analysis of hypertexts (2015) 0.00

0.0027115005 = product of:
  0.021692004 = sum of:
    0.021692004 = weight(_text_:der in 1172) [ClassicSimilarity], result of:
      0.021692004 = score(doc=1172,freq=2.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.2467987 = fieldWeight in 1172, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.078125 = fieldNorm(doc=1172)
  0.125 = coord(1/8)

Footnote: Überarbeitete Version der Doktorarbeit, Universität Passau, 2013.

Snajder, J.: Distributional semantics of multi-word expressions (2013) 0.00

0.0022414406 = product of:
  0.017931525 = sum of:
    0.017931525 = product of:
      0.053794574 = sum of:
        0.053794574 = weight(_text_:29 in 2868) [ClassicSimilarity], result of:
          0.053794574 = score(doc=2868,freq=2.0), product of:
            0.13841279 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.039347667 = queryNorm
            0.38865322 = fieldWeight in 2868, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.078125 = fieldNorm(doc=2868)
      0.33333334 = coord(1/3)
  0.125 = coord(1/8)

Date: 29. 4.2016 12:04:50

Clark, M.; Kim, Y.; Kruschwitz, U.; Song, D.; Albakour, D.; Dignum, S.; Beresi, U.C.; Fasli, M.; Roeck, A De: Automatically structuring domain knowledge from text : an overview of current research (2012) 0.00

0.0019019255 = product of:
  0.015215404 = sum of:
    0.015215404 = product of:
      0.045646213 = sum of:
        0.045646213 = weight(_text_:29 in 2738) [ClassicSimilarity], result of:
          0.045646213 = score(doc=2738,freq=4.0), product of:
            0.13841279 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.039347667 = queryNorm
            0.3297832 = fieldWeight in 2738, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.046875 = fieldNorm(doc=2738)
      0.33333334 = coord(1/3)
  0.125 = coord(1/8)

Date: 29. 1.2016 18:29:51

Altmann, E.G.; Cristadoro, G.; Esposti, M.D.: On the origin of long-range correlations in texts (2012) 0.00

0.0016269004 = product of:
  0.013015203 = sum of:
    0.013015203 = weight(_text_:der in 330) [ClassicSimilarity], result of:
      0.013015203 = score(doc=330,freq=2.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.14807922 = fieldWeight in 330, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=330)
  0.125 = coord(1/8)

Content: Vgl. die Pressemitteilung zum Artikel: Auf der Suche nach dem entscheidenden Wort: die Häufung bestimmter Wörter innerhalb eines Textes macht diese zu Schlüsselwörtern [11. Juli 2012]. Unter: http://www.mpg.de/5894319/statistische_Textanalyse?filter_order=L. Vgl. auch: http://arxiv.org/list/cs.CL/current.

Engerer, V.: Exploring interdisciplinary relationships between linguistics and information retrieval from the 1960s to today (2017) 0.00

0.0016269004 = product of:
  0.013015203 = sum of:
    0.013015203 = weight(_text_:der in 3434) [ClassicSimilarity], result of:
      0.013015203 = score(doc=3434,freq=2.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.14807922 = fieldWeight in 3434, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=3434)
  0.125 = coord(1/8)

Theme: Geschichte der Sacherschließung

Stoykova, V.; Petkova, E.: Automatic extraction of mathematical terms for precalculus (2012) 0.00

0.0015690083 = product of:
  0.012552067 = sum of:
    0.012552067 = product of:
      0.0376562 = sum of:
        0.0376562 = weight(_text_:29 in 156) [ClassicSimilarity], result of:
          0.0376562 = score(doc=156,freq=2.0), product of:
            0.13841279 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.039347667 = queryNorm
            0.27205724 = fieldWeight in 156, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.0546875 = fieldNorm(doc=156)
      0.33333334 = coord(1/3)
  0.125 = coord(1/8)

Date: 29. 5.2012 10:17:08

Rayson, P.; Piao, S.; Sharoff, S.; Evert, S.; Moiron, B.V.: Multiword expressions : hard going or plain sailing? (2015) 0.00

0.0015690083 = product of:
  0.012552067 = sum of:
    0.012552067 = product of:
      0.0376562 = sum of:
        0.0376562 = weight(_text_:29 in 2918) [ClassicSimilarity], result of:
          0.0376562 = score(doc=2918,freq=2.0), product of:
            0.13841279 = queryWeight, product of:
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.039347667 = queryNorm
            0.27205724 = fieldWeight in 2918, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5176873 = idf(docFreq=3565, maxDocs=44218)
              0.0546875 = fieldNorm(doc=2918)
      0.33333334 = coord(1/3)
  0.125 = coord(1/8)

Date: 29. 4.2016 12:05:56

Ramisch, C.: Multiword expressions acquisition : a generic and open framework (2015) 0.00

0.0015338564 = product of:
  0.012270851 = sum of:
    0.012270851 = weight(_text_:der in 1649) [ClassicSimilarity], result of:
      0.012270851 = score(doc=1649,freq=4.0), product of:
        0.087893516 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.039347667 = queryNorm
        0.13961042 = fieldWeight in 1649, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=1649)
  0.125 = coord(1/8)

Footnote: Bemerkung im Katalog der DNB: "Gehoert eindeutig nicht zum Sammelgebiet der Deutschen Nationalbibliothek"

Search (49 results, page 2 of 3)

Authors

Languages

Types

Themes

Subjects

Classifications