Search (26 results, page 1 of 2)

Huo, W.: Automatic multi-word term extraction and its application to Web-page summarization (2012) 0.16

0.15969515 = product of:
  0.47908545 = sum of:
    0.1552798 = weight(_text_:2f in 563) [ClassicSimilarity], result of:
      0.1552798 = score(doc=563,freq=2.0), product of:
        0.2762897 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.032588977 = queryNorm
        0.56201804 = fieldWeight in 563, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=563)
    0.1552798 = weight(_text_:2f in 563) [ClassicSimilarity], result of:
      0.1552798 = score(doc=563,freq=2.0), product of:
        0.2762897 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.032588977 = queryNorm
        0.56201804 = fieldWeight in 563, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=563)
    0.1552798 = weight(_text_:2f in 563) [ClassicSimilarity], result of:
      0.1552798 = score(doc=563,freq=2.0), product of:
        0.2762897 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.032588977 = queryNorm
        0.56201804 = fieldWeight in 563, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=563)
    0.01324607 = product of:
      0.02649214 = sum of:
        0.02649214 = weight(_text_:22 in 563) [ClassicSimilarity], result of:
          0.02649214 = score(doc=563,freq=2.0), product of:
            0.11412105 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.032588977 = queryNorm
            0.23214069 = fieldWeight in 563, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=563)
      0.5 = coord(1/2)
  0.33333334 = coord(4/12)

Content: A Thesis presented to The University of Guelph In partial fulfilment of requirements for the degree of Master of Science in Computer Science. Vgl. Unter: http://www.inf.ufrgs.br%2F~ceramisch%2Fdownload_files%2Fpublications%2F2009%2Fp01.pdf.
Date: 10. 1.2013 19:22:47

Computerlinguistik und Sprachtechnologie : Eine Einführung (2010) 0.03
```
0.034867764 = product of:
  0.13947105 = sum of:
    0.05302886 = weight(_text_:informatik in 1735) [ClassicSimilarity], result of:
      0.05302886 = score(doc=1735,freq=4.0), product of:
        0.1662844 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.032588977 = queryNorm
        0.3189046 = fieldWeight in 1735, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.03125 = fieldNorm(doc=1735)
    0.058325887 = weight(_text_:systeme in 1735) [ClassicSimilarity], result of:
      0.058325887 = score(doc=1735,freq=4.0), product of:
        0.17439179 = queryWeight, product of:
          5.3512506 = idf(docFreq=569, maxDocs=44218)
          0.032588977 = queryNorm
        0.33445317 = fieldWeight in 1735, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.3512506 = idf(docFreq=569, maxDocs=44218)
          0.03125 = fieldNorm(doc=1735)
    0.028116304 = product of:
      0.05623261 = sum of:
        0.05623261 = weight(_text_:allgemein in 1735) [ClassicSimilarity], result of:
          0.05623261 = score(doc=1735,freq=4.0), product of:
            0.17123379 = queryWeight, product of:
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.032588977 = queryNorm
            0.32839668 = fieldWeight in 1735, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.03125 = fieldNorm(doc=1735)
      0.5 = coord(1/2)
  0.25 = coord(3/12)
```
Abstract

Dieses Lehrbuch bietet eine umfassende Einführung in Grundlagen und Methoden der Computerlinguistik und stellt die wichtigsten Anwendungsgebiete in der Sprachtechnologie vor. Es richtet sich gleichermaßen an Studierende der Computerlinguistik und verwandter Fächer mit Bezug zur Verarbeitung natürlicher Sprache wie an Entwickler sprachverarbeitender Systeme. Nach einem Überblick über Aufgaben und Ziele der Computerlinguistik werden die erforderlichen theoretischen Grundlagen zur Logik, den Formalen Sprachen, der Graphentheorie, den statistischen Verfahren sowie der Texttechnologie beispielbezogen erläutert. Es schließt sich eine Darstellung der verschiedenen Methoden für die Verarbeitung auf den linguistischen Beschreibungsebenen an. Dabei werden zunächst die grundlegenden Begriffe und Konzepte der Phonetik und Phonologie, Morphologie, Syntax, Semantik sowie der Pragmatik vermittelt und darauf aufbauend die Prinzipien der sprachtechnologischen Umsetzung behandelt. Die drei letzten Teile des Buchs geben Überblicke über die verwendeten sprachtechnologischen Informationsquellen, die vielfältigen Anwendungen in der Praxis sowie über Evaluationsverfahren für sprachverarbeitende Systeme. Anhand konkreter Fragestellungen - von der Entwicklung von Korrekturprogrammen über das Informationsmanagement bis zur Maschinellen Übersetzung - wird das Zusammenwirken der einzelnen Methoden aufgezeigt. Für die dritte Auflage wurden sämtliche Kapitel überarbeitet und aktualisiert sowie zum Teil zu eigenständigen, neuen Kapiteln zusammengeführt. Insbesondere trägt die dritte Auflage der rasanten Entwicklung in der Computerlinguistik und Sprachtechnologie durch eine stärkere Fokussierung auf statistische Grundlagen und Methoden Rechnung. "Durch dieses Handbuch wird für den deutschsprachigen Raum eine empfindliche Lücke geschlossen. Es umfasst die relevanten Aspekte computerlinguistischer Grundlagenwissenschaft und sprachtechnologischer Anwendung in eindrucksvoller Breite und auf aktuellem Stand." [Manfred Pinkal]

BK

18.00 Einzelne Sprachen und Literaturen allgemein
54.75 Sprachverarbeitung Informatik

Classification

18.00 Einzelne Sprachen und Literaturen allgemein
54.75 Sprachverarbeitung Informatik
Bredack, J.: Automatische Extraktion fachterminologischer Mehrwortbegriffe : ein Verfahrensvergleich (2016) 0.02
```
0.022694042 = product of:
  0.13616425 = sum of:
    0.046871334 = weight(_text_:informatik in 3194) [ClassicSimilarity], result of:
      0.046871334 = score(doc=3194,freq=2.0), product of:
        0.1662844 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.032588977 = queryNorm
        0.2818745 = fieldWeight in 3194, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3194)
    0.08929291 = weight(_text_:systeme in 3194) [ClassicSimilarity], result of:
      0.08929291 = score(doc=3194,freq=6.0), product of:
        0.17439179 = queryWeight, product of:
          5.3512506 = idf(docFreq=569, maxDocs=44218)
          0.032588977 = queryNorm
        0.51202476 = fieldWeight in 3194, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          5.3512506 = idf(docFreq=569, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3194)
  0.16666667 = coord(2/12)
```
Abstract

In dieser Untersuchung wurden zwei Systeme eingesetzt, um MWT aus einer Dokumentkollektion mit fachsprachlichem Bezug (Volltexte des ACL Anthology Reference Corpus) automatisch zu extrahieren. Das thematische Spektrum umfasste alle Bereiche der natürlichen Sprachverarbeitung, im Speziellen die CL als interdisziplinäre Wissenschaft. Ziel war es MWT zu extrahieren, die als potentielle Indexterme im IR Verwendung finden können. Diese sollten auf Konzepte, Methoden, Verfahren und Algorithmen in der CL und angrenzenden Teilgebieten, wie Linguistik und Informatik hinweisen bzw. benennen.
Als Extraktionssysteme wurden der TreeTagger und die Indexierungssoftware Lingo verwendet. Der TreeTagger basiert auf einem statistischen Tagging- und Chunking- Algorithmus, mit dessen Hilfe NPs automatisch identifiziert und extrahiert werden. Er kann für verschiedene Anwendungsszenarien der natürlichen Sprachverarbeitung eingesetzt werden, in erster Linie als POS-Tagger für unterschiedliche Sprachen. Das Indexierungssystem Lingo arbeitet im Gegensatz zum TreeTagger mit elektronischen Wörterbüchern und einem musterbasierten Abgleich. Lingo ist ein auf automatische Indexierung ausgerichtetes System, was eine Vielzahl von Modulen mitliefert, die individuell auf eine bestimmte Aufgabenstellung angepasst und aufeinander abgestimmt werden können. Die unterschiedlichen Verarbeitungsweisen haben sich in den Ergebnismengen beider Systeme deutlich gezeigt. Die gering ausfallenden Übereinstimmungen der Ergebnismengen verdeutlichen die abweichende Funktionsweise und konnte mit einer qualitativen Analyse beispielhaft beschrieben werden. In der vorliegenden Arbeit kann abschließend nicht geklärt werden, welches der beiden Systeme bevorzugt für die Generierung von Indextermen eingesetzt werden sollte.

Lobin, H: Computerlinguistik und Texttechnologie (2010) 0.02

0.02028629 = product of:
  0.121717736 = sum of:
    0.079543285 = weight(_text_:informatik in 564) [ClassicSimilarity], result of:
      0.079543285 = score(doc=564,freq=4.0), product of:
        0.1662844 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.032588977 = queryNorm
        0.4783569 = fieldWeight in 564, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.046875 = fieldNorm(doc=564)
    0.042174455 = product of:
      0.08434891 = sum of:
        0.08434891 = weight(_text_:allgemein in 564) [ClassicSimilarity], result of:
          0.08434891 = score(doc=564,freq=4.0), product of:
            0.17123379 = queryWeight, product of:
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.032588977 = queryNorm
            0.49259502 = fieldWeight in 564, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.254347 = idf(docFreq=627, maxDocs=44218)
              0.046875 = fieldNorm(doc=564)
      0.5 = coord(1/2)
  0.16666667 = coord(2/12)

BK: 18.00 Einzelne Sprachen und Literaturen allgemein
54.75 Sprachverarbeitung Informatik
Classification: 18.00 Einzelne Sprachen und Literaturen allgemein
54.75 Sprachverarbeitung Informatik

Renker, L.: Exploration von Textkorpora : Topic Models als Grundlage der Interaktion (2015) 0.01
```
0.013662837 = product of:
  0.081977025 = sum of:
    0.06628608 = weight(_text_:informatik in 2380) [ClassicSimilarity], result of:
      0.06628608 = score(doc=2380,freq=4.0), product of:
        0.1662844 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.032588977 = queryNorm
        0.39863077 = fieldWeight in 2380, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2380)
    0.015690941 = weight(_text_:internet in 2380) [ClassicSimilarity], result of:
      0.015690941 = score(doc=2380,freq=2.0), product of:
        0.09621047 = queryWeight, product of:
          2.9522398 = idf(docFreq=6276, maxDocs=44218)
          0.032588977 = queryNorm
        0.16308975 = fieldWeight in 2380, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.9522398 = idf(docFreq=6276, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2380)
  0.16666667 = coord(2/12)
```
Abstract

Das Internet birgt schier endlose Informationen. Ein zentrales Problem besteht heutzutage darin diese auch zugänglich zu machen. Es ist ein fundamentales Domänenwissen erforderlich, um in einer Volltextsuche die korrekten Suchanfragen zu formulieren. Das ist jedoch oftmals nicht vorhanden, so dass viel Zeit aufgewandt werden muss, um einen Überblick des behandelten Themas zu erhalten. In solchen Situationen findet sich ein Nutzer in einem explorativen Suchvorgang, in dem er sich schrittweise an ein Thema heranarbeiten muss. Für die Organisation von Daten werden mittlerweile ganz selbstverständlich Verfahren des Machine Learnings verwendet. In den meisten Fällen bleiben sie allerdings für den Anwender unsichtbar. Die interaktive Verwendung in explorativen Suchprozessen könnte die menschliche Urteilskraft enger mit der maschinellen Verarbeitung großer Datenmengen verbinden. Topic Models sind ebensolche Verfahren. Sie finden in einem Textkorpus verborgene Themen, die sich relativ gut von Menschen interpretieren lassen und sind daher vielversprechend für die Anwendung in explorativen Suchprozessen. Nutzer können damit beim Verstehen unbekannter Quellen unterstützt werden. Bei der Betrachtung entsprechender Forschungsarbeiten fiel auf, dass Topic Models vorwiegend zur Erzeugung statischer Visualisierungen verwendet werden. Das Sensemaking ist ein wesentlicher Bestandteil der explorativen Suche und wird dennoch nur in sehr geringem Umfang genutzt, um algorithmische Neuerungen zu begründen und in einen umfassenden Kontext zu setzen. Daraus leitet sich die Vermutung ab, dass die Verwendung von Modellen des Sensemakings und die nutzerzentrierte Konzeption von explorativen Suchen, neue Funktionen für die Interaktion mit Topic Models hervorbringen und einen Kontext für entsprechende Forschungsarbeiten bieten können.

Footnote

Masterthesis zur Erlangung des akademischen Grades Master of Science (M.Sc.) vorgelegt an der Fachhochschule Köln / Fakultät für Informatik und Ingenieurswissenschaften im Studiengang Medieninformatik.

Imprint

Gummersbach : Fakultät für Informatik und Ingenieurswissenschaften

Rötzer, F.: KI-Programm besser als Menschen im Verständnis natürlicher Sprache (2018) 0.01

0.0077212965 = product of:
  0.046327777 = sum of:
    0.037497066 = weight(_text_:informatik in 4217) [ClassicSimilarity], result of:
      0.037497066 = score(doc=4217,freq=2.0), product of:
        0.1662844 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.032588977 = queryNorm
        0.2254996 = fieldWeight in 4217, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.03125 = fieldNorm(doc=4217)
    0.008830713 = product of:
      0.017661426 = sum of:
        0.017661426 = weight(_text_:22 in 4217) [ClassicSimilarity], result of:
          0.017661426 = score(doc=4217,freq=2.0), product of:
            0.11412105 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.032588977 = queryNorm
            0.15476047 = fieldWeight in 4217, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.03125 = fieldNorm(doc=4217)
      0.5 = coord(1/2)
  0.16666667 = coord(2/12)

Date: 22. 1.2018 11:32:44
Field: Informatik

Sünkler, S.; Kerkmann, F.; Schultheiß, S.: Ok Google . the end of search as we know it : sprachgesteuerte Websuche im Test (2018) 0.01
```
0.00601455 = product of:
  0.0721746 = sum of:
    0.0721746 = weight(_text_:systeme in 5626) [ClassicSimilarity], result of:
      0.0721746 = score(doc=5626,freq=2.0), product of:
        0.17439179 = queryWeight, product of:
          5.3512506 = idf(docFreq=569, maxDocs=44218)
          0.032588977 = queryNorm
        0.41386467 = fieldWeight in 5626, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.3512506 = idf(docFreq=569, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5626)
  0.083333336 = coord(1/12)
```
Abstract

Sprachsteuerungssysteme, die den Nutzer auf Zuruf unterstützen, werden im Zuge der Verbreitung von Smartphones und Lautsprechersystemen wie Amazon Echo oder Google Home zunehmend populär. Eine der zentralen Anwendungen dabei stellt die Suche in Websuchmaschinen dar. Wie aber funktioniert "googlen", wenn der Nutzer seine Suchanfrage nicht schreibt, sondern spricht? Dieser Frage ist ein Projektteam der HAW Hamburg nachgegangen und hat im Auftrag der Deutschen Telekom untersucht, wie effektiv, effizient und zufriedenstellend Google Now, Apple Siri, Microsoft Cortana sowie das Amazon Fire OS arbeiten. Ermittelt wurden Stärken und Schwächen der Systeme sowie Erfolgskriterien für eine hohe Gebrauchstauglichkeit. Diese Erkenntnisse mündeten in dem Prototyp einer optimalen Voice Web Search.

Multi-source, multilingual information extraction and summarization (2013) 0.01

0.00552384 = product of:
  0.06628608 = sum of:
    0.06628608 = weight(_text_:informatik in 978) [ClassicSimilarity], result of:
      0.06628608 = score(doc=978,freq=4.0), product of:
        0.1662844 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.032588977 = queryNorm
        0.39863077 = fieldWeight in 978, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.0390625 = fieldNorm(doc=978)
  0.083333336 = coord(1/12)

BK: 54.75 (Sprachverarbeitung) <Informatik>
Classification: 54.75 (Sprachverarbeitung) <Informatik>

Helbig, H.: Knowledge representation and the semantics of natural language (2014) 0.01

0.00552384 = product of:
  0.06628608 = sum of:
    0.06628608 = weight(_text_:informatik in 2396) [ClassicSimilarity], result of:
      0.06628608 = score(doc=2396,freq=4.0), product of:
        0.1662844 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.032588977 = queryNorm
        0.39863077 = fieldWeight in 2396, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2396)
  0.083333336 = coord(1/12)

BK: 54.75 (Sprachverarbeitung, Informatik)
Classification: 54.75 (Sprachverarbeitung, Informatik)

Strube, M.: Kreativ durch Analogien (2011) 0.01
```
0.005468322 = product of:
  0.06561986 = sum of:
    0.06561986 = weight(_text_:informatik in 4805) [ClassicSimilarity], result of:
      0.06561986 = score(doc=4805,freq=2.0), product of:
        0.1662844 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.032588977 = queryNorm
        0.3946243 = fieldWeight in 4805, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4805)
  0.083333336 = coord(1/12)
```
Content

"Die Computerlinguistik vereinigt Elemente von Informatik und Linguistik; sie verwendet darüber hinaus Methoden aus weiteren Gebieten wie Mathematik, Psychologie, Statistik und künstliche Intelligenz. Der Reiz und die Herausforderung einer solchen interdisziplinären Wissenschaft liegen darin, Analogien zwischen Konzepten aus weit entfernten Teilgebieten zu erkennen und zu nutzen. Paradebeispiel dafür ist einer der entscheidenden Durchbrüche, welche die Computerlinguistik prägten. Es geht um das »Parsing«: Ein Computerprogramm, genauer gesagt ein Compiler, nimmt Zeichen für Zeichen den Input des Benutzers entgegen, der in diesem Fall seinerseits aus dem Text eines Computerprogramms besteht, und ermittelt dessen Struktur. Im Prinzip dasselbe tut ein Mensch, der einen gesprochenen Satz hört und versteht."

Rötzer, F.: Kann KI mit KI generierte Texte erkennen? (2019) 0.01

0.005468322 = product of:
  0.06561986 = sum of:
    0.06561986 = weight(_text_:informatik in 3977) [ClassicSimilarity], result of:
      0.06561986 = score(doc=3977,freq=2.0), product of:
        0.1662844 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.032588977 = queryNorm
        0.3946243 = fieldWeight in 3977, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3977)
  0.083333336 = coord(1/12)

Field: Informatik

Holland, M.: Erstes wissenschaftliches Buch eines Algorithmus' veröffentlicht (2019) 0.01

0.005468322 = product of:
  0.06561986 = sum of:
    0.06561986 = weight(_text_:informatik in 5227) [ClassicSimilarity], result of:
      0.06561986 = score(doc=5227,freq=2.0), product of:
        0.1662844 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.032588977 = queryNorm
        0.3946243 = fieldWeight in 5227, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5227)
  0.083333336 = coord(1/12)

Field: Informatik

Scherer Auberson, K.: Counteracting concept drift in natural language classifiers : proposal for an automated method (2018) 0.01
```
0.0051553287 = product of:
  0.061863944 = sum of:
    0.061863944 = weight(_text_:systeme in 2849) [ClassicSimilarity], result of:
      0.061863944 = score(doc=2849,freq=2.0), product of:
        0.17439179 = queryWeight, product of:
          5.3512506 = idf(docFreq=569, maxDocs=44218)
          0.032588977 = queryNorm
        0.35474116 = fieldWeight in 2849, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.3512506 = idf(docFreq=569, maxDocs=44218)
          0.046875 = fieldNorm(doc=2849)
  0.083333336 = coord(1/12)
```
Abstract

Natural Language Classifier helfen Unternehmen zunehmend dabei die Flut von Textdaten zu überwinden. Aber diese Classifier, einmal trainiert, verlieren mit der Zeit ihre Nützlichkeit. Sie bleiben statisch, aber die zugrundeliegende Domäne der Textdaten verändert sich: Ihre Genauigkeit nimmt aufgrund eines Phänomens ab, das als Konzeptdrift bekannt ist. Die Frage ist ob Konzeptdrift durch die Ausgabe eines Classifiers zuverlässig erkannt werden kann, und falls ja: ist es möglich dem durch nachtrainieren des Classifiers entgegenzuwirken. Es wird eine System-Implementierung mittels Proof-of-Concept vorgestellt, bei der das Konfidenzmass des Classifiers zur Erkennung von Konzeptdrift verwendet wird. Der Classifier wird dann iterativ neu trainiert, indem er Stichproben mit niedrigem Konfidenzmass auswählt, sie korrigiert und im Trainingsset der nächsten Iteration verwendet. Die Leistung des Classifiers wird über die Zeit gemessen, und die Leistung des Systems beobachtet. Basierend darauf werden schließlich Empfehlungen gegeben, die sich bei der Implementierung solcher Systeme als nützlich erweisen können.
Sprachtechnologie : ein Überblick (2012) 0.00
```
0.0039059445 = product of:
  0.046871334 = sum of:
    0.046871334 = weight(_text_:informatik in 1750) [ClassicSimilarity], result of:
      0.046871334 = score(doc=1750,freq=2.0), product of:
        0.1662844 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.032588977 = queryNorm
        0.2818745 = fieldWeight in 1750, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1750)
  0.083333336 = coord(1/12)
```
Abstract

Seit mehr als einem halben Jahrhundert existieren ernsthafte und ernst zu nehmende Versuche, menschliche Sprache maschinell zu verarbeiten. Maschinelle Übersetzung oder "natürliche" Dialoge mit Computern gehören zu den ersten Ideen, die den Bereich der späteren Computerlinguistik oder Sprachtechnologie abgesteckt und deren Vorhaben geleitet haben. Heute ist dieser auch maschinelle Sprachverarbeitung (natural language processing, NLP) genannte Bereich stark ausdiversifiziert: Durch die rapide Entwicklung der Informatik ist vieles vorher Unvorstellbare Realität (z. B. automatische Telefonauskunft), einiges früher Unmögliche immerhin möglich geworden (z. B. Handhelds mit Sprachein- und -ausgabe als digitale persönliche (Informations-)Assistenten). Es gibt verschiedene Anwendungen der Computerlinguistik, von denen einige den Sprung in die kommerzielle Nutzung geschafft haben (z. B. Diktiersysteme, Textklassifikation, maschinelle Übersetzung). Immer noch wird an natürlichsprachlichen Systemen (natural language systems, NLS) verschiedenster Funktionalität (z. B. zur Beantwortung beliebiger Fragen oder zur Generierung komplexer Texte) intensiv geforscht, auch wenn die hoch gesteckten Ziele von einst längst nicht erreicht sind (und deshalb entsprechend "heruntergefahren" wurden). Wo die maschinelle Sprachverarbeitung heute steht, ist allerdings angesichts der vielfältigen Aktivitäten in der Computerlinguistik und Sprachtechnologie weder offensichtlich noch leicht in Erfahrung zu bringen (für Studierende des Fachs und erst recht für Laien). Ein Ziel dieses Buches ist, es, die aktuelle Literaturlage in dieser Hinsicht zu verbessern, indem spezifisch systembezogene Aspekte der Computerlinguistik als Überblick über die Sprachtechnologie zusammengetragen werden.

Rettinger, A.; Schumilin, A.; Thoma, S.; Ell, B.: Learning a cross-lingual semantic representation of relations expressed in text (2015) 0.00

0.002615157 = product of:
  0.031381883 = sum of:
    0.031381883 = weight(_text_:internet in 2027) [ClassicSimilarity], result of:
      0.031381883 = score(doc=2027,freq=2.0), product of:
        0.09621047 = queryWeight, product of:
          2.9522398 = idf(docFreq=6276, maxDocs=44218)
          0.032588977 = queryNorm
        0.3261795 = fieldWeight in 2027, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.9522398 = idf(docFreq=6276, maxDocs=44218)
          0.078125 = fieldNorm(doc=2027)
  0.083333336 = coord(1/12)

Series: Information Systems and Applications, incl. Internet/Web, and HCI; Bd. 9088

RWI/PH: Auf der Suche nach dem entscheidenden Wort : die Häufung bestimmter Wörter innerhalb eines Textes macht diese zu Schlüsselwörtern (2012) 0.00
```
0.0025776643 = product of:
  0.030931972 = sum of:
    0.030931972 = weight(_text_:systeme in 331) [ClassicSimilarity], result of:
      0.030931972 = score(doc=331,freq=2.0), product of:
        0.17439179 = queryWeight, product of:
          5.3512506 = idf(docFreq=569, maxDocs=44218)
          0.032588977 = queryNorm
        0.17737058 = fieldWeight in 331, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.3512506 = idf(docFreq=569, maxDocs=44218)
          0.0234375 = fieldNorm(doc=331)
  0.083333336 = coord(1/12)
```
Abstract

Der Mensch kann komplexe Sachverhalte in eine eindimensionale Abfolge von Buchstaben umwandeln und niederschreiben. Dabei dienen Schlüsselwörter dazu, den Inhalt des Textes zu vermitteln. Wie Buchstaben und Wörtern mit dem Thema eines Textes zusammenhängen, haben Eduardo Altmann und seine Kollegen vom Max-Planck-Institut für die Physik komplexer Systeme und der Universität Bologna mit Hilfe von statistischen Methoden untersucht. Dabei haben sie herausgefunden, dass Schlüsselwörter nicht dadurch gekennzeichnet sind, dass sie im ganzen Text besonders häufig vorkommen, sondern nur an bestimmten Stellen vermehrt zu finden sind. Außerdem gibt es Beziehungen zwischen weit entfernten Textabschnitten, in der Form, dass dieselben Wörter und Buchstaben bevorzugt verwendet werden.
Gencosman, B.C.; Ozmutlu, H.C.; Ozmutlu, S.: Character n-gram application for automatic new topic identification (2014) 0.00
```
0.0018491952 = product of:
  0.022190342 = sum of:
    0.022190342 = weight(_text_:internet in 2688) [ClassicSimilarity], result of:
      0.022190342 = score(doc=2688,freq=4.0), product of:
        0.09621047 = queryWeight, product of:
          2.9522398 = idf(docFreq=6276, maxDocs=44218)
          0.032588977 = queryNorm
        0.23064373 = fieldWeight in 2688, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.9522398 = idf(docFreq=6276, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2688)
  0.083333336 = coord(1/12)
```
Abstract

The widespread availability of the Internet and the variety of Internet-based applications have resulted in a significant increase in the amount of web pages. Determining the behaviors of search engine users has become a critical step in enhancing search engine performance. Search engine user behaviors can be determined by content-based or content-ignorant algorithms. Although many content-ignorant studies have been performed to automatically identify new topics, previous results have demonstrated that spelling errors can cause significant errors in topic shift estimates. In this study, we focused on minimizing the number of wrong estimates that were based on spelling errors. We developed a new hybrid algorithm combining character n-gram and neural network methodologies, and compared the experimental results with results from previous studies. For the FAST and Excite datasets, the proposed algorithm improved topic shift estimates by 6.987% and 2.639%, respectively. Moreover, we analyzed the performance of the character n-gram method in different aspects including the comparison with Levenshtein edit-distance method. The experimental results demonstrated that the character n-gram method outperformed to the Levensthein edit distance method in terms of topic identification.
Kajanan, S.; Bao, Y.; Datta, A.; VanderMeer, D.; Dutta, K.: Efficient automatic search query formulation using phrase-level analysis (2014) 0.00
```
0.0014793561 = product of:
  0.017752273 = sum of:
    0.017752273 = weight(_text_:internet in 1264) [ClassicSimilarity], result of:
      0.017752273 = score(doc=1264,freq=4.0), product of:
        0.09621047 = queryWeight, product of:
          2.9522398 = idf(docFreq=6276, maxDocs=44218)
          0.032588977 = queryNorm
        0.18451498 = fieldWeight in 1264, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.9522398 = idf(docFreq=6276, maxDocs=44218)
          0.03125 = fieldNorm(doc=1264)
  0.083333336 = coord(1/12)
```
Abstract

Over the past decade, the volume of information available digitally over the Internet has grown enormously. Technical developments in the area of search, such as Google's Page Rank algorithm, have proved so good at serving relevant results that Internet search has become integrated into daily human activity. One can endlessly explore topics of interest simply by querying and reading through the resulting links. Yet, although search engines are well known for providing relevant results based on users' queries, users do not always receive the results they are looking for. Google's Director of Research describes clickstream evidence of frustrated users repeatedly reformulating queries and searching through page after page of results. Given the general quality of search engine results, one must consider the possibility that the frustrated user's query is not effective; that is, it does not describe the essence of the user's interest. Indeed, extensive research into human search behavior has found that humans are not very effective at formulating good search queries that describe what they are interested in. Ideally, the user should simply point to a portion of text that sparked the user's interest, and a system should automatically formulate a search query that captures the essence of the text. In this paper, we describe an implemented system that provides this capability. We first describe how our work differs from existing work in automatic query formulation, and propose a new method for improved quantification of the relevance of candidate search terms drawn from input text using phrase-level analysis. We then propose an implementable method designed to provide relevant queries based on a user's text input. We demonstrate the quality of our results and performance of our system through experimental studies. Our results demonstrate that our system produces relevant search terms with roughly two-thirds precision and recall compared to search terms selected by experts, and that typical users find significantly more relevant results (31% more relevant) more quickly (64% faster) using our system than self-formulated search queries. Further, we show that our implementation can scale to request loads of up to 10 requests per second within current online responsiveness expectations (<2-second response times at the highest loads tested).

Lezius, W.: Morphy - Morphologie und Tagging für das Deutsche (2013) 0.00

0.0014717856 = product of:
  0.017661426 = sum of:
    0.017661426 = product of:
      0.035322852 = sum of:
        0.035322852 = weight(_text_:22 in 1490) [ClassicSimilarity], result of:
          0.035322852 = score(doc=1490,freq=2.0), product of:
            0.11412105 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.032588977 = queryNorm
            0.30952093 = fieldWeight in 1490, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=1490)
      0.5 = coord(1/2)
  0.083333336 = coord(1/12)

Date: 22. 3.2015 9:30:24

Luo, Z.; Yu, Y.; Osborne, M.; Wang, T.: Structuring tweets for improving Twitter search (2015) 0.00

0.0013075785 = product of:
  0.015690941 = sum of:
    0.015690941 = weight(_text_:internet in 2335) [ClassicSimilarity], result of:
      0.015690941 = score(doc=2335,freq=2.0), product of:
        0.09621047 = queryWeight, product of:
          2.9522398 = idf(docFreq=6276, maxDocs=44218)
          0.032588977 = queryNorm
        0.16308975 = fieldWeight in 2335, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.9522398 = idf(docFreq=6276, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2335)
  0.083333336 = coord(1/12)

Theme: Internet

Search (26 results, page 1 of 2)

Authors

Languages

Types

Themes

Subjects

Classifications