Search (7 results, page 1 of 1)

Huo, W.: Automatic multi-word term extraction and its application to Web-page summarization (2012) 0.04

0.0360905 = product of:
  0.24060333 = sum of:
    0.11538043 = weight(_text_:2f in 563) [ClassicSimilarity], result of:
      0.11538043 = score(doc=563,freq=2.0), product of:
        0.20529667 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.024215192 = queryNorm
        0.56201804 = fieldWeight in 563, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=563)
    0.11538043 = weight(_text_:2f in 563) [ClassicSimilarity], result of:
      0.11538043 = score(doc=563,freq=2.0), product of:
        0.20529667 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.024215192 = queryNorm
        0.56201804 = fieldWeight in 563, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=563)
    0.009842472 = product of:
      0.019684944 = sum of:
        0.019684944 = weight(_text_:22 in 563) [ClassicSimilarity], result of:
          0.019684944 = score(doc=563,freq=2.0), product of:
            0.08479747 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.024215192 = queryNorm
            0.23214069 = fieldWeight in 563, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=563)
      0.5 = coord(1/2)
  0.15 = coord(3/20)

Content: A Thesis presented to The University of Guelph In partial fulfilment of requirements for the degree of Master of Science in Computer Science. Vgl. Unter: http://www.inf.ufrgs.br%2F~ceramisch%2Fdownload_files%2Fpublications%2F2009%2Fp01.pdf.
Date: 10. 1.2013 19:22:47

Bredack, J.: Automatische Extraktion fachterminologischer Mehrwortbegriffe : ein Verfahrensvergleich (2016) 0.02

0.024719775 = product of:
  0.0988791 = sum of:
    0.019713672 = weight(_text_:und in 3194) [ClassicSimilarity], result of:
      0.019713672 = score(doc=3194,freq=18.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.3673144 = fieldWeight in 3194, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3194)
    0.019713672 = weight(_text_:und in 3194) [ClassicSimilarity], result of:
      0.019713672 = score(doc=3194,freq=18.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.3673144 = fieldWeight in 3194, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3194)
    0.020024417 = weight(_text_:der in 3194) [ClassicSimilarity], result of:
      0.020024417 = score(doc=3194,freq=18.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.37019804 = fieldWeight in 3194, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3194)
    0.019713672 = weight(_text_:und in 3194) [ClassicSimilarity], result of:
      0.019713672 = score(doc=3194,freq=18.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.3673144 = fieldWeight in 3194, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3194)
    0.019713672 = weight(_text_:und in 3194) [ClassicSimilarity], result of:
      0.019713672 = score(doc=3194,freq=18.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.3673144 = fieldWeight in 3194, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3194)
  0.25 = coord(5/20)

Abstract: In dieser Untersuchung wurden zwei Systeme eingesetzt, um MWT aus einer Dokumentkollektion mit fachsprachlichem Bezug (Volltexte des ACL Anthology Reference Corpus) automatisch zu extrahieren. Das thematische Spektrum umfasste alle Bereiche der natürlichen Sprachverarbeitung, im Speziellen die CL als interdisziplinäre Wissenschaft. Ziel war es MWT zu extrahieren, die als potentielle Indexterme im IR Verwendung finden können. Diese sollten auf Konzepte, Methoden, Verfahren und Algorithmen in der CL und angrenzenden Teilgebieten, wie Linguistik und Informatik hinweisen bzw. benennen.
Als Extraktionssysteme wurden der TreeTagger und die Indexierungssoftware Lingo verwendet. Der TreeTagger basiert auf einem statistischen Tagging- und Chunking- Algorithmus, mit dessen Hilfe NPs automatisch identifiziert und extrahiert werden. Er kann für verschiedene Anwendungsszenarien der natürlichen Sprachverarbeitung eingesetzt werden, in erster Linie als POS-Tagger für unterschiedliche Sprachen. Das Indexierungssystem Lingo arbeitet im Gegensatz zum TreeTagger mit elektronischen Wörterbüchern und einem musterbasierten Abgleich. Lingo ist ein auf automatische Indexierung ausgerichtetes System, was eine Vielzahl von Modulen mitliefert, die individuell auf eine bestimmte Aufgabenstellung angepasst und aufeinander abgestimmt werden können. Die unterschiedlichen Verarbeitungsweisen haben sich in den Ergebnismengen beider Systeme deutlich gezeigt. Die gering ausfallenden Übereinstimmungen der Ergebnismengen verdeutlichen die abweichende Funktionsweise und konnte mit einer qualitativen Analyse beispielhaft beschrieben werden. In der vorliegenden Arbeit kann abschließend nicht geklärt werden, welches der beiden Systeme bevorzugt für die Generierung von Indextermen eingesetzt werden sollte.
Content: Schriftliche Hausarbeit (Masterarbeit) zur Erlangung des Grades eines Master of Arts An der Universität Trier Fachbereich II Studiengang Computerlinguistik.

Renker, L.: Exploration von Textkorpora : Topic Models als Grundlage der Interaktion (2015) 0.02

0.021117155 = product of:
  0.08446862 = sum of:
    0.017385824 = weight(_text_:und in 2380) [ClassicSimilarity], result of:
      0.017385824 = score(doc=2380,freq=14.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.32394084 = fieldWeight in 2380, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2380)
    0.017385824 = weight(_text_:und in 2380) [ClassicSimilarity], result of:
      0.017385824 = score(doc=2380,freq=14.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.32394084 = fieldWeight in 2380, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2380)
    0.014925319 = weight(_text_:der in 2380) [ClassicSimilarity], result of:
      0.014925319 = score(doc=2380,freq=10.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.27592933 = fieldWeight in 2380, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2380)
    0.017385824 = weight(_text_:und in 2380) [ClassicSimilarity], result of:
      0.017385824 = score(doc=2380,freq=14.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.32394084 = fieldWeight in 2380, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2380)
    0.017385824 = weight(_text_:und in 2380) [ClassicSimilarity], result of:
      0.017385824 = score(doc=2380,freq=14.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.32394084 = fieldWeight in 2380, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2380)
  0.25 = coord(5/20)

Abstract: Das Internet birgt schier endlose Informationen. Ein zentrales Problem besteht heutzutage darin diese auch zugänglich zu machen. Es ist ein fundamentales Domänenwissen erforderlich, um in einer Volltextsuche die korrekten Suchanfragen zu formulieren. Das ist jedoch oftmals nicht vorhanden, so dass viel Zeit aufgewandt werden muss, um einen Überblick des behandelten Themas zu erhalten. In solchen Situationen findet sich ein Nutzer in einem explorativen Suchvorgang, in dem er sich schrittweise an ein Thema heranarbeiten muss. Für die Organisation von Daten werden mittlerweile ganz selbstverständlich Verfahren des Machine Learnings verwendet. In den meisten Fällen bleiben sie allerdings für den Anwender unsichtbar. Die interaktive Verwendung in explorativen Suchprozessen könnte die menschliche Urteilskraft enger mit der maschinellen Verarbeitung großer Datenmengen verbinden. Topic Models sind ebensolche Verfahren. Sie finden in einem Textkorpus verborgene Themen, die sich relativ gut von Menschen interpretieren lassen und sind daher vielversprechend für die Anwendung in explorativen Suchprozessen. Nutzer können damit beim Verstehen unbekannter Quellen unterstützt werden. Bei der Betrachtung entsprechender Forschungsarbeiten fiel auf, dass Topic Models vorwiegend zur Erzeugung statischer Visualisierungen verwendet werden. Das Sensemaking ist ein wesentlicher Bestandteil der explorativen Suche und wird dennoch nur in sehr geringem Umfang genutzt, um algorithmische Neuerungen zu begründen und in einen umfassenden Kontext zu setzen. Daraus leitet sich die Vermutung ab, dass die Verwendung von Modellen des Sensemakings und die nutzerzentrierte Konzeption von explorativen Suchen, neue Funktionen für die Interaktion mit Topic Models hervorbringen und einen Kontext für entsprechende Forschungsarbeiten bieten können.
Footnote: Masterthesis zur Erlangung des akademischen Grades Master of Science (M.Sc.) vorgelegt an der Fachhochschule Köln / Fakultät für Informatik und Ingenieurswissenschaften im Studiengang Medieninformatik.
Imprint: Gummersbach : Fakultät für Informatik und Ingenieurswissenschaften

Scherer Auberson, K.: Counteracting concept drift in natural language classifiers : proposal for an automated method (2018) 0.02

0.020675898 = product of:
  0.08270359 = sum of:
    0.015770938 = weight(_text_:und in 2849) [ClassicSimilarity], result of:
      0.015770938 = score(doc=2849,freq=8.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.29385152 = fieldWeight in 2849, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=2849)
    0.015770938 = weight(_text_:und in 2849) [ClassicSimilarity], result of:
      0.015770938 = score(doc=2849,freq=8.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.29385152 = fieldWeight in 2849, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=2849)
    0.019619841 = weight(_text_:der in 2849) [ClassicSimilarity], result of:
      0.019619841 = score(doc=2849,freq=12.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.36271852 = fieldWeight in 2849, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=2849)
    0.015770938 = weight(_text_:und in 2849) [ClassicSimilarity], result of:
      0.015770938 = score(doc=2849,freq=8.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.29385152 = fieldWeight in 2849, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=2849)
    0.015770938 = weight(_text_:und in 2849) [ClassicSimilarity], result of:
      0.015770938 = score(doc=2849,freq=8.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.29385152 = fieldWeight in 2849, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=2849)
  0.25 = coord(5/20)

Abstract: Natural Language Classifier helfen Unternehmen zunehmend dabei die Flut von Textdaten zu überwinden. Aber diese Classifier, einmal trainiert, verlieren mit der Zeit ihre Nützlichkeit. Sie bleiben statisch, aber die zugrundeliegende Domäne der Textdaten verändert sich: Ihre Genauigkeit nimmt aufgrund eines Phänomens ab, das als Konzeptdrift bekannt ist. Die Frage ist ob Konzeptdrift durch die Ausgabe eines Classifiers zuverlässig erkannt werden kann, und falls ja: ist es möglich dem durch nachtrainieren des Classifiers entgegenzuwirken. Es wird eine System-Implementierung mittels Proof-of-Concept vorgestellt, bei der das Konfidenzmass des Classifiers zur Erkennung von Konzeptdrift verwendet wird. Der Classifier wird dann iterativ neu trainiert, indem er Stichproben mit niedrigem Konfidenzmass auswählt, sie korrigiert und im Trainingsset der nächsten Iteration verwendet. Die Leistung des Classifiers wird über die Zeit gemessen, und die Leistung des Systems beobachtet. Basierend darauf werden schließlich Empfehlungen gegeben, die sich bei der Implementierung solcher Systeme als nützlich erweisen können.
Imprint: Chur : Hochschule für Technik und Wirtschaft / Arbeitsbereich Informationswissenschaft

Schmolz, H.: Anaphora resolution and text retrieval : a lnguistic analysis of hypertexts (2013) 0.02

0.016479852 = product of:
  0.06591941 = sum of:
    0.013142449 = weight(_text_:und in 1810) [ClassicSimilarity], result of:
      0.013142449 = score(doc=1810,freq=2.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.24487628 = fieldWeight in 1810, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=1810)
    0.013142449 = weight(_text_:und in 1810) [ClassicSimilarity], result of:
      0.013142449 = score(doc=1810,freq=2.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.24487628 = fieldWeight in 1810, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=1810)
    0.013349611 = weight(_text_:der in 1810) [ClassicSimilarity], result of:
      0.013349611 = score(doc=1810,freq=2.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.2467987 = fieldWeight in 1810, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.078125 = fieldNorm(doc=1810)
    0.013142449 = weight(_text_:und in 1810) [ClassicSimilarity], result of:
      0.013142449 = score(doc=1810,freq=2.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.24487628 = fieldWeight in 1810, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=1810)
    0.013142449 = weight(_text_:und in 1810) [ClassicSimilarity], result of:
      0.013142449 = score(doc=1810,freq=2.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.24487628 = fieldWeight in 1810, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=1810)
  0.25 = coord(5/20)

Content: Trägerin des VFI-Dissertationspreises 2014: "Überzeugende gründliche linguistische und quantitative Analyse eines im Information Retrieval bisher wenig beachteten Textelementes anhand eines eigens erstellten grossen Hypertextkorpus, einschliesslich der Evaluation selbsterstellter Auflösungsregeln für die Nutzung in künftigen IR-Systemen.".

Karlova-Bourbonus, N.: Automatic detection of contradictions in texts (2018) 0.00

0.0018202305 = product of:
  0.018202305 = sum of:
    0.006936662 = weight(_text_:der in 5976) [ClassicSimilarity], result of:
      0.006936662 = score(doc=5976,freq=6.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.12824038 = fieldWeight in 5976, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0234375 = fieldNorm(doc=5976)
    0.011265644 = product of:
      0.022531288 = sum of:
        0.022531288 = weight(_text_:philosophie in 5976) [ClassicSimilarity], result of:
          0.022531288 = score(doc=5976,freq=2.0), product of:
            0.12829916 = queryWeight, product of:
              5.298292 = idf(docFreq=600, maxDocs=44218)
              0.024215192 = queryNorm
            0.17561524 = fieldWeight in 5976, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.298292 = idf(docFreq=600, maxDocs=44218)
              0.0234375 = fieldNorm(doc=5976)
      0.5 = coord(1/2)
  0.1 = coord(2/20)

Content: Inaugural-Dissertation zur Erlangung des Doktorgrades der Philosophie des Fachbereiches 05 - Sprache, Literatur, Kultur der Justus-Liebig-Universität Gießen. Vgl. unter: https://core.ac.uk/download/pdf/196294796.pdf.
Imprint: Gießen : Fachbereiches 05 - Sprache, Literatur, Kultur der Justus-Liebig-Universität Gießen

Schmolz, H.: Anaphora resolution and text retrieval : a lnguistic analysis of hypertexts (2015) 0.00

6.674806E-4 = product of:
  0.013349611 = sum of:
    0.013349611 = weight(_text_:der in 1172) [ClassicSimilarity], result of:
      0.013349611 = score(doc=1172,freq=2.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.2467987 = fieldWeight in 1172, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.078125 = fieldNorm(doc=1172)
  0.05 = coord(1/20)

Footnote: Überarbeitete Version der Doktorarbeit, Universität Passau, 2013.

Search (7 results, page 1 of 1)

Authors

Languages

Themes

Subjects

Classifications