Search (41 results, page 1 of 3)

Lezius, W.: Morphy - Morphologie und Tagging für das Deutsche (2013) 0.04

0.038045496 = product of:
  0.12681831 = sum of:
    0.025753833 = weight(_text_:und in 1490) [ClassicSimilarity], result of:
      0.025753833 = score(doc=1490,freq=12.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.47985753 = fieldWeight in 1490, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1490)
    0.025753833 = weight(_text_:und in 1490) [ClassicSimilarity], result of:
      0.025753833 = score(doc=1490,freq=12.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.47985753 = fieldWeight in 1490, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1490)
    0.010679688 = weight(_text_:der in 1490) [ClassicSimilarity], result of:
      0.010679688 = score(doc=1490,freq=2.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.19743896 = fieldWeight in 1490, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=1490)
    0.025753833 = weight(_text_:und in 1490) [ClassicSimilarity], result of:
      0.025753833 = score(doc=1490,freq=12.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.47985753 = fieldWeight in 1490, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1490)
    0.025753833 = weight(_text_:und in 1490) [ClassicSimilarity], result of:
      0.025753833 = score(doc=1490,freq=12.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.47985753 = fieldWeight in 1490, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1490)
    0.013123296 = product of:
      0.026246592 = sum of:
        0.026246592 = weight(_text_:22 in 1490) [ClassicSimilarity], result of:
          0.026246592 = score(doc=1490,freq=2.0), product of:
            0.08479747 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.024215192 = queryNorm
            0.30952093 = fieldWeight in 1490, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=1490)
      0.5 = coord(1/2)
  0.3 = coord(6/20)

Abstract: Morphy ist ein frei verfügbares Softwarepaket für die morphologische Analyse und Synthese und die kontextsensitive Wortartenbestimmung des Deutschen. Die Verwendung der Software unterliegt keinen Beschränkungen. Da die Weiterentwicklung eingestellt worden ist, verwenden Sie Morphy as is, d.h. auf eigenes Risiko, ohne jegliche Haftung und Gewährleistung und vor allem ohne Support. Morphy ist nur für die Windows-Plattform verfügbar und nur auf Standalone-PCs lauffähig.
Date: 22. 3.2015 9:30:24

Engerer, V.: Informationswissenschaft und Linguistik. : kurze Geschichte eines fruchtbaren interdisziplinäaren Verhäaltnisses in drei Akten (2012) 0.04

0.03787226 = product of:
  0.15148903 = sum of:
    0.02276339 = weight(_text_:und in 3376) [ClassicSimilarity], result of:
      0.02276339 = score(doc=3376,freq=6.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.42413816 = fieldWeight in 3376, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=3376)
    0.060435485 = weight(_text_:geschichte in 3376) [ClassicSimilarity], result of:
      0.060435485 = score(doc=3376,freq=2.0), product of:
        0.11508996 = queryWeight, product of:
          4.7528 = idf(docFreq=1036, maxDocs=44218)
          0.024215192 = queryNorm
        0.5251152 = fieldWeight in 3376, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.7528 = idf(docFreq=1036, maxDocs=44218)
          0.078125 = fieldNorm(doc=3376)
    0.02276339 = weight(_text_:und in 3376) [ClassicSimilarity], result of:
      0.02276339 = score(doc=3376,freq=6.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.42413816 = fieldWeight in 3376, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=3376)
    0.02276339 = weight(_text_:und in 3376) [ClassicSimilarity], result of:
      0.02276339 = score(doc=3376,freq=6.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.42413816 = fieldWeight in 3376, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=3376)
    0.02276339 = weight(_text_:und in 3376) [ClassicSimilarity], result of:
      0.02276339 = score(doc=3376,freq=6.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.42413816 = fieldWeight in 3376, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=3376)
  0.25 = coord(5/20)

Source: SDV - Sprache und Datenverarbeitung. International journal for language data processing. 36(2012) H.2, S.71-91 [= E-Books - Fakten, Perspektiven und Szenarien] 36/2 (2012), S. 71-91

Huo, W.: Automatic multi-word term extraction and its application to Web-page summarization (2012) 0.04

0.0360905 = product of:
  0.24060333 = sum of:
    0.11538043 = weight(_text_:2f in 563) [ClassicSimilarity], result of:
      0.11538043 = score(doc=563,freq=2.0), product of:
        0.20529667 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.024215192 = queryNorm
        0.56201804 = fieldWeight in 563, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=563)
    0.11538043 = weight(_text_:2f in 563) [ClassicSimilarity], result of:
      0.11538043 = score(doc=563,freq=2.0), product of:
        0.20529667 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.024215192 = queryNorm
        0.56201804 = fieldWeight in 563, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=563)
    0.009842472 = product of:
      0.019684944 = sum of:
        0.019684944 = weight(_text_:22 in 563) [ClassicSimilarity], result of:
          0.019684944 = score(doc=563,freq=2.0), product of:
            0.08479747 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.024215192 = queryNorm
            0.23214069 = fieldWeight in 563, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=563)
      0.5 = coord(1/2)
  0.15 = coord(3/20)

Content: A Thesis presented to The University of Guelph In partial fulfilment of requirements for the degree of Master of Science in Computer Science. Vgl. Unter: http://www.inf.ufrgs.br%2F~ceramisch%2Fdownload_files%2Fpublications%2F2009%2Fp01.pdf.
Date: 10. 1.2013 19:22:47

Heid, U.: Computerlinguistik zwischen Informationswissenschaft und multilingualer Kommunikation (2010) 0.03

0.031593163 = product of:
  0.12637265 = sum of:
    0.02781732 = weight(_text_:und in 4018) [ClassicSimilarity], result of:
      0.02781732 = score(doc=4018,freq=14.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.51830536 = fieldWeight in 4018, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=4018)
    0.02781732 = weight(_text_:und in 4018) [ClassicSimilarity], result of:
      0.02781732 = score(doc=4018,freq=14.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.51830536 = fieldWeight in 4018, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=4018)
    0.015103361 = weight(_text_:der in 4018) [ClassicSimilarity], result of:
      0.015103361 = score(doc=4018,freq=4.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.27922085 = fieldWeight in 4018, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=4018)
    0.02781732 = weight(_text_:und in 4018) [ClassicSimilarity], result of:
      0.02781732 = score(doc=4018,freq=14.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.51830536 = fieldWeight in 4018, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=4018)
    0.02781732 = weight(_text_:und in 4018) [ClassicSimilarity], result of:
      0.02781732 = score(doc=4018,freq=14.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.51830536 = fieldWeight in 4018, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=4018)
  0.25 = coord(5/20)

Abstract: Dieser Beitrag widmet sich den Möglichkeiten der Interaktion zwischen Informationswissenschaft und Computerlinguistik. Dazu werden relevante Aspekte computerlinguistischer Forschung präsentiert, und ihr Potential für die Interaktion mit informationswissenschaftlichen Fragestellungen und Produkten wird erläutert. Im dritten Teil werden anhand der spezifischen Hildesheimer Situation Vorschläge für eine solche Interaktion diskutiert, und zwar im Dreieck: Informationswissenschaft, Computerlinguistik und Multilinguale Kommunikation.
Source: Information - Wissenschaft und Praxis. 61(2010) H.6/7, S.361-366

Budin, G.: Zum Entwicklungsstand der Terminologiewissenschaft (2019) 0.03

0.03052111 = product of:
  0.12208444 = sum of:
    0.024340155 = weight(_text_:und in 5604) [ClassicSimilarity], result of:
      0.024340155 = score(doc=5604,freq=14.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.4535172 = fieldWeight in 5604, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5604)
    0.024340155 = weight(_text_:und in 5604) [ClassicSimilarity], result of:
      0.024340155 = score(doc=5604,freq=14.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.4535172 = fieldWeight in 5604, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5604)
    0.024723826 = weight(_text_:der in 5604) [ClassicSimilarity], result of:
      0.024723826 = score(doc=5604,freq=14.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.4570776 = fieldWeight in 5604, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5604)
    0.024340155 = weight(_text_:und in 5604) [ClassicSimilarity], result of:
      0.024340155 = score(doc=5604,freq=14.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.4535172 = fieldWeight in 5604, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5604)
    0.024340155 = weight(_text_:und in 5604) [ClassicSimilarity], result of:
      0.024340155 = score(doc=5604,freq=14.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.4535172 = fieldWeight in 5604, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5604)
  0.25 = coord(5/20)

Abstract: In diesem Aufsatz wird der Entwicklungsstand der Terminologiewissenschaft auf 3 Ebenen analysiert: (1) in Bezug auf die Forschungsfragen, die in Forschungsprojekten, universitären Qualifizierungsarbeiten und anderen Forschungskontexten gestellt und auf der Basis empirischer Analysen beantwortet werden, darauf aufbauend (2) in Bezug auf die Methoden, die dabei verwendet werden, die Theorien, die solchen Arbeiten zugrunde gelegt werden, und die Paradigmen, in denen sich die Theorien und Methoden verorten lassen, sowie (3) in Bezug auf die darüber liegende Ebene der Terminologiewissenschaft als Disziplin. Auf allen 3 Ebenen lässt sich feststellen, dass der interdisziplinäre und multiperspektivische Charakter der Terminologiewissenschaft in den letzten Jahrzehnten zugenommen hat und sich weiter verstärkt.
Series: Kommunikation und Medienmanagement - Springer eBooks. Computer Science and Engineering

Rötzer, F.: KI-Programm besser als Menschen im Verständnis natürlicher Sprache (2018) 0.03

0.02888717 = product of:
  0.09629056 = sum of:
    0.018210711 = weight(_text_:und in 4217) [ClassicSimilarity], result of:
      0.018210711 = score(doc=4217,freq=24.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.33931053 = fieldWeight in 4217, product of:
          4.8989797 = tf(freq=24.0), with freq of:
            24.0 = termFreq=24.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=4217)
    0.018210711 = weight(_text_:und in 4217) [ClassicSimilarity], result of:
      0.018210711 = score(doc=4217,freq=24.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.33931053 = fieldWeight in 4217, product of:
          4.8989797 = tf(freq=24.0), with freq of:
            24.0 = termFreq=24.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=4217)
    0.01688607 = weight(_text_:der in 4217) [ClassicSimilarity], result of:
      0.01688607 = score(doc=4217,freq=20.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.3121784 = fieldWeight in 4217, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=4217)
    0.018210711 = weight(_text_:und in 4217) [ClassicSimilarity], result of:
      0.018210711 = score(doc=4217,freq=24.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.33931053 = fieldWeight in 4217, product of:
          4.8989797 = tf(freq=24.0), with freq of:
            24.0 = termFreq=24.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=4217)
    0.018210711 = weight(_text_:und in 4217) [ClassicSimilarity], result of:
      0.018210711 = score(doc=4217,freq=24.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.33931053 = fieldWeight in 4217, product of:
          4.8989797 = tf(freq=24.0), with freq of:
            24.0 = termFreq=24.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=4217)
    0.006561648 = product of:
      0.013123296 = sum of:
        0.013123296 = weight(_text_:22 in 4217) [ClassicSimilarity], result of:
          0.013123296 = score(doc=4217,freq=2.0), product of:
            0.08479747 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.024215192 = queryNorm
            0.15476047 = fieldWeight in 4217, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.03125 = fieldNorm(doc=4217)
      0.5 = coord(1/2)
  0.3 = coord(6/20)

Abstract: Jetzt scheint es allmählich ans Eingemachte zu gehen. Ein von der chinesischen Alibaba-Gruppe entwickelte KI-Programm konnte erstmals Menschen in der Beantwortung von Fragen und dem Verständnis von Text schlagen. Die chinesische Regierung will das Land führend in der Entwicklung von Künstlicher Intelligenz machen und hat dafür eine nationale Strategie aufgestellt. Dazu ernannte das Ministerium für Wissenschaft und Technik die Internetkonzerne Baidu, Alibaba und Tencent sowie iFlyTek zum ersten nationalen Team für die Entwicklung der KI-Technik der nächsten Generation. Baidu ist zuständig für die Entwicklung autonomer Fahrzeuge, Alibaba für die Entwicklung von Clouds für "city brains" (Smart Cities sollen sich an ihre Einwohner und ihre Umgebung anpassen), Tencent für die Enwicklung von Computervision für medizinische Anwendungen und iFlyTec für "Stimmenintelligenz". Die vier Konzerne sollen offene Plattformen herstellen, die auch andere Firmen und Start-ups verwenden können. Überdies wird bei Peking für eine Milliarde US-Dollar ein Technologiepark für die Entwicklung von KI gebaut. Dabei geht es selbstverständlich nicht nur um zivile Anwendungen, sondern auch militärische. Noch gibt es in den USA mehr KI-Firmen, aber China liegt bereits an zweiter Stelle. Das Pentagon ist beunruhigt. Offenbar kommt China rasch vorwärts. Ende 2017 stellte die KI-Firma iFlyTek, die zunächst auf Stimmerkennung und digitale Assistenten spezialisiert war, einen Roboter vor, der den schriftlichen Test der nationalen Medizinprüfung erfolgreich bestanden hatte. Der Roboter war nicht nur mit immensem Wissen aus 53 medizinischen Lehrbüchern, 2 Millionen medizinischen Aufzeichnungen und 400.000 medizinischen Texten und Berichten gefüttert worden, er soll von Medizinexperten klinische Erfahrungen und Falldiagnosen übernommen haben. Eingesetzt werden soll er, in China herrscht vor allem auf dem Land, Ärztemangel, als Helfer, der mit der automatischen Auswertung von Patientendaten eine erste Diagnose erstellt und ansonsten Ärzten mit Vorschlägen zur Seite stehen.
Date: 22. 1.2018 11:32:44

Ludwig, B.; Reischer, J.: Informationslinguistik in Regensburg (2012) 0.03

0.028849771 = product of:
  0.115399085 = sum of:
    0.023509927 = weight(_text_:und in 555) [ClassicSimilarity], result of:
      0.023509927 = score(doc=555,freq=10.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.438048 = fieldWeight in 555, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=555)
    0.023509927 = weight(_text_:und in 555) [ClassicSimilarity], result of:
      0.023509927 = score(doc=555,freq=10.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.438048 = fieldWeight in 555, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=555)
    0.021359377 = weight(_text_:der in 555) [ClassicSimilarity], result of:
      0.021359377 = score(doc=555,freq=8.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.3948779 = fieldWeight in 555, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=555)
    0.023509927 = weight(_text_:und in 555) [ClassicSimilarity], result of:
      0.023509927 = score(doc=555,freq=10.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.438048 = fieldWeight in 555, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=555)
    0.023509927 = weight(_text_:und in 555) [ClassicSimilarity], result of:
      0.023509927 = score(doc=555,freq=10.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.438048 = fieldWeight in 555, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=555)
  0.25 = coord(5/20)

Abstract: In ihrem Beitrag stellen die Autoren die Informationslinguistik als Teildisziplin der Informationswissenschaft vor, grenzen sie gegen benachbarte Fächer Theoretische Linguistik, Computerlinguistik und Maschinelle Sprachverarbeitung ab, zeigen aber zugleich auch Gemeinsamkeiten und Überschneidungsbereiche auf. Anwendungsbereiche, Verfahren und Produkte der Informationslinguistik werden in einem kurzen Überblick eingeführt. Einige davon, die im Zentrum der Forschung an der Universität Regensburg stehen, werden unter Bezugnahme auf aktuelle Arbeiten und Forschungsprojekte näher erläutert.
Source: Information - Wissenschaft und Praxis. 63(2012) H.5, S.292-296

Strube, M.: Kreativ durch Analogien (2011) 0.03

0.02825706 = product of:
  0.11302824 = sum of:
    0.022534605 = weight(_text_:und in 4805) [ClassicSimilarity], result of:
      0.022534605 = score(doc=4805,freq=12.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.41987535 = fieldWeight in 4805, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4805)
    0.022534605 = weight(_text_:und in 4805) [ClassicSimilarity], result of:
      0.022534605 = score(doc=4805,freq=12.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.41987535 = fieldWeight in 4805, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4805)
    0.022889815 = weight(_text_:der in 4805) [ClassicSimilarity], result of:
      0.022889815 = score(doc=4805,freq=12.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.4231716 = fieldWeight in 4805, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4805)
    0.022534605 = weight(_text_:und in 4805) [ClassicSimilarity], result of:
      0.022534605 = score(doc=4805,freq=12.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.41987535 = fieldWeight in 4805, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4805)
    0.022534605 = weight(_text_:und in 4805) [ClassicSimilarity], result of:
      0.022534605 = score(doc=4805,freq=12.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.41987535 = fieldWeight in 4805, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4805)
  0.25 = coord(5/20)

Content: "Die Computerlinguistik vereinigt Elemente von Informatik und Linguistik; sie verwendet darüber hinaus Methoden aus weiteren Gebieten wie Mathematik, Psychologie, Statistik und künstliche Intelligenz. Der Reiz und die Herausforderung einer solchen interdisziplinären Wissenschaft liegen darin, Analogien zwischen Konzepten aus weit entfernten Teilgebieten zu erkennen und zu nutzen. Paradebeispiel dafür ist einer der entscheidenden Durchbrüche, welche die Computerlinguistik prägten. Es geht um das »Parsing«: Ein Computerprogramm, genauer gesagt ein Compiler, nimmt Zeichen für Zeichen den Input des Benutzers entgegen, der in diesem Fall seinerseits aus dem Text eines Computerprogramms besteht, und ermittelt dessen Struktur. Im Prinzip dasselbe tut ein Mensch, der einen gesprochenen Satz hört und versteht."
Series: Spektrum der Wissenschaft - Extra: Datengetriebene Wissenschaft
Source: Spektrum der Wissenschaft. 2011, H.12, S.30-33

Becks, D.; Schulz, J.M.: Domänenübergreifende Phrasenextraktion mithilfe einer lexikonunabhängigen Analysekomponente (2010) 0.03

0.027285768 = product of:
  0.10914307 = sum of:
    0.023509927 = weight(_text_:und in 4661) [ClassicSimilarity], result of:
      0.023509927 = score(doc=4661,freq=10.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.438048 = fieldWeight in 4661, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=4661)
    0.023509927 = weight(_text_:und in 4661) [ClassicSimilarity], result of:
      0.023509927 = score(doc=4661,freq=10.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.438048 = fieldWeight in 4661, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=4661)
    0.015103361 = weight(_text_:der in 4661) [ClassicSimilarity], result of:
      0.015103361 = score(doc=4661,freq=4.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.27922085 = fieldWeight in 4661, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=4661)
    0.023509927 = weight(_text_:und in 4661) [ClassicSimilarity], result of:
      0.023509927 = score(doc=4661,freq=10.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.438048 = fieldWeight in 4661, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=4661)
    0.023509927 = weight(_text_:und in 4661) [ClassicSimilarity], result of:
      0.023509927 = score(doc=4661,freq=10.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.438048 = fieldWeight in 4661, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=4661)
  0.25 = coord(5/20)

Abstract: Der vorliegende Artikel beschreibt einen neuartigen domänenübergreifenden Ansatz zur Extraktion von Phrasen, der sich mit geringem Aufwand und ohne komplexe Lexika umsetzen und auf andere Domänen übertragen lässt. Dies wird anhand von Kundenrezensionen und Patentschriften getestet.
Source: Information und Wissen: global, sozial und frei? Proceedings des 12. Internationalen Symposiums für Informationswissenschaft (ISI 2011) ; Hildesheim, 9. - 11. März 2011. Hrsg.: J. Griesbaum, T. Mandl u. C. Womser-Hacker

Babik, W.: Keywords as linguistic tools in information and knowledge organization (2017) 0.03

0.027140621 = product of:
  0.108562484 = sum of:
    0.018399429 = weight(_text_:und in 3510) [ClassicSimilarity], result of:
      0.018399429 = score(doc=3510,freq=8.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.34282678 = fieldWeight in 3510, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3510)
    0.018399429 = weight(_text_:und in 3510) [ClassicSimilarity], result of:
      0.018399429 = score(doc=3510,freq=8.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.34282678 = fieldWeight in 3510, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3510)
    0.034964766 = weight(_text_:der in 3510) [ClassicSimilarity], result of:
      0.034964766 = score(doc=3510,freq=28.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.6464053 = fieldWeight in 3510, product of:
          5.2915025 = tf(freq=28.0), with freq of:
            28.0 = termFreq=28.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3510)
    0.018399429 = weight(_text_:und in 3510) [ClassicSimilarity], result of:
      0.018399429 = score(doc=3510,freq=8.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.34282678 = fieldWeight in 3510, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3510)
    0.018399429 = weight(_text_:und in 3510) [ClassicSimilarity], result of:
      0.018399429 = score(doc=3510,freq=8.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.34282678 = fieldWeight in 3510, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3510)
  0.25 = coord(5/20)

Series: Fortschritte in der Wissensorganisation; Bd.13
Source: Theorie, Semantik und Organisation von Wissen: Proceedings der 13. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) und dem 13. Internationalen Symposium der Informationswissenschaft der Higher Education Association for Information Science (HI) Potsdam (19.-20.03.2013): 'Theory, Information and Organization of Knowledge' / Proceedings der 14. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) und Natural Language & Information Systems (NLDB) Passau (16.06.2015): 'Lexical Resources for Knowledge Organization' / Proceedings des Workshops der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) auf der SEMANTICS Leipzig (1.09.2014): 'Knowledge Organization and Semantic Web' / Proceedings des Workshops der Polnischen und Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation (ISKO) Cottbus (29.-30.09.2011): 'Economics of Knowledge Production and Organization'. Hrsg. von W. Babik, H.P. Ohly u. K. Weber

Mengel, T.: Wie viel Terminologiearbeit steckt in der Übersetzung der Dewey-Dezimalklassifikation? (2019) 0.03

0.025647653 = product of:
  0.10259061 = sum of:
    0.019315375 = weight(_text_:und in 5603) [ClassicSimilarity], result of:
      0.019315375 = score(doc=5603,freq=12.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.35989314 = fieldWeight in 5603, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5603)
    0.019315375 = weight(_text_:und in 5603) [ClassicSimilarity], result of:
      0.019315375 = score(doc=5603,freq=12.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.35989314 = fieldWeight in 5603, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5603)
    0.025329107 = weight(_text_:der in 5603) [ClassicSimilarity], result of:
      0.025329107 = score(doc=5603,freq=20.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.46826762 = fieldWeight in 5603, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=5603)
    0.019315375 = weight(_text_:und in 5603) [ClassicSimilarity], result of:
      0.019315375 = score(doc=5603,freq=12.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.35989314 = fieldWeight in 5603, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5603)
    0.019315375 = weight(_text_:und in 5603) [ClassicSimilarity], result of:
      0.019315375 = score(doc=5603,freq=12.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.35989314 = fieldWeight in 5603, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5603)
  0.25 = coord(5/20)

Abstract: Bibliotheken weltweit setzen die Dewey-Dezimalklassifikation (DDC) als Aufstellungssystematik und/oder zur Katalogsuche ein. Es existieren Übersetzungen der DDC in über 30 Sprachen. Als ein umfassendes System zur Ordnung von Wissen bestehend aus numerischen Notationen und sprachlichen Klasseninhalten bietet die DDC dem Terminologen bzw. der Terminologin ein weites Arbeits- und Forschungsfeld. Aber wie spielen Terminologiearbeit und Übersetzung zusammen, wenn, wie in diesem Fall, die Terminologie selbst das Übersetzungsobjekt ist? Der Aufsatz kann nicht alle Themen erschöpfend behandeln, aber er präsentiert Merkmale der DDC erstmals aus der Perspektive der DDC-Übersetzungsarbeit, und er wirft die Frage auf, ob dem Aspekt der Terminologiearbeit in der DDC-Übersetzung bislang tatsächlich genügend Aufmerksamkeit geschenkt wurde.
Series: Kommunikation und Medienmanagement - Springer eBooks. Computer Science and Engineering

Computerlinguistik und Sprachtechnologie : Eine Einführung (2010) 0.03

0.025530476 = product of:
  0.102121904 = sum of:
    0.020360194 = weight(_text_:und in 1735) [ClassicSimilarity], result of:
      0.020360194 = score(doc=1735,freq=30.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.3793607 = fieldWeight in 1735, product of:
          5.477226 = tf(freq=30.0), with freq of:
            30.0 = termFreq=30.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=1735)
    0.020360194 = weight(_text_:und in 1735) [ClassicSimilarity], result of:
      0.020360194 = score(doc=1735,freq=30.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.3793607 = fieldWeight in 1735, product of:
          5.477226 = tf(freq=30.0), with freq of:
            30.0 = termFreq=30.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=1735)
    0.02068113 = weight(_text_:der in 1735) [ClassicSimilarity], result of:
      0.02068113 = score(doc=1735,freq=30.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.3823389 = fieldWeight in 1735, product of:
          5.477226 = tf(freq=30.0), with freq of:
            30.0 = termFreq=30.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=1735)
    0.020360194 = weight(_text_:und in 1735) [ClassicSimilarity], result of:
      0.020360194 = score(doc=1735,freq=30.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.3793607 = fieldWeight in 1735, product of:
          5.477226 = tf(freq=30.0), with freq of:
            30.0 = termFreq=30.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=1735)
    0.020360194 = weight(_text_:und in 1735) [ClassicSimilarity], result of:
      0.020360194 = score(doc=1735,freq=30.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.3793607 = fieldWeight in 1735, product of:
          5.477226 = tf(freq=30.0), with freq of:
            30.0 = termFreq=30.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=1735)
  0.25 = coord(5/20)

Abstract: Dieses Lehrbuch bietet eine umfassende Einführung in Grundlagen und Methoden der Computerlinguistik und stellt die wichtigsten Anwendungsgebiete in der Sprachtechnologie vor. Es richtet sich gleichermaßen an Studierende der Computerlinguistik und verwandter Fächer mit Bezug zur Verarbeitung natürlicher Sprache wie an Entwickler sprachverarbeitender Systeme. Nach einem Überblick über Aufgaben und Ziele der Computerlinguistik werden die erforderlichen theoretischen Grundlagen zur Logik, den Formalen Sprachen, der Graphentheorie, den statistischen Verfahren sowie der Texttechnologie beispielbezogen erläutert. Es schließt sich eine Darstellung der verschiedenen Methoden für die Verarbeitung auf den linguistischen Beschreibungsebenen an. Dabei werden zunächst die grundlegenden Begriffe und Konzepte der Phonetik und Phonologie, Morphologie, Syntax, Semantik sowie der Pragmatik vermittelt und darauf aufbauend die Prinzipien der sprachtechnologischen Umsetzung behandelt. Die drei letzten Teile des Buchs geben Überblicke über die verwendeten sprachtechnologischen Informationsquellen, die vielfältigen Anwendungen in der Praxis sowie über Evaluationsverfahren für sprachverarbeitende Systeme. Anhand konkreter Fragestellungen - von der Entwicklung von Korrekturprogrammen über das Informationsmanagement bis zur Maschinellen Übersetzung - wird das Zusammenwirken der einzelnen Methoden aufgezeigt. Für die dritte Auflage wurden sämtliche Kapitel überarbeitet und aktualisiert sowie zum Teil zu eigenständigen, neuen Kapiteln zusammengeführt. Insbesondere trägt die dritte Auflage der rasanten Entwicklung in der Computerlinguistik und Sprachtechnologie durch eine stärkere Fokussierung auf statistische Grundlagen und Methoden Rechnung. "Durch dieses Handbuch wird für den deutschsprachigen Raum eine empfindliche Lücke geschlossen. Es umfasst die relevanten Aspekte computerlinguistischer Grundlagenwissenschaft und sprachtechnologischer Anwendung in eindrucksvoller Breite und auf aktuellem Stand." [Manfred Pinkal]
BK: 18.00 Einzelne Sprachen und Literaturen allgemein
Classification: 18.00 Einzelne Sprachen und Literaturen allgemein

Lobin, H: Computerlinguistik und Texttechnologie (2010) 0.02

0.024867874 = product of:
  0.099471495 = sum of:
    0.020862991 = weight(_text_:und in 564) [ClassicSimilarity], result of:
      0.020862991 = score(doc=564,freq=14.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.38872904 = fieldWeight in 564, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=564)
    0.020862991 = weight(_text_:und in 564) [ClassicSimilarity], result of:
      0.020862991 = score(doc=564,freq=14.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.38872904 = fieldWeight in 564, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=564)
    0.016019532 = weight(_text_:der in 564) [ClassicSimilarity], result of:
      0.016019532 = score(doc=564,freq=8.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.29615843 = fieldWeight in 564, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=564)
    0.020862991 = weight(_text_:und in 564) [ClassicSimilarity], result of:
      0.020862991 = score(doc=564,freq=14.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.38872904 = fieldWeight in 564, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=564)
    0.020862991 = weight(_text_:und in 564) [ClassicSimilarity], result of:
      0.020862991 = score(doc=564,freq=14.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.38872904 = fieldWeight in 564, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=564)
  0.25 = coord(5/20)

Abstract: Computerlinguistik (die Verarbeitung von Sprache mit dem Computer) und Texttechnologie (die automatisierte Handhabung elektronischer Texte) haben im letzten Jahrzehnt unterschiedliche Richtungen eingeschlagen. Beide Disziplinen speisen sich jedoch aus der gleichen Quelle: der formalen Grammatik. Deshalb ist eine gemeinsame Darstellung sinnvoll. Der Bezug auf die gemeinsamen Grundlagen und die kontrastierende Gegenüberstellung einzelner Teilbereiche fördern das Verständnis der jeweils anderen Disziplin und eröffnen interessante Querbezüge. Erstmals wird die Verknüpfung von Computerlinguistik und Texttechnologie mit dieser Einführung in knapper Form systematisch vollzogen, was sie insbesondere für Module im Bachelor-Studium geeignet macht.
BK: 18.00 Einzelne Sprachen und Literaturen allgemein
Classification: 18.00 Einzelne Sprachen und Literaturen allgemein

Bredack, J.: Automatische Extraktion fachterminologischer Mehrwortbegriffe : ein Verfahrensvergleich (2016) 0.02

0.024719775 = product of:
  0.0988791 = sum of:
    0.019713672 = weight(_text_:und in 3194) [ClassicSimilarity], result of:
      0.019713672 = score(doc=3194,freq=18.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.3673144 = fieldWeight in 3194, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3194)
    0.019713672 = weight(_text_:und in 3194) [ClassicSimilarity], result of:
      0.019713672 = score(doc=3194,freq=18.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.3673144 = fieldWeight in 3194, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3194)
    0.020024417 = weight(_text_:der in 3194) [ClassicSimilarity], result of:
      0.020024417 = score(doc=3194,freq=18.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.37019804 = fieldWeight in 3194, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3194)
    0.019713672 = weight(_text_:und in 3194) [ClassicSimilarity], result of:
      0.019713672 = score(doc=3194,freq=18.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.3673144 = fieldWeight in 3194, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3194)
    0.019713672 = weight(_text_:und in 3194) [ClassicSimilarity], result of:
      0.019713672 = score(doc=3194,freq=18.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.3673144 = fieldWeight in 3194, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3194)
  0.25 = coord(5/20)

Abstract: In dieser Untersuchung wurden zwei Systeme eingesetzt, um MWT aus einer Dokumentkollektion mit fachsprachlichem Bezug (Volltexte des ACL Anthology Reference Corpus) automatisch zu extrahieren. Das thematische Spektrum umfasste alle Bereiche der natürlichen Sprachverarbeitung, im Speziellen die CL als interdisziplinäre Wissenschaft. Ziel war es MWT zu extrahieren, die als potentielle Indexterme im IR Verwendung finden können. Diese sollten auf Konzepte, Methoden, Verfahren und Algorithmen in der CL und angrenzenden Teilgebieten, wie Linguistik und Informatik hinweisen bzw. benennen.
Als Extraktionssysteme wurden der TreeTagger und die Indexierungssoftware Lingo verwendet. Der TreeTagger basiert auf einem statistischen Tagging- und Chunking- Algorithmus, mit dessen Hilfe NPs automatisch identifiziert und extrahiert werden. Er kann für verschiedene Anwendungsszenarien der natürlichen Sprachverarbeitung eingesetzt werden, in erster Linie als POS-Tagger für unterschiedliche Sprachen. Das Indexierungssystem Lingo arbeitet im Gegensatz zum TreeTagger mit elektronischen Wörterbüchern und einem musterbasierten Abgleich. Lingo ist ein auf automatische Indexierung ausgerichtetes System, was eine Vielzahl von Modulen mitliefert, die individuell auf eine bestimmte Aufgabenstellung angepasst und aufeinander abgestimmt werden können. Die unterschiedlichen Verarbeitungsweisen haben sich in den Ergebnismengen beider Systeme deutlich gezeigt. Die gering ausfallenden Übereinstimmungen der Ergebnismengen verdeutlichen die abweichende Funktionsweise und konnte mit einer qualitativen Analyse beispielhaft beschrieben werden. In der vorliegenden Arbeit kann abschließend nicht geklärt werden, welches der beiden Systeme bevorzugt für die Generierung von Indextermen eingesetzt werden sollte.
Content: Schriftliche Hausarbeit (Masterarbeit) zur Erlangung des Grades eines Master of Arts An der Universität Trier Fachbereich II Studiengang Computerlinguistik.

Geißler, S.: Maschinelles Lernen und NLP : Reif für die industrielle Anwendung! (2019) 0.02

0.024220336 = product of:
  0.096881345 = sum of:
    0.019315375 = weight(_text_:und in 3547) [ClassicSimilarity], result of:
      0.019315375 = score(doc=3547,freq=12.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.35989314 = fieldWeight in 3547, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=3547)
    0.019315375 = weight(_text_:und in 3547) [ClassicSimilarity], result of:
      0.019315375 = score(doc=3547,freq=12.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.35989314 = fieldWeight in 3547, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=3547)
    0.019619841 = weight(_text_:der in 3547) [ClassicSimilarity], result of:
      0.019619841 = score(doc=3547,freq=12.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.36271852 = fieldWeight in 3547, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=3547)
    0.019315375 = weight(_text_:und in 3547) [ClassicSimilarity], result of:
      0.019315375 = score(doc=3547,freq=12.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.35989314 = fieldWeight in 3547, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=3547)
    0.019315375 = weight(_text_:und in 3547) [ClassicSimilarity], result of:
      0.019315375 = score(doc=3547,freq=12.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.35989314 = fieldWeight in 3547, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=3547)
  0.25 = coord(5/20)

Abstract: Anwendungen von maschinellen Lernverfahren (ML) haben in jüngster Zeit aufsehenerregende Durchbrüche bei einer ganzen Reihe von Aufgaben in der maschinellen Sprachverarbeitung (NLP) erzielt. Der Fokus vieler Arbeiten liegt hierbei in der Entwicklung immer besserer Modelle, während der Anteil der Aufgaben in praktischen Projekten, der sich nicht mit Modellbildung, sondern mit Themen wie Datenbereitstellung sowie Evaluierung, Wartung und Deployment von Modellen beschäftigt, oftmals noch nicht ausreichend Beachtung erfährt. Im Ergebnis fehlen gerade Unternehmen, die nicht die Möglichkeit haben, eigene Plattformen für den Einsatz von ML und NLP zu entwerfen, oft geeignete Werkzeuge und Best Practices. Es ist zeichnet sich ab, dass in den kommenden Monaten eine gerade diesen praktischen Fragen zugewandte Ingenieurssicht auf ML und ihren Einsatz im Unternehmen an Bedeutung gewinnen wird.
Source: Information - Wissenschaft und Praxis. 70(2019) H.2/3, S.134-140

Sünkler, S.; Kerkmann, F.; Schultheiß, S.: Ok Google . the end of search as we know it : sprachgesteuerte Websuche im Test (2018) 0.02

0.024121884 = product of:
  0.09648754 = sum of:
    0.018399429 = weight(_text_:und in 5626) [ClassicSimilarity], result of:
      0.018399429 = score(doc=5626,freq=8.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.34282678 = fieldWeight in 5626, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5626)
    0.018399429 = weight(_text_:und in 5626) [ClassicSimilarity], result of:
      0.018399429 = score(doc=5626,freq=8.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.34282678 = fieldWeight in 5626, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5626)
    0.022889815 = weight(_text_:der in 5626) [ClassicSimilarity], result of:
      0.022889815 = score(doc=5626,freq=12.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.4231716 = fieldWeight in 5626, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5626)
    0.018399429 = weight(_text_:und in 5626) [ClassicSimilarity], result of:
      0.018399429 = score(doc=5626,freq=8.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.34282678 = fieldWeight in 5626, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5626)
    0.018399429 = weight(_text_:und in 5626) [ClassicSimilarity], result of:
      0.018399429 = score(doc=5626,freq=8.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.34282678 = fieldWeight in 5626, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5626)
  0.25 = coord(5/20)

Abstract: Sprachsteuerungssysteme, die den Nutzer auf Zuruf unterstützen, werden im Zuge der Verbreitung von Smartphones und Lautsprechersystemen wie Amazon Echo oder Google Home zunehmend populär. Eine der zentralen Anwendungen dabei stellt die Suche in Websuchmaschinen dar. Wie aber funktioniert "googlen", wenn der Nutzer seine Suchanfrage nicht schreibt, sondern spricht? Dieser Frage ist ein Projektteam der HAW Hamburg nachgegangen und hat im Auftrag der Deutschen Telekom untersucht, wie effektiv, effizient und zufriedenstellend Google Now, Apple Siri, Microsoft Cortana sowie das Amazon Fire OS arbeiten. Ermittelt wurden Stärken und Schwächen der Systeme sowie Erfolgskriterien für eine hohe Gebrauchstauglichkeit. Diese Erkenntnisse mündeten in dem Prototyp einer optimalen Voice Web Search.

RWI/PH: Auf der Suche nach dem entscheidenden Wort : die Häufung bestimmter Wörter innerhalb eines Textes macht diese zu Schlüsselwörtern (2012) 0.02
```
0.023799077 = product of:
  0.07933025 = sum of:
    0.012468021 = weight(_text_:und in 331) [ClassicSimilarity], result of:
      0.012468021 = score(doc=331,freq=20.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.23231003 = fieldWeight in 331, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0234375 = fieldNorm(doc=331)
    0.018130645 = weight(_text_:geschichte in 331) [ClassicSimilarity], result of:
      0.018130645 = score(doc=331,freq=2.0), product of:
        0.11508996 = queryWeight, product of:
          4.7528 = idf(docFreq=1036, maxDocs=44218)
          0.024215192 = queryNorm
        0.15753455 = fieldWeight in 331, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.7528 = idf(docFreq=1036, maxDocs=44218)
          0.0234375 = fieldNorm(doc=331)
    0.012468021 = weight(_text_:und in 331) [ClassicSimilarity], result of:
      0.012468021 = score(doc=331,freq=20.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.23231003 = fieldWeight in 331, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0234375 = fieldNorm(doc=331)
    0.011327521 = weight(_text_:der in 331) [ClassicSimilarity], result of:
      0.011327521 = score(doc=331,freq=16.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.20941564 = fieldWeight in 331, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0234375 = fieldNorm(doc=331)
    0.012468021 = weight(_text_:und in 331) [ClassicSimilarity], result of:
      0.012468021 = score(doc=331,freq=20.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.23231003 = fieldWeight in 331, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0234375 = fieldNorm(doc=331)
    0.012468021 = weight(_text_:und in 331) [ClassicSimilarity], result of:
      0.012468021 = score(doc=331,freq=20.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.23231003 = fieldWeight in 331, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0234375 = fieldNorm(doc=331)
  0.3 = coord(6/20)
```
Abstract

Der Mensch kann komplexe Sachverhalte in eine eindimensionale Abfolge von Buchstaben umwandeln und niederschreiben. Dabei dienen Schlüsselwörter dazu, den Inhalt des Textes zu vermitteln. Wie Buchstaben und Wörtern mit dem Thema eines Textes zusammenhängen, haben Eduardo Altmann und seine Kollegen vom Max-Planck-Institut für die Physik komplexer Systeme und der Universität Bologna mit Hilfe von statistischen Methoden untersucht. Dabei haben sie herausgefunden, dass Schlüsselwörter nicht dadurch gekennzeichnet sind, dass sie im ganzen Text besonders häufig vorkommen, sondern nur an bestimmten Stellen vermehrt zu finden sind. Außerdem gibt es Beziehungen zwischen weit entfernten Textabschnitten, in der Form, dass dieselben Wörter und Buchstaben bevorzugt verwendet werden.

Content

"Die Dresdner Wissenschaftler haben die semantischen Eigenschaften von Texten mathematisch untersucht, indem sie zehn verschiedene englische Texte in unterschiedlichen Formen kodierten. Dazu zählt unter anderem die englische Ausgabe von Leo Tolstois "Krieg und Frieden". Beispielsweise übersetzten die Forscher Buchstaben innerhalb eines Textes in eine Binär-Sequenz. Dazu ersetzten sie alle Vokale durch eine Eins und alle Konsonanten durch eine Null. Mit Hilfe weiterer mathematischer Funktionen beleuchteten die Wissenschaftler dabei verschiedene Ebenen des Textes, also sowohl einzelne Vokale, Buchstaben als auch ganze Wörter, die in verschiedenen Formen kodiert wurden. Innerhalb des ganzen Textes lassen sich so wiederkehrende Muster finden. Diesen Zusammenhang innerhalb des Textes bezeichnet man als Langzeitkorrelation. Diese gibt an, ob zwei Buchstaben an beliebig weit voneinander entfernten Textstellen miteinander in Verbindung stehen - beispielsweise gibt es wenn wir an einer Stelle einen Buchstaben "K" finden, eine messbare höhere Wahrscheinlichkeit den Buchstaben "K" einige Seiten später nochmal zu finden. "Es ist zu erwarten, dass wenn es in einem Buch an einer Stelle um Krieg geht, die Wahrscheinlichkeit hoch ist das Wort Krieg auch einige Seiten später zu finden. Überraschend ist es, dass wir die hohe Wahrscheinlichkeit auch auf der Buchstabenebene finden", so Altmann.
Schlüsselwörter häufen sich in einzelnen Textpassagen Dabei haben sie die Langzeitkorrelation sowohl zwischen einzelnen Buchstaben, als auch innerhalb höherer sprachlicher Ebenen wie Wörtern gefunden. Innerhalb einzelner Ebenen bleibt die Korrelation dabei erhalten, wenn man verschiedene Texte betrachtet. "Viel interessanter ist es für uns zu überprüfen, wie die Korrelation sich zwischen den Ebenen ändert", sagt Altmann. Die Langzeitkorrelation erlaubt Rückschlüsse, inwieweit einzelne Wörter mit einem Thema in Verbindungen stehen. "Auch die Verbindung zwischen einem Wort und den Buchstaben, aus denen es sich zusammensetzt, lässt sich so analysieren", so Altmann. Darüber hinaus untersuchten die Wissenschaftler auch die sogenannte "Burstiness", die beschreibt, ob ein Zeichenmuster in einer Textpassage vermehrt zu finden ist. Sie zeigt also beispielsweise an, ob ein Wort in einem bestimmten Abschnitt gehäuft vorkommt. Je häufiger ein bestimmtes Wort in einer Passage verwendet wird, desto wahrscheinlicher ist es, dass diese repräsentativ für ein bestimmtes Thema ist. Die Wissenschaftler zeigten, dass bestimmte Wörter zwar im ganzen Text immer wieder vorkommen, aber nicht in einem bestimmten Abschnitt verstärkt zu finden sind. Diese Wörter weisen zwar eine Langzeitkorrelation auf, stehen aber nicht in einer engen Verbindung mit dem Thema. "Das beste Beispiel dafür sind Artikel. Sie kommen in jedem Text sehr oft vor, sind aber nicht entscheidend um ein bestimmtes Thema zu vermitteln", so Altmann.
Die statistische Textanalyse funktioniert unabhängig von der Sprache Während sowohl Buchstaben als auch Wörter Langzeit-korreliert sind, kommen Buchstaben nur selten an bestimmten Stellen eines Textes gehäuft vor. "Ein Buchstabe ist eben nur sehr selten so eng mit einem Thema verknüpft wie das Wort zu dem er einen Teil beiträgt. Buchstaben sind sozusagen flexibler einsetzbar", sagt Altmann. Ein "a" beispielsweise kann zu einer ganzen Reihe von Wörtern beitragen, die nicht mit demselben Thema in Verbindung stehen. Mit Hilfe der statistischen Analyse von Texten ist es den Forschern gelungen, die prägenden Wörter eines Textes auf einfache Weise zu ermitteln. "Dabei ist es vollkommen egal, in welcher Sprache ein Text geschrieben ist. Es geht nur noch um die Geschichte und nicht um sprachspezifische Regeln", sagt Altmann. Die Ergebnisse könnten zukünftig zur Verbesserung von Internetsuchmaschinen beitragen, aber auch bei Textanalysen und der Suche nach Plagiaten helfen."

Baierer, K.; Zumstein, P.: Verbesserung der OCR in digitalen Sammlungen von Bibliotheken (2016) 0.02

0.023550555 = product of:
  0.09420222 = sum of:
    0.018210711 = weight(_text_:und in 2818) [ClassicSimilarity], result of:
      0.018210711 = score(doc=2818,freq=6.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.33931053 = fieldWeight in 2818, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=2818)
    0.018210711 = weight(_text_:und in 2818) [ClassicSimilarity], result of:
      0.018210711 = score(doc=2818,freq=6.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.33931053 = fieldWeight in 2818, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=2818)
    0.021359377 = weight(_text_:der in 2818) [ClassicSimilarity], result of:
      0.021359377 = score(doc=2818,freq=8.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.3948779 = fieldWeight in 2818, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=2818)
    0.018210711 = weight(_text_:und in 2818) [ClassicSimilarity], result of:
      0.018210711 = score(doc=2818,freq=6.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.33931053 = fieldWeight in 2818, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=2818)
    0.018210711 = weight(_text_:und in 2818) [ClassicSimilarity], result of:
      0.018210711 = score(doc=2818,freq=6.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.33931053 = fieldWeight in 2818, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=2818)
  0.25 = coord(5/20)

Abstract: Möglichkeiten zur Verbesserung der automatischen Texterkennung (OCR) in digitalen Sammlungen insbesondere durch computerlinguistische Methoden werden beschrieben und bisherige PostOCR-Verfahren analysiert. Im Gegensatz zu diesen Möglichkeiten aus der Forschung oder aus einzelnen Projekten unterscheidet sich die momentane Anwendung von OCR in der Bibliothekspraxis wesentlich und nutzt das Potential nur teilweise aus.
Content: Beitrag in einem Themenschwerpunkt 'Computerlinguistik und Bibliotheken'. Vgl.: http://0277.ch/ojs/index.php/cdrs_0277/article/view/155/353.

Franke-Maier, M.: Computerlinguistik und Bibliotheken : Editorial (2016) 0.02

0.023445 = product of:
  0.09378 = sum of:
    0.019713672 = weight(_text_:und in 3206) [ClassicSimilarity], result of:
      0.019713672 = score(doc=3206,freq=18.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.3673144 = fieldWeight in 3206, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3206)
    0.019713672 = weight(_text_:und in 3206) [ClassicSimilarity], result of:
      0.019713672 = score(doc=3206,freq=18.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.3673144 = fieldWeight in 3206, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3206)
    0.014925319 = weight(_text_:der in 3206) [ClassicSimilarity], result of:
      0.014925319 = score(doc=3206,freq=10.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.27592933 = fieldWeight in 3206, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3206)
    0.019713672 = weight(_text_:und in 3206) [ClassicSimilarity], result of:
      0.019713672 = score(doc=3206,freq=18.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.3673144 = fieldWeight in 3206, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3206)
    0.019713672 = weight(_text_:und in 3206) [ClassicSimilarity], result of:
      0.019713672 = score(doc=3206,freq=18.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.3673144 = fieldWeight in 3206, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3206)
  0.25 = coord(5/20)

Abstract: Vor 50 Jahren, im Februar 1966, wies Floyd M. Cammack auf den Zusammenhang von "Linguistics and Libraries" hin. Er ging dabei von dem Eintrag für "Linguistics" in den Library of Congress Subject Headings (LCSH) von 1957 aus, der als Verweis "See Language and Languages; Philology; Philology, Comparative" enthielt. Acht Jahre später kamen unter dem Schlagwort "Language and Languages" Ergänzungen wie "language data processing", "automatic indexing", "machine translation" und "psycholinguistics" hinzu. Für Cammack zeigt sich hier ein Netz komplexer Wechselbeziehungen, die unter dem Begriff "Linguistics" zusammengefasst werden sollten. Dieses System habe wichtigen Einfluss auf alle, die mit dem Sammeln, Organisieren, Speichern und Wiederauffinden von Informationen befasst seien. (Cammack 1966:73). Hier liegt - im übertragenen Sinne - ein Heft vor Ihnen, in dem es um computerlinguistische Verfahren in Bibliotheken geht. Letztlich geht es um eine Versachlichung der Diskussion, um den Stellenwert der Inhaltserschliessung und die Rekalibrierung ihrer Wertschätzung in Zeiten von Mega-Indizes und Big Data. Der derzeitige Widerspruch zwischen dem Wunsch nach relevanter Treffermenge in Rechercheoberflächen vs. der Erfahrung des Relevanz-Rankings ist zu lösen. Explizit auch die Frage, wie oft wir von letzterem enttäuscht wurden und was zu tun ist, um das Verhältnis von recall und precision wieder in ein angebrachtes Gleichgewicht zu bringen. Unsere Nutzerinnen und Nutzer werden es uns danken.
Content: Editorial zu einem Themenschwerpunkt 'Computerlinguistik und Bibliotheken'. Vgl-: http://0277.ch/ojs/index.php/cdrs_0277/article/view/159/349.

Hahn, U.: Methodische Grundlagen der Informationslinguistik (2013) 0.02

0.023306027 = product of:
  0.09322411 = sum of:
    0.018586228 = weight(_text_:und in 719) [ClassicSimilarity], result of:
      0.018586228 = score(doc=719,freq=4.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.34630734 = fieldWeight in 719, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=719)
    0.018586228 = weight(_text_:und in 719) [ClassicSimilarity], result of:
      0.018586228 = score(doc=719,freq=4.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.34630734 = fieldWeight in 719, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=719)
    0.018879201 = weight(_text_:der in 719) [ClassicSimilarity], result of:
      0.018879201 = score(doc=719,freq=4.0), product of:
        0.054091092 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.024215192 = queryNorm
        0.34902605 = fieldWeight in 719, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.078125 = fieldNorm(doc=719)
    0.018586228 = weight(_text_:und in 719) [ClassicSimilarity], result of:
      0.018586228 = score(doc=719,freq=4.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.34630734 = fieldWeight in 719, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=719)
    0.018586228 = weight(_text_:und in 719) [ClassicSimilarity], result of:
      0.018586228 = score(doc=719,freq=4.0), product of:
        0.05366975 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.024215192 = queryNorm
        0.34630734 = fieldWeight in 719, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=719)
  0.25 = coord(5/20)

Source: Grundlagen der praktischen Information und Dokumentation. Handbuch zur Einführung in die Informationswissenschaft und -praxis. 6., völlig neu gefaßte Ausgabe. Hrsg. von R. Kuhlen, W. Semar u. D. Strauch. Begründet von Klaus Laisiepen, Ernst Lutterbeck, Karl-Heinrich Meyer-Uhlenried

Search (41 results, page 1 of 3)

Authors

Languages

Types

Themes

Subjects

Classifications