Search (181 results, page 1 of 10)

Hotho, A.; Bloehdorn, S.: Data Mining 2004 : Text classification by boosting weak learners based on terms and concepts (2004) 0.14

0.1417635 = product of:
  0.47254497 = sum of:
    0.045731008 = product of:
      0.13719302 = sum of:
        0.13719302 = weight(_text_:3a in 562) [ClassicSimilarity], result of:
          0.13719302 = score(doc=562,freq=2.0), product of:
            0.24410787 = queryWeight, product of:
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.02879306 = queryNorm
            0.56201804 = fieldWeight in 562, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.046875 = fieldNorm(doc=562)
      0.33333334 = coord(1/3)
    0.13719302 = weight(_text_:2f in 562) [ClassicSimilarity], result of:
      0.13719302 = score(doc=562,freq=2.0), product of:
        0.24410787 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.02879306 = queryNorm
        0.56201804 = fieldWeight in 562, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=562)
    0.13719302 = weight(_text_:2f in 562) [ClassicSimilarity], result of:
      0.13719302 = score(doc=562,freq=2.0), product of:
        0.24410787 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.02879306 = queryNorm
        0.56201804 = fieldWeight in 562, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=562)
    0.13719302 = weight(_text_:2f in 562) [ClassicSimilarity], result of:
      0.13719302 = score(doc=562,freq=2.0), product of:
        0.24410787 = queryWeight, product of:
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.02879306 = queryNorm
        0.56201804 = fieldWeight in 562, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          8.478011 = idf(docFreq=24, maxDocs=44218)
          0.046875 = fieldNorm(doc=562)
    0.003531705 = weight(_text_:in in 562) [ClassicSimilarity], result of:
      0.003531705 = score(doc=562,freq=2.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.09017298 = fieldWeight in 562, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=562)
    0.011703186 = product of:
      0.023406371 = sum of:
        0.023406371 = weight(_text_:22 in 562) [ClassicSimilarity], result of:
          0.023406371 = score(doc=562,freq=2.0), product of:
            0.10082839 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.02879306 = queryNorm
            0.23214069 = fieldWeight in 562, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=562)
      0.5 = coord(1/2)
  0.3 = coord(6/20)

Abstract: Document representations for text classification are typically based on the classical Bag-Of-Words paradigm. This approach comes with deficiencies that motivate the integration of features on a higher semantic level than single words. In this paper we propose an enhancement of the classical document representation through concepts extracted from background knowledge. Boosting is used for actual classification. Experimental evaluations on two well known text corpora support our approach through consistent improvement of the results.
Content: Vgl.: http://www.google.de/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&ved=0CEAQFjAA&url=http%3A%2F%2Fciteseerx.ist.psu.edu%2Fviewdoc%2Fdownload%3Fdoi%3D10.1.1.91.4940%26rep%3Drep1%26type%3Dpdf&ei=dOXrUMeIDYHDtQahsIGACg&usg=AFQjCNHFWVh6gNPvnOrOS9R3rkrXCNVD-A&sig2=5I2F5evRfMnsttSgFF9g7Q&bvm=bv.1357316858,d.Yms.
Date: 8. 1.2013 10:22:32

Rahmstorf, G.: Rückkehr von Ordnung in die Informationstechnik? (2000) 0.08

0.078659214 = product of:
  0.22474062 = sum of:
    0.031097382 = weight(_text_:und in 5504) [ClassicSimilarity], result of:
      0.031097382 = score(doc=5504,freq=22.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.48729765 = fieldWeight in 5504, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5504)
    0.028572025 = weight(_text_:der in 5504) [ClassicSimilarity], result of:
      0.028572025 = score(doc=5504,freq=18.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.44423765 = fieldWeight in 5504, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=5504)
    0.050429977 = weight(_text_:kommunikation in 5504) [ClassicSimilarity], result of:
      0.050429977 = score(doc=5504,freq=2.0), product of:
        0.14799947 = queryWeight, product of:
          5.140109 = idf(docFreq=703, maxDocs=44218)
          0.02879306 = queryNorm
        0.34074432 = fieldWeight in 5504, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.140109 = idf(docFreq=703, maxDocs=44218)
          0.046875 = fieldNorm(doc=5504)
    0.031097382 = weight(_text_:und in 5504) [ClassicSimilarity], result of:
      0.031097382 = score(doc=5504,freq=22.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.48729765 = fieldWeight in 5504, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5504)
    0.025354039 = weight(_text_:des in 5504) [ClassicSimilarity], result of:
      0.025354039 = score(doc=5504,freq=6.0), product of:
        0.079736836 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02879306 = queryNorm
        0.31797147 = fieldWeight in 5504, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.046875 = fieldNorm(doc=5504)
    0.003531705 = weight(_text_:in in 5504) [ClassicSimilarity], result of:
      0.003531705 = score(doc=5504,freq=2.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.09017298 = fieldWeight in 5504, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=5504)
    0.05465812 = weight(_text_:elektronischen in 5504) [ClassicSimilarity], result of:
      0.05465812 = score(doc=5504,freq=2.0), product of:
        0.15407887 = queryWeight, product of:
          5.3512506 = idf(docFreq=569, maxDocs=44218)
          0.02879306 = queryNorm
        0.35474116 = fieldWeight in 5504, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.3512506 = idf(docFreq=569, maxDocs=44218)
          0.046875 = fieldNorm(doc=5504)
  0.35 = coord(7/20)

Abstract: Im Zuge der aktuellen Informationstechnik, der weltweiten Kommunikation und des elektronischen Publizierens scheinen die herkömmlichen Instrumente der Ordnungsstiftung - bibliothekarische Klassifikationssysteme und Thesauren - an den Rand gedrängt zu werden oder sogar ganz zu verschwinden. Andererseits sind die Endbenutzer oft unzufrieden mit dem Ergebnis des Recherchierens im Bestand des unabsehbar wachsenden Informationsangebotes. Ist eine präzise und vollständige Recherche bei den gegebenen technischen und Ökonomischen Verhältnissen überhaupt noch realisierbar'?
Series: Gemeinsamer Kongress der Bundesvereinigung Deutscher Bibliotheksverbände e.V. (BDB) und der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis e.V. (DGI); Bd.1)(Tagungen der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis e.V.; Bd.3
Source: Information und Öffentlichkeit: 1. Gemeinsamer Kongress der Bundesvereinigung Deutscher Bibliotheksverbände e.V. (BDB) und der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis e.V. (DGI), Leipzig, 20.-23.3.2000. Zugleich 90. Deutscher Bibliothekartag, 52. Jahrestagung der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis e.V. (DGI). Hrsg.: G. Ruppelt u. H. Neißer

Erbach, G.: Sprachdialogsysteme für Telefondienste : Stand der Technik und zukünftige Entwicklungen (2000) 0.08

0.07520344 = product of:
  0.18800859 = sum of:
    0.035235714 = weight(_text_:medien in 5556) [ClassicSimilarity], result of:
      0.035235714 = score(doc=5556,freq=2.0), product of:
        0.1355183 = queryWeight, product of:
          4.7066307 = idf(docFreq=1085, maxDocs=44218)
          0.02879306 = queryNorm
        0.26000705 = fieldWeight in 5556, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          4.7066307 = idf(docFreq=1085, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5556)
    0.022099946 = weight(_text_:und in 5556) [ClassicSimilarity], result of:
      0.022099946 = score(doc=5556,freq=16.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.34630734 = fieldWeight in 5556, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5556)
    0.025097964 = weight(_text_:der in 5556) [ClassicSimilarity], result of:
      0.025097964 = score(doc=5556,freq=20.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.390223 = fieldWeight in 5556, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5556)
    0.042024978 = weight(_text_:kommunikation in 5556) [ClassicSimilarity], result of:
      0.042024978 = score(doc=5556,freq=2.0), product of:
        0.14799947 = queryWeight, product of:
          5.140109 = idf(docFreq=703, maxDocs=44218)
          0.02879306 = queryNorm
        0.28395358 = fieldWeight in 5556, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.140109 = idf(docFreq=703, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5556)
    0.022099946 = weight(_text_:und in 5556) [ClassicSimilarity], result of:
      0.022099946 = score(doc=5556,freq=16.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.34630734 = fieldWeight in 5556, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5556)
    0.017251236 = weight(_text_:des in 5556) [ClassicSimilarity], result of:
      0.017251236 = score(doc=5556,freq=4.0), product of:
        0.079736836 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02879306 = queryNorm
        0.21635216 = fieldWeight in 5556, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5556)
    0.006580944 = weight(_text_:in in 5556) [ClassicSimilarity], result of:
      0.006580944 = score(doc=5556,freq=10.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.16802745 = fieldWeight in 5556, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5556)
    0.017617857 = product of:
      0.035235714 = sum of:
        0.035235714 = weight(_text_:medien in 5556) [ClassicSimilarity], result of:
          0.035235714 = score(doc=5556,freq=2.0), product of:
            0.1355183 = queryWeight, product of:
              4.7066307 = idf(docFreq=1085, maxDocs=44218)
              0.02879306 = queryNorm
            0.26000705 = fieldWeight in 5556, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.7066307 = idf(docFreq=1085, maxDocs=44218)
              0.0390625 = fieldNorm(doc=5556)
      0.5 = coord(1/2)
  0.4 = coord(8/20)

Abstract: Trotz des ungebrernsten Wachstums des Internet wird das Telefon auch weiterhin eines der wichtigsten Medien für die Kommunikation zwischen Unternehmen und ihren Kunden bleiben. Die Bedeutung der gesprochenen Sprache wird durch die rasante Verbreitung von Mobiltelefonen noch verstärkt. Fast alle großen Unternehmen betreiben oder beauftragen Call Centers, um ihren Kunden telefonisch zu Diensten zu stehen. Oft sind Call Centers mit sogenannten IVR-Systemen (Interactive Voice Response) ausgestattet, die dem Benutzer eine eingeschränkte Menüauswahl über die Telefontasten oder eine rudimentäre Spracheingabe bieten. Diese Art der Eingabe wird aber bei mehr als fünf Wahlmöglichkeiten als lästig empfunden. Hier bietet sich ein großes Potenzial für automatische Spracherkennung und Sprachdialogsysteme. In diesem Artikel werden die technischen Grundlagen sowie die derzeitigen Möglichkeiten und Grenzen der automatischen Spracherkennungstechnologie dargestellt. Wir berichten über Erfahrungen mit einem System für telefonische Posttarifauskünfte, das am Forschungszentrum Telekommunikation Wien (FTW) in Zusammenarbeit mit Philips Speech Processing und der Österreichischen Post AG realisiert und erprobt wurde. Der Stand der Technik in Sprachausgabe und Sprechererkennung wird kurz dargestellt. Zum Abschluss wird ein Ausblick auf die Rolle von Sprachdialogen in zukünftigen mobilen Multirnedia-Anwendungen gegeben
Source: Sprachtechnologie für eine dynamische Wirtschaft im Medienzeitalter - Language technologies for dynamic business in the age of the media - L'ingénierie linguistique au service de la dynamisation économique à l'ère du multimédia: Tagungsakten der XXVI. Jahrestagung der Internationalen Vereinigung Sprache und Wirtschaft e.V., 23.-25.11.2000, Fachhochschule Köln. Hrsg.: K.-D. Schmitz

Schürmann, H.: Software scannt Radio- und Fernsehsendungen : Recherche in Nachrichtenarchiven erleichtert (2001) 0.06

0.06076981 = product of:
  0.17362803 = sum of:
    0.034881577 = weight(_text_:medien in 5759) [ClassicSimilarity], result of:
      0.034881577 = score(doc=5759,freq=4.0), product of:
        0.1355183 = queryWeight, product of:
          4.7066307 = idf(docFreq=1085, maxDocs=44218)
          0.02879306 = queryNorm
        0.25739387 = fieldWeight in 5759, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          4.7066307 = idf(docFreq=1085, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5759)
    0.023840811 = weight(_text_:und in 5759) [ClassicSimilarity], result of:
      0.023840811 = score(doc=5759,freq=38.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.3735868 = fieldWeight in 5759, product of:
          6.164414 = tf(freq=38.0), with freq of:
            38.0 = termFreq=38.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5759)
    0.020031257 = weight(_text_:der in 5759) [ClassicSimilarity], result of:
      0.020031257 = score(doc=5759,freq=26.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.31144586 = fieldWeight in 5759, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5759)
    0.023840811 = weight(_text_:und in 5759) [ClassicSimilarity], result of:
      0.023840811 = score(doc=5759,freq=38.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.3735868 = fieldWeight in 5759, product of:
          6.164414 = tf(freq=38.0), with freq of:
            38.0 = termFreq=38.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5759)
    0.014789856 = weight(_text_:des in 5759) [ClassicSimilarity], result of:
      0.014789856 = score(doc=5759,freq=6.0), product of:
        0.079736836 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02879306 = queryNorm
        0.18548335 = fieldWeight in 5759, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5759)
    0.0077084173 = weight(_text_:in in 5759) [ClassicSimilarity], result of:
      0.0077084173 = score(doc=5759,freq=28.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.19681457 = fieldWeight in 5759, product of:
          5.2915025 = tf(freq=28.0), with freq of:
            28.0 = termFreq=28.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02734375 = fieldNorm(doc=5759)
    0.048535295 = sum of:
      0.034881577 = weight(_text_:medien in 5759) [ClassicSimilarity], result of:
        0.034881577 = score(doc=5759,freq=4.0), product of:
          0.1355183 = queryWeight, product of:
            4.7066307 = idf(docFreq=1085, maxDocs=44218)
            0.02879306 = queryNorm
          0.25739387 = fieldWeight in 5759, product of:
            2.0 = tf(freq=4.0), with freq of:
              4.0 = termFreq=4.0
            4.7066307 = idf(docFreq=1085, maxDocs=44218)
            0.02734375 = fieldNorm(doc=5759)
      0.013653717 = weight(_text_:22 in 5759) [ClassicSimilarity], result of:
        0.013653717 = score(doc=5759,freq=2.0), product of:
          0.10082839 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.02879306 = queryNorm
          0.1354154 = fieldWeight in 5759, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.02734375 = fieldNorm(doc=5759)
  0.35 = coord(7/20)

Abstract: Computer müssen lernen, die Sprache des Menschen zu verstehen. Forscher an der Uni Duisburg haben eine Methode entwickelt, mit der ein Rechner Informationen aus Radiobeiträgen herausfiltern kann.
Content: Um Firmen und Agenturen die Beobachtungen von Medien zu erleichtern, entwickeln Forscher an der Duisburger Hochschule zurzeit ein System zur automatischen Themenerkennung in Rundfunk und Fernsehen. Das so genannte Alert-System soll dem Nutzer helfen, die für ihn relevanten Sprachinformationen aus Nachrichtensendungen herauszufiltem und weiterzuverarbeiten. Durch die automatische Analyse durch den Computer können mehrere Programme rund um die Uhr beobachtet werden. Noch erfolgt die Informationsgewinnung aus TV- und Radiosendungen auf klassischem Wege: Ein Mensch sieht, hört, liest und wertet aus. Das ist enorm zeitaufwendig und für eine Firma, die beispielsweise die Konkurrenz beobachten oder ihre Medienpräsenz dokumentieren lassen möchte, auch sehr teuer. Diese Arbeit ließe sich mit einem Spracherkenner automatisieren, sagten sich die Duisburger Forscher. Sie arbeiten nun zusammen mit Partnern aus Deutschland, Frankreich und Portugal in einem europaweiten Projekt an der Entwicklung einer entsprechenden Technologie (http://alert.uni-duisburg.de). An dem Projekt sind auch zwei Medienbeobachtungsuntemehmen beteiligt, die Oberserver Argus Media GmbH aus Baden-Baden und das französische Unternehmen Secodip. Unsere Arbeit würde schon dadurch erleichtert, wenn Informationen, die über unsere Kunden in den Medien erscheinen, vorselektiert würden", beschreibt Simone Holderbach, Leiterin der Produktentwicklung bei Oberserver, ihr Interesse an der Technik. Und wie funktioniert Alert? Das Spracherkennungssystem wird darauf getrimmt, Nachrichtensendungen in Radio und Fernsehen zu überwachen: Alles, was gesagt wird - sei es vom Nachrichtensprecher, Reporter oder Interviewten -, wird durch die automatische Spracherkennung in Text umgewandelt. Dabei werden Themen und Schlüsselwörter erkannt und gespeichert. Diese werden mit den Suchbegriffen des Nutzers verglichen. Gefundene Übereinstimmungen werden angezeigt und dem Benutzer automatisch mitgeteilt. Konventionelle Spracherkennungstechnik sei für die Medienbeobachtung nicht einsetzbar, da diese für einen anderen Zweck entwickelt worden sei, betont Prof. Gerhard Rigoll, Leiter des Fachgebiets Technische Informatik an der Duisburger Hochschule. Für die Umwandlung von Sprache in Text wurde die Alert-Software gründlich trainiert. Aus Zeitungstexten, Audio- und Video-Material wurden bislang rund 3 50 Millionen Wörter verarbeitet. Das System arbeitet in drei Sprachen. Doch so ganz fehlerfrei sei der automatisch gewonnene Text nicht, räumt Rigoll ein. Zurzeit liegt die Erkennungsrate bei 40 bis 70 Prozent. Und das wird sich in absehbarer Zeit auch nicht ändern." Musiküberlagerungen oder starke Hintergrundgeräusche bei Reportagen führen zu Ungenauigkeiten bei der Textumwandlung. Deshalb haben die, Duisburger Wissenschaftler Methoden entwickelt, die über die herkömmliche Suche nach Schlüsselwörtern hinausgehen und eine inhaltsorientierte Zuordnung ermöglichen. Dadurch erhält der Nutzer dann auch solche Nachrichten, die zwar zum Thema passen, in denen das Stichwort aber gar nicht auftaucht", bringt Rigoll den Vorteil der Technik auf den Punkt. Wird beispielsweise "Ölpreis" als Suchbegriff eingegeben, werden auch solche Nachrichten angezeigt, in denen Olkonzerne und Energieagenturen eine Rolle spielen. Rigoll: Das Alert-System liest sozusagen zwischen den Zeilen!' Das Forschungsprojekt wurde vor einem Jahr gestartet und läuft noch bis Mitte 2002. Wer sich über den Stand der Technik informieren möchte, kann dies in dieser Woche auf der Industriemesse in Hannover. Das Alert-System wird auf dem Gemeinschaftsstand "Forschungsland NRW" in Halle 18, Stand M12, präsentiert
Source: Handelsblatt. Nr.79 vom 24.4.2001, S.22

Schmidt, R.: Maschinelle Text-Ton-Synchronisation in Wissenschaft und Wirtschaft (2000) 0.06

0.055938948 = product of:
  0.18646315 = sum of:
    0.02344053 = weight(_text_:und in 5559) [ClassicSimilarity], result of:
      0.02344053 = score(doc=5559,freq=18.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.3673144 = fieldWeight in 5559, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5559)
    0.08276299 = weight(_text_:formen in 5559) [ClassicSimilarity], result of:
      0.08276299 = score(doc=5559,freq=4.0), product of:
        0.17464934 = queryWeight, product of:
          6.0656753 = idf(docFreq=278, maxDocs=44218)
          0.02879306 = queryNorm
        0.4738809 = fieldWeight in 5559, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          6.0656753 = idf(docFreq=278, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5559)
    0.030738605 = weight(_text_:der in 5559) [ClassicSimilarity], result of:
      0.030738605 = score(doc=5559,freq=30.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.47792363 = fieldWeight in 5559, product of:
          5.477226 = tf(freq=30.0), with freq of:
            30.0 = termFreq=30.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5559)
    0.02344053 = weight(_text_:und in 5559) [ClassicSimilarity], result of:
      0.02344053 = score(doc=5559,freq=18.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.3673144 = fieldWeight in 5559, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5559)
    0.017251236 = weight(_text_:des in 5559) [ClassicSimilarity], result of:
      0.017251236 = score(doc=5559,freq=4.0), product of:
        0.079736836 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02879306 = queryNorm
        0.21635216 = fieldWeight in 5559, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5559)
    0.008829262 = weight(_text_:in in 5559) [ClassicSimilarity], result of:
      0.008829262 = score(doc=5559,freq=18.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.22543246 = fieldWeight in 5559, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5559)
  0.3 = coord(6/20)

Abstract: Tonmaterial in Form von Audio- oder Videoaufnahmen spielt in Bereichen der Wissenschaft, die sich mit verbaler Interaktion beschäftigen, eine bedeutende Rolle. Solche Gebiete sind u,a. die Linguistik, Psychologie, Soziologie und Kriminalistik. Gegenstand der Untersuchung können dabei z.B. die Formen des sprachlichen Handelns und der Sprachvariation in Abhängigkeit von der Situation oder die Ausprägung und Entwicklung von Sprachunterschieden vor dem sozialen Hintergrund sein. Im Rahmen der Analyse eines Gesprächsverlaufs kann beispielsweise die Form der Rederechtsicherung von Interesse sein. In diesem Zusammenhang stellen sich Fragen wie z.B. "Wie bringen Gesprächsteilnehrner Gesprächsbeteiligte dazu, ihre Rede zu unterbrechen?" oder "Wie wehren Gesprächsteilnehmer Unterbrechungsversuche voll anderen Teilnehmern ab?". Denkbar ist hier u.a. nach dem Vorkommen von "ausreden lassen" zu suchen, wobei diese beiden Wörter nicht unbedingt nebeneinander auftreten müssen. Bei der Suche nach Stellen an denen ein Gesprächsteilnehmer Ansprüche oder Forderungen an einen Gesprächspartner stellt, können die flektierten Formen der Modalverben wie z.B. "müssen", "sollen" oder "dürfen" für die Anfrage wichtig sein, während Konnektiva wie "aber", "ja aber" oder "doch" auf oppositive Gesprächsabschnitte verweisen können. Näheres zur gesprächsanalytischen Methodik kann Deppermann (1999) und Brünner et al. (1999) entnommen werden. In dem Bereich der Linguistik, die den Gebrauch von gesprochener Sprache in offiziellen und privaten Situationen zum Gegenstand hat, sind u.a. auch Aussprachevarianten von großem Interesse. Von der Untersuchung der Sprachfärbungen erhofft man sich detaillierte Aussagen über die Sprechersituation und die regionale (König (1988)) und soziale Herkunft des Sprechers machen zu können. In der Kriminalistik wirken solche Ergebnisse unterstützend bei der Identifizierung von Personen
Source: Sprachtechnologie für eine dynamische Wirtschaft im Medienzeitalter - Language technologies for dynamic business in the age of the media - L'ingénierie linguistique au service de la dynamisation économique à l'ère du multimédia: Tagungsakten der XXVI. Jahrestagung der Internationalen Vereinigung Sprache und Wirtschaft e.V., 23.-25.11.2000, Fachhochschule Köln. Hrsg.: K.-D. Schmitz

Tartakovski, O.; Shramko, M.: Implementierung eines Werkzeugs zur Sprachidentifikation in mono- und multilingualen Texten (2006) 0.05

0.04773758 = product of:
  0.15912525 = sum of:
    0.02446016 = weight(_text_:und in 5978) [ClassicSimilarity], result of:
      0.02446016 = score(doc=5978,freq=10.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.38329202 = fieldWeight in 5978, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5978)
    0.022222685 = weight(_text_:der in 5978) [ClassicSimilarity], result of:
      0.022222685 = score(doc=5978,freq=8.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.34551817 = fieldWeight in 5978, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5978)
    0.02446016 = weight(_text_:und in 5978) [ClassicSimilarity], result of:
      0.02446016 = score(doc=5978,freq=10.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.38329202 = fieldWeight in 5978, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5978)
    0.017077852 = weight(_text_:des in 5978) [ClassicSimilarity], result of:
      0.017077852 = score(doc=5978,freq=2.0), product of:
        0.079736836 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02879306 = queryNorm
        0.2141777 = fieldWeight in 5978, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5978)
    0.0071366085 = weight(_text_:in in 5978) [ClassicSimilarity], result of:
      0.0071366085 = score(doc=5978,freq=6.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.1822149 = fieldWeight in 5978, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5978)
    0.0637678 = weight(_text_:elektronischen in 5978) [ClassicSimilarity], result of:
      0.0637678 = score(doc=5978,freq=2.0), product of:
        0.15407887 = queryWeight, product of:
          5.3512506 = idf(docFreq=569, maxDocs=44218)
          0.02879306 = queryNorm
        0.41386467 = fieldWeight in 5978, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.3512506 = idf(docFreq=569, maxDocs=44218)
          0.0546875 = fieldNorm(doc=5978)
  0.3 = coord(6/20)

Abstract: Die Identifikation der Sprache bzw. der Sprachen in Textdokumenten ist einer der wichtigsten Schritte maschineller Textverarbeitung für das Information Retrieval. Der vorliegende Artikel stellt Langldent vor, ein System zur Sprachidentifikation von mono- und multilingualen elektronischen Textdokumenten. Das System bietet sowohl eine Auswahl von gängigen Algorithmen für die Sprachidentifikation monolingualer Textdokumente als auch einen neuen Algorithmus für die Sprachidentifikation multilingualer Textdokumente.
Source: Effektive Information Retrieval Verfahren in Theorie und Praxis: ausgewählte und erweiterte Beiträge des Vierten Hildesheimer Evaluierungs- und Retrievalworkshop (HIER 2005), Hildesheim, 20.7.2005. Hrsg.: T. Mandl u. C. Womser-Hacker

Schneider, R.: Web 3.0 ante portas? : Integration von Social Web und Semantic Web (2008) 0.05

0.04766096 = product of:
  0.15886986 = sum of:
    0.026794761 = weight(_text_:und in 4184) [ClassicSimilarity], result of:
      0.026794761 = score(doc=4184,freq=12.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.41987535 = fieldWeight in 4184, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4184)
    0.015713813 = weight(_text_:der in 4184) [ClassicSimilarity], result of:
      0.015713813 = score(doc=4184,freq=4.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.24431825 = fieldWeight in 4184, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4184)
    0.05883497 = weight(_text_:kommunikation in 4184) [ClassicSimilarity], result of:
      0.05883497 = score(doc=4184,freq=2.0), product of:
        0.14799947 = queryWeight, product of:
          5.140109 = idf(docFreq=703, maxDocs=44218)
          0.02879306 = queryNorm
        0.39753503 = fieldWeight in 4184, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.140109 = idf(docFreq=703, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4184)
    0.026794761 = weight(_text_:und in 4184) [ClassicSimilarity], result of:
      0.026794761 = score(doc=4184,freq=12.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.41987535 = fieldWeight in 4184, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4184)
    0.017077852 = weight(_text_:des in 4184) [ClassicSimilarity], result of:
      0.017077852 = score(doc=4184,freq=2.0), product of:
        0.079736836 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02879306 = queryNorm
        0.2141777 = fieldWeight in 4184, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4184)
    0.013653717 = product of:
      0.027307434 = sum of:
        0.027307434 = weight(_text_:22 in 4184) [ClassicSimilarity], result of:
          0.027307434 = score(doc=4184,freq=2.0), product of:
            0.10082839 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.02879306 = queryNorm
            0.2708308 = fieldWeight in 4184, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=4184)
      0.5 = coord(1/2)
  0.3 = coord(6/20)

Abstract: Das Medium Internet ist im Wandel, und mit ihm ändern sich seine Publikations- und Rezeptionsbedingungen. Welche Chancen bieten die momentan parallel diskutierten Zukunftsentwürfe von Social Web und Semantic Web? Zur Beantwortung dieser Frage beschäftigt sich der Beitrag mit den Grundlagen beider Modelle unter den Aspekten Anwendungsbezug und Technologie, beleuchtet darüber hinaus jedoch auch deren Unzulänglichkeiten sowie den Mehrwert einer mediengerechten Kombination. Am Beispiel des grammatischen Online-Informationssystems grammis wird eine Strategie zur integrativen Nutzung der jeweiligen Stärken skizziert.
Date: 22. 1.2011 10:38:28
Source: Kommunikation, Partizipation und Wirkungen im Social Web, Band 1. Hrsg.: A. Zerfaß u.a

Stock, W.G.: Textwortmethode : Norbert Henrichs zum 65. (3) (2000) 0.05

0.047031216 = product of:
  0.18812487 = sum of:
    0.021653436 = weight(_text_:und in 4891) [ClassicSimilarity], result of:
      0.021653436 = score(doc=4891,freq=6.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.33931053 = fieldWeight in 4891, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=4891)
    0.033597544 = weight(_text_:der in 4891) [ClassicSimilarity], result of:
      0.033597544 = score(doc=4891,freq=14.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.5223744 = fieldWeight in 4891, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=4891)
    0.021653436 = weight(_text_:und in 4891) [ClassicSimilarity], result of:
      0.021653436 = score(doc=4891,freq=6.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.33931053 = fieldWeight in 4891, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=4891)
    0.0081561245 = weight(_text_:in in 4891) [ClassicSimilarity], result of:
      0.0081561245 = score(doc=4891,freq=6.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.2082456 = fieldWeight in 4891, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0625 = fieldNorm(doc=4891)
    0.103064336 = weight(_text_:elektronischen in 4891) [ClassicSimilarity], result of:
      0.103064336 = score(doc=4891,freq=4.0), product of:
        0.15407887 = queryWeight, product of:
          5.3512506 = idf(docFreq=569, maxDocs=44218)
          0.02879306 = queryNorm
        0.66890633 = fieldWeight in 4891, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.3512506 = idf(docFreq=569, maxDocs=44218)
          0.0625 = fieldNorm(doc=4891)
  0.25 = coord(5/20)

Abstract: Nur wenige Dokumentationsmethoden werden mit dem Namen ihrer Entwickler assoziiert. Ausnahmen sind Melvil Dewey (DDC), S.R. Ranganathan (Colon Classification) - und Norbert Henrichs. Seine Textwortmethode ermöglicht die Indexierung und das Retrieval von Literatur aus Fachgebieten, die keine allseits akzeptierte Fachterminologie vorweisen, also viele Sozial- und Geisteswissenschaften, vorneweg die Philosophie. Für den Einsatz in der elektronischen Philosophie-Dokumentation hat Henrichs in den späten sechziger Jahren die Textwortmethode entworfen. Er ist damit nicht nur einer der Pioniere der Anwendung der elektronischen Datenverarbeitung in der Informationspraxis, sondern auch der Pionier bei der Dokumentation terminologisch nicht starrer Fachsprachen

Susen, A.: Spracherkennung : Aktuelle Einsatzmöglichkeiten im Bereich der Telekommunikation (2000) 0.04

0.04061273 = product of:
  0.13537577 = sum of:
    0.019139115 = weight(_text_:und in 5555) [ClassicSimilarity], result of:
      0.019139115 = score(doc=5555,freq=12.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.29991096 = fieldWeight in 5555, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5555)
    0.032723743 = weight(_text_:der in 5555) [ClassicSimilarity], result of:
      0.032723743 = score(doc=5555,freq=34.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.5087885 = fieldWeight in 5555, product of:
          5.8309517 = tf(freq=34.0), with freq of:
            34.0 = termFreq=34.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5555)
    0.042024978 = weight(_text_:kommunikation in 5555) [ClassicSimilarity], result of:
      0.042024978 = score(doc=5555,freq=2.0), product of:
        0.14799947 = queryWeight, product of:
          5.140109 = idf(docFreq=703, maxDocs=44218)
          0.02879306 = queryNorm
        0.28395358 = fieldWeight in 5555, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.140109 = idf(docFreq=703, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5555)
    0.019139115 = weight(_text_:und in 5555) [ClassicSimilarity], result of:
      0.019139115 = score(doc=5555,freq=12.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.29991096 = fieldWeight in 5555, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5555)
    0.017251236 = weight(_text_:des in 5555) [ClassicSimilarity], result of:
      0.017251236 = score(doc=5555,freq=4.0), product of:
        0.079736836 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02879306 = queryNorm
        0.21635216 = fieldWeight in 5555, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5555)
    0.005097578 = weight(_text_:in in 5555) [ClassicSimilarity], result of:
      0.005097578 = score(doc=5555,freq=6.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.1301535 = fieldWeight in 5555, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5555)
  0.3 = coord(6/20)

Abstract: Das Thema der Sprachverarbeitung und insbesondere der Spracherkennung erhitzt schon seit vielen Jahren die Gemüter der Forscher und der Entwickler. Schon zu Beginn des Coniputerzeitalters wurde prophezeit, daß auch der Computer bald menschliche Sprache verstehen wird. Dabei wurde aber die Leistung des Gehirns bei der Erkennung unterschätzt. Erst durch die Vervielfältigung von Speicherkapazität und Rechnergeschwindigkeit, wurden vor ca. 20 Jahren ernstzunehmende Verfahren entwickelt, die eine minimale Sprachbeherrschung ermöglichten. Inzwischen ist die Entwicklung soweit fortgeschritten, daß wir uns über Produkte unterhalten können, die schon im Markt eingeführt sind. Die wahrscheinlich bekanntesten Beispiele für den Einsatz von Spracherkennung sind, neben Diktiersystemen, die sogenannten Telefonsprachcomputer in Firmen, die den Anrufer ohne den Einsatz der klassischen Telefonzentrale mit der gewünschten Abteilung verbinden. Die Spracherkennung ist für die Telekommunikation von besonderer Bedeutung, da der Bereich der Kommunikation größten Veränderungen unterworfen ist. Die Menge der Informationen, welche täglich abrufbereit zur Verfügung steht, ist inzwischen schon so unübersehbar gross geworden, daß eine intelligente Organisation für den sinnvollen Umgang erforderlich ist. Brauchbare Inhalte können nur mit neuen Werkzeugen und weiteren Hilfsmitteln herausgefiltert und weiter verarbeitet werden. Verschiedene bekannte Variationen können hier nur kurzfristigen Erfolg bringen, z.B. die erhöhte Erreichbarkeit durch Mobilfunk. Bei genauer Betrachtung der Einsatzmöglichkeiten von Spracherkennung in der Telekommunikation ist es zunächst erforderlich, den Userkreis genauer zu definieren. Eine erste Unterteilung ergibt der Einsatz im privaten oder geschäftlichen Bereich
Source: Sprachtechnologie für eine dynamische Wirtschaft im Medienzeitalter - Language technologies for dynamic business in the age of the media - L'ingénierie linguistique au service de la dynamisation économique à l'ère du multimédia: Tagungsakten der XXVI. Jahrestagung der Internationalen Vereinigung Sprache und Wirtschaft e.V., 23.-25.11.2000, Fachhochschule Köln. Hrsg.: K.-D. Schmitz

Melzer, C.: ¬Der Maschine anpassen : PC-Spracherkennung - Programme sind mittlerweile alltagsreif (2005) 0.04
```
0.03878148 = product of:
  0.11080422 = sum of:
    0.01640837 = weight(_text_:und in 4044) [ClassicSimilarity], result of:
      0.01640837 = score(doc=4044,freq=18.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.25712007 = fieldWeight in 4044, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02734375 = fieldNorm(doc=4044)
    0.02421661 = weight(_text_:der in 4044) [ClassicSimilarity], result of:
      0.02421661 = score(doc=4044,freq=38.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.37651968 = fieldWeight in 4044, product of:
          6.164414 = tf(freq=38.0), with freq of:
            38.0 = termFreq=38.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02734375 = fieldNorm(doc=4044)
    0.029417485 = weight(_text_:kommunikation in 4044) [ClassicSimilarity], result of:
      0.029417485 = score(doc=4044,freq=2.0), product of:
        0.14799947 = queryWeight, product of:
          5.140109 = idf(docFreq=703, maxDocs=44218)
          0.02879306 = queryNorm
        0.19876751 = fieldWeight in 4044, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.140109 = idf(docFreq=703, maxDocs=44218)
          0.02734375 = fieldNorm(doc=4044)
    0.01640837 = weight(_text_:und in 4044) [ClassicSimilarity], result of:
      0.01640837 = score(doc=4044,freq=18.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.25712007 = fieldWeight in 4044, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02734375 = fieldNorm(doc=4044)
    0.012075866 = weight(_text_:des in 4044) [ClassicSimilarity], result of:
      0.012075866 = score(doc=4044,freq=4.0), product of:
        0.079736836 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02879306 = queryNorm
        0.1514465 = fieldWeight in 4044, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02734375 = fieldNorm(doc=4044)
    0.005450675 = weight(_text_:in in 4044) [ClassicSimilarity], result of:
      0.005450675 = score(doc=4044,freq=14.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.13916893 = fieldWeight in 4044, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02734375 = fieldNorm(doc=4044)
    0.0068268585 = product of:
      0.013653717 = sum of:
        0.013653717 = weight(_text_:22 in 4044) [ClassicSimilarity], result of:
          0.013653717 = score(doc=4044,freq=2.0), product of:
            0.10082839 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.02879306 = queryNorm
            0.1354154 = fieldWeight in 4044, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.02734375 = fieldNorm(doc=4044)
      0.5 = coord(1/2)
  0.35 = coord(7/20)
```
Content

"Der Spracherkennung am Computer schien vor wenigen Jahren die Zukunft zu gehören. Geradezu euphorisch waren viele Computernutzer, als sich auf den Bildschirmen die ersten gesprochenen Sätze als Text darstellten. Doch die Spracherkennung erwies sich als anfällig, die Nachbearbeitung nahm manchmal mehr Zeit in Anspruch als gespart wurde. Dabei ist die Kommunikation des Menschen mit der Maschine über die Tastatur eigentlich höchst kompliziert - selbst geübte Schreiber sprechen schneller als sie tippen. Deshalb hat sich inzwischen viel getan: Im Preis und in der Genauigkeit sind viele Spracherkennungsprogramme heute alltagsreif. Die besten Systeme kosten aber noch immer mehrere hundert Euro, die günstigsten weisen Lücken auf. Letztlich gilt: Respektable Ergebnisse sind erreichbar, wenn sich der Mensch der Maschine anpasst. Die Stiftung Warentest in Berlin hat die sechs gängigsten Systeme auf den Prüfstand gestellt. Die ersten Ergebnisse waren ernüchternd: Das deutlich gesprochene "Johann Wolfgang von Goethe" wurde als "Juan Wolf kann Mohnblüte", "Jaun Wolfgang von Göbel" oder "Johann-Wolfgang Wohngüte" geschrieben. Grundsätzlich gilt: Bei einem einfachen Basiswortschatz sind die Ergebnisse genau, sobald es etwas spezieller wird, wird die Software erfinderisch. "Zweiter Weltkrieg" kann dann zu "Zeit für Geld kriegt" werden. Doch ebenso wie der Nutzer lernt auch das System. Bei der Software ist Lernfähigkeit Standard. Ohnehin muss der Benutzer das System einrichten, indem er vorgegebene Texte liest. Dabei wird das Programm der Stimme und der Sprechgeschwindigkeit angepasst. Hier gilt, dass der Anwender deutlich, aber ganz normal vorlesen sollte. Wer akzentuiert und übertrieben betont, wird später mit ungenauen Ausgaben bestraft. Erkennt das System auch nach dem Training einzelne Wörter nicht, können sie nachträglich eingefügt werden. Gleiches gilt für kompliziertere Orts- oder Eigennamen. Wie gut das funktioniert, beweist ein Gegentest: Liest ein anderer den selben Text vor, sinkt das Erkennungsniveau rapide. Die beste Lernfähigkeit attestierten die Warentester dem System "Voice Pro 10" von linguatec. Das war das mit Abstand vielseitigste, mit fast 200 Euro jedoch auch das teuerste Programm.
Billiger geht es mit "Via Voice Standard" von IBM. Die Software kostet etwa 50 Euro, hat aber erhebliche Schwächen in der Lernfähigkeit: Sie schneidet jedoch immer noch besser ab als das gut drei Mal so teure "Voice Office Premium 10"; das im Test der sechs Programme als einziges nur ein "Befriedigend" bekam. "Man liest über Spracherkennung nicht mehr so viel" weil es funktioniert", glaubt Dorothee Wiegand von der in Hannover erscheinenden Computerzeitschrift "c't". Die Technik" etwa "Dragon Naturally Speaking" von ScanSoft, sei ausgereift, "Spracherkennung ist vor allem Statistik, die Auswertung unendlicher Wortmöglichkeiten. Eigentlich war eher die Hardware das Problem", sagt Wiegand. Da jetzt selbst einfache Heimcomputer schnell und leistungsfähig seien, hätten die Entwickler viel mehr Möglichkeiten."Aber selbst ältere Computer kommen mit den Systemen klar. Sie brauchen nur etwas länger! "Jedes Byte macht die Spracherkennung etwas schneller, ungenauer ist sie sonst aber nicht", bestätigt Kristina Henry von linguatec in München. Auch für die Produkte des Herstellers gelte jedoch, dass "üben und deutlich sprechen wichtiger sind als jede Hardware". Selbst Stimmen von Diktiergeräten würden klar, erkannt, versichert Henry: "Wir wollen einen Schritt weiter gehen und das Diktieren von unterwegs möglich machen." Der Benutzer könnte dann eine Nummer anwählen, etwa im Auto einen Text aufsprechen und ihn zu Hause "getippt" vorfinden. Grundsätzlich passt die Spracherkennungssoftware inzwischen auch auf den privaten Computer. Klar ist aber, dass selbst der bestgesprochene Text nachbearbeitet werden muss. Zudem ist vom Nutzer Geduld gefragt: Ebenso wie sein System lernt, muss der Mensch sich in Aussprache und Geschwindigkeit dem System anpassen. Dann sind die Ergebnisse allerdings beachtlich - und "Sexterminvereinbarung" statt "zwecks Terminvereinbarung" gehört der Vergangenheit an."

Date

3. 5.1997 8:44:22

Schmitz, K.-D.: Projektforschung und Infrastrukturen im Bereich der Terminologie : Wie kann die Wirtschaft davon profitieren? (2000) 0.04

0.037451427 = product of:
  0.14980571 = sum of:
    0.031097382 = weight(_text_:und in 5568) [ClassicSimilarity], result of:
      0.031097382 = score(doc=5568,freq=22.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.48729765 = fieldWeight in 5568, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5568)
    0.03011756 = weight(_text_:der in 5568) [ClassicSimilarity], result of:
      0.03011756 = score(doc=5568,freq=20.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.46826762 = fieldWeight in 5568, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=5568)
    0.050429977 = weight(_text_:kommunikation in 5568) [ClassicSimilarity], result of:
      0.050429977 = score(doc=5568,freq=2.0), product of:
        0.14799947 = queryWeight, product of:
          5.140109 = idf(docFreq=703, maxDocs=44218)
          0.02879306 = queryNorm
        0.34074432 = fieldWeight in 5568, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.140109 = idf(docFreq=703, maxDocs=44218)
          0.046875 = fieldNorm(doc=5568)
    0.031097382 = weight(_text_:und in 5568) [ClassicSimilarity], result of:
      0.031097382 = score(doc=5568,freq=22.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.48729765 = fieldWeight in 5568, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5568)
    0.00706341 = weight(_text_:in in 5568) [ClassicSimilarity], result of:
      0.00706341 = score(doc=5568,freq=8.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.18034597 = fieldWeight in 5568, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=5568)
  0.25 = coord(5/20)

Abstract: In der heutigen Informationsgesellschaft bieten sich der Industrie neue Perspektiven für Kommunikation und Handel auf dem europäischen und internationalen Markt; beide Märkte sind von einer großen sprachlichen, kulturellen und gesellschaftlichen Vielfalt geprägt. Uni Nutzen aus diesen neuen Möglichkeiten zu ziehen und um weiterhin konkurrenzfähig zu bleiben, muß die Industrie spezifische und adäquate Lösungen zur Überwindung der Sprachbarrieren finden. Voraussetzung hierfür ist die genaue Definition, systematische Ordnung und exakte Benennung der Begriffe innerhalb der jeweiligen Fachgebiete, in der eigenen Sprache ebenso wie in den Fremdsprachen. Genau dies sind die Themenbereiche, mit dem sich die Terminologiewissenschaft und die praktische Temninologiearbeit beschäftigen. Die Ergebnisse der Terminologiearbeit im Unternehmen beeinflussen Konstruktion, Produktion, Einkauf, Marketing und Verkauf, Vertragswesen, technische Dokumentation und Übersetzung
Source: Sprachtechnologie für eine dynamische Wirtschaft im Medienzeitalter - Language technologies for dynamic business in the age of the media - L'ingénierie linguistique au service de la dynamisation économique à l'ère du multimédia: Tagungsakten der XXVI. Jahrestagung der Internationalen Vereinigung Sprache und Wirtschaft e.V., 23.-25.11.2000, Fachhochschule Köln. Hrsg.: K.-D. Schmitz

Kiss, T.: Anmerkungen zur scheinbaren Konkurrenz von numerischen und symbolischen Verfahren in der Computerlinguistik (2002) 0.03

0.034054164 = product of:
  0.11351387 = sum of:
    0.018752426 = weight(_text_:und in 1752) [ClassicSimilarity], result of:
      0.018752426 = score(doc=1752,freq=18.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.29385152 = fieldWeight in 1752, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=1752)
    0.017958641 = weight(_text_:der in 1752) [ClassicSimilarity], result of:
      0.017958641 = score(doc=1752,freq=16.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.27922085 = fieldWeight in 1752, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=1752)
    0.018752426 = weight(_text_:und in 1752) [ClassicSimilarity], result of:
      0.018752426 = score(doc=1752,freq=18.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.29385152 = fieldWeight in 1752, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=1752)
    0.016902693 = weight(_text_:des in 1752) [ClassicSimilarity], result of:
      0.016902693 = score(doc=1752,freq=6.0), product of:
        0.079736836 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02879306 = queryNorm
        0.21198097 = fieldWeight in 1752, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.03125 = fieldNorm(doc=1752)
    0.00470894 = weight(_text_:in in 1752) [ClassicSimilarity], result of:
      0.00470894 = score(doc=1752,freq=8.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.120230645 = fieldWeight in 1752, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.03125 = fieldNorm(doc=1752)
    0.036438745 = weight(_text_:elektronischen in 1752) [ClassicSimilarity], result of:
      0.036438745 = score(doc=1752,freq=2.0), product of:
        0.15407887 = queryWeight, product of:
          5.3512506 = idf(docFreq=569, maxDocs=44218)
          0.02879306 = queryNorm
        0.2364941 = fieldWeight in 1752, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.3512506 = idf(docFreq=569, maxDocs=44218)
          0.03125 = fieldNorm(doc=1752)
  0.3 = coord(6/20)

Abstract: Veränderungen in der Mode vollziehen sich schrittweise, allmählich, oftmals unmerklich. Manchmal kommt es dann doch zu einem plötzlichen Bruch, zu einer eindeutig bestimmten Opposition zwischen dem modischen Jetzt und seinem Vorgänger. Deutlich erkennbar etwa, als um die Wende von den 70er zu den 80er Jahren die weite Karotte die enge Schlaghose verdrängte und im Gefolge dieses Wechsels taillierte Sakkos und Hemden big suits und Polohemden weichen mussten. Etwas Ähnliches hat sich vor einigen Jahren in der Computerlinguistik ereignet: Wurde diese seit Beginn der 80er Jahre durch deduktive, regelbasierte Verfahren beherrscht, so gab es seit Beginn der 90er Jahre zunächst eine Hinwendung, schließlich Mitte der 90er Jahre eine Flucht zu induktiven, numerisch basierten Verfahren, die mittlerweile die Computerlinguistik nahezu vollständig zu beherrschen scheinen.
Man kann wohl abschließend festhalten, dass von einer Überlegenheit statistischer Verfahren zumindest im Bereich des Tagging eigentlich nicht gesprochen werden sollte. Darüber hinaus muss die Opposition zwischen regelbasierten und numerischen Verfahren hier aufgeweicht werden, denn auch die statistischen Verfahren verwenden Regelsysteme. Selbst beim Lernen ohne Referenzkorpus ist ja zumindest eine Zuordnung der Wörter zu einem Lexikon bzw. auch eine heuristische Erkennung unbekannter Wörter nach Regeln notwendig. Statistische Verfahren haben - und dies wurde hier wahrscheinlich nicht ausreichend betont - durchaus ihre Berechtigung, sie sind nützlich; sie gestatten, insbesondere im Vergleich zur Introspektion, eine unmittelbarere und breitere Heranführung an das Phänomen Sprache. Die vorhandenen umfangreichen elektronischen Korpora verlangen nahezu danach, Sprache auch mit statistischen Mitteln zu untersuchen. Allerdings können die statistischen Verfahren die regelbasierten Verfahren nicht ersetzen. Somit muss dem Diktum vom "Es geht nicht anders" deutlich widersprochen werden. Dass die statistischen Verfahren zur Zeit so en vogue sind und die regelbasierten Verfahren aussehen lassen wie eine alte Dallas-Folge, mag wohl auch daran liegen, dass zu viele Vertreter des alten Paradigmas nicht die Energie aufbringen, sich dem neuen Paradigma so weit zu öffnen, dass eine kritische Auseinandersetzung mit dem neuen auf der Basis des alten möglich wird. Die Mathematik ist eine geachtete, weil schwierige Wissenschaft, die statistische Sprachverarbeitung ist eine gefürchtete, weil in ihren Eigenschaften oftmals nicht gründlich genug betrachtete Disziplin.

Jensen, N.: Evaluierung von mehrsprachigem Web-Retrieval : Experimente mit dem EuroGOV-Korpus im Rahmen des Cross Language Evaluation Forum (CLEF) (2006) 0.03

0.028811984 = product of:
  0.115247935 = sum of:
    0.022966936 = weight(_text_:und in 5964) [ClassicSimilarity], result of:
      0.022966936 = score(doc=5964,freq=12.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.35989314 = fieldWeight in 5964, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5964)
    0.03158756 = weight(_text_:der in 5964) [ClassicSimilarity], result of:
      0.03158756 = score(doc=5964,freq=22.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.4911232 = fieldWeight in 5964, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=5964)
    0.022966936 = weight(_text_:und in 5964) [ClassicSimilarity], result of:
      0.022966936 = score(doc=5964,freq=12.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.35989314 = fieldWeight in 5964, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5964)
    0.032731917 = weight(_text_:des in 5964) [ClassicSimilarity], result of:
      0.032731917 = score(doc=5964,freq=10.0), product of:
        0.079736836 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02879306 = queryNorm
        0.41049933 = fieldWeight in 5964, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.046875 = fieldNorm(doc=5964)
    0.0049945856 = weight(_text_:in in 5964) [ClassicSimilarity], result of:
      0.0049945856 = score(doc=5964,freq=4.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.12752387 = fieldWeight in 5964, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=5964)
  0.25 = coord(5/20)

Abstract: Der vorliegende Artikel beschreibt die Experimente der Universität Hildesheim im Rahmen des ersten Web Track der CLEF-Initiative (WebCLEF) im Jahr 2005. Bei der Teilnahme konnten Erfahrungen mit einem multilingualen Web-Korpus (EuroGOV) bei der Vorverarbeitung, der Topic- bzw. Query-Entwicklung, bei sprachunabhängigen Indexierungsmethoden und multilingualen Retrieval-Strategien gesammelt werden. Aufgrund des großen Um-fangs des Korpus und der zeitlichen Einschränkungen wurden multilinguale Indizes aufgebaut. Der Artikel beschreibt die Vorgehensweise bei der Teilnahme der Universität Hildesheim und die Ergebnisse der offiziell eingereichten sowie weiterer Experimente. Für den Multilingual Task konnte das beste Ergebnis in CLEF erzielt werden.
Source: Effektive Information Retrieval Verfahren in Theorie und Praxis: ausgewählte und erweiterte Beiträge des Vierten Hildesheimer Evaluierungs- und Retrievalworkshop (HIER 2005), Hildesheim, 20.7.2005. Hrsg.: T. Mandl u. C. Womser-Hacker

Sienel, J.; Weiss, M.; Laube, M.: Sprachtechnologien für die Informationsgesellschaft des 21. Jahrhunderts (2000) 0.03

0.028326325 = product of:
  0.09442108 = sum of:
    0.022099946 = weight(_text_:und in 5557) [ClassicSimilarity], result of:
      0.022099946 = score(doc=5557,freq=16.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.34630734 = fieldWeight in 5557, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5557)
    0.0194408 = weight(_text_:der in 5557) [ClassicSimilarity], result of:
      0.0194408 = score(doc=5557,freq=12.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.30226544 = fieldWeight in 5557, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5557)
    0.022099946 = weight(_text_:und in 5557) [ClassicSimilarity], result of:
      0.022099946 = score(doc=5557,freq=16.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.34630734 = fieldWeight in 5557, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5557)
    0.012198467 = weight(_text_:des in 5557) [ClassicSimilarity], result of:
      0.012198467 = score(doc=5557,freq=2.0), product of:
        0.079736836 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02879306 = queryNorm
        0.15298408 = fieldWeight in 5557, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5557)
    0.008829262 = weight(_text_:in in 5557) [ClassicSimilarity], result of:
      0.008829262 = score(doc=5557,freq=18.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.22543246 = fieldWeight in 5557, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5557)
    0.009752655 = product of:
      0.01950531 = sum of:
        0.01950531 = weight(_text_:22 in 5557) [ClassicSimilarity], result of:
          0.01950531 = score(doc=5557,freq=2.0), product of:
            0.10082839 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.02879306 = queryNorm
            0.19345059 = fieldWeight in 5557, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0390625 = fieldNorm(doc=5557)
      0.5 = coord(1/2)
  0.3 = coord(6/20)

Abstract: In den vergangenen Jahren hat sich die Entwicklung, Sprache als Schnittstelle zwischen Mensch und Maschine einzusetzen, zunehmend an Bedeutung gewonnen. Die steigende Verarbeitungsgeschwindigkeit der Prozessoren ermöglicht es heute, selbst sehr komplexe Aufgaben wie Diktiersysteme auf handelsüblichen PCs verfügbar zu machen. Ebenso haben sich Verfahren weiterentwickelt und die Erkennungsleistung konnte gesteigert werden. Insbesondere im mobilen Umfeld wird sich Sprache als notwendig erweisen, um den Widerspruch, immer komplexere Funktionalität in immer kleineren und leichteren Terminals unterzubringen, aufzulösen. In diesem Umfeld können auch andere Modalitäten, wie Handschrift oder Gestik, integriert werden. Eine der Hauptanwendungen in mobiler Umgebung wird der Zugriff auf das Internet werden: um schnell und umfassend zu den benötigten Information zu gelangen, können intelligente Agenten eine mögliche Hilfe darstellen. Sie sind in Lage, die Informationen bezüglich ihrer Relevanz für den Nutzer zu beurteilen und fassen die Inhalte zusammen, die sich auf den kleinen Displays, oder akustisch wiedergeben lassen. Ist das gefundene Dokument in einer dein Benutzer fremden Sprache verfaßt, kann es automatisch übersetzt werden. Natürlich werden die benötigten Technologien nicht alle in einem Endgerät untergebracht werden können, deshalb wird bereits heute in Standardisierungsgremien untersucht, wie verteilte Architekturen helfen können, den Zugriff auf Informationen immer, überall und jedem verfügbaren Endgerät zugänglich zu machen. Das vom BMWi geförderte Projekt "Mobiler Multimedia-Arbeitsplatz der Zukunft" will diesen Ansatz verfolgen. Dabei werden auch die sozialen und arbeitsrechtlichen Aspekte untersucht
Date: 26.12.2000 13:22:17
Source: Sprachtechnologie für eine dynamische Wirtschaft im Medienzeitalter - Language technologies for dynamic business in the age of the media - L'ingénierie linguistique au service de la dynamisation économique à l'ère du multimédia: Tagungsakten der XXVI. Jahrestagung der Internationalen Vereinigung Sprache und Wirtschaft e.V., 23.-25.11.2000, Fachhochschule Köln. Hrsg.: K.-D. Schmitz

Kunze, C.: Lexikalisch-semantische Wortnetze in Sprachwissenschaft und Sprachtechnologie (2006) 0.03

0.028261602 = product of:
  0.11304641 = sum of:
    0.03307617 = weight(_text_:und in 6023) [ClassicSimilarity], result of:
      0.03307617 = score(doc=6023,freq=14.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.51830536 = fieldWeight in 6023, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=6023)
    0.017958641 = weight(_text_:der in 6023) [ClassicSimilarity], result of:
      0.017958641 = score(doc=6023,freq=4.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.27922085 = fieldWeight in 6023, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=6023)
    0.03307617 = weight(_text_:und in 6023) [ClassicSimilarity], result of:
      0.03307617 = score(doc=6023,freq=14.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.51830536 = fieldWeight in 6023, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=6023)
    0.019517547 = weight(_text_:des in 6023) [ClassicSimilarity], result of:
      0.019517547 = score(doc=6023,freq=2.0), product of:
        0.079736836 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02879306 = queryNorm
        0.24477452 = fieldWeight in 6023, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.0625 = fieldNorm(doc=6023)
    0.00941788 = weight(_text_:in in 6023) [ClassicSimilarity], result of:
      0.00941788 = score(doc=6023,freq=8.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.24046129 = fieldWeight in 6023, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0625 = fieldNorm(doc=6023)
  0.25 = coord(5/20)

Abstract: Dieser Beitrag beschreibt die Strukturierungsprinzipien und Anwendungskontexte lexikalisch-semantischer Wortnetze, insbesondere des deutschen Wortnetzes GermaNet. Wortnetze sind zurzeit besonders populäre elektronische Lexikonressourcen, die große Abdeckungen semantisch strukturierter Datenfür verschiedene Sprachen und Sprachverbünde enthalten. In Wortnetzen sind die häufigsten und wichtigsten Konzepte einer Sprache mit ihren elementaren Bedeutungsrelationen repräsentiert. Zentrale Anwendungen für Wortnetze sind u.a. die Lesartendisambiguierung und die Informationserschließung. Der Artikel skizziert die neusten Szenarien, in denen GermaNet eingesetzt wird: die Semantische Informationserschließung und die Integration allgemeinsprachlicher Wortnetze mit terminologischen Ressourcen vordem Hintergrund der Datenkonvertierung in OWL.
Source: Information - Wissenschaft und Praxis. 57(2006) H.6/7, S.309-314

Carter-Sigglow, J.: ¬Die Rolle der Sprache bei der Informationsvermittlung (2001) 0.03

0.02715002 = product of:
  0.10860008 = sum of:
    0.028128639 = weight(_text_:und in 5882) [ClassicSimilarity], result of:
      0.028128639 = score(doc=5882,freq=18.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.4407773 = fieldWeight in 5882, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5882)
    0.03158756 = weight(_text_:der in 5882) [ClassicSimilarity], result of:
      0.03158756 = score(doc=5882,freq=22.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.4911232 = fieldWeight in 5882, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=5882)
    0.028128639 = weight(_text_:und in 5882) [ClassicSimilarity], result of:
      0.028128639 = score(doc=5882,freq=18.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.4407773 = fieldWeight in 5882, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5882)
    0.014638159 = weight(_text_:des in 5882) [ClassicSimilarity], result of:
      0.014638159 = score(doc=5882,freq=2.0), product of:
        0.079736836 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02879306 = queryNorm
        0.18358089 = fieldWeight in 5882, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.046875 = fieldNorm(doc=5882)
    0.006117093 = weight(_text_:in in 5882) [ClassicSimilarity], result of:
      0.006117093 = score(doc=5882,freq=6.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.1561842 = fieldWeight in 5882, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=5882)
  0.25 = coord(5/20)

Abstract: In der Zeit des Internets und E-Commerce müssen auch deutsche Informationsfachleute ihre Dienste auf Englisch anbieten und sogar auf Englisch gestalten, um die internationale Community zu erreichen. Auf der anderen Seite spielt gerade auf dem Wissensmarkt Europa die sprachliche Identität der einzelnen Nationen eine große Rolle. In diesem Spannungsfeld zwischen Globalisierung und Lokalisierung arbeiten Informationsvermittler und werden dabei von Sprachspezialisten unterstützt. Man muss sich darüber im Klaren sein, dass jede Sprache - auch die für international gehaltene Sprache Englisch - eine Sprachgemeinschaft darstellt. In diesem Beitrag wird anhand aktueller Beispiele gezeigt, dass Sprache nicht nur grammatikalisch und terminologisch korrekt sein muss, sie soll auch den sprachlichen Erwartungen der Rezipienten gerecht werden, um die Grenzen der Sprachwelt nicht zu verletzen. Die Rolle der Sprachspezialisten besteht daher darin, die Informationsvermittlung zwischen diesen Welten reibungslos zu gestalten
Series: Tagungen der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis; 4
Source: Information Research & Content Management: Orientierung, Ordnung und Organisation im Wissensmarkt; 23. DGI-Online-Tagung der DGI und 53. Jahrestagung der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis e.V. DGI, Frankfurt am Main, 8.-10.5.2001. Proceedings. Hrsg.: R. Schmidt

Geisel, S.: ¬Der Traum von der Abschaffung der Wörter : Das Pfingstwunder und die babylonische Sprachverwirrung im Zeitalter des Internets (2001) 0.03

0.026384655 = product of:
  0.10553862 = sum of:
    0.017679956 = weight(_text_:und in 4963) [ClassicSimilarity], result of:
      0.017679956 = score(doc=4963,freq=4.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.27704588 = fieldWeight in 4963, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=4963)
    0.035917282 = weight(_text_:der in 4963) [ClassicSimilarity], result of:
      0.035917282 = score(doc=4963,freq=16.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.5584417 = fieldWeight in 4963, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=4963)
    0.017679956 = weight(_text_:und in 4963) [ClassicSimilarity], result of:
      0.017679956 = score(doc=4963,freq=4.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.27704588 = fieldWeight in 4963, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=4963)
    0.027601978 = weight(_text_:des in 4963) [ClassicSimilarity], result of:
      0.027601978 = score(doc=4963,freq=4.0), product of:
        0.079736836 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02879306 = queryNorm
        0.34616345 = fieldWeight in 4963, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.0625 = fieldNorm(doc=4963)
    0.006659447 = weight(_text_:in in 4963) [ClassicSimilarity], result of:
      0.006659447 = score(doc=4963,freq=4.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.17003182 = fieldWeight in 4963, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0625 = fieldNorm(doc=4963)
  0.25 = coord(5/20)

Abstract: In den nächsten Jahren wird der Bedarf nach Übersetzungen auf der ganzen Welt stark anwachsen. Vor allem in der Finanz- und Geschäftswelt kommen dabei computerisierte Übersetzungshilfen gezielt zum Einsattz. Je kontrollierter die Sprache, desto besser die Übersetzung des Computers, der etwa mit den Mehrdeutigkeiten der Alltagssprache völlig überfordert ist. Obwohl sie für beträchtliche Verwirrung sorgen, werden Übersetzungsmaschinen jedoch auch im Internet immer wichtiger

Thiel, M.: Bedingt wahrscheinliche Syntaxbäume (2006) 0.03
```
0.025403896 = product of:
  0.101615585 = sum of:
    0.026519936 = weight(_text_:und in 6069) [ClassicSimilarity], result of:
      0.026519936 = score(doc=6069,freq=36.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.41556883 = fieldWeight in 6069, product of:
          6.0 = tf(freq=36.0), with freq of:
            36.0 = termFreq=36.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=6069)
    0.021994755 = weight(_text_:der in 6069) [ClassicSimilarity], result of:
      0.021994755 = score(doc=6069,freq=24.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.34197432 = fieldWeight in 6069, product of:
          4.8989797 = tf(freq=24.0), with freq of:
            24.0 = termFreq=24.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.03125 = fieldNorm(doc=6069)
    0.026519936 = weight(_text_:und in 6069) [ClassicSimilarity], result of:
      0.026519936 = score(doc=6069,freq=36.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.41556883 = fieldWeight in 6069, product of:
          6.0 = tf(freq=36.0), with freq of:
            36.0 = termFreq=36.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=6069)
    0.019517547 = weight(_text_:des in 6069) [ClassicSimilarity], result of:
      0.019517547 = score(doc=6069,freq=8.0), product of:
        0.079736836 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02879306 = queryNorm
        0.24477452 = fieldWeight in 6069, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.03125 = fieldNorm(doc=6069)
    0.00706341 = weight(_text_:in in 6069) [ClassicSimilarity], result of:
      0.00706341 = score(doc=6069,freq=18.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.18034597 = fieldWeight in 6069, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.03125 = fieldNorm(doc=6069)
  0.25 = coord(5/20)
```
Abstract

Es wird argumentiert, dass die Ansätze der probabilistischen kontextfreien Grammatiken und anderer Modelle nicht ausreichend sind für die Lösung der im Parsing auftretenden Probleme. Zu deren Lösung wird folgende Hypothese aufgestellt: Die Wahrscheinlichkeiten einzelner Lesarten und verschiedener Knoten in einem Syntaxbaum sind voneinander abhängig. Vereindeutigt man eine Lesart bzw. einen Knoten, hat dies Auswirkungen auf die Wahrscheinlichkeit anderer Lesarten bzw. Knoten. Daher werden alle Lesarten und Syntaxbäume in einen Graphen integriert. Wenn die Wahrscheinlichkeiten also voneinander abhängig sind, wird angenommen, dass die Theorie der bedingten Wahrscheinlichkeiten von Bayes als Basis eine Lösung produzieren sollte. An einem Beispiel wird dies nachvollzogen und die Hypothese konnte bestätigt werden.
Die Tendenz ist eindeutig: wo immer es sinnvoll ist, werden hart' programmierte Lösungen durch Ansätze des Softcomputing ersetzt. Vor allem technische und kommerzielle Bereiche profitieren davon. So finden wir Kransteuerungen und viele andere Anwendungen mit Fuzzy Expertensystemen sowie Bilderkennungssysteme und Entscheidungen über die Kreditvergabe mit Neuronalen Netzen oder auch Methoden des Maschinellen Lernens (vgl. Jafar-Shaghaghi 1994). Ein Prinzip dieser Ansätze ist, dass die Software sich automatisch an die spezielle Situation und Datengrundlage der Anwendung anpasst. Flexibilität der Anpassung und die Fähigkeit zur Verallgemeinerung auf bislang ungesehene Fälle sind implizit in den Methoden vorhanden. Gerade dies ist auch ein typisches Problem, das bei der Beschreibung und vor allem beim Parsen natürlicher Sprache auftritt. Bei der Verarbeitung natürlicher Sprache kommt das leidige Problem der Ambiguität auf verschiedenen Ebenen hinzu. Alternative Regeln schließen sich in ihrer Anwendung in einem Satz meistens gegenseitig aus und sind nicht alle an der aktuellen Stelle gleich wahrscheinlich. Auf diese Problematik wurde schon früh hingewiesen (Thiel 1987, 137 ff.), wo versucht wurde, mit Gewichtungen die Wahrscheinlichkeit von Regeln, Syntaxbäumen, Kategorien und Wortsemantik in den Griff zu bekommen. Das Gewicht eines Syntaxbaumes kann z.B. einfach zugewiesen werden oder berechnet werden als Funktion des Baumes, aus dem er abgeleitet wird, und der angewandten Regel. Ein solches Verfahren wird (Thiel 1987, 152) am Beispiel einer Heuristik für die Inferenzmaschine eines Expertensystems gezeigt. Aber auch bereits in einer sehr frühen Veröffentlichung zur Analyse natürlicher Sprache, an der Zimmermann maßgeblich beteiligt war, wurde auf Vorkommenswahrscheinlichkeiten hingewiesen: "Statistische Auswertung von Typen des Satzbaus, Bau nominaler und verbaler Gruppen ..." (Eggers et al. 1969, 18). Derzeit konzentrieren sich die Ansätze von Vagheit in der Verarbeitung von natürlicher Sprache vor allem auf die Filterung von Texten z.B. in Spam-Filtern und auf probabilistische kontextfreie Grammatiken.

Source

Information und Sprache: Beiträge zu Informationswissenschaft, Computerlinguistik, Bibliothekswesen und verwandten Fächern. Festschrift für Harald H. Zimmermann. Herausgegeben von Ilse Harms, Heinz-Dirk Luckhardt und Hans W. Giessen

Kummer, N.: Indexierungstechniken für das japanische Retrieval (2006) 0.02

0.024523515 = product of:
  0.09809406 = sum of:
    0.027954467 = weight(_text_:und in 5979) [ClassicSimilarity], result of:
      0.027954467 = score(doc=5979,freq=10.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.438048 = fieldWeight in 5979, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=5979)
    0.017958641 = weight(_text_:der in 5979) [ClassicSimilarity], result of:
      0.017958641 = score(doc=5979,freq=4.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.27922085 = fieldWeight in 5979, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.0625 = fieldNorm(doc=5979)
    0.027954467 = weight(_text_:und in 5979) [ClassicSimilarity], result of:
      0.027954467 = score(doc=5979,freq=10.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.438048 = fieldWeight in 5979, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=5979)
    0.019517547 = weight(_text_:des in 5979) [ClassicSimilarity], result of:
      0.019517547 = score(doc=5979,freq=2.0), product of:
        0.079736836 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02879306 = queryNorm
        0.24477452 = fieldWeight in 5979, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.0625 = fieldNorm(doc=5979)
    0.00470894 = weight(_text_:in in 5979) [ClassicSimilarity], result of:
      0.00470894 = score(doc=5979,freq=2.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.120230645 = fieldWeight in 5979, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0625 = fieldNorm(doc=5979)
  0.25 = coord(5/20)

Abstract: Der vorliegende Artikel beschreibt die Herausforderungen, die die japanische Sprache aufgrund der besonderen Struktur ihres Schriftsystems an das Information Retrieval stellt und präsentiert Strategien und Ansätze für die Indexierung japanischer Dokumente. Im Besonderen soll auf die Effektivität aussprachebasierter (yomi-based) Indexierung sowie Fusion verschiedener einzelner Indexierungsansätze eingegangen werden.
Source: Effektive Information Retrieval Verfahren in Theorie und Praxis: ausgewählte und erweiterte Beiträge des Vierten Hildesheimer Evaluierungs- und Retrievalworkshop (HIER 2005), Hildesheim, 20.7.2005. Hrsg.: T. Mandl u. C. Womser-Hacker

Strötgen, R.; Mandl, T.; Schneider, R.: Entwicklung und Evaluierung eines Question Answering Systems im Rahmen des Cross Language Evaluation Forum (CLEF) (2006) 0.02

0.024250636 = product of:
  0.09700254 = sum of:
    0.029650189 = weight(_text_:und in 5981) [ClassicSimilarity], result of:
      0.029650189 = score(doc=5981,freq=20.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.46462005 = fieldWeight in 5981, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5981)
    0.013468982 = weight(_text_:der in 5981) [ClassicSimilarity], result of:
      0.013468982 = score(doc=5981,freq=4.0), product of:
        0.06431698 = queryWeight, product of:
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.02879306 = queryNorm
        0.20941564 = fieldWeight in 5981, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.2337668 = idf(docFreq=12875, maxDocs=44218)
          0.046875 = fieldNorm(doc=5981)
    0.029650189 = weight(_text_:und in 5981) [ClassicSimilarity], result of:
      0.029650189 = score(doc=5981,freq=20.0), product of:
        0.06381599 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02879306 = queryNorm
        0.46462005 = fieldWeight in 5981, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5981)
    0.020701483 = weight(_text_:des in 5981) [ClassicSimilarity], result of:
      0.020701483 = score(doc=5981,freq=4.0), product of:
        0.079736836 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02879306 = queryNorm
        0.25962257 = fieldWeight in 5981, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.046875 = fieldNorm(doc=5981)
    0.003531705 = weight(_text_:in in 5981) [ClassicSimilarity], result of:
      0.003531705 = score(doc=5981,freq=2.0), product of:
        0.039165888 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02879306 = queryNorm
        0.09017298 = fieldWeight in 5981, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=5981)
  0.25 = coord(5/20)

Abstract: Question Answering Systeme versuchen, zu konkreten Fragen eine korrekte Antwort zu liefern. Dazu durchsuchen sie einen Dokumentenbestand und extrahieren einen Bruchteil eines Dokuments. Dieser Beitrag beschreibt die Entwicklung eines modularen Systems zum multilingualen Question Answering. Die Strategie bei der Entwicklung zielte auf eine schnellstmögliche Verwendbarkeit eines modularen Systems, das auf viele frei verfügbare Ressourcen zugreift. Das System integriert Module zur Erkennung von Eigennamen, zu Indexierung und Retrieval, elektronische Wörterbücher, Online-Übersetzungswerkzeuge sowie Textkorpora zu Trainings- und Testzwecken und implementiert eigene Ansätze zu den Bereichen der Frage- und AntwortTaxonomien, zum Passagenretrieval und zum Ranking alternativer Antworten.
Source: Effektive Information Retrieval Verfahren in Theorie und Praxis: ausgewählte und erweiterte Beiträge des Vierten Hildesheimer Evaluierungs- und Retrievalworkshop (HIER 2005), Hildesheim, 20.7.2005. Hrsg.: T. Mandl u. C. Womser-Hacker

Search (181 results, page 1 of 10)

Authors

Languages

Themes