Document (#36045)

Author
Melzer, C.
Title
¬Der Maschine anpassen : PC-Spracherkennung - Programme sind mittlerweile alltagsreif
Source
Bergische Landeszeitung. Nr.175 vom 30.7.2005, S.ras04a/1
Year
2005
Series
Netzwelt
Content
"Der Spracherkennung am Computer schien vor wenigen Jahren die Zukunft zu gehören. Geradezu euphorisch waren viele Computernutzer, als sich auf den Bildschirmen die ersten gesprochenen Sätze als Text darstellten. Doch die Spracherkennung erwies sich als anfällig, die Nachbearbeitung nahm manchmal mehr Zeit in Anspruch als gespart wurde. Dabei ist die Kommunikation des Menschen mit der Maschine über die Tastatur eigentlich höchst kompliziert - selbst geübte Schreiber sprechen schneller als sie tippen. Deshalb hat sich inzwischen viel getan: Im Preis und in der Genauigkeit sind viele Spracherkennungsprogramme heute alltagsreif. Die besten Systeme kosten aber noch immer mehrere hundert Euro, die günstigsten weisen Lücken auf. Letztlich gilt: Respektable Ergebnisse sind erreichbar, wenn sich der Mensch der Maschine anpasst. Die Stiftung Warentest in Berlin hat die sechs gängigsten Systeme auf den Prüfstand gestellt. Die ersten Ergebnisse waren ernüchternd: Das deutlich gesprochene "Johann Wolfgang von Goethe" wurde als "Juan Wolf kann Mohnblüte", "Jaun Wolfgang von Göbel" oder "Johann-Wolfgang Wohngüte" geschrieben. Grundsätzlich gilt: Bei einem einfachen Basiswortschatz sind die Ergebnisse genau, sobald es etwas spezieller wird, wird die Software erfinderisch. "Zweiter Weltkrieg" kann dann zu "Zeit für Geld kriegt" werden. Doch ebenso wie der Nutzer lernt auch das System. Bei der Software ist Lernfähigkeit Standard. Ohnehin muss der Benutzer das System einrichten, indem er vorgegebene Texte liest. Dabei wird das Programm der Stimme und der Sprechgeschwindigkeit angepasst. Hier gilt, dass der Anwender deutlich, aber ganz normal vorlesen sollte. Wer akzentuiert und übertrieben betont, wird später mit ungenauen Ausgaben bestraft. Erkennt das System auch nach dem Training einzelne Wörter nicht, können sie nachträglich eingefügt werden. Gleiches gilt für kompliziertere Orts- oder Eigennamen. Wie gut das funktioniert, beweist ein Gegentest: Liest ein anderer den selben Text vor, sinkt das Erkennungsniveau rapide. Die beste Lernfähigkeit attestierten die Warentester dem System "Voice Pro 10" von linguatec. Das war das mit Abstand vielseitigste, mit fast 200 Euro jedoch auch das teuerste Programm.
Billiger geht es mit "Via Voice Standard" von IBM. Die Software kostet etwa 50 Euro, hat aber erhebliche Schwächen in der Lernfähigkeit: Sie schneidet jedoch immer noch besser ab als das gut drei Mal so teure "Voice Office Premium 10"; das im Test der sechs Programme als einziges nur ein "Befriedigend" bekam. "Man liest über Spracherkennung nicht mehr so viel" weil es funktioniert", glaubt Dorothee Wiegand von der in Hannover erscheinenden Computerzeitschrift "c't". Die Technik" etwa "Dragon Naturally Speaking" von ScanSoft, sei ausgereift, "Spracherkennung ist vor allem Statistik, die Auswertung unendlicher Wortmöglichkeiten. Eigentlich war eher die Hardware das Problem", sagt Wiegand. Da jetzt selbst einfache Heimcomputer schnell und leistungsfähig seien, hätten die Entwickler viel mehr Möglichkeiten."Aber selbst ältere Computer kommen mit den Systemen klar. Sie brauchen nur etwas länger! "Jedes Byte macht die Spracherkennung etwas schneller, ungenauer ist sie sonst aber nicht", bestätigt Kristina Henry von linguatec in München. Auch für die Produkte des Herstellers gelte jedoch, dass "üben und deutlich sprechen wichtiger sind als jede Hardware". Selbst Stimmen von Diktiergeräten würden klar, erkannt, versichert Henry: "Wir wollen einen Schritt weiter gehen und das Diktieren von unterwegs möglich machen." Der Benutzer könnte dann eine Nummer anwählen, etwa im Auto einen Text aufsprechen und ihn zu Hause "getippt" vorfinden. Grundsätzlich passt die Spracherkennungssoftware inzwischen auch auf den privaten Computer. Klar ist aber, dass selbst der bestgesprochene Text nachbearbeitet werden muss. Zudem ist vom Nutzer Geduld gefragt: Ebenso wie sein System lernt, muss der Mensch sich in Aussprache und Geschwindigkeit dem System anpassen. Dann sind die Ergebnisse allerdings beachtlich - und "Sexterminvereinbarung" statt "zwecks Terminvereinbarung" gehört der Vergangenheit an."
Theme
Computerlinguistik
Object
Voice Pro 10
Via Voice Standard
Dragon Naturally Speaking

Similar documents (content)

  1. Ludwig, B.: Spracherkennung (2013) 1.05
    1.0465145 = sum of:
      1.0465145 = product of:
        6.279087 = sum of:
          6.279087 = weight(title_txt:spracherkennung in 723) [ClassicSimilarity], result of:
            6.279087 = score(doc=723,freq=1.0), product of:
              0.6439444 = queryWeight, product of:
                2.4891324 = boost
                9.7509775 = idf(docFreq=6, maxDocs=44218)
                0.026530914 = queryNorm
              9.7509775 = fieldWeight in 723, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.7509775 = idf(docFreq=6, maxDocs=44218)
                1.0 = fieldNorm(doc=723)
        0.16666667 = coord(1/6)
    
  2. Susen, A.: Spracherkennung : Aktuelle Einsatzmöglichkeiten im Bereich der Telekommunikation (2000) 0.80
    0.7968817 = sum of:
      0.7968817 = product of:
        2.390645 = sum of:
          0.035987157 = weight(abstract_txt:sind in 5555) [ClassicSimilarity], result of:
            0.035987157 = score(doc=5555,freq=2.0), product of:
              0.10393274 = queryWeight, product of:
                3.9174201 = idf(docFreq=2390, maxDocs=44218)
                0.026530914 = queryNorm
              0.3462543 = fieldWeight in 5555, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                3.9174201 = idf(docFreq=2390, maxDocs=44218)
                0.0625 = fieldNorm(doc=5555)
          2.354658 = weight(title_txt:spracherkennung in 5555) [ClassicSimilarity], result of:
            2.354658 = score(doc=5555,freq=1.0), product of:
              0.6439444 = queryWeight, product of:
                2.4891324 = boost
                9.7509775 = idf(docFreq=6, maxDocs=44218)
                0.026530914 = queryNorm
              3.6566167 = fieldWeight in 5555, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.7509775 = idf(docFreq=6, maxDocs=44218)
                0.375 = fieldNorm(doc=5555)
        0.33333334 = coord(2/6)
    
  3. Endres-Niggemeyer, B.: Thinkie: Lautes Denken mit Spracherkennung (mobil) (2013) 0.80
    0.7954888 = sum of:
      0.7954888 = product of:
        2.3864663 = sum of:
          0.031808455 = weight(abstract_txt:sind in 1145) [ClassicSimilarity], result of:
            0.031808455 = score(doc=1145,freq=1.0), product of:
              0.10393274 = queryWeight, product of:
                3.9174201 = idf(docFreq=2390, maxDocs=44218)
                0.026530914 = queryNorm
              0.30604845 = fieldWeight in 1145, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                3.9174201 = idf(docFreq=2390, maxDocs=44218)
                0.078125 = fieldNorm(doc=1145)
          2.354658 = weight(title_txt:spracherkennung in 1145) [ClassicSimilarity], result of:
            2.354658 = score(doc=1145,freq=1.0), product of:
              0.6439444 = queryWeight, product of:
                2.4891324 = boost
                9.7509775 = idf(docFreq=6, maxDocs=44218)
                0.026530914 = queryNorm
              3.6566167 = fieldWeight in 1145, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.7509775 = idf(docFreq=6, maxDocs=44218)
                0.375 = fieldNorm(doc=1145)
        0.33333334 = coord(2/6)
    
  4. Maschinelle Spracherkennung (1994) 0.65
    0.65407157 = sum of:
      0.65407157 = product of:
        3.9244294 = sum of:
          3.9244294 = weight(title_txt:spracherkennung in 7147) [ClassicSimilarity], result of:
            3.9244294 = score(doc=7147,freq=1.0), product of:
              0.6439444 = queryWeight, product of:
                2.4891324 = boost
                9.7509775 = idf(docFreq=6, maxDocs=44218)
                0.026530914 = queryNorm
              6.094361 = fieldWeight in 7147, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.7509775 = idf(docFreq=6, maxDocs=44218)
                0.625 = fieldNorm(doc=7147)
        0.16666667 = coord(1/6)
    
  5. Kókai, G.: Erfolge und Probleme evolutionärer Algorithmen, induktiver logischer Programmierung und ihrer Kombination (2002) 0.28
    0.282555 = sum of:
      0.282555 = product of:
        0.56511 = sum of:
          0.025446763 = weight(abstract_txt:sind in 4108) [ClassicSimilarity], result of:
            0.025446763 = score(doc=4108,freq=1.0), product of:
              0.10393274 = queryWeight, product of:
                3.9174201 = idf(docFreq=2390, maxDocs=44218)
                0.026530914 = queryNorm
              0.24483876 = fieldWeight in 4108, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                3.9174201 = idf(docFreq=2390, maxDocs=44218)
                0.0625 = fieldNorm(doc=4108)
          0.122805 = weight(abstract_txt:programme in 4108) [ClassicSimilarity], result of:
            0.122805 = score(doc=4108,freq=2.0), product of:
              0.23557618 = queryWeight, product of:
                1.5055304 = boost
                5.8977947 = idf(docFreq=329, maxDocs=44218)
                0.026530914 = queryNorm
              0.5212963 = fieldWeight in 4108, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                5.8977947 = idf(docFreq=329, maxDocs=44218)
                0.0625 = fieldNorm(doc=4108)
          0.4168583 = weight(abstract_txt:anpassen in 4108) [ClassicSimilarity], result of:
            0.4168583 = score(doc=4108,freq=2.0), product of:
              0.53208333 = queryWeight, product of:
                2.2626305 = boost
                8.863674 = idf(docFreq=16, maxDocs=44218)
                0.026530914 = queryNorm
              0.7834455 = fieldWeight in 4108, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                8.863674 = idf(docFreq=16, maxDocs=44218)
                0.0625 = fieldNorm(doc=4108)
        0.5 = coord(3/6)