Document (#30913)

Author
Winterschladen, S.
Gurevych, I.
Title
¬Die perfekte Suchmaschine : Forschungsgruppe entwickelt ein System, das artverwandte Begriffe finden soll
Issue
Interview
Source
Kölner Stadtanzeiger. Nr.191 vom 18.8.2006, Magazin S.7
Year
2006
Series
Technik
Content
"KÖLNER STADT-ANZEIGER: Frau Gurevych, Sie entwickeln eine Suchmaschine der nächsten Generation? Wie kann man sich diese vorstellen? IRYNA GUREVYCH Jeder kennt die herkömmlichen Suchmaschinen wie Google, Yahoo oder Altavista. Diese sind aber nicht perfekt, weil sie nur nach dem Prinzip der Zeichenerkennung funktionieren. Das steigende Informationsbedürfnis können herkömmliche Suchmaschinen nicht befriedigen. KStA: Wieso nicht? GUREVYCH Nehmen wir mal ein konkretes Beispiel: Sie suchen bei Google nach einem Rezept für einen Kuchen, der aber kein Obst enthalten soll. Keine Suchmaschine der Welt kann bisher sinnvoll solche oder ähnliche Anfragen ausführen. Meistens kommen Tausende von Ergebnissen, in denen der Nutzer die relevanten Informationen wie eine Nadel im Heuhaufen suchen muss. KStA: Und Sie können dieses Problem lösen? GUREVYCH Wir entwickeln eine Suchmaschine, die sich nicht nur auf das System der Zeichenerkennung verlässt, sondern auch linguistische Merkmale nutzt. Unsere Suchmaschine soll also auch artverwandte Begriffe zeigen. KStA: Wie weit sind Sie mit Ihrer Forschung? GUREVYCH Das Projekt ist auf zwei Jahre angelegt. Wir haben vor einem halben Jahr begonnen, haben also noch einen großen Teil vor uns. Trotzdem sind die ersten Zwischenergebnisse schon sehr beachtlich. KStA: Und wann geht die Suchmaschine ins Internet? GUREVYCH Da es sich um ein Projekt der Deutschen Forschungsgemeinschaft handelt, wird die Suchmaschine vorerst nicht veröffentlicht. Wir sehen es als unsere Aufgabe an, Verbesserungsmöglichkeiten durch schlaue Such-Algorithmen mit unseren Forschungsarbeiten nachzuweisen und Fehler der bekannten Suchmaschinen zu beseitigen. Und da sind wir auf einem guten Weg. KStA: Arbeiten Sie auch an einem ganz speziellen Projekt? GUREVYCH Ja, ihre erste Bewährungsprobe muss die neue Technologie auf einem auf den ersten Blick ungewöhnlichen Feld bestehen: Unsere Forschungsgruppe an der Technischen Universität Darmstadt entwickelt derzeit ein neuartiges System zur Unterstützung Jugendlicher bei der Berufsauswahl. Dazu stellt uns die Bundesagentur für Arbeit die Beschreibungen von 5800 Berufen in Deutschland zur Verfügung. KStA: Und was sollen Sie dann mit diesen konkreten Informationen machen? GUREVYCH Jugendliche sollen unsere Suchmaschine mit einem Aufsatz über ihre beruflichen Vorlieben flittern. Das System soll dann eine Suchabfrage starten und mögliche Berufe anhand des Interesses des Jugendlichen heraussuchen. Die persönliche Beratung durch die Bundesagentur für Arbeit kann dadurch auf alternative Angebote ausgeweitet werden. Ein erster Prototyp soll Ende des Jahres bereitstehen. KStA: Es geht also zunächst einmal nicht darum, einen Jobfür den Jugendlichen zu finden, sondern den perfekten Beruf für ihn zu ermitteln? GUREVYCH Ja, anhand der Beschreibung des Jugendlichen startet die Suchmaschine eine semantische Abfrage und sucht den passenden Beruf heraus. KStA: Gab es schon weitere Anfragen seitens der Industrie? GUREVYCH Nein, wir haben bisher noch keine Werbung betrieben. Meine Erfahrung zeigt, dass angesehene Kongresse die beste Plattform sind, um die Ergebnisse zu präsentieren und auf sich aufmerksam zu machen. Einige erste Veröffentlichungen sind bereits unterwegs und werden 2006 noch erscheinen. KStA: Wie sieht denn Ihrer Meinung nach die Suchmaschine der Zukunft aus? GUREVYCH Suchmaschinen werden immer spezieller. Das heißt, dass es etwa in der Medizin, bei den Krankenkassen oder im Sport eigene Suchmaschinen geben wird. Außerdem wird die Tendenz verstärkt zu linguistischen Suchmaschinen gehen, die nach artverwandten Begriffen fahnden. Die perfekte Suchmaschine wird wohl eine Kombination aus statistischem und linguistisch-semantischem Suchverhalten sein. Algorithmen, die wir am Fachgebiet Telekooperation an der TU Darmstadt entwickeln, werden für den nächsten qualitativen Sprung bei der Entwicklung der Suchmaschinen von größter Bedeutung sein."
Theme
Suchmaschinen
Computerlinguistik

Similar documents (content)

  1. Hoffmann, L.: Reflexionen über die Sprache : de Saussure, Chomsky, Bühler (2005) 0.20
    0.20093837 = sum of:
      0.20093837 = product of:
        0.8037535 = sum of:
          0.11922941 = weight(abstract_txt:soll in 4068) [ClassicSimilarity], result of:
            0.11922941 = score(doc=4068,freq=1.0), product of:
              0.18180701 = queryWeight, product of:
                1.5557345 = boost
                5.2464166 = idf(docFreq=632, maxDocs=44218)
                0.022274727 = queryNorm
              0.6558021 = fieldWeight in 4068, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.2464166 = idf(docFreq=632, maxDocs=44218)
                0.125 = fieldNorm(doc=4068)
          0.68452406 = weight(abstract_txt:forschungsgruppe in 4068) [ClassicSimilarity], result of:
            0.68452406 = score(doc=4068,freq=1.0), product of:
              0.582927 = queryWeight, product of:
                2.7857187 = boost
                9.394302 = idf(docFreq=9, maxDocs=44218)
                0.022274727 = queryNorm
              1.1742878 = fieldWeight in 4068, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.394302 = idf(docFreq=9, maxDocs=44218)
                0.125 = fieldNorm(doc=4068)
        0.25 = coord(2/8)
    
  2. Lehrke, C.: Architektur von Suchmaschinen : Googles Architektur, insb. Crawler und Indizierer (2005) 0.19
    0.19338787 = sum of:
      0.19338787 = product of:
        0.38677573 = sum of:
          0.059614707 = weight(abstract_txt:soll in 867) [ClassicSimilarity], result of:
            0.059614707 = score(doc=867,freq=1.0), product of:
              0.18180701 = queryWeight, product of:
                1.5557345 = boost
                5.2464166 = idf(docFreq=632, maxDocs=44218)
                0.022274727 = queryNorm
              0.32790104 = fieldWeight in 867, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.2464166 = idf(docFreq=632, maxDocs=44218)
                0.0625 = fieldNorm(doc=867)
          0.09869775 = weight(abstract_txt:entwickelt in 867) [ClassicSimilarity], result of:
            0.09869775 = score(doc=867,freq=2.0), product of:
              0.20194659 = queryWeight, product of:
                1.6396396 = boost
                5.529371 = idf(docFreq=476, maxDocs=44218)
                0.022274727 = queryNorm
              0.48873195 = fieldWeight in 867, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                5.529371 = idf(docFreq=476, maxDocs=44218)
                0.0625 = fieldNorm(doc=867)
          0.074067265 = weight(abstract_txt:finden in 867) [ClassicSimilarity], result of:
            0.074067265 = score(doc=867,freq=1.0), product of:
              0.21011604 = queryWeight, product of:
                1.6724755 = boost
                5.6401033 = idf(docFreq=426, maxDocs=44218)
                0.022274727 = queryNorm
              0.35250646 = fieldWeight in 867, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.6401033 = idf(docFreq=426, maxDocs=44218)
                0.0625 = fieldNorm(doc=867)
          0.15439601 = weight(abstract_txt:suchmaschine in 867) [ClassicSimilarity], result of:
            0.15439601 = score(doc=867,freq=2.0), product of:
              0.2721379 = queryWeight, product of:
                1.9033765 = boost
                6.4187727 = idf(docFreq=195, maxDocs=44218)
                0.022274727 = queryNorm
              0.5673447 = fieldWeight in 867, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                6.4187727 = idf(docFreq=195, maxDocs=44218)
                0.0625 = fieldNorm(doc=867)
        0.5 = coord(4/8)
    
  3. Hummingbird Neuer Suchalgorithmus bei Google (2013) 0.17
    0.17458439 = sum of:
      0.17458439 = product of:
        0.46555838 = sum of:
          0.10538491 = weight(abstract_txt:soll in 2520) [ClassicSimilarity], result of:
            0.10538491 = score(doc=2520,freq=2.0), product of:
              0.18180701 = queryWeight, product of:
                1.5557345 = boost
                5.2464166 = idf(docFreq=632, maxDocs=44218)
                0.022274727 = queryNorm
              0.5796526 = fieldWeight in 2520, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                5.2464166 = idf(docFreq=632, maxDocs=44218)
                0.078125 = fieldNorm(doc=2520)
          0.08723731 = weight(abstract_txt:entwickelt in 2520) [ClassicSimilarity], result of:
            0.08723731 = score(doc=2520,freq=1.0), product of:
              0.20194659 = queryWeight, product of:
                1.6396396 = boost
                5.529371 = idf(docFreq=476, maxDocs=44218)
                0.022274727 = queryNorm
              0.4319821 = fieldWeight in 2520, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.529371 = idf(docFreq=476, maxDocs=44218)
                0.078125 = fieldNorm(doc=2520)
          0.27293617 = weight(abstract_txt:suchmaschine in 2520) [ClassicSimilarity], result of:
            0.27293617 = score(doc=2520,freq=4.0), product of:
              0.2721379 = queryWeight, product of:
                1.9033765 = boost
                6.4187727 = idf(docFreq=195, maxDocs=44218)
                0.022274727 = queryNorm
              1.0029333 = fieldWeight in 2520, product of:
                2.0 = tf(freq=4.0), with freq of:
                  4.0 = termFreq=4.0
                6.4187727 = idf(docFreq=195, maxDocs=44218)
                0.078125 = fieldNorm(doc=2520)
        0.375 = coord(3/8)
    
  4. Frühwald, W.: Vor uns die Cyber-Sintflut (1996) 0.17
    0.16745095 = sum of:
      0.16745095 = product of:
        1.3396076 = sum of:
          1.3396076 = weight(abstract_txt:perfekte in 5490) [ClassicSimilarity], result of:
            1.3396076 = score(doc=5490,freq=1.0), product of:
              0.62803143 = queryWeight, product of:
                2.8914845 = boost
                9.7509775 = idf(docFreq=6, maxDocs=44218)
                0.022274727 = queryNorm
              2.1330264 = fieldWeight in 5490, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                9.7509775 = idf(docFreq=6, maxDocs=44218)
                0.21875 = fieldNorm(doc=5490)
        0.125 = coord(1/8)
    
  5. Jesdanun, A.: Streitbare Suchmaschine : Polar Rose ermöglicht Internet-Recherche mit Gesichtserkennung (2007) 0.16
    0.15656717 = sum of:
      0.15656717 = product of:
        0.31313434 = sum of:
          0.052162867 = weight(abstract_txt:soll in 547) [ClassicSimilarity], result of:
            0.052162867 = score(doc=547,freq=1.0), product of:
              0.18180701 = queryWeight, product of:
                1.5557345 = boost
                5.2464166 = idf(docFreq=632, maxDocs=44218)
                0.022274727 = queryNorm
              0.2869134 = fieldWeight in 547, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.2464166 = idf(docFreq=632, maxDocs=44218)
                0.0546875 = fieldNorm(doc=547)
          0.061066117 = weight(abstract_txt:entwickelt in 547) [ClassicSimilarity], result of:
            0.061066117 = score(doc=547,freq=1.0), product of:
              0.20194659 = queryWeight, product of:
                1.6396396 = boost
                5.529371 = idf(docFreq=476, maxDocs=44218)
                0.022274727 = queryNorm
              0.30238748 = fieldWeight in 547, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.529371 = idf(docFreq=476, maxDocs=44218)
                0.0546875 = fieldNorm(doc=547)
          0.06480885 = weight(abstract_txt:finden in 547) [ClassicSimilarity], result of:
            0.06480885 = score(doc=547,freq=1.0), product of:
              0.21011604 = queryWeight, product of:
                1.6724755 = boost
                5.6401033 = idf(docFreq=426, maxDocs=44218)
                0.022274727 = queryNorm
              0.30844316 = fieldWeight in 547, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.6401033 = idf(docFreq=426, maxDocs=44218)
                0.0546875 = fieldNorm(doc=547)
          0.1350965 = weight(abstract_txt:suchmaschine in 547) [ClassicSimilarity], result of:
            0.1350965 = score(doc=547,freq=2.0), product of:
              0.2721379 = queryWeight, product of:
                1.9033765 = boost
                6.4187727 = idf(docFreq=195, maxDocs=44218)
                0.022274727 = queryNorm
              0.49642664 = fieldWeight in 547, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                6.4187727 = idf(docFreq=195, maxDocs=44218)
                0.0546875 = fieldNorm(doc=547)
        0.5 = coord(4/8)