Search (332 results, page 17 of 17)

Efthimiadis, E.N.: Interactive query expansion : a user-based evaluation in a relevance feedback environment (2000) 0.00

0.0010504998 = product of:
  0.0021009997 = sum of:
    0.0021009997 = product of:
      0.0042019994 = sum of:
        0.0042019994 = weight(_text_:e in 5701) [ClassicSimilarity], result of:
          0.0042019994 = score(doc=5701,freq=2.0), product of:
            0.06614887 = queryWeight, product of:
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.04602077 = queryNorm
            0.063523374 = fieldWeight in 5701, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.03125 = fieldNorm(doc=5701)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Language: e

Bar-Ilan, J.; Levene, M.; Mat-Hassan, M.: Methods for evaluating dynamic changes in search engine rankings : a case study (2006) 0.00

0.0010504998 = product of:
  0.0021009997 = sum of:
    0.0021009997 = product of:
      0.0042019994 = sum of:
        0.0042019994 = weight(_text_:e in 616) [ClassicSimilarity], result of:
          0.0042019994 = score(doc=616,freq=2.0), product of:
            0.06614887 = queryWeight, product of:
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.04602077 = queryNorm
            0.063523374 = fieldWeight in 616, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.03125 = fieldNorm(doc=616)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Language: e

Henzinger, M.R.: Link analysis in Web information retrieval (2000) 0.00

0.0010504998 = product of:
  0.0021009997 = sum of:
    0.0021009997 = product of:
      0.0042019994 = sum of:
        0.0042019994 = weight(_text_:e in 801) [ClassicSimilarity], result of:
          0.0042019994 = score(doc=801,freq=2.0), product of:
            0.06614887 = queryWeight, product of:
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.04602077 = queryNorm
            0.063523374 = fieldWeight in 801, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.03125 = fieldNorm(doc=801)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Language: e

Ackermann, J.: Knuth-Morris-Pratt (2005) 0.00
```
0.0010504998 = product of:
  0.0021009997 = sum of:
    0.0021009997 = product of:
      0.0042019994 = sum of:
        0.0042019994 = weight(_text_:e in 865) [ClassicSimilarity], result of:
          0.0042019994 = score(doc=865,freq=2.0), product of:
            0.06614887 = queryWeight, product of:
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.04602077 = queryNorm
            0.063523374 = fieldWeight in 865, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.03125 = fieldNorm(doc=865)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Im Rahmen des Seminars Suchmaschinen und Suchalgorithmen beschäftigt sich diese Arbeit mit dem Auffinden bestimmter Wörter oder Muster in Texten. Der Begriff "Text" wird hier in einem sehr allgemeinen Sinne als strukturierte Folge beliebiger Länge von Zeichen aus einem endlichen Alphabet verstanden. Somit fällt unter diesen Bereich ganz allgemein die Suche nach einem Muster in einer Sequenz von Zeichen. Beispiele hierfür sind neben der Suche von Wörtern in "literarischen" Texten, z.B. das Finden von Pixelfolgen in Bildern oder gar das Finden von Mustern in DNS-Strängen. Das Anwendungsgebiet für eine solche Suche ist weit gefächert. Man denke hier allein an Texteditoren, Literaturdatenbanken, digitale Lexika oder die besagte DNADatenbank. Betrachtet man allein das 1989 publizierte Oxford English Dictionary mit seinen etwa 616500 definierten Stichworten auf gedruckten 21728 Seiten, so gilt es, einen möglichst effizienten Algorithmus für die Suche in Texten zu nutzen. Der in der Arbeit zugrunde liegende Datentyp ist vom Typ String (Zeichenkette), wobei hier offen gelassen wird, wie der Datentyp programmtechnisch realisiert wird. Algorithmen zur Verarbeitung von Zeichenketten (string processing) umfassen ein bestimmtes Spektrum an Anwendungsgebieten [Ot96, S.617 f.], wie z.B. das Komprimieren, das Verschlüssen, das Analysieren (parsen), das Übersetzen von Texten sowie das Suchen in Texten, welches Thema dieses Seminars ist. Im Rahmen dieser Arbeit wird der Knuth-Morris-Pratt Algorithmus vorgestellt, der wie der ebenfalls in diesem Seminar vorgestellte Boyer-Moore Algorithmus einen effizienten Suchalgorithmus darstellt. Dabei soll ein gegebenes Suchwort oder Muster (pattern) in einer gegeben Zeichenkette erkannt werden (pattern matching). Gesucht werden dabei ein oder mehrere Vorkommen eines bestimmten Suchwortes (exact pattern matching). Der Knuth-Morris-Pratt Algorithmus wurde erstmals 1974 als Institutbericht der Stanford University beschrieben und erschien 1977 in der Fachzeitschrift Journal of Computing unter dem Titel "Fast Pattern Matching in Strings" [Kn77]. Der Algorithmus beschreibt eine Suche in Zeichenketten mit linearer Laufzeit. Der Name des Algorithmus setzt sich aus den Entwicklern des Algorithmus Donald E. Knuth, James H. Morris und Vaughan R. Pratt zusammen.

Berry, M.W.; Browne, M.: Understanding search engines : mathematical modeling and text retrieval (2005) 0.00

0.0010504998 = product of:
  0.0021009997 = sum of:
    0.0021009997 = product of:
      0.0042019994 = sum of:
        0.0042019994 = weight(_text_:e in 7) [ClassicSimilarity], result of:
          0.0042019994 = score(doc=7,freq=2.0), product of:
            0.06614887 = queryWeight, product of:
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.04602077 = queryNorm
            0.063523374 = fieldWeight in 7, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.03125 = fieldNorm(doc=7)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Language: e

Henzinger, M.R.: Hyperlink analysis for the Web (2001) 0.00

0.0010504998 = product of:
  0.0021009997 = sum of:
    0.0021009997 = product of:
      0.0042019994 = sum of:
        0.0042019994 = weight(_text_:e in 8) [ClassicSimilarity], result of:
          0.0042019994 = score(doc=8,freq=2.0), product of:
            0.06614887 = queryWeight, product of:
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.04602077 = queryNorm
            0.063523374 = fieldWeight in 8, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.03125 = fieldNorm(doc=8)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Language: e

Bilal, D.: Ranking, relevance judgment, and precision of information retrieval on children's queries : evaluation of Google, Yahoo!, Bing, Yahoo! Kids, and ask Kids (2012) 0.00

0.0010504998 = product of:
  0.0021009997 = sum of:
    0.0021009997 = product of:
      0.0042019994 = sum of:
        0.0042019994 = weight(_text_:e in 393) [ClassicSimilarity], result of:
          0.0042019994 = score(doc=393,freq=2.0), product of:
            0.06614887 = queryWeight, product of:
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.04602077 = queryNorm
            0.063523374 = fieldWeight in 393, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.03125 = fieldNorm(doc=393)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Language: e

Dadashkarimia, J.; Shakery, A.; Failia, H.; Zamani, H.: ¬An expectation-maximization algorithm for query translation based on pseudo-relevant documents (2017) 0.00

0.0010504998 = product of:
  0.0021009997 = sum of:
    0.0021009997 = product of:
      0.0042019994 = sum of:
        0.0042019994 = weight(_text_:e in 3296) [ClassicSimilarity], result of:
          0.0042019994 = score(doc=3296,freq=2.0), product of:
            0.06614887 = queryWeight, product of:
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.04602077 = queryNorm
            0.063523374 = fieldWeight in 3296, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.03125 = fieldNorm(doc=3296)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Language: e

Ayadi, H.; Torjmen-Khemakhem, M.; Daoud, M.; Xiangji Huang, J.; Ben Jemaa, M.: MF-Re-Rank : a modality feature-based re-ranking model for medical image retrieval (2018) 0.00

0.0010504998 = product of:
  0.0021009997 = sum of:
    0.0021009997 = product of:
      0.0042019994 = sum of:
        0.0042019994 = weight(_text_:e in 4459) [ClassicSimilarity], result of:
          0.0042019994 = score(doc=4459,freq=2.0), product of:
            0.06614887 = queryWeight, product of:
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.04602077 = queryNorm
            0.063523374 = fieldWeight in 4459, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.03125 = fieldNorm(doc=4459)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Language: e

Cross-language information retrieval (1998) 0.00
```
9.2851947E-4 = product of:
  0.0018570389 = sum of:
    0.0018570389 = product of:
      0.0037140779 = sum of:
        0.0037140779 = weight(_text_:e in 6299) [ClassicSimilarity], result of:
          0.0037140779 = score(doc=6299,freq=4.0), product of:
            0.06614887 = queryWeight, product of:
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.04602077 = queryNorm
            0.056147262 = fieldWeight in 6299, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.01953125 = fieldNorm(doc=6299)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Content

Enthält die Beiträge: GREFENSTETTE, G.: The Problem of Cross-Language Information Retrieval; DAVIS, M.W.: On the Effective Use of Large Parallel Corpora in Cross-Language Text Retrieval; BALLESTEROS, L. u. W.B. CROFT: Statistical Methods for Cross-Language Information Retrieval; Distributed Cross-Lingual Information Retrieval; Automatic Cross-Language Information Retrieval Using Latent Semantic Indexing; EVANS, D.A. u.a.: Mapping Vocabularies Using Latent Semantics; PICCHI, E. u. C. PETERS: Cross-Language Information Retrieval: A System for Comparable Corpus Querying; YAMABANA, K. u.a.: A Language Conversion Front-End for Cross-Language Information Retrieval; GACHOT, D.A. u.a.: The Systran NLP Browser: An Application of Machine Translation Technology in Cross-Language Information Retrieval; HULL, D.: A Weighted Boolean Model for Cross-Language Text Retrieval; SHERIDAN, P. u.a. Building a Large Multilingual Test Collection from Comparable News Documents; OARD; D.W. u. B.J. DORR: Evaluating Cross-Language Text Filtering Effectiveness

Language

e

Austin, D.: How Google finds your needle in the Web's haystack : as we'll see, the trick is to ask the web itself to rank the importance of pages... (2006) 0.00

9.191874E-4 = product of:
  0.0018383748 = sum of:
    0.0018383748 = product of:
      0.0036767495 = sum of:
        0.0036767495 = weight(_text_:e in 93) [ClassicSimilarity], result of:
          0.0036767495 = score(doc=93,freq=2.0), product of:
            0.06614887 = queryWeight, product of:
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.04602077 = queryNorm
            0.05558295 = fieldWeight in 93, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.02734375 = fieldNorm(doc=93)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Language: e

Effektive Information Retrieval Verfahren in Theorie und Praxis : ausgewählte und erweiterte Beiträge des Vierten Hildesheimer Evaluierungs- und Retrievalworkshop (HIER 2005), Hildesheim, 20.7.2005 (2006) 0.00
```
5.252499E-4 = product of:
  0.0010504998 = sum of:
    0.0010504998 = product of:
      0.0021009997 = sum of:
        0.0021009997 = weight(_text_:e in 5973) [ClassicSimilarity], result of:
          0.0021009997 = score(doc=5973,freq=2.0), product of:
            0.06614887 = queryWeight, product of:
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.04602077 = queryNorm
            0.031761687 = fieldWeight in 5973, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.43737 = idf(docFreq=28552, maxDocs=44218)
              0.015625 = fieldNorm(doc=5973)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Footnote

"Evaluierung", das Thema des dritten Kapitels, ist in seiner Breite nicht auf das Information Retrieval beschränkt sondern beinhaltet ebenso einzelne Aspekte der Bereiche Mensch-Maschine-Interaktion sowie des E-Learning. Michael Muck und Marco Winter von der Stiftung Wissenschaft und Politik sowie dem Informationszentrum Sozialwissenschaften thematisieren in ihrem Beitrag den Einfluss der Fragestellung (Topic) auf die Bewertung von Relevanz und zeigen Verfahrensweisen für die Topic-Erstellung auf, die beim Cross Language Evaluation Forum (CLEF) Anwendung finden. Im darauf folgenden Aufsatz stellt Thomas Mandl verschiedene Evaluierungsinitiativen im Information Retrieval und aktuelle Entwicklungen dar. Joachim Pfister erläutert in seinem Beitrag das automatisierte Gruppieren, das sogenannte Clustering, von Patent-Dokumenten in den Datenbanken des Fachinformationszentrums Karlsruhe und evaluiert unterschiedliche Clusterverfahren auf Basis von Nutzerbewertungen. Ralph Kölle, Glenn Langemeier und Wolfgang Semar widmen sich dem kollaborativen Lernen unter den speziellen Bedingungen des Programmierens. Dabei werden das System VitaminL zur synchronen Bearbeitung von Programmieraufgaben und das Kennzahlensystem K-3 für die Bewertung kollaborativer Zusammenarbeit in einer Lehrveranstaltung angewendet. Der aktuelle Forschungsschwerpunkt der Hildesheimer Informationswissenschaft zeichnet sich im vierten Kapitel unter dem Thema "Multilinguale Systeme" ab. Hier finden sich die meisten Beiträge des Tagungsbandes wieder. Olga Tartakovski und Margaryta Shramko beschreiben und prüfen das System Langldent, das die Sprache von mono- und multilingualen Texten identifiziert. Die Eigenheiten der japanischen Schriftzeichen stellt Nina Kummer dar und vergleicht experimentell die unterschiedlichen Techniken der Indexierung. Suriya Na Nhongkai und Hans-Joachim Bentz präsentieren und prüfen eine bilinguale Suche auf Basis von Konzeptnetzen, wobei die Konzeptstruktur das verbindende Elemente der beiden Textsammlungen darstellt. Das Entwickeln und Evaluieren eines mehrsprachigen Question-Answering-Systems im Rahmen des Cross Language Evaluation Forum (CLEF), das die alltagssprachliche Formulierung von konkreten Fragestellungen ermöglicht, wird im Beitrag von Robert Strötgen, Thomas Mandl und Rene Schneider thematisiert. Den Schluss bildet der Aufsatz von Niels Jensen, der ein mehrsprachiges Web-Retrieval-System ebenfalls im Zusammenhang mit dem CLEF anhand des multilingualen EuroGOVKorpus evaluiert.

Search (332 results, page 17 of 17)

Authors

Years

Languages

Types

Themes

Subjects

Classifications