Search (4 results, page 1 of 1)

  • × author_ss:"Heyer, G."
  1. Heyer, G.; Quasthoff, U.; Wolff, C.: Aiding Web searches by statistical classification tools (2000) 0.01
    0.0069121853 = product of:
      0.048385296 = sum of:
        0.040167104 = weight(_text_:web in 5488) [ClassicSimilarity], result of:
          0.040167104 = score(doc=5488,freq=4.0), product of:
            0.09846355 = queryWeight, product of:
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.030171053 = queryNorm
            0.4079388 = fieldWeight in 5488, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.0625 = fieldNorm(doc=5488)
        0.008218191 = weight(_text_:information in 5488) [ClassicSimilarity], result of:
          0.008218191 = score(doc=5488,freq=2.0), product of:
            0.052964617 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.030171053 = queryNorm
            0.1551638 = fieldWeight in 5488, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.0625 = fieldNorm(doc=5488)
      0.14285715 = coord(2/14)
    
    Abstract
    We describe an infrastructure for the collection and management of large amounts of text, and discuss the possibility of information extraction and visualisation from text corpora with statistical methods. The paper gives an overview of processing steps, the contents of our text databases as well as different query facilities. Our focus is on the extraction and visualisation of collocations and their usage for aiding web searches
  2. Greinoecker, A.; Seaward, L; Terras, M.; Ares Oliveira, S.; Bosch, V.; Bryan, M.; Colutto, S.; Déjean, H.; Diem, M.; Fiel, S.; Gatos, B.; Grüning, T.; Hackl, G.; Haukkovaara, V.; Heyer, G.; Hirvonen, L.; Hodel, T.; Jokinen, M.; Kahle, P.; Kallio, M.; Kaplan, F.; Kleber, F.; Labahn, R.; Lang, E.M.; Laube, S.; Leifert, G.; Louloudis, G.; McNicholl, R.; Meunier, J.-L.; Michael, J.; Mühlbauer, E.; Philipp, N.; Pratikakis, I.; Pérez, J.P.; Putz, H.; Retsinas, G.; Romero, V.; Sablatnig, R.; Sánchez, J.A.; Schofield, P.; Sfikas, G.; Sieber, C.; Stamatopoulos, N.; Tobias Strauß, T.; Terbul, T.; Ulreich, B; Villegas, M.; Vidal, E.; Walcher, J.; Weidemann, M.; Wurster, H.; Zagoris, K.; Toselli, A.H.; Muehlberger, G,: Transforming scholarship in the archives through handwritten text recognition (2019) 0.00
    0.0043265144 = product of:
      0.0302856 = sum of:
        0.026176505 = weight(_text_:wide in 5458) [ClassicSimilarity], result of:
          0.026176505 = score(doc=5458,freq=2.0), product of:
            0.13368066 = queryWeight, product of:
              4.4307585 = idf(docFreq=1430, maxDocs=44218)
              0.030171053 = queryNorm
            0.1958137 = fieldWeight in 5458, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.4307585 = idf(docFreq=1430, maxDocs=44218)
              0.03125 = fieldNorm(doc=5458)
        0.0041090953 = weight(_text_:information in 5458) [ClassicSimilarity], result of:
          0.0041090953 = score(doc=5458,freq=2.0), product of:
            0.052964617 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.030171053 = queryNorm
            0.0775819 = fieldWeight in 5458, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.03125 = fieldNorm(doc=5458)
      0.14285715 = coord(2/14)
    
    Abstract
    Purpose An overview of the current use of handwritten text recognition (HTR) on archival manuscript material, as provided by the EU H2020 funded Transkribus platform. It explains HTR, demonstrates Transkribus, gives examples of use cases, highlights the affect HTR may have on scholarship, and evidences this turning point of the advanced use of digitised heritage content. The paper aims to discuss these issues. Design/methodology/approach This paper adopts a case study approach, using the development and delivery of the one openly available HTR platform for manuscript material. Findings Transkribus has demonstrated that HTR is now a useable technology that can be employed in conjunction with mass digitisation to generate accurate transcripts of archival material. Use cases are demonstrated, and a cooperative model is suggested as a way to ensure sustainability and scaling of the platform. However, funding and resourcing issues are identified. Research limitations/implications The paper presents results from projects: further user studies could be undertaken involving interviews, surveys, etc. Practical implications Only HTR provided via Transkribus is covered: however, this is the only publicly available platform for HTR on individual collections of historical documents at time of writing and it represents the current state-of-the-art in this field. Social implications The increased access to information contained within historical texts has the potential to be transformational for both institutions and individuals. Originality/value This is the first published overview of how HTR is used by a wide archival studies community, reporting and showcasing current application of handwriting technology in the cultural heritage sector.
  3. Heyer, G.; Quasthoff, U.; Wittig, T.: Text Mining : Wissensrohstoff Text. Konzepte, Algorithmen, Ergebnisse (2006) 0.00
    0.0014345396 = product of:
      0.020083552 = sum of:
        0.020083552 = weight(_text_:web in 5218) [ClassicSimilarity], result of:
          0.020083552 = score(doc=5218,freq=4.0), product of:
            0.09846355 = queryWeight, product of:
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.030171053 = queryNorm
            0.2039694 = fieldWeight in 5218, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              3.2635105 = idf(docFreq=4597, maxDocs=44218)
              0.03125 = fieldNorm(doc=5218)
      0.071428575 = coord(1/14)
    
    Abstract
    Ein großer Teil des Weltwissens befindet sich in Form digitaler Texte im Internet oder in Intranets. Heutige Suchmaschinen nutzen diesen Wissensrohstoff nur rudimentär: Sie können semantische Zusammen-hänge nur bedingt erkennen. Alle warten auf das semantische Web, in dem die Ersteller von Text selbst die Semantik einfügen. Das wird aber noch lange dauern. Es gibt jedoch eine Technologie, die es bereits heute ermöglicht semantische Zusammenhänge in Rohtexten zu analysieren und aufzubereiten. Das Forschungsgebiet "Text Mining" ermöglicht es mit Hilfe statistischer und musterbasierter Verfahren, Wissen aus Texten zu extrahieren, zu verarbeiten und zu nutzen. Hier wird die Basis für die Suchmaschinen der Zukunft gelegt. Das erste deutsche Lehrbuch zu einer bahnbrechenden Technologie: Text Mining: Wissensrohstoff Text Konzepte, Algorithmen, Ergebnisse Ein großer Teil des Weltwissens befindet sich in Form digitaler Texte im Internet oder in Intranets. Heutige Suchmaschinen nutzen diesen Wissensrohstoff nur rudimentär: Sie können semantische Zusammen-hänge nur bedingt erkennen. Alle warten auf das semantische Web, in dem die Ersteller von Text selbst die Semantik einfügen. Das wird aber noch lange dauern. Es gibt jedoch eine Technologie, die es bereits heute ermöglicht semantische Zusammenhänge in Rohtexten zu analysieren und aufzubereiten. Das For-schungsgebiet "Text Mining" ermöglicht es mit Hilfe statistischer und musterbasierter Verfahren, Wissen aus Texten zu extrahieren, zu verarbeiten und zu nutzen. Hier wird die Basis für die Suchmaschinen der Zukunft gelegt. Was fällt Ihnen bei dem Wort "Stich" ein? Die einen denken an Tennis, die anderen an Skat. Die verschiedenen Zusammenhänge können durch Text Mining automatisch ermittelt und in Form von Wortnetzen dargestellt werden. Welche Begriffe stehen am häufigsten links und rechts vom Wort "Festplatte"? Welche Wortformen und Eigennamen treten seit 2001 neu in der deutschen Sprache auf? Text Mining beantwortet diese und viele weitere Fragen. Tauchen Sie mit diesem Lehrbuch ein in eine neue, faszinierende Wissenschaftsdisziplin und entdecken Sie neue, bisher unbekannte Zusammenhänge und Sichtweisen. Sehen Sie, wie aus dem Wissensrohstoff Text Wissen wird! Dieses Lehrbuch richtet sich sowohl an Studierende als auch an Praktiker mit einem fachlichen Schwerpunkt in der Informatik, Wirtschaftsinformatik und/oder Linguistik, die sich über die Grundlagen, Verfahren und Anwendungen des Text Mining informieren möchten und Anregungen für die Implementierung eigener Anwendungen suchen. Es basiert auf Arbeiten, die während der letzten Jahre an der Abteilung Automatische Sprachverarbeitung am Institut für Informatik der Universität Leipzig unter Leitung von Prof. Dr. Heyer entstanden sind. Eine Fülle praktischer Beispiele von Text Mining-Konzepten und -Algorithmen verhelfen dem Leser zu einem umfassenden, aber auch detaillierten Verständnis der Grundlagen und Anwendungen des Text Mining. Folgende Themen werden behandelt: Wissen und Text Grundlagen der Bedeutungsanalyse Textdatenbanken Sprachstatistik Clustering Musteranalyse Hybride Verfahren Beispielanwendungen Anhänge: Statistik und linguistische Grundlagen 360 Seiten, 54 Abb., 58 Tabellen und 95 Glossarbegriffe Mit kostenlosen e-learning-Kurs "Schnelleinstieg: Sprachstatistik" Zusätzlich zum Buch gibt es in Kürze einen Online-Zertifikats-Kurs mit Mentor- und Tutorunterstützung.
  4. Heyer, G.; Eckart, T.; Goldhahn, D.: Was sind IT-basierte Forschungsinfrastrukturen für die Geistes- und Sozialwissenschaften und wie können sie genutzt werden? (2015) 0.00
    5.8701367E-4 = product of:
      0.008218191 = sum of:
        0.008218191 = weight(_text_:information in 6179) [ClassicSimilarity], result of:
          0.008218191 = score(doc=6179,freq=2.0), product of:
            0.052964617 = queryWeight, product of:
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.030171053 = queryNorm
            0.1551638 = fieldWeight in 6179, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              1.7554779 = idf(docFreq=20772, maxDocs=44218)
              0.0625 = fieldNorm(doc=6179)
      0.071428575 = coord(1/14)
    
    Source
    Information - Wissenschaft und Praxis. 66(2015) H.5/6, S.295-303