Search (24 results, page 1 of 2)

  • × theme_ss:"Data Mining"
  1. Budzik, J.; Hammond, K.J.; Birnbaum, L.: Information access in context (2001) 0.03
    0.027458025 = product of:
      0.08237407 = sum of:
        0.08237407 = product of:
          0.16474815 = sum of:
            0.16474815 = weight(_text_:2001 in 3835) [ClassicSimilarity], result of:
              0.16474815 = score(doc=3835,freq=5.0), product of:
                0.15710425 = queryWeight, product of:
                  4.2877507 = idf(docFreq=1650, maxDocs=44218)
                  0.03664025 = queryNorm
                1.0486549 = fieldWeight in 3835, product of:
                  2.236068 = tf(freq=5.0), with freq of:
                    5.0 = termFreq=5.0
                  4.2877507 = idf(docFreq=1650, maxDocs=44218)
                  0.109375 = fieldNorm(doc=3835)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Source
    Knowledge-based systems. 14(2001) nos.1/2, S.37-53
    Year
    2001
  2. Medien-Informationsmanagement : Archivarische, dokumentarische, betriebswirtschaftliche, rechtliche und Berufsbild-Aspekte ; [Frühjahrstagung der Fachgruppe 7 im Jahr 2000 in Weimar und Folgetagung 2001 in Köln] (2003) 0.02
    0.019849373 = product of:
      0.059548117 = sum of:
        0.059548117 = sum of:
          0.044655375 = weight(_text_:2001 in 1833) [ClassicSimilarity], result of:
            0.044655375 = score(doc=1833,freq=8.0), product of:
              0.15710425 = queryWeight, product of:
                4.2877507 = idf(docFreq=1650, maxDocs=44218)
                0.03664025 = queryNorm
              0.2842404 = fieldWeight in 1833, product of:
                2.828427 = tf(freq=8.0), with freq of:
                  8.0 = termFreq=8.0
                4.2877507 = idf(docFreq=1650, maxDocs=44218)
                0.0234375 = fieldNorm(doc=1833)
          0.014892743 = weight(_text_:22 in 1833) [ClassicSimilarity], result of:
            0.014892743 = score(doc=1833,freq=2.0), product of:
              0.12830791 = queryWeight, product of:
                3.5018296 = idf(docFreq=3622, maxDocs=44218)
                0.03664025 = queryNorm
              0.116070345 = fieldWeight in 1833, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                3.5018296 = idf(docFreq=3622, maxDocs=44218)
                0.0234375 = fieldNorm(doc=1833)
      0.33333334 = coord(1/3)
    
    Abstract
    Als in den siebziger Jahren des vergangenen Jahrhunderts immer häufiger die Bezeichnung Informationsmanager für Leute propagiert wurde, die bis dahin als Dokumentare firmierten, wurde dies in den etablierten Kreisen der Archivare und Bibliothekare gelegentlich belächelt und als Zeichen einer Identitätskrise oder jedenfalls einer Verunsicherung des damit überschriebenen Berufsbilds gewertet. Für den Berufsstand der Medienarchivare/Mediendokumentare, die sich seit 1960 in der Fachgruppe 7 des Vereins, später Verbands deutscher Archivare (VdA) organisieren, gehörte diese Verortung im Zeichen neuer inhaltlicher Herausforderungen (Informationsflut) und Technologien (EDV) allerdings schon früh zu den Selbstverständlichkeiten des Berufsalltags. "Halt, ohne uns geht es nicht!" lautete die Überschrift eines Artikels im Verbandsorgan "Info 7", der sich mit der Einrichtung von immer mächtigeren Leitungsnetzen und immer schnelleren Datenautobahnen beschäftigte. Information, Informationsgesellschaft: diese Begriffe wurden damals fast nur im technischen Sinne verstanden. Die informatisierte, nicht die informierte Gesellschaft stand im Vordergrund - was wiederum Kritiker auf den Plan rief, von Joseph Weizenbaum in den USA bis hin zu den Informations-Ökologen in Bremen. Bei den nationalen, manchmal auch nur regionalen Projekten und Modellversuchen mit Datenautobahnen - auch beim frühen Btx - war nie so recht deutlich geworden, welche Inhalte in welcher Gestalt durch diese Netze und Straßen gejagt werden sollten und wer diese Inhalte eigentlich selektieren, portionieren, positionieren, kurz: managen sollte. Spätestens mit dem World Wide Web sind diese Projekte denn auch obsolet geworden, jedenfalls was die Hardware und Software anging. Geblieben ist das Thema Inhalte (neudeutsch: Content). Und - immer drängender im nicht nur technischen Verständnis - das Thema Informationsmanagement. MedienInformationsManagement war die Frühjahrstagung der Fachgruppe 7 im Jahr 2000 in Weimar überschrieben, und auch die Folgetagung 2001 in Köln, die der multimedialen Produktion einen dokumentarischen Pragmatismus gegenüber stellte, handelte vom Geschäftsfeld Content und von Content-Management-Systemen. Die in diesem 6. Band der Reihe Beiträge zur Mediendokumentation versammelten Vorträge und Diskussionsbeiträge auf diesen beiden Tagungen beleuchten das Titel-Thema aus den verschiedensten Blickwinkeln: archivarischen, dokumentarischen, kaufmännischen, berufsständischen und juristischen. Deutlich wird dabei, daß die Berufsbezeichnung Medienarchivarln/Mediendokumentarln ziemlich genau für all das steht, was heute mit sog. alten wie neuen Medien im organisatorischen, d.h. ordnenden und vermittelnden Sinne geschieht. Im besonderen Maße trifft dies auf das Internet und die aus ihm geborenen Intranets zu. Beide bedürfen genauso der ordnenden Hand, die sich an den alten Medien, an Buch, Zeitung, Tonträger, Film etc. geschult hat, denn sie leben zu großen Teilen davon. Daß das Internet gleichwohl ein Medium sui generis ist und die alten Informationsberufe vor ganz neue Herausforderungen stellt - auch das durchzieht die Beiträge von Weimar und Köln.
    Content
    Enthält u.a. die Beiträge (Dokumentarische Aspekte): Günter Perers/Volker Gaese: Das DocCat-System in der Textdokumentation von Gr+J (Weimar 2000) Thomas Gerick: Finden statt suchen. Knowledge Retrieval in Wissensbanken. Mit organisiertem Wissen zu mehr Erfolg (Weimar 2000) Winfried Gödert: Aufbereitung und Rezeption von Information (Weimar 2000) Elisabeth Damen: Klassifikation als Ordnungssystem im elektronischen Pressearchiv (Köln 2001) Clemens Schlenkrich: Aspekte neuer Regelwerksarbeit - Multimediales Datenmodell für ARD und ZDF (Köln 2001) Josef Wandeler: Comprenez-vous only Bahnhof'? - Mehrsprachigkeit in der Mediendokumentation (Köln 200 1)
    Date
    11. 5.2008 19:49:22
  3. Witten, I.H.; Frank, E.: Data Mining : Praktische Werkzeuge und Techniken für das maschinelle Lernen (2000) 0.01
    0.014885126 = product of:
      0.044655375 = sum of:
        0.044655375 = product of:
          0.08931075 = sum of:
            0.08931075 = weight(_text_:2001 in 6833) [ClassicSimilarity], result of:
              0.08931075 = score(doc=6833,freq=2.0), product of:
                0.15710425 = queryWeight, product of:
                  4.2877507 = idf(docFreq=1650, maxDocs=44218)
                  0.03664025 = queryNorm
                0.5684808 = fieldWeight in 6833, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  4.2877507 = idf(docFreq=1650, maxDocs=44218)
                  0.09375 = fieldNorm(doc=6833)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Footnote
    Rez. in: nfd 52(2001), H.7, S.427-428 (T. Mandl)
  4. Loh, S.; Oliveira, J.P.M. de; Gastal, F.L.: Knowledge discovery in textual documentation : qualitative and quantitative analyses (2001) 0.01
    0.0117677245 = product of:
      0.03530317 = sum of:
        0.03530317 = product of:
          0.07060634 = sum of:
            0.07060634 = weight(_text_:2001 in 4482) [ClassicSimilarity], result of:
              0.07060634 = score(doc=4482,freq=5.0), product of:
                0.15710425 = queryWeight, product of:
                  4.2877507 = idf(docFreq=1650, maxDocs=44218)
                  0.03664025 = queryNorm
                0.44942352 = fieldWeight in 4482, product of:
                  2.236068 = tf(freq=5.0), with freq of:
                    5.0 = termFreq=5.0
                  4.2877507 = idf(docFreq=1650, maxDocs=44218)
                  0.046875 = fieldNorm(doc=4482)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Source
    Journal of documentation. 57(2001) no.5, S.577-590
    Year
    2001
  5. Gluck , M.: Multimedia exploratory data analysis for geospatial data mining : the case for augmented seriation (2001) 0.01
    0.0117677245 = product of:
      0.03530317 = sum of:
        0.03530317 = product of:
          0.07060634 = sum of:
            0.07060634 = weight(_text_:2001 in 5214) [ClassicSimilarity], result of:
              0.07060634 = score(doc=5214,freq=5.0), product of:
                0.15710425 = queryWeight, product of:
                  4.2877507 = idf(docFreq=1650, maxDocs=44218)
                  0.03664025 = queryNorm
                0.44942352 = fieldWeight in 5214, product of:
                  2.236068 = tf(freq=5.0), with freq of:
                    5.0 = termFreq=5.0
                  4.2877507 = idf(docFreq=1650, maxDocs=44218)
                  0.046875 = fieldNorm(doc=5214)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Source
    Journal of the American Society for Information Science and technology. 52(2001) no.8, S.686-696
    Year
    2001
  6. Chowdhury, G.G.: Template mining for information extraction from digital documents (1999) 0.01
    0.011583245 = product of:
      0.034749735 = sum of:
        0.034749735 = product of:
          0.06949947 = sum of:
            0.06949947 = weight(_text_:22 in 4577) [ClassicSimilarity], result of:
              0.06949947 = score(doc=4577,freq=2.0), product of:
                0.12830791 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03664025 = queryNorm
                0.5416616 = fieldWeight in 4577, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.109375 = fieldNorm(doc=4577)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Date
    2. 4.2000 18:01:22
  7. KDD : techniques and applications (1998) 0.01
    0.009928496 = product of:
      0.029785486 = sum of:
        0.029785486 = product of:
          0.059570972 = sum of:
            0.059570972 = weight(_text_:22 in 6783) [ClassicSimilarity], result of:
              0.059570972 = score(doc=6783,freq=2.0), product of:
                0.12830791 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03664025 = queryNorm
                0.46428138 = fieldWeight in 6783, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.09375 = fieldNorm(doc=6783)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Footnote
    A special issue of selected papers from the Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD'97), held Singapore, 22-23 Feb 1997
  8. Relational data mining (2001) 0.01
    0.009115241 = product of:
      0.02734572 = sum of:
        0.02734572 = product of:
          0.05469144 = sum of:
            0.05469144 = weight(_text_:2001 in 1303) [ClassicSimilarity], result of:
              0.05469144 = score(doc=1303,freq=3.0), product of:
                0.15710425 = queryWeight, product of:
                  4.2877507 = idf(docFreq=1650, maxDocs=44218)
                  0.03664025 = queryNorm
                0.34812197 = fieldWeight in 1303, product of:
                  1.7320508 = tf(freq=3.0), with freq of:
                    3.0 = termFreq=3.0
                  4.2877507 = idf(docFreq=1650, maxDocs=44218)
                  0.046875 = fieldNorm(doc=1303)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Year
    2001
  9. Matson, L.D.; Bonski, D.J.: Do digital libraries need librarians? (1997) 0.01
    0.006618997 = product of:
      0.019856991 = sum of:
        0.019856991 = product of:
          0.039713982 = sum of:
            0.039713982 = weight(_text_:22 in 1737) [ClassicSimilarity], result of:
              0.039713982 = score(doc=1737,freq=2.0), product of:
                0.12830791 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03664025 = queryNorm
                0.30952093 = fieldWeight in 1737, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0625 = fieldNorm(doc=1737)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Date
    22.11.1998 18:57:22
  10. Lusti, M.: Data Warehousing and Data Mining : Eine Einführung in entscheidungsunterstützende Systeme (1999) 0.01
    0.006618997 = product of:
      0.019856991 = sum of:
        0.019856991 = product of:
          0.039713982 = sum of:
            0.039713982 = weight(_text_:22 in 4261) [ClassicSimilarity], result of:
              0.039713982 = score(doc=4261,freq=2.0), product of:
                0.12830791 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03664025 = queryNorm
                0.30952093 = fieldWeight in 4261, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0625 = fieldNorm(doc=4261)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Date
    17. 7.2002 19:22:06
  11. Amir, A.; Feldman, R.; Kashi, R.: ¬A new and versatile method for association generation (1997) 0.01
    0.006618997 = product of:
      0.019856991 = sum of:
        0.019856991 = product of:
          0.039713982 = sum of:
            0.039713982 = weight(_text_:22 in 1270) [ClassicSimilarity], result of:
              0.039713982 = score(doc=1270,freq=2.0), product of:
                0.12830791 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03664025 = queryNorm
                0.30952093 = fieldWeight in 1270, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0625 = fieldNorm(doc=1270)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Source
    Information systems. 22(1997) nos.5/6, S.333-347
  12. Hofstede, A.H.M. ter; Proper, H.A.; Van der Weide, T.P.: Exploiting fact verbalisation in conceptual information modelling (1997) 0.01
    0.0057916227 = product of:
      0.017374868 = sum of:
        0.017374868 = product of:
          0.034749735 = sum of:
            0.034749735 = weight(_text_:22 in 2908) [ClassicSimilarity], result of:
              0.034749735 = score(doc=2908,freq=2.0), product of:
                0.12830791 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03664025 = queryNorm
                0.2708308 = fieldWeight in 2908, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0546875 = fieldNorm(doc=2908)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Source
    Information systems. 22(1997) nos.5/6, S.349-385
  13. Seidenfaden, U.: Schürfen in Datenbergen : Data-Mining soll möglichst viel Information zu Tage fördern (2001) 0.01
    0.0053172237 = product of:
      0.01595167 = sum of:
        0.01595167 = product of:
          0.03190334 = sum of:
            0.03190334 = weight(_text_:2001 in 6923) [ClassicSimilarity], result of:
              0.03190334 = score(doc=6923,freq=3.0), product of:
                0.15710425 = queryWeight, product of:
                  4.2877507 = idf(docFreq=1650, maxDocs=44218)
                  0.03664025 = queryNorm
                0.20307115 = fieldWeight in 6923, product of:
                  1.7320508 = tf(freq=3.0), with freq of:
                    3.0 = termFreq=3.0
                  4.2877507 = idf(docFreq=1650, maxDocs=44218)
                  0.02734375 = fieldNorm(doc=6923)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Year
    2001
  14. Lackes, R.; Tillmanns, C.: Data Mining für die Unternehmenspraxis : Entscheidungshilfen und Fallstudien mit führenden Softwarelösungen (2006) 0.00
    0.004964248 = product of:
      0.014892743 = sum of:
        0.014892743 = product of:
          0.029785486 = sum of:
            0.029785486 = weight(_text_:22 in 1383) [ClassicSimilarity], result of:
              0.029785486 = score(doc=1383,freq=2.0), product of:
                0.12830791 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03664025 = queryNorm
                0.23214069 = fieldWeight in 1383, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.046875 = fieldNorm(doc=1383)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Date
    22. 3.2008 14:46:06
  15. Klein, H.: Web Content Mining (2004) 0.00
    0.0049617086 = product of:
      0.014885125 = sum of:
        0.014885125 = product of:
          0.02977025 = sum of:
            0.02977025 = weight(_text_:2001 in 3154) [ClassicSimilarity], result of:
              0.02977025 = score(doc=3154,freq=2.0), product of:
                0.15710425 = queryWeight, product of:
                  4.2877507 = idf(docFreq=1650, maxDocs=44218)
                  0.03664025 = queryNorm
                0.1894936 = fieldWeight in 3154, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  4.2877507 = idf(docFreq=1650, maxDocs=44218)
                  0.03125 = fieldNorm(doc=3154)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Abstract
    Web Mining - ein Schlagwort, das mit der Verbreitung des Internets immer öfter zu lesen und zu hören ist. Die gegenwärtige Forschung beschäftigt sich aber eher mit dem Nutzungsverhalten der Internetnutzer, und ein Blick in Tagungsprogramme einschlägiger Konferenzen (z.B. GOR - German Online Research) zeigt, dass die Analyse der Inhalte kaum Thema ist. Auf der GOR wurden 1999 zwei Vorträge zu diesem Thema gehalten, auf der Folgekonferenz 2001 kein einziger. Web Mining ist der Oberbegriff für zwei Typen von Web Mining: Web Usage Mining und Web Content Mining. Unter Web Usage Mining versteht man das Analysieren von Daten, wie sie bei der Nutzung des WWW anfallen und von den Servern protokolliert wenden. Man kann ermitteln, welche Seiten wie oft aufgerufen wurden, wie lange auf den Seiten verweilt wurde und vieles andere mehr. Beim Web Content Mining wird der Inhalt der Webseiten untersucht, der nicht nur Text, sondern auf Bilder, Video- und Audioinhalte enthalten kann. Die Software für die Analyse von Webseiten ist in den Grundzügen vorhanden, doch müssen die meisten Webseiten für die entsprechende Analysesoftware erst aufbereitet werden. Zuerst müssen die relevanten Websites ermittelt werden, die die gesuchten Inhalte enthalten. Das geschieht meist mit Suchmaschinen, von denen es mittlerweile Hunderte gibt. Allerdings kann man nicht davon ausgehen, dass die Suchmaschinen alle existierende Webseiten erfassen. Das ist unmöglich, denn durch das schnelle Wachstum des Internets kommen täglich Tausende von Webseiten hinzu, und bereits bestehende ändern sich der werden gelöscht. Oft weiß man auch nicht, wie die Suchmaschinen arbeiten, denn das gehört zu den Geschäftsgeheimnissen der Betreiber. Man muss also davon ausgehen, dass die Suchmaschinen nicht alle relevanten Websites finden (können). Der nächste Schritt ist das Herunterladen der Websites, dafür gibt es Software, die unter den Bezeichnungen OfflineReader oder Webspider zu finden ist. Das Ziel dieser Programme ist, die Website in einer Form herunterzuladen, die es erlaubt, die Website offline zu betrachten. Die Struktur der Website wird in der Regel beibehalten. Wer die Inhalte einer Website analysieren will, muss also alle Dateien mit seiner Analysesoftware verarbeiten können. Software für Inhaltsanalyse geht davon aus, dass nur Textinformationen in einer einzigen Datei verarbeitet werden. QDA Software (qualitative data analysis) verarbeitet dagegen auch Audiound Videoinhalte sowie internetspezifische Kommunikation wie z.B. Chats.
  16. Heyer, G.; Quasthoff, U.; Wittig, T.: Text Mining : Wissensrohstoff Text. Konzepte, Algorithmen, Ergebnisse (2006) 0.00
    0.0049617086 = product of:
      0.014885125 = sum of:
        0.014885125 = product of:
          0.02977025 = sum of:
            0.02977025 = weight(_text_:2001 in 5218) [ClassicSimilarity], result of:
              0.02977025 = score(doc=5218,freq=2.0), product of:
                0.15710425 = queryWeight, product of:
                  4.2877507 = idf(docFreq=1650, maxDocs=44218)
                  0.03664025 = queryNorm
                0.1894936 = fieldWeight in 5218, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  4.2877507 = idf(docFreq=1650, maxDocs=44218)
                  0.03125 = fieldNorm(doc=5218)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Abstract
    Ein großer Teil des Weltwissens befindet sich in Form digitaler Texte im Internet oder in Intranets. Heutige Suchmaschinen nutzen diesen Wissensrohstoff nur rudimentär: Sie können semantische Zusammen-hänge nur bedingt erkennen. Alle warten auf das semantische Web, in dem die Ersteller von Text selbst die Semantik einfügen. Das wird aber noch lange dauern. Es gibt jedoch eine Technologie, die es bereits heute ermöglicht semantische Zusammenhänge in Rohtexten zu analysieren und aufzubereiten. Das Forschungsgebiet "Text Mining" ermöglicht es mit Hilfe statistischer und musterbasierter Verfahren, Wissen aus Texten zu extrahieren, zu verarbeiten und zu nutzen. Hier wird die Basis für die Suchmaschinen der Zukunft gelegt. Das erste deutsche Lehrbuch zu einer bahnbrechenden Technologie: Text Mining: Wissensrohstoff Text Konzepte, Algorithmen, Ergebnisse Ein großer Teil des Weltwissens befindet sich in Form digitaler Texte im Internet oder in Intranets. Heutige Suchmaschinen nutzen diesen Wissensrohstoff nur rudimentär: Sie können semantische Zusammen-hänge nur bedingt erkennen. Alle warten auf das semantische Web, in dem die Ersteller von Text selbst die Semantik einfügen. Das wird aber noch lange dauern. Es gibt jedoch eine Technologie, die es bereits heute ermöglicht semantische Zusammenhänge in Rohtexten zu analysieren und aufzubereiten. Das For-schungsgebiet "Text Mining" ermöglicht es mit Hilfe statistischer und musterbasierter Verfahren, Wissen aus Texten zu extrahieren, zu verarbeiten und zu nutzen. Hier wird die Basis für die Suchmaschinen der Zukunft gelegt. Was fällt Ihnen bei dem Wort "Stich" ein? Die einen denken an Tennis, die anderen an Skat. Die verschiedenen Zusammenhänge können durch Text Mining automatisch ermittelt und in Form von Wortnetzen dargestellt werden. Welche Begriffe stehen am häufigsten links und rechts vom Wort "Festplatte"? Welche Wortformen und Eigennamen treten seit 2001 neu in der deutschen Sprache auf? Text Mining beantwortet diese und viele weitere Fragen. Tauchen Sie mit diesem Lehrbuch ein in eine neue, faszinierende Wissenschaftsdisziplin und entdecken Sie neue, bisher unbekannte Zusammenhänge und Sichtweisen. Sehen Sie, wie aus dem Wissensrohstoff Text Wissen wird! Dieses Lehrbuch richtet sich sowohl an Studierende als auch an Praktiker mit einem fachlichen Schwerpunkt in der Informatik, Wirtschaftsinformatik und/oder Linguistik, die sich über die Grundlagen, Verfahren und Anwendungen des Text Mining informieren möchten und Anregungen für die Implementierung eigener Anwendungen suchen. Es basiert auf Arbeiten, die während der letzten Jahre an der Abteilung Automatische Sprachverarbeitung am Institut für Informatik der Universität Leipzig unter Leitung von Prof. Dr. Heyer entstanden sind. Eine Fülle praktischer Beispiele von Text Mining-Konzepten und -Algorithmen verhelfen dem Leser zu einem umfassenden, aber auch detaillierten Verständnis der Grundlagen und Anwendungen des Text Mining. Folgende Themen werden behandelt: Wissen und Text Grundlagen der Bedeutungsanalyse Textdatenbanken Sprachstatistik Clustering Musteranalyse Hybride Verfahren Beispielanwendungen Anhänge: Statistik und linguistische Grundlagen 360 Seiten, 54 Abb., 58 Tabellen und 95 Glossarbegriffe Mit kostenlosen e-learning-Kurs "Schnelleinstieg: Sprachstatistik" Zusätzlich zum Buch gibt es in Kürze einen Online-Zertifikats-Kurs mit Mentor- und Tutorunterstützung.
  17. Hallonsten, O.; Holmberg, D.: Analyzing structural stratification in the Swedish higher education system : data contextualization with policy-history analysis (2013) 0.00
    0.0041368734 = product of:
      0.01241062 = sum of:
        0.01241062 = product of:
          0.02482124 = sum of:
            0.02482124 = weight(_text_:22 in 668) [ClassicSimilarity], result of:
              0.02482124 = score(doc=668,freq=2.0), product of:
                0.12830791 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03664025 = queryNorm
                0.19345059 = fieldWeight in 668, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0390625 = fieldNorm(doc=668)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Date
    22. 3.2013 19:43:01
  18. Vaughan, L.; Chen, Y.: Data mining from web search queries : a comparison of Google trends and Baidu index (2015) 0.00
    0.0041368734 = product of:
      0.01241062 = sum of:
        0.01241062 = product of:
          0.02482124 = sum of:
            0.02482124 = weight(_text_:22 in 1605) [ClassicSimilarity], result of:
              0.02482124 = score(doc=1605,freq=2.0), product of:
                0.12830791 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03664025 = queryNorm
                0.19345059 = fieldWeight in 1605, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0390625 = fieldNorm(doc=1605)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Source
    Journal of the Association for Information Science and Technology. 66(2015) no.1, S.13-22
  19. Fonseca, F.; Marcinkowski, M.; Davis, C.: Cyber-human systems of thought and understanding (2019) 0.00
    0.0041368734 = product of:
      0.01241062 = sum of:
        0.01241062 = product of:
          0.02482124 = sum of:
            0.02482124 = weight(_text_:22 in 5011) [ClassicSimilarity], result of:
              0.02482124 = score(doc=5011,freq=2.0), product of:
                0.12830791 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03664025 = queryNorm
                0.19345059 = fieldWeight in 5011, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0390625 = fieldNorm(doc=5011)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Date
    7. 3.2019 16:32:22
  20. Peters, G.; Gaese, V.: ¬Das DocCat-System in der Textdokumentation von G+J (2003) 0.00
    0.0033094985 = product of:
      0.009928496 = sum of:
        0.009928496 = product of:
          0.019856991 = sum of:
            0.019856991 = weight(_text_:22 in 1507) [ClassicSimilarity], result of:
              0.019856991 = score(doc=1507,freq=2.0), product of:
                0.12830791 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03664025 = queryNorm
                0.15476047 = fieldWeight in 1507, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.03125 = fieldNorm(doc=1507)
          0.5 = coord(1/2)
      0.33333334 = coord(1/3)
    
    Date
    22. 4.2003 11:45:36

Languages

  • e 14
  • d 10

Types