Search (58 results, page 1 of 3)

Hölzig, C.: Google spürt Grippewellen auf : Die neue Anwendung ist bisher auf die USA beschränkt (2008) 0.03
```
0.028175205 = product of:
  0.05635041 = sum of:
    0.008412795 = weight(_text_:m in 2403) [ClassicSimilarity], result of:
      0.008412795 = score(doc=2403,freq=2.0), product of:
        0.07649739 = queryWeight, product of:
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.030740997 = queryNorm
        0.10997493 = fieldWeight in 2403, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.03125 = fieldNorm(doc=2403)
    0.047937613 = sum of:
      0.03127769 = weight(_text_:da in 2403) [ClassicSimilarity], result of:
        0.03127769 = score(doc=2403,freq=2.0), product of:
          0.1475006 = queryWeight, product of:
            4.7981725 = idf(docFreq=990, maxDocs=44218)
            0.030740997 = queryNorm
          0.21205126 = fieldWeight in 2403, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            4.7981725 = idf(docFreq=990, maxDocs=44218)
            0.03125 = fieldNorm(doc=2403)
      0.016659923 = weight(_text_:22 in 2403) [ClassicSimilarity], result of:
        0.016659923 = score(doc=2403,freq=2.0), product of:
          0.107649736 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.030740997 = queryNorm
          0.15476047 = fieldWeight in 2403, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.03125 = fieldNorm(doc=2403)
  0.5 = coord(2/4)
```
Content

"Vor Google gibt es kein Entrinnen. Nun macht sich die größte Internetsuchmaschine daran, auch gefährliche Grippewellen in den USA vorauszusagen - und das schneller als die US-Gesundheitsbehörde. In den Regionen, in denen die Influenza grassiert, häufen sich erfahrungsgemäß auch die Online-Anfragen im Internet speziell zu diesem Thema. "Wir haben einen engen Zusammenhang feststellen können zwischen Personen, die nach themenbezogenen Informationen suchen, und Personen, die tatsächlich an der Grippe erkrankt sind", schreibt Google. Ein Webtool namens "Google Flu Trends" errechnet aus den Anfragen die Ausbreitung von Grippeviren. Auch wenn nicht jeder Nutzer erkrankt sei, spiegele die Zahl der Anfragen doch ziemlich genau die Entwicklung einer Grippewelle wider. Das belege ein Vergleich mit den Daten der US-Seuchenkontrollbehörde CDC, die in den meisten Fällen nahezu identisch seien. Die Internet-Suchmaschine könne anders als die Gesundheitsbehörde täglich auf aktuelle Daten zurückgreifen. Dadurch sei Google in der Lage, die Grippesaison ein bis zwei Wochen früher vorherzusagen. Und Zeit bedeutet Leben, wie Lyn Finelli sagt, Leiter der Abteilung Influenza der USSeuchenkontrollbehörde: "Je früher wir gewarnt werden, desto früher können wir handeln. Dies kann die Anzahl der Erkrankten erheblich minimieren." "Google Flu Trends" ist das erste Projekt, das Datenbanken einer Suchmaschine nutzt, um einen auftretenden Grippevirus zu lokalisieren - zurzeit nur in den USA, aber weltweite Prognosen wären ein folgerichtiger nächster Schritt. Philip M. Polgreen von der Universität von Iowa verspricht sich noch viel mehr: "Theoretisch können wir diese Flut an Informationen dazu nutzen, auch den Verlauf anderer Krankheiten besser zu studieren." Um das Grippe-Ausbreitungsmodell zu erstellen, hat Google mehrere hundert Milliarden Suchanfragen aus den vergangenen Jahren analysiert. Datenschützer haben den Internetgiganten bereits mehrfach als "datenschutzfeindlich" eingestuft. Die Anwender wüssten weder, was mit den gesammelten Daten passiere, noch wie lange gespeicherte Informationen verfügbar seien. Google versichert jedoch, dass "Flu Trends" die Privatsphäre wahre. Das Tool könne niemals dazu genutzt werden, einzelne Nutzer zu identifizieren, da wir bei der Erstellung der Statistiken lediglich anonyme Datenmaterialien nutzen. Die Muster, die wir in den Daten analysieren, ergeben erst in einem größeren Kontext Sinn." An einer echten Virus-Grippe - nicht zu verwechseln mit einer Erkältung - erkranken weltweit mehrere Millionen Menschen, mehr als 500 000 sterben daran."

Date

3. 5.1997 8:44:22

Lusti, M.: Data Warehousing and Data Mining : Eine Einführung in entscheidungsunterstützende Systeme (1999) 0.02

0.02022745 = product of:
  0.0404549 = sum of:
    0.023794979 = weight(_text_:m in 4261) [ClassicSimilarity], result of:
      0.023794979 = score(doc=4261,freq=4.0), product of:
        0.07649739 = queryWeight, product of:
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.030740997 = queryNorm
        0.31105608 = fieldWeight in 4261, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.0625 = fieldNorm(doc=4261)
    0.016659923 = product of:
      0.033319846 = sum of:
        0.033319846 = weight(_text_:22 in 4261) [ClassicSimilarity], result of:
          0.033319846 = score(doc=4261,freq=2.0), product of:
            0.107649736 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.030740997 = queryNorm
            0.30952093 = fieldWeight in 4261, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=4261)
      0.5 = coord(1/2)
  0.5 = coord(2/4)

Date: 17. 7.2002 19:22:06
Type: m

Peters, G.; Gaese, V.: ¬Das DocCat-System in der Textdokumentation von G+J (2003) 0.02
```
0.015223314 = product of:
  0.060893256 = sum of:
    0.060893256 = sum of:
      0.044233333 = weight(_text_:da in 1507) [ClassicSimilarity], result of:
        0.044233333 = score(doc=1507,freq=4.0), product of:
          0.1475006 = queryWeight, product of:
            4.7981725 = idf(docFreq=990, maxDocs=44218)
            0.030740997 = queryNorm
          0.29988578 = fieldWeight in 1507, product of:
            2.0 = tf(freq=4.0), with freq of:
              4.0 = termFreq=4.0
            4.7981725 = idf(docFreq=990, maxDocs=44218)
            0.03125 = fieldNorm(doc=1507)
      0.016659923 = weight(_text_:22 in 1507) [ClassicSimilarity], result of:
        0.016659923 = score(doc=1507,freq=2.0), product of:
          0.107649736 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.030740997 = queryNorm
          0.15476047 = fieldWeight in 1507, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.03125 = fieldNorm(doc=1507)
  0.25 = coord(1/4)
```
Abstract

Wir werden einmal die Grundlagen des Text-Mining-Systems bei IBM darstellen, dann werden wir das Projekt etwas umfangreicher und deutlicher darstellen, da kennen wir uns aus. Von daher haben wir zwei Teile, einmal Heidelberg, einmal Hamburg. Noch einmal zur Technologie. Text-Mining ist eine von IBM entwickelte Technologie, die in einer besonderen Ausformung und Programmierung für uns zusammengestellt wurde. Das Projekt hieß bei uns lange Zeit DocText Miner und heißt seit einiger Zeit auf Vorschlag von IBM DocCat, das soll eine Abkürzung für Document-Categoriser sein, sie ist ja auch nett und anschaulich. Wir fangen an mit Text-Mining, das bei IBM in Heidelberg entwickelt wurde. Die verstehen darunter das automatische Indexieren als eine Instanz, also einen Teil von Text-Mining. Probleme werden dabei gezeigt, und das Text-Mining ist eben eine Methode zur Strukturierung von und der Suche in großen Dokumentenmengen, die Extraktion von Informationen und, das ist der hohe Anspruch, von impliziten Zusammenhängen. Das letztere sei dahingestellt. IBM macht das quantitativ, empirisch, approximativ und schnell. das muss man wirklich sagen. Das Ziel, und das ist ganz wichtig für unser Projekt gewesen, ist nicht, den Text zu verstehen, sondern das Ergebnis dieser Verfahren ist, was sie auf Neudeutsch a bundle of words, a bag of words nennen, also eine Menge von bedeutungstragenden Begriffen aus einem Text zu extrahieren, aufgrund von Algorithmen, also im Wesentlichen aufgrund von Rechenoperationen. Es gibt eine ganze Menge von linguistischen Vorstudien, ein wenig Linguistik ist auch dabei, aber nicht die Grundlage der ganzen Geschichte. Was sie für uns gemacht haben, ist also die Annotierung von Pressetexten für unsere Pressedatenbank. Für diejenigen, die es noch nicht kennen: Gruner + Jahr führt eine Textdokumentation, die eine Datenbank führt, seit Anfang der 70er Jahre, da sind z.Z. etwa 6,5 Millionen Dokumente darin, davon etwas über 1 Million Volltexte ab 1993. Das Prinzip war lange Zeit, dass wir die Dokumente, die in der Datenbank gespeichert waren und sind, verschlagworten und dieses Prinzip haben wir auch dann, als der Volltext eingeführt wurde, in abgespeckter Form weitergeführt. Zu diesen 6,5 Millionen Dokumenten gehören dann eben auch ungefähr 10 Millionen Faksimileseiten, weil wir die Faksimiles auch noch standardmäßig aufheben.

Date

22. 4.2003 11:45:36

Lackes, R.; Tillmanns, C.: Data Mining für die Unternehmenspraxis : Entscheidungshilfen und Fallstudien mit führenden Softwarelösungen (2006) 0.01

0.012557067 = product of:
  0.025114134 = sum of:
    0.012619193 = weight(_text_:m in 1383) [ClassicSimilarity], result of:
      0.012619193 = score(doc=1383,freq=2.0), product of:
        0.07649739 = queryWeight, product of:
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.030740997 = queryNorm
        0.1649624 = fieldWeight in 1383, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.046875 = fieldNorm(doc=1383)
    0.012494942 = product of:
      0.024989884 = sum of:
        0.024989884 = weight(_text_:22 in 1383) [ClassicSimilarity], result of:
          0.024989884 = score(doc=1383,freq=2.0), product of:
            0.107649736 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.030740997 = queryNorm
            0.23214069 = fieldWeight in 1383, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=1383)
      0.5 = coord(1/2)
  0.5 = coord(2/4)

Date: 22. 3.2008 14:46:06
Type: m

Fonseca, F.; Marcinkowski, M.; Davis, C.: Cyber-human systems of thought and understanding (2019) 0.01

0.010464223 = product of:
  0.020928446 = sum of:
    0.010515994 = weight(_text_:m in 5011) [ClassicSimilarity], result of:
      0.010515994 = score(doc=5011,freq=2.0), product of:
        0.07649739 = queryWeight, product of:
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.030740997 = queryNorm
        0.13746867 = fieldWeight in 5011, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.0390625 = fieldNorm(doc=5011)
    0.010412452 = product of:
      0.020824904 = sum of:
        0.020824904 = weight(_text_:22 in 5011) [ClassicSimilarity], result of:
          0.020824904 = score(doc=5011,freq=2.0), product of:
            0.107649736 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.030740997 = queryNorm
            0.19345059 = fieldWeight in 5011, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0390625 = fieldNorm(doc=5011)
      0.5 = coord(1/2)
  0.5 = coord(2/4)

Date: 7. 3.2019 16:32:22

Lischka, K.: Spurensuche im Datenwust : Data-Mining-Software fahndet nach kriminellen Mitarbeitern, guten Kunden - und bald vielleicht auch nach Terroristen (2002) 0.01
```
0.008988302 = product of:
  0.03595321 = sum of:
    0.03595321 = sum of:
      0.023458267 = weight(_text_:da in 1178) [ClassicSimilarity], result of:
        0.023458267 = score(doc=1178,freq=2.0), product of:
          0.1475006 = queryWeight, product of:
            4.7981725 = idf(docFreq=990, maxDocs=44218)
            0.030740997 = queryNorm
          0.15903844 = fieldWeight in 1178, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            4.7981725 = idf(docFreq=990, maxDocs=44218)
            0.0234375 = fieldNorm(doc=1178)
      0.012494942 = weight(_text_:22 in 1178) [ClassicSimilarity], result of:
        0.012494942 = score(doc=1178,freq=2.0), product of:
          0.107649736 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.030740997 = queryNorm
          0.116070345 = fieldWeight in 1178, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.0234375 = fieldNorm(doc=1178)
  0.25 = coord(1/4)
```
Content

"Ob man als Terrorist einen Anschlag gegen die Vereinigten Staaten plant, als Kassierer Scheine aus der Kasse unterschlägt oder für bestimmte Produkte besonders gerne Geld ausgibt - einen Unterschied macht Data-Mining-Software da nicht. Solche Programme analysieren riesige Daten- mengen und fällen statistische Urteile. Mit diesen Methoden wollen nun die For- scher des "Information Awaren in den Vereinigten Staaten Spuren von Terroristen in den Datenbanken von Behörden und privaten Unternehmen wie Kreditkartenfirmen finden. 200 Millionen Dollar umfasst der Jahresetat für die verschiedenen Forschungsprojekte. Dass solche Software in der Praxis funktioniert, zeigen die steigenden Umsätze der Anbieter so genannter Customer-Relationship-Management-Software. Im vergangenen Jahr ist das Potenzial für analytische CRM-Anwendungen laut dem Marktforschungsinstitut IDC weltweit um 22 Prozent gewachsen, bis zum Jahr 2006 soll es in Deutschland mit einem jährlichen Plus von 14,1 Prozent so weitergehen. Und das trotz schwacher Konjunktur - oder gerade deswegen. Denn ähnlich wie Data-Mining der USRegierung helfen soll, Terroristen zu finden, entscheiden CRM-Programme heute, welche Kunden für eine Firma profitabel sind. Und welche es künftig sein werden, wie Manuela Schnaubelt, Sprecherin des CRM-Anbieters SAP, beschreibt: "Die Kundenbewertung ist ein zentraler Bestandteil des analytischen CRM. Sie ermöglicht es Unternehmen, sich auf die für sie wichtigen und richtigen Kunden zu fokussieren. Darüber hinaus können Firmen mit speziellen Scoring- Verfahren ermitteln, welche Kunden langfristig in welchem Maße zum Unternehmenserfolg beitragen." Die Folgen der Bewertungen sind für die Betroffenen nicht immer positiv: Attraktive Kunden profitieren von individuellen Sonderangeboten und besonderer Zuwendung. Andere hängen vielleicht so lauge in der Warteschleife des Telefonservice, bis die profitableren Kunden abgearbeitet sind. So könnte eine praktische Umsetzung dessen aussehen, was SAP-Spreche-rin Schnaubelt abstrakt beschreibt: "In vielen Unternehmen wird Kundenbewertung mit der klassischen ABC-Analyse durchgeführt, bei der Kunden anhand von Daten wie dem Umsatz kategorisiert werden. A-Kunden als besonders wichtige Kunden werden anders betreut als C-Kunden." Noch näher am geplanten Einsatz von Data-Mining zur Terroristenjagd ist eine Anwendung, die heute viele Firmen erfolgreich nutzen: Sie spüren betrügende Mitarbeiter auf. Werner Sülzer vom großen CRM-Anbieter NCR Teradata beschreibt die Möglichkeiten so: "Heute hinterlässt praktisch jeder Täter - ob Mitarbeiter, Kunde oder Lieferant - Datenspuren bei seinen wirtschaftskriminellen Handlungen. Es muss vorrangig darum gehen, einzelne Spuren zu Handlungsmustern und Täterprofilen zu verdichten. Das gelingt mittels zentraler Datenlager und hoch entwickelter Such- und Analyseinstrumente." Von konkreten Erfolgen sprich: Entlas-sungen krimineller Mitarbeiter-nach Einsatz solcher Programme erzählen Unternehmen nicht gerne. Matthias Wilke von der "Beratungsstelle für Technologiefolgen und Qualifizierung" (BTQ) der Gewerkschaft Verdi weiß von einem Fall 'aus der Schweiz. Dort setzt die Handelskette "Pick Pay" das Programm "Lord Lose Prevention" ein. Zwei Monate nach Einfüh-rung seien Unterschlagungen im Wert von etwa 200 000 Franken ermittelt worden. Das kostete mehr als 50 verdächtige Kassiererinnen und Kassierer den Job.

Medien-Informationsmanagement : Archivarische, dokumentarische, betriebswirtschaftliche, rechtliche und Berufsbild-Aspekte ; [Frühjahrstagung der Fachgruppe 7 im Jahr 2000 in Weimar und Folgetagung 2001 in Köln] (2003) 0.01

0.007585294 = product of:
  0.015170588 = sum of:
    0.008923117 = weight(_text_:m in 1833) [ClassicSimilarity], result of:
      0.008923117 = score(doc=1833,freq=4.0), product of:
        0.07649739 = queryWeight, product of:
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.030740997 = queryNorm
        0.11664603 = fieldWeight in 1833, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.0234375 = fieldNorm(doc=1833)
    0.006247471 = product of:
      0.012494942 = sum of:
        0.012494942 = weight(_text_:22 in 1833) [ClassicSimilarity], result of:
          0.012494942 = score(doc=1833,freq=2.0), product of:
            0.107649736 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.030740997 = queryNorm
            0.116070345 = fieldWeight in 1833, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0234375 = fieldNorm(doc=1833)
      0.5 = coord(1/2)
  0.5 = coord(2/4)

Date: 11. 5.2008 19:49:22
Editor: Englert, M. u.a.
Type: m

Handbuch Web Mining im Marketing : Konzepte, Systeme, Fallstudien (2002) 0.01

0.007361196 = product of:
  0.029444784 = sum of:
    0.029444784 = weight(_text_:m in 6106) [ClassicSimilarity], result of:
      0.029444784 = score(doc=6106,freq=2.0), product of:
        0.07649739 = queryWeight, product of:
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.030740997 = queryNorm
        0.38491225 = fieldWeight in 6106, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.109375 = fieldNorm(doc=6106)
  0.25 = coord(1/4)

Type: m

Mattison, R.: Data warehousing and data mining for telecommunications (1997) 0.01

0.007361196 = product of:
  0.029444784 = sum of:
    0.029444784 = weight(_text_:m in 246) [ClassicSimilarity], result of:
      0.029444784 = score(doc=246,freq=2.0), product of:
        0.07649739 = queryWeight, product of:
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.030740997 = queryNorm
        0.38491225 = fieldWeight in 246, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.109375 = fieldNorm(doc=246)
  0.25 = coord(1/4)

Type: m

Chowdhury, G.G.: Template mining for information extraction from digital documents (1999) 0.01

0.0072887163 = product of:
  0.029154865 = sum of:
    0.029154865 = product of:
      0.05830973 = sum of:
        0.05830973 = weight(_text_:22 in 4577) [ClassicSimilarity], result of:
          0.05830973 = score(doc=4577,freq=2.0), product of:
            0.107649736 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.030740997 = queryNorm
            0.5416616 = fieldWeight in 4577, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.109375 = fieldNorm(doc=4577)
      0.5 = coord(1/2)
  0.25 = coord(1/4)

Date: 2. 4.2000 18:01:22

Data Mining im praktischen Einsatz : Verfahren und Anwendungsfälle für Marketing, Vertrieb, Controlling und Kundenunterstützung (2000) 0.01

0.0063095964 = product of:
  0.025238385 = sum of:
    0.025238385 = weight(_text_:m in 3425) [ClassicSimilarity], result of:
      0.025238385 = score(doc=3425,freq=2.0), product of:
        0.07649739 = queryWeight, product of:
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.030740997 = queryNorm
        0.3299248 = fieldWeight in 3425, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.09375 = fieldNorm(doc=3425)
  0.25 = coord(1/4)

Type: m

Cios, K.J.; Pedrycz, W.; Swiniarksi, R.: Data mining methods for knowledge discovery (1998) 0.01

0.0063095964 = product of:
  0.025238385 = sum of:
    0.025238385 = weight(_text_:m in 6075) [ClassicSimilarity], result of:
      0.025238385 = score(doc=6075,freq=2.0), product of:
        0.07649739 = queryWeight, product of:
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.030740997 = queryNorm
        0.3299248 = fieldWeight in 6075, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.09375 = fieldNorm(doc=6075)
  0.25 = coord(1/4)

Type: m

Witten, I.H.; Frank, E.: Data Mining : Praktische Werkzeuge und Techniken für das maschinelle Lernen (2000) 0.01

0.0063095964 = product of:
  0.025238385 = sum of:
    0.025238385 = weight(_text_:m in 6833) [ClassicSimilarity], result of:
      0.025238385 = score(doc=6833,freq=2.0), product of:
        0.07649739 = queryWeight, product of:
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.030740997 = queryNorm
        0.3299248 = fieldWeight in 6833, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.09375 = fieldNorm(doc=6833)
  0.25 = coord(1/4)

Type: m

Intelligent information processing and web mining : Proceedings of the International IIS: IIPWM'03 Conference held in Zakopane, Poland, June 2-5, 2003 (2003) 0.01

0.0063095964 = product of:
  0.025238385 = sum of:
    0.025238385 = weight(_text_:m in 4642) [ClassicSimilarity], result of:
      0.025238385 = score(doc=4642,freq=2.0), product of:
        0.07649739 = queryWeight, product of:
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.030740997 = queryNorm
        0.3299248 = fieldWeight in 4642, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.09375 = fieldNorm(doc=4642)
  0.25 = coord(1/4)

Type: m

KDD : techniques and applications (1998) 0.01

0.006247471 = product of:
  0.024989884 = sum of:
    0.024989884 = product of:
      0.04997977 = sum of:
        0.04997977 = weight(_text_:22 in 6783) [ClassicSimilarity], result of:
          0.04997977 = score(doc=6783,freq=2.0), product of:
            0.107649736 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.030740997 = queryNorm
            0.46428138 = fieldWeight in 6783, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=6783)
      0.5 = coord(1/2)
  0.25 = coord(1/4)

Footnote: A special issue of selected papers from the Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD'97), held Singapore, 22-23 Feb 1997

Ester, M.; Sander, J.: Knowledge discovery in databases : Techniken und Anwendungen (2000) 0.01

0.0059487447 = product of:
  0.023794979 = sum of:
    0.023794979 = weight(_text_:m in 1374) [ClassicSimilarity], result of:
      0.023794979 = score(doc=1374,freq=4.0), product of:
        0.07649739 = queryWeight, product of:
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.030740997 = queryNorm
        0.31105608 = fieldWeight in 1374, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.0625 = fieldNorm(doc=1374)
  0.25 = coord(1/4)

Type: m

Keim, D.A.: Datenvisualisierung und Data Mining (2004) 0.00
```
0.0048871385 = product of:
  0.019548554 = sum of:
    0.019548554 = product of:
      0.039097108 = sum of:
        0.039097108 = weight(_text_:da in 2931) [ClassicSimilarity], result of:
          0.039097108 = score(doc=2931,freq=2.0), product of:
            0.1475006 = queryWeight, product of:
              4.7981725 = idf(docFreq=990, maxDocs=44218)
              0.030740997 = queryNorm
            0.26506406 = fieldWeight in 2931, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.7981725 = idf(docFreq=990, maxDocs=44218)
              0.0390625 = fieldNorm(doc=2931)
      0.5 = coord(1/2)
  0.25 = coord(1/4)
```
Abstract

Die rasante technologische Entwicklung der letzten zwei Jahrzehnte ermöglicht heute die persistente Speicherung riesiger Datenmengen durch den Computer. Forscher an der Universität Berkeley haben berechnet, dass jedes Jahr ca. 1 Exabyte (= 1 Million Terabyte) Daten generiert werden - ein großer Teil davon in digitaler Form. Das bedeutet aber, dass in den nächsten drei Jahren mehr Daten generiert werden als in der gesamten menschlichen Entwicklung zuvor. Die Daten werden oft automatisch mit Hilfe von Sensoren und Überwachungssystemen aufgezeichnet. So werden beispielsweise alltägliche Vorgänge des menschlichen Lebens, wie das Bezahlen mit Kreditkarte oder die Benutzung des Telefons, durch Computer aufgezeichnet. Dabei werden gewöhnlich alle verfügbaren Parameter abgespeichert, wodurch hochdimensionale Datensätze entstehen. Die Daten werden gesammelt, da sie wertvolle Informationen enthalten, die einen Wettbewerbsvorteil bieten können. Das Finden der wertvollen Informationen in den großen Datenmengen ist aber keine leichte Aufgabe. Heutige Datenbankmanagementsysteme können nur kleine Teilmengen dieser riesigen Datenmengen darstellen. Werden die Daten zum Beispiel in textueller Form ausgegeben, können höchstens ein paar hundert Zeilen auf dem Bildschirm dargestellt werden. Bei Millionen von Datensätzen ist dies aber nur ein Tropfen auf den heißen Stein.

Principles of data mining and knowledge discovery (1998) 0.00

0.0042063976 = product of:
  0.01682559 = sum of:
    0.01682559 = weight(_text_:m in 3822) [ClassicSimilarity], result of:
      0.01682559 = score(doc=3822,freq=2.0), product of:
        0.07649739 = queryWeight, product of:
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.030740997 = queryNorm
        0.21994986 = fieldWeight in 3822, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.0625 = fieldNorm(doc=3822)
  0.25 = coord(1/4)

Editor: Quafafou, M.

Analytische Informationssysteme : Data Warehouse, On-Line Analytical Processing, Data Mining (1998) 0.00

0.0042063976 = product of:
  0.01682559 = sum of:
    0.01682559 = weight(_text_:m in 1380) [ClassicSimilarity], result of:
      0.01682559 = score(doc=1380,freq=2.0), product of:
        0.07649739 = queryWeight, product of:
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.030740997 = queryNorm
        0.21994986 = fieldWeight in 1380, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.0625 = fieldNorm(doc=1380)
  0.25 = coord(1/4)

Type: m

Chardonnens, A.; Hengchen, S.: Text mining for cultural heritage institutions : a 5-step method for cultural heritage institutions (2017) 0.00

0.0042063976 = product of:
  0.01682559 = sum of:
    0.01682559 = weight(_text_:m in 646) [ClassicSimilarity], result of:
      0.01682559 = score(doc=646,freq=2.0), product of:
        0.07649739 = queryWeight, product of:
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.030740997 = queryNorm
        0.21994986 = fieldWeight in 646, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.4884486 = idf(docFreq=9980, maxDocs=44218)
          0.0625 = fieldNorm(doc=646)
  0.25 = coord(1/4)

Source: Everything changes, everything stays the same? - Understanding information spaces : Proceedings of the 15th International Symposium of Information Science (ISI 2017), Berlin/Germany, 13th - 15th March 2017. Eds.: M. Gäde, V. Trkulja u. V. Petras

Search (58 results, page 1 of 3)

Authors

Years

Languages

Types

Themes

Subjects

Classifications