Search (371 results, page 1 of 19)

Gödert, W.; Lepsky, K.: Semantische Umfeldsuche im Information Retrieval (1998) 0.33

0.32841355 = product of:
  0.39409626 = sum of:
    0.16464578 = weight(_text_:umfeld in 606) [ClassicSimilarity], result of:
      0.16464578 = score(doc=606,freq=4.0), product of:
        0.26788878 = queryWeight, product of:
          5.619245 = idf(docFreq=435, maxDocs=44218)
          0.047673445 = queryNorm
        0.61460495 = fieldWeight in 606, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.619245 = idf(docFreq=435, maxDocs=44218)
          0.0546875 = fieldNorm(doc=606)
    0.015254747 = weight(_text_:in in 606) [ClassicSimilarity], result of:
      0.015254747 = score(doc=606,freq=10.0), product of:
        0.06484802 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.047673445 = queryNorm
        0.23523843 = fieldWeight in 606, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0546875 = fieldNorm(doc=606)
    0.15080757 = weight(_text_:indexierung in 606) [ClassicSimilarity], result of:
      0.15080757 = score(doc=606,freq=4.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.5882099 = fieldWeight in 606, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0546875 = fieldNorm(doc=606)
    0.03953255 = weight(_text_:u in 606) [ClassicSimilarity], result of:
      0.03953255 = score(doc=606,freq=2.0), product of:
        0.15610404 = queryWeight, product of:
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.047673445 = queryNorm
        0.25324488 = fieldWeight in 606, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.0546875 = fieldNorm(doc=606)
    0.023855632 = product of:
      0.047711264 = sum of:
        0.047711264 = weight(_text_:retrieval in 606) [ClassicSimilarity], result of:
          0.047711264 = score(doc=606,freq=4.0), product of:
            0.14420812 = queryWeight, product of:
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.047673445 = queryNorm
            0.33085006 = fieldWeight in 606, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.0546875 = fieldNorm(doc=606)
      0.5 = coord(1/2)
  0.8333333 = coord(5/6)

Abstract: Sachliche Suchen in bibliothekarischen Online-Katalogen enden häufig mit unbefriedigenden Ergebnissen. Als eine Ursache dafür kann angesehen werden, daß die Gestaltung des Suchprozesses das semantische Umfeld einer Suchanfrage nicht mit einbezieht, daß in Übertragung der Verhältnisse in konventionellen Katalogen am Paradigma des Wort-Matching zwischen Suchwort und Indexat festgehalten wird. Es wird statt dessen das Konzept einer semantischen Umfeldsuche entwickelt und gezeigt, welche Rolle die Verwendung strukturierten Vokabulars dafür spielen kann. Insbesondere wird dargestellt, welche Möglichkeiten Verfahren der wörterbuchgestützten maschinellen Indexierung in diesem Zusammenhang spielen können. Die Ausführungen werden durch Beispiele illustriert
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Harman, D.: Automatic indexing (1994) 0.28

0.2753411 = product of:
  0.33040932 = sum of:
    0.13305387 = weight(_text_:umfeld in 7729) [ClassicSimilarity], result of:
      0.13305387 = score(doc=7729,freq=2.0), product of:
        0.26788878 = queryWeight, product of:
          5.619245 = idf(docFreq=435, maxDocs=44218)
          0.047673445 = queryNorm
        0.4966758 = fieldWeight in 7729, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.619245 = idf(docFreq=435, maxDocs=44218)
          0.0625 = fieldNorm(doc=7729)
    0.011026227 = weight(_text_:in in 7729) [ClassicSimilarity], result of:
      0.011026227 = score(doc=7729,freq=4.0), product of:
        0.06484802 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.047673445 = queryNorm
        0.17003182 = fieldWeight in 7729, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0625 = fieldNorm(doc=7729)
    0.12187091 = weight(_text_:indexierung in 7729) [ClassicSimilarity], result of:
      0.12187091 = score(doc=7729,freq=2.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.47534537 = fieldWeight in 7729, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0625 = fieldNorm(doc=7729)
    0.045180056 = weight(_text_:u in 7729) [ClassicSimilarity], result of:
      0.045180056 = score(doc=7729,freq=2.0), product of:
        0.15610404 = queryWeight, product of:
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.047673445 = queryNorm
        0.28942272 = fieldWeight in 7729, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.0625 = fieldNorm(doc=7729)
    0.019278264 = product of:
      0.038556527 = sum of:
        0.038556527 = weight(_text_:retrieval in 7729) [ClassicSimilarity], result of:
          0.038556527 = score(doc=7729,freq=2.0), product of:
            0.14420812 = queryWeight, product of:
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.047673445 = queryNorm
            0.26736724 = fieldWeight in 7729, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.0625 = fieldNorm(doc=7729)
      0.5 = coord(1/2)
  0.8333333 = coord(5/6)

Source: Challenges in indexing electronic text and images. Ed.: R. Fidel et al
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Gábor, K.; Zargayouna, H.; Tellier, I.; Buscaldi, D.; Charnois, T.: ¬A typology of semantic relations dedicated to scientific literature analysis (2016) 0.24

0.2427304 = product of:
  0.29127648 = sum of:
    0.11642214 = weight(_text_:umfeld in 2933) [ClassicSimilarity], result of:
      0.11642214 = score(doc=2933,freq=2.0), product of:
        0.26788878 = queryWeight, product of:
          5.619245 = idf(docFreq=435, maxDocs=44218)
          0.047673445 = queryNorm
        0.43459132 = fieldWeight in 2933, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.619245 = idf(docFreq=435, maxDocs=44218)
          0.0546875 = fieldNorm(doc=2933)
    0.011816275 = weight(_text_:in in 2933) [ClassicSimilarity], result of:
      0.011816275 = score(doc=2933,freq=6.0), product of:
        0.06484802 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.047673445 = queryNorm
        0.1822149 = fieldWeight in 2933, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0546875 = fieldNorm(doc=2933)
    0.106637046 = weight(_text_:indexierung in 2933) [ClassicSimilarity], result of:
      0.106637046 = score(doc=2933,freq=2.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.4159272 = fieldWeight in 2933, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0546875 = fieldNorm(doc=2933)
    0.03953255 = weight(_text_:u in 2933) [ClassicSimilarity], result of:
      0.03953255 = score(doc=2933,freq=2.0), product of:
        0.15610404 = queryWeight, product of:
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.047673445 = queryNorm
        0.25324488 = fieldWeight in 2933, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.0546875 = fieldNorm(doc=2933)
    0.016868481 = product of:
      0.033736963 = sum of:
        0.033736963 = weight(_text_:retrieval in 2933) [ClassicSimilarity], result of:
          0.033736963 = score(doc=2933,freq=2.0), product of:
            0.14420812 = queryWeight, product of:
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.047673445 = queryNorm
            0.23394634 = fieldWeight in 2933, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.0546875 = fieldNorm(doc=2933)
      0.5 = coord(1/2)
  0.8333333 = coord(5/6)

Abstract: We propose a method for improving access to scientific literature by analyzing the content of research papers beyond citation links and topic tracking. Our model relies on a typology of explicit semantic relations. These relations are instantiated in the abstract/introduction part of the papers and can be identified automatically using textual data and external ontologies. Preliminary results show a promising precision in unsupervised relationship classification.
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Rädler, K.: In Bibliothekskatalogen "googlen" : Integration von Inhaltsverzeichnissen, Volltexten und WEB-Ressourcen in Bibliothekskataloge (2004) 0.22

0.22429754 = product of:
  0.26915705 = sum of:
    0.08315867 = weight(_text_:umfeld in 2432) [ClassicSimilarity], result of:
      0.08315867 = score(doc=2432,freq=2.0), product of:
        0.26788878 = queryWeight, product of:
          5.619245 = idf(docFreq=435, maxDocs=44218)
          0.047673445 = queryNorm
        0.31042236 = fieldWeight in 2432, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.619245 = idf(docFreq=435, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2432)
    0.0137827825 = weight(_text_:in in 2432) [ClassicSimilarity], result of:
      0.0137827825 = score(doc=2432,freq=16.0), product of:
        0.06484802 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.047673445 = queryNorm
        0.21253976 = fieldWeight in 2432, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2432)
    0.13192914 = weight(_text_:indexierung in 2432) [ClassicSimilarity], result of:
      0.13192914 = score(doc=2432,freq=6.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.5145765 = fieldWeight in 2432, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2432)
    0.028237537 = weight(_text_:u in 2432) [ClassicSimilarity], result of:
      0.028237537 = score(doc=2432,freq=2.0), product of:
        0.15610404 = queryWeight, product of:
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.047673445 = queryNorm
        0.1808892 = fieldWeight in 2432, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2432)
    0.012048915 = product of:
      0.02409783 = sum of:
        0.02409783 = weight(_text_:retrieval in 2432) [ClassicSimilarity], result of:
          0.02409783 = score(doc=2432,freq=2.0), product of:
            0.14420812 = queryWeight, product of:
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.047673445 = queryNorm
            0.16710453 = fieldWeight in 2432, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.0390625 = fieldNorm(doc=2432)
      0.5 = coord(1/2)
  0.8333333 = coord(5/6)

Abstract: Ausgangslage Die Katalog-Recherchen über Internet, also von außerhalb der Bibliothek, nehmen erwartungsgemäß stark zu bzw. sind mittlerweile die Regel. Damit ist natürlich das Bedürfnis und die Notwendigkeit gewachsen, über den Titel hinaus zusätzliche inhaltliche Informationen zu erhalten, die es erlauben, die Zweckmäßigkeit wesentlich besser abschätzen zu können, eine Bestellung vorzunehmen oder vielleicht auch 50 km in die Bibliothek zu fahren, um ein Buch zu entleihen. Dieses Informationsdefizit wird zunehmend als gravierender Mangel erfahren. Inhaltsverzeichnisse referieren den Inhalt kurz und prägnant. Sie sind die erste Stelle, welche zur Relevanz-Beurteilung herangezogen wird. Fast alle relevanten Terme einer Fachbuchpublikation finden sich bereits dort. Andererseits wird immer deutlicher, dass die dem bibliothekarischen Paradigma entsprechende intellektuelle Indexierung der einzelnen dokumentarischen Einheiten mit den engsten umfassenden dokumentationssprachlichen Termen (Schlagwörter, Klassen) zwar eine notwendige, aber keinesfalls hinreichende Methode darstellt, das teuer erworbene Bibliotheksgut Information für den Benutzer in seiner spezifischen Problemstellung zu aktivieren und als Informationsdienstleistung anbieten zu können. Informationen zu sehr speziellen Fragestellungen, die oft nur in kürzeren Abschnitten (Kapitel) erörtert werden, sind derzeit nur indirekt, mit großem Zeitaufwand und oft überhaupt nicht auffindbar. Sie liegen sozusagen brach. Die Tiefe der intellektuellen Indexierung bis in einzelne inhaltliche Details zu erweitern, ist aus personellen und damit auch finanziellen Gesichtspunkten nicht vertretbar. Bibliotheken fallen deshalb in der Wahrnehmung von Informationssuchenden immer mehr zurück. Die enorme Informationsvielfalt liegt hinter dem Informations- bzw. Recherchehorizont der bibliographischen Aufnahmen im Katalog.
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Buckley, C.; Allan, J.; Salton, G.: Automatic routing and retrieval using Smart : TREC-2 (1995) 0.22

0.22010356 = product of:
  0.26412427 = sum of:
    0.09979041 = weight(_text_:umfeld in 5699) [ClassicSimilarity], result of:
      0.09979041 = score(doc=5699,freq=2.0), product of:
        0.26788878 = queryWeight, product of:
          5.619245 = idf(docFreq=435, maxDocs=44218)
          0.047673445 = queryNorm
        0.37250686 = fieldWeight in 5699, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.619245 = idf(docFreq=435, maxDocs=44218)
          0.046875 = fieldNorm(doc=5699)
    0.010128236 = weight(_text_:in in 5699) [ClassicSimilarity], result of:
      0.010128236 = score(doc=5699,freq=6.0), product of:
        0.06484802 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.047673445 = queryNorm
        0.1561842 = fieldWeight in 5699, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=5699)
    0.09140319 = weight(_text_:indexierung in 5699) [ClassicSimilarity], result of:
      0.09140319 = score(doc=5699,freq=2.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.35650903 = fieldWeight in 5699, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.046875 = fieldNorm(doc=5699)
    0.033885043 = weight(_text_:u in 5699) [ClassicSimilarity], result of:
      0.033885043 = score(doc=5699,freq=2.0), product of:
        0.15610404 = queryWeight, product of:
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.047673445 = queryNorm
        0.21706703 = fieldWeight in 5699, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.046875 = fieldNorm(doc=5699)
    0.028917395 = product of:
      0.05783479 = sum of:
        0.05783479 = weight(_text_:retrieval in 5699) [ClassicSimilarity], result of:
          0.05783479 = score(doc=5699,freq=8.0), product of:
            0.14420812 = queryWeight, product of:
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.047673445 = queryNorm
            0.40105087 = fieldWeight in 5699, product of:
              2.828427 = tf(freq=8.0), with freq of:
                8.0 = termFreq=8.0
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.046875 = fieldNorm(doc=5699)
      0.5 = coord(1/2)
  0.8333333 = coord(5/6)

Abstract: The Smart information retrieval project emphazises completely automatic approaches to the understanding and retrieval of large quantities of text. The work in the TREC-2 environment continues, performing both routing and ad hoc experiments. The ad hoc work extends investigations into combining global similarities, giving an overall indication of how a document matches a query, with local similarities identifying a smaller part of the document that matches the query. The performance of ad hoc runs is good, but it is clear that full advantage of the available local information is not been taken advantage of. The routing experiments use conventional relevance feedback approaches to routing, but with a much greater degree of query expansion than was previously done. The length of a query vector is increased by a factor of 5 to 10 by adding terms found in previously seen relevant documents. This approach improves effectiveness by 30-40% over the original query
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Hauer, M: Silicon Valley Vorarlberg : Maschinelle Indexierung und semantisches Retrieval verbessert den Katalog der Vorarlberger Landesbibliothek (2004) 0.21

0.21079966 = product of:
  0.2529596 = sum of:
    0.08315867 = weight(_text_:umfeld in 2489) [ClassicSimilarity], result of:
      0.08315867 = score(doc=2489,freq=2.0), product of:
        0.26788878 = queryWeight, product of:
          5.619245 = idf(docFreq=435, maxDocs=44218)
          0.047673445 = queryNorm
        0.31042236 = fieldWeight in 2489, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.619245 = idf(docFreq=435, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2489)
    0.0097459 = weight(_text_:in in 2489) [ClassicSimilarity], result of:
      0.0097459 = score(doc=2489,freq=8.0), product of:
        0.06484802 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.047673445 = queryNorm
        0.15028831 = fieldWeight in 2489, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2489)
    0.10771969 = weight(_text_:indexierung in 2489) [ClassicSimilarity], result of:
      0.10771969 = score(doc=2489,freq=4.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.42014992 = fieldWeight in 2489, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2489)
    0.028237537 = weight(_text_:u in 2489) [ClassicSimilarity], result of:
      0.028237537 = score(doc=2489,freq=2.0), product of:
        0.15610404 = queryWeight, product of:
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.047673445 = queryNorm
        0.1808892 = fieldWeight in 2489, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2489)
    0.02409783 = product of:
      0.04819566 = sum of:
        0.04819566 = weight(_text_:retrieval in 2489) [ClassicSimilarity], result of:
          0.04819566 = score(doc=2489,freq=8.0), product of:
            0.14420812 = queryWeight, product of:
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.047673445 = queryNorm
            0.33420905 = fieldWeight in 2489, product of:
              2.828427 = tf(freq=8.0), with freq of:
                8.0 = termFreq=8.0
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.0390625 = fieldNorm(doc=2489)
      0.5 = coord(1/2)
  0.8333333 = coord(5/6)

Abstract: 10 Jahre Internet haben die WeIt um die Bibliotheken herum stark geändert. Der Web-OPAC war eine Antwort der Bibliotheken. Doch reicht ein Web-OPAC im Zeitalter des Internets noch aus? Außer Web ist es doch der alte Katalog. Ca. 90% aller Bibliotheksrecherchen durch Benutzer sind Themenrecherchen. Ein Anteil dieser Recherchen bringt kein Ergebnis. Es kann leicht gemessen werden, dass null Medien gefunden wurden. Die Gründe hierfür wurden auch immer wieder untersucht: Plural- anstelle Singularformen, zu spezifische Suchbegriffe, Schreib- oder Bedienungsfehler. Zu wenig untersucht sind aber die Recherchen, die nicht mit einer Ausleihe enden, denn auch dann kann man in vielen Fällen von einem Retrieval-Mangel ausgehen. Schließlich: Von den ausgeliehenen Büchern werden nach Einschätzung vieler Bibliothekare 80% nicht weiter als bis zum Inhaltsverzeichnis gelesen (außer in Präsenzbibliotheken) - und erst nach Wochen zurückgegeben. Ein Politiker würde dies neudeutsch als "ein Vermittlungsproblem" bezeichnen. Ein Controller als nicht hinreichende Kapitalnutzung. Einfacher machen es sich immer mehr Studenten und Wissenschaftler, ihr Wissensaustausch vollzieht sich zunehmend an anderen Orten. Bibliotheken (als Funktion) sind unverzichtbar für die wissenschaftliche Kommunikation. Deshalb geht es darum, Wege zu finden und auch zu beschreiten, welche die Schätze von Bibliotheken (als Institution) effizienter an die Zielgruppe bringen. Der Einsatz von Information Retrieval-Technologie, neue Erschließungsmethoden und neuer Content sind Ansätze dazu. Doch die bisherigen Verbundstrukturen und Abhängigkeit haben das hier vorgestellte innovative Projekt keineswegs gefördert. Innovation entsteht wie die Innvoationsforschung zeigt eigentlich immer an der Peripherie: in Bregenz fing es an.
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Nohr, H.: Grundlagen der automatischen Indexierung : ein Lehrbuch (2003) 0.20
```
0.19895789 = product of:
  0.29843682 = sum of:
    0.011026227 = weight(_text_:in in 1767) [ClassicSimilarity], result of:
      0.011026227 = score(doc=1767,freq=16.0), product of:
        0.06484802 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.047673445 = queryNorm
        0.17003182 = fieldWeight in 1767, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.03125 = fieldNorm(doc=1767)
    0.21970592 = weight(_text_:indexierung in 1767) [ClassicSimilarity], result of:
      0.21970592 = score(doc=1767,freq=26.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.8569411 = fieldWeight in 1767, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.03125 = fieldNorm(doc=1767)
    0.022590028 = weight(_text_:u in 1767) [ClassicSimilarity], result of:
      0.022590028 = score(doc=1767,freq=2.0), product of:
        0.15610404 = queryWeight, product of:
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.047673445 = queryNorm
        0.14471136 = fieldWeight in 1767, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.03125 = fieldNorm(doc=1767)
    0.045114636 = sum of:
      0.019278264 = weight(_text_:retrieval in 1767) [ClassicSimilarity], result of:
        0.019278264 = score(doc=1767,freq=2.0), product of:
          0.14420812 = queryWeight, product of:
            3.024915 = idf(docFreq=5836, maxDocs=44218)
            0.047673445 = queryNorm
          0.13368362 = fieldWeight in 1767, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.024915 = idf(docFreq=5836, maxDocs=44218)
            0.03125 = fieldNorm(doc=1767)
      0.025836375 = weight(_text_:22 in 1767) [ClassicSimilarity], result of:
        0.025836375 = score(doc=1767,freq=2.0), product of:
          0.16694428 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.047673445 = queryNorm
          0.15476047 = fieldWeight in 1767, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.03125 = fieldNorm(doc=1767)
  0.6666667 = coord(4/6)
```
Date

22. 6.2009 12:46:51

Footnote

Rez. in: nfd 54(2003) H.5, S.314 (W. Ratzek): "Um entscheidungsrelevante Daten aus der ständig wachsenden Flut von mehr oder weniger relevanten Dokumenten zu extrahieren, müssen Unternehmen, öffentliche Verwaltung oder Einrichtungen der Fachinformation effektive und effiziente Filtersysteme entwickeln, einsetzen und pflegen. Das vorliegende Lehrbuch von Holger Nohr bietet erstmalig eine grundlegende Einführung in das Thema "automatische Indexierung". Denn: "Wie man Information sammelt, verwaltet und verwendet, wird darüber entscheiden, ob man zu den Gewinnern oder Verlierern gehört" (Bill Gates), heißt es einleitend. Im ersten Kapitel "Einleitung" stehen die Grundlagen im Mittelpunkt. Die Zusammenhänge zwischen Dokumenten-Management-Systeme, Information Retrieval und Indexierung für Planungs-, Entscheidungs- oder Innovationsprozesse, sowohl in Profit- als auch Non-Profit-Organisationen werden beschrieben. Am Ende des einleitenden Kapitels geht Nohr auf die Diskussion um die intellektuelle und automatische Indexierung ein und leitet damit über zum zweiten Kapitel "automatisches Indexieren. Hier geht der Autor überblickartig unter anderem ein auf - Probleme der automatischen Sprachverarbeitung und Indexierung - verschiedene Verfahren der automatischen Indexierung z.B. einfache Stichwortextraktion / Volltextinvertierung, - statistische Verfahren, Pattern-Matching-Verfahren. Die "Verfahren der automatischen Indexierung" behandelt Nohr dann vertiefend und mit vielen Beispielen versehen im umfangreichsten dritten Kapitel. Das vierte Kapitel "Keyphrase Extraction" nimmt eine Passpartout-Status ein: "Eine Zwischenstufe auf dem Weg von der automatischen Indexierung hin zur automatischen Generierung textueller Zusammenfassungen (Automatic Text Summarization) stellen Ansätze dar, die Schlüsselphrasen aus Dokumenten extrahieren (Keyphrase Extraction). Die Grenzen zwischen den automatischen Verfahren der Indexierung und denen des Text Summarization sind fließend." (S. 91). Am Beispiel NCR"s Extractor/Copernic Summarizer beschreibt Nohr die Funktionsweise.
Im fünften Kapitel "Information Extraction" geht Nohr auf eine Problemstellung ein, die in der Fachwelt eine noch stärkere Betonung verdiente: "Die stetig ansteigende Zahl elektronischer Dokumente macht neben einer automatischen Erschließung auch eine automatische Gewinnung der relevanten Informationen aus diesen Dokumenten wünschenswert, um diese z.B. für weitere Bearbeitungen oder Auswertungen in betriebliche Informationssysteme übernehmen zu können." (S. 103) "Indexierung und Retrievalverfahren" als voneinander abhängige Verfahren werden im sechsten Kapitel behandelt. Hier stehen Relevance Ranking und Relevance Feedback sowie die Anwendung informationslinguistischer Verfahren in der Recherche im Mittelpunkt. Die "Evaluation automatischer Indexierung" setzt den thematischen Schlusspunkt. Hier geht es vor allem um die Oualität einer Indexierung, um gängige Retrievalmaße in Retrievaltest und deren Einssatz. Weiterhin ist hervorzuheben, dass jedes Kapitel durch die Vorgabe von Lernzielen eingeleitet wird und zu den jeweiligen Kapiteln (im hinteren Teil des Buches) einige Kontrollfragen gestellt werden. Die sehr zahlreichen Beispiele aus der Praxis, ein Abkürzungsverzeichnis und ein Sachregister erhöhen den Nutzwert des Buches. Die Lektüre förderte beim Rezensenten das Verständnis für die Zusammenhänge von BID-Handwerkzeug, Wirtschaftsinformatik (insbesondere Data Warehousing) und Künstlicher Intelligenz. Die "Grundlagen der automatischen Indexierung" sollte auch in den bibliothekarischen Studiengängen zur Pflichtlektüre gehören. Holger Nohrs Lehrbuch ist auch für den BID-Profi geeignet, um die mehr oder weniger fundierten Kenntnisse auf dem Gebiet "automatisches Indexieren" schnell, leicht verständlich und informativ aufzufrischen."

Theme

Grundlagen u. Einführungen: Allgemeine Literatur

Ma, N.; Zheng, H.T.; Xiao, X.: ¬An ontology-based latent semantic indexing approach using long short-term memory networks (2017) 0.18

0.17542557 = product of:
  0.2105107 = sum of:
    0.08315867 = weight(_text_:umfeld in 3810) [ClassicSimilarity], result of:
      0.08315867 = score(doc=3810,freq=2.0), product of:
        0.26788878 = queryWeight, product of:
          5.619245 = idf(docFreq=435, maxDocs=44218)
          0.047673445 = queryNorm
        0.31042236 = fieldWeight in 3810, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.619245 = idf(docFreq=435, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3810)
    0.010896247 = weight(_text_:in in 3810) [ClassicSimilarity], result of:
      0.010896247 = score(doc=3810,freq=10.0), product of:
        0.06484802 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.047673445 = queryNorm
        0.16802745 = fieldWeight in 3810, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3810)
    0.07616932 = weight(_text_:indexierung in 3810) [ClassicSimilarity], result of:
      0.07616932 = score(doc=3810,freq=2.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.29709086 = fieldWeight in 3810, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3810)
    0.028237537 = weight(_text_:u in 3810) [ClassicSimilarity], result of:
      0.028237537 = score(doc=3810,freq=2.0), product of:
        0.15610404 = queryWeight, product of:
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.047673445 = queryNorm
        0.1808892 = fieldWeight in 3810, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.0390625 = fieldNorm(doc=3810)
    0.012048915 = product of:
      0.02409783 = sum of:
        0.02409783 = weight(_text_:retrieval in 3810) [ClassicSimilarity], result of:
          0.02409783 = score(doc=3810,freq=2.0), product of:
            0.14420812 = queryWeight, product of:
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.047673445 = queryNorm
            0.16710453 = fieldWeight in 3810, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.0390625 = fieldNorm(doc=3810)
      0.5 = coord(1/2)
  0.8333333 = coord(5/6)

Abstract: Nowadays, online data shows an astonishing increase and the issue of semantic indexing remains an open question. Ontologies and knowledge bases have been widely used to optimize performance. However, researchers are placing increased emphasis on internal relations of ontologies but neglect latent semantic relations between ontologies and documents. They generally annotate instances mentioned in documents, which are related to concepts in ontologies. In this paper, we propose an Ontology-based Latent Semantic Indexing approach utilizing Long Short-Term Memory networks (LSTM-OLSI). We utilize an importance-aware topic model to extract document-level semantic features and leverage ontologies to extract word-level contextual features. Then we encode the above two levels of features and match their embedding vectors utilizing LSTM networks. Finally, the experimental results reveal that LSTM-OLSI outperforms existing techniques and demonstrates deep comprehension of instances and articles.
Series: Lecture notes in computer science; vol.10366
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Reimer, U.: Verfahren der automatischen Indexierung : benötigtes Vorwissen und Ansätze zu seiner automatischen Akquisition, ein Überblick (1992) 0.14

0.13974693 = product of:
  0.27949387 = sum of:
    0.18280637 = weight(_text_:indexierung in 7858) [ClassicSimilarity], result of:
      0.18280637 = score(doc=7858,freq=2.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.71301806 = fieldWeight in 7858, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.09375 = fieldNorm(doc=7858)
    0.067770086 = weight(_text_:u in 7858) [ClassicSimilarity], result of:
      0.067770086 = score(doc=7858,freq=2.0), product of:
        0.15610404 = queryWeight, product of:
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.047673445 = queryNorm
        0.43413407 = fieldWeight in 7858, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.09375 = fieldNorm(doc=7858)
    0.028917395 = product of:
      0.05783479 = sum of:
        0.05783479 = weight(_text_:retrieval in 7858) [ClassicSimilarity], result of:
          0.05783479 = score(doc=7858,freq=2.0), product of:
            0.14420812 = queryWeight, product of:
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.047673445 = queryNorm
            0.40105087 = fieldWeight in 7858, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.09375 = fieldNorm(doc=7858)
      0.5 = coord(1/2)
  0.5 = coord(3/6)

Source: Experimentelles und praktisches Information Retrieval: Festschrift für Gerhard Lustig. Hrsg. R. Kuhlen

Probst, M.; Mittelbach, J.: Maschinelle Indexierung in der Sacherschließung wissenschaftlicher Bibliotheken (2006) 0.14

0.13518876 = product of:
  0.27037752 = sum of:
    0.007796719 = weight(_text_:in in 1755) [ClassicSimilarity], result of:
      0.007796719 = score(doc=1755,freq=2.0), product of:
        0.06484802 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.047673445 = queryNorm
        0.120230645 = fieldWeight in 1755, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0625 = fieldNorm(doc=1755)
    0.17235151 = weight(_text_:indexierung in 1755) [ClassicSimilarity], result of:
      0.17235151 = score(doc=1755,freq=4.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.6722399 = fieldWeight in 1755, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0625 = fieldNorm(doc=1755)
    0.09022927 = sum of:
      0.038556527 = weight(_text_:retrieval in 1755) [ClassicSimilarity], result of:
        0.038556527 = score(doc=1755,freq=2.0), product of:
          0.14420812 = queryWeight, product of:
            3.024915 = idf(docFreq=5836, maxDocs=44218)
            0.047673445 = queryNorm
          0.26736724 = fieldWeight in 1755, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.024915 = idf(docFreq=5836, maxDocs=44218)
            0.0625 = fieldNorm(doc=1755)
      0.05167275 = weight(_text_:22 in 1755) [ClassicSimilarity], result of:
        0.05167275 = score(doc=1755,freq=2.0), product of:
          0.16694428 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.047673445 = queryNorm
          0.30952093 = fieldWeight in 1755, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.0625 = fieldNorm(doc=1755)
  0.5 = coord(3/6)

Abstract: Obwohl fast alle größeren Bibliotheken intellektuelle Sacherschließung betreiben, sind elektronische Kataloge für die zielgerichtete sachliche Suche nur eingeschränkt nutzbar. Durch maschinelle Indexierung können ohne nennenswerten personellen Mehraufwand ausreichend große Datenmengen für Informationsretrievalsysteme erzeugt und somit die Auffindbarkeit von Dokumenten erhöht werden. Geeignete Sprachanalysetechniken zur Indextermerzeugung sind bekannt und bieten im Gegensatz zur gebräuchlichen Freitextinvertierung entscheidende Vorteile beim Retrieval. Im Fokus steht die Betrachtung der Vor- und Nachteile der gängigen Indexierungssysteme MILOS und intelligentCAPTURE.
Date: 22. 3.2008 12:35:19

Experimentelles und praktisches Information Retrieval : Festschrift für Gerhard Lustig (1992) 0.13

0.133362 = product of:
  0.200043 = sum of:
    0.011695079 = weight(_text_:in in 4) [ClassicSimilarity], result of:
      0.011695079 = score(doc=4,freq=8.0), product of:
        0.06484802 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.047673445 = queryNorm
        0.18034597 = fieldWeight in 4, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=4)
    0.09140319 = weight(_text_:indexierung in 4) [ClassicSimilarity], result of:
      0.09140319 = score(doc=4,freq=2.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.35650903 = fieldWeight in 4, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.046875 = fieldNorm(doc=4)
    0.058690622 = weight(_text_:u in 4) [ClassicSimilarity], result of:
      0.058690622 = score(doc=4,freq=6.0), product of:
        0.15610404 = queryWeight, product of:
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.047673445 = queryNorm
        0.3759712 = fieldWeight in 4, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.046875 = fieldNorm(doc=4)
    0.038254116 = product of:
      0.07650823 = sum of:
        0.07650823 = weight(_text_:retrieval in 4) [ClassicSimilarity], result of:
          0.07650823 = score(doc=4,freq=14.0), product of:
            0.14420812 = queryWeight, product of:
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.047673445 = queryNorm
            0.5305404 = fieldWeight in 4, product of:
              3.7416575 = tf(freq=14.0), with freq of:
                14.0 = termFreq=14.0
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.046875 = fieldNorm(doc=4)
      0.5 = coord(1/2)
  0.6666667 = coord(4/6)

Content: Enthält die Beiträge: SALTON, G.: Effective text understanding in information retrieval; KRAUSE, J.: Intelligentes Information retrieval; FUHR, N.: Konzepte zur Gestaltung zukünftiger Information-Retrieval-Systeme; HÜTHER, H.: Überlegungen zu einem mathematischen Modell für die Type-Token-, die Grundform-Token und die Grundform-Type-Relation; KNORZ, G.: Automatische Generierung inferentieller Links in und zwischen Hyperdokumenten; KONRAD, E.: Zur Effektivitätsbewertung von Information-Retrieval-Systemen; HENRICHS, N.: Retrievalunterstützung durch automatisch generierte Wortfelder; LÜCK, W., W. RITTBERGER u. M. SCHWANTNER: Der Einsatz des Automatischen Indexierungs- und Retrieval-System (AIR) im Fachinformationszentrum Karlsruhe; REIMER, U.: Verfahren der Automatischen Indexierung. Benötigtes Vorwissen und Ansätze zu seiner automatischen Akquisition: Ein Überblick; ENDRES-NIGGEMEYER, B.: Dokumentrepräsentation: Ein individuelles prozedurales Modell des Abstracting, des Indexierens und Klassifizierens; SEELBACH, D.: Zur Entwicklung von zwei- und mehrsprachigen lexikalischen Datenbanken und Terminologiedatenbanken; ZIMMERMANN, H.: Der Einfluß der Sprachbarrieren in Europa und Möglichkeiten zu ihrer Minderung; LENDERS, W.: Wörter zwischen Welt und Wissen; PANYR, J.: Frames, Thesauri und automatische Klassifikation (Clusteranalyse): HAHN, U.: Forschungsstrategien und Erkenntnisinteressen in der anwendungsorientierten automatischen Sprachverarbeitung. Überlegungen zu einer ingenieurorientierten Computerlinguistik; KUHLEN, R.: Hypertext und Information Retrieval - mehr als Browsing und Suche.

Zimmermann, H.H.: Automatische Indexierung und elektronische Thesauri (1996) 0.13

0.13203171 = product of:
  0.26406342 = sum of:
    0.007796719 = weight(_text_:in in 2062) [ClassicSimilarity], result of:
      0.007796719 = score(doc=2062,freq=2.0), product of:
        0.06484802 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.047673445 = queryNorm
        0.120230645 = fieldWeight in 2062, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0625 = fieldNorm(doc=2062)
    0.21108663 = weight(_text_:indexierung in 2062) [ClassicSimilarity], result of:
      0.21108663 = score(doc=2062,freq=6.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.8233224 = fieldWeight in 2062, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0625 = fieldNorm(doc=2062)
    0.045180056 = weight(_text_:u in 2062) [ClassicSimilarity], result of:
      0.045180056 = score(doc=2062,freq=2.0), product of:
        0.15610404 = queryWeight, product of:
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.047673445 = queryNorm
        0.28942272 = fieldWeight in 2062, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.0625 = fieldNorm(doc=2062)
  0.5 = coord(3/6)

Abstract: Überblick über die Möglichkeiten des Einsatzes automatischer Indexierung für die Erschließung von Textdokumenten mit einer Kurzvorstellung der Verfahren PASSAT, CTX und IDX sowie einer Skizze des Nutzens der Einbindung von Thesauri in den Prozess der automatischen Indexierung.
Source: Zukunft der Sacherschließung im OPAC: Vorträge des 2. Düsseldorfer OPAC-Kolloquiums am 21. Juni 1995. Hrsg.: E. Niggemann u. K. Lepsky

Kumpe, D.: Methoden zur automatischen Indexierung von Dokumenten (2006) 0.12

0.12197592 = product of:
  0.24395184 = sum of:
    0.0068221292 = weight(_text_:in in 782) [ClassicSimilarity], result of:
      0.0068221292 = score(doc=782,freq=2.0), product of:
        0.06484802 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.047673445 = queryNorm
        0.10520181 = fieldWeight in 782, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0546875 = fieldNorm(doc=782)
    0.21327409 = weight(_text_:indexierung in 782) [ClassicSimilarity], result of:
      0.21327409 = score(doc=782,freq=8.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.8318544 = fieldWeight in 782, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0546875 = fieldNorm(doc=782)
    0.023855632 = product of:
      0.047711264 = sum of:
        0.047711264 = weight(_text_:retrieval in 782) [ClassicSimilarity], result of:
          0.047711264 = score(doc=782,freq=4.0), product of:
            0.14420812 = queryWeight, product of:
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.047673445 = queryNorm
            0.33085006 = fieldWeight in 782, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.0546875 = fieldNorm(doc=782)
      0.5 = coord(1/2)
  0.5 = coord(3/6)

Abstract: Diese Diplomarbeit handelt von der Indexierung von unstrukturierten und natürlichsprachigen Dokumenten. Die zunehmende Informationsflut und die Zahl an veröffentlichten wissenschaftlichen Berichten und Büchern machen eine maschinelle inhaltliche Erschließung notwendig. Um die Anforderungen hierfür besser zu verstehen, werden Probleme der natürlichsprachigen schriftlichen Kommunikation untersucht. Die manuellen Techniken der Indexierung und die Dokumentationssprachen werden vorgestellt. Die Indexierung wird thematisch in den Bereich der inhaltlichen Erschließung und des Information Retrieval eingeordnet. Weiterhin werden Vor- und Nachteile von ausgesuchten Algorithmen untersucht und Softwareprodukte im Bereich des Information Retrieval auf ihre Arbeitsweise hin evaluiert. Anhand von Beispiel-Dokumenten werden die Ergebnisse einzelner Verfahren vorgestellt. Mithilfe des Projekts European Migration Network werden Probleme und grundlegende Anforderungen an die Durchführung einer inhaltlichen Erschließung identifiziert und Lösungsmöglichkeiten vorgeschlagen.

Automatische Indexierung zwischen Forschung und Anwendung (1986) 0.12

0.12189342 = product of:
  0.24378684 = sum of:
    0.0136442585 = weight(_text_:in in 953) [ClassicSimilarity], result of:
      0.0136442585 = score(doc=953,freq=8.0), product of:
        0.06484802 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.047673445 = queryNorm
        0.21040362 = fieldWeight in 953, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0546875 = fieldNorm(doc=953)
    0.21327409 = weight(_text_:indexierung in 953) [ClassicSimilarity], result of:
      0.21327409 = score(doc=953,freq=8.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.8318544 = fieldWeight in 953, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0546875 = fieldNorm(doc=953)
    0.016868481 = product of:
      0.033736963 = sum of:
        0.033736963 = weight(_text_:retrieval in 953) [ClassicSimilarity], result of:
          0.033736963 = score(doc=953,freq=2.0), product of:
            0.14420812 = queryWeight, product of:
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.047673445 = queryNorm
            0.23394634 = fieldWeight in 953, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.0546875 = fieldNorm(doc=953)
      0.5 = coord(1/2)
  0.5 = coord(3/6)

Abstract: Die automatische Indexierung von Dokumenten für das Information Retrieval, d. h. die automatische Charakterisierung von Dokumentinhalten mittels Deskriptoren (Schlagwörtern) ist bereits seit über 25 Jahren ein Gebiet theoretischer und experimenteller Forschung. Dagegen wurde erst im Oktober 1985 mit der Anwendung der automatischen Indexierung in der Inputproduktion für ein großes Retrievalsystem begonnen. Es handelt sich um die Indexierung englischer Referatetexte für die Physik-Datenbasis des Informationszentrums Energie, Physik, Mathematik GmbH in Karlsruhe. In dem vorliegenden Buch beschreiben Mitarbeiter der Technischen Hochschule Darmstadt ihre Forschungs- und Entwicklungsarbeiten, die zu dieser Pilotanwendung geführt haben.
Footnote: Rez. in: Zeitschrift für Bibliothekswesen und Bibliographie 35(1988) S.508-510 (W. Gödert)

Fuhr, N.: Rankingexperimente mit gewichteter Indexierung (1986) 0.12

0.11846151 = product of:
  0.35538453 = sum of:
    0.31662998 = weight(_text_:indexierung in 2051) [ClassicSimilarity], result of:
      0.31662998 = score(doc=2051,freq=6.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        1.2349837 = fieldWeight in 2051, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.09375 = fieldNorm(doc=2051)
    0.03875456 = product of:
      0.07750912 = sum of:
        0.07750912 = weight(_text_:22 in 2051) [ClassicSimilarity], result of:
          0.07750912 = score(doc=2051,freq=2.0), product of:
            0.16694428 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.047673445 = queryNorm
            0.46428138 = fieldWeight in 2051, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=2051)
      0.5 = coord(1/2)
  0.33333334 = coord(2/6)

Abstract: Der Beitrag enthält eine Darstellung zur Frage der Konzeption von Rankingalgorithmen auf Grundlage gewichteter Indexierung mittels statistischer Verfahren.
Date: 14. 6.2015 22:12:56
Source: Automatische Indexierung zwischen Forschung und Anwendung, Hrsg.: G. Lustig

Busch, D.: Domänenspezifische hybride automatische Indexierung von bibliographischen Metadaten (2019) 0.12

0.116944626 = product of:
  0.23388925 = sum of:
    0.010128236 = weight(_text_:in in 5628) [ClassicSimilarity], result of:
      0.010128236 = score(doc=5628,freq=6.0), product of:
        0.06484802 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.047673445 = queryNorm
        0.1561842 = fieldWeight in 5628, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=5628)
    0.20438375 = weight(_text_:indexierung in 5628) [ClassicSimilarity], result of:
      0.20438375 = score(doc=5628,freq=10.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.79717845 = fieldWeight in 5628, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.046875 = fieldNorm(doc=5628)
    0.01937728 = product of:
      0.03875456 = sum of:
        0.03875456 = weight(_text_:22 in 5628) [ClassicSimilarity], result of:
          0.03875456 = score(doc=5628,freq=2.0), product of:
            0.16694428 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.047673445 = queryNorm
            0.23214069 = fieldWeight in 5628, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.046875 = fieldNorm(doc=5628)
      0.5 = coord(1/2)
  0.5 = coord(3/6)

Abstract: Im Fraunhofer-Informationszentrum Raum und Bau (IRB) wird Fachliteratur im Bereich Planen und Bauen bibliographisch erschlossen. Die daraus resultierenden Dokumente (Metadaten-Einträge) werden u.a. bei der Produktion der bibliographischen Datenbanken des IRB verwendet. In Abb. 1 ist ein Dokument dargestellt, das einen Zeitschriftenartikel beschreibt. Die Dokumente werden mit Deskriptoren von einer Nomenklatur (Schlagwortliste IRB) indexiert. Ein Deskriptor ist "eine Benennung., die für sich allein verwendbar, eindeutig zur Inhaltskennzeichnung geeignet und im betreffenden Dokumentationssystem zugelassen ist". Momentan wird die Indexierung intellektuell von menschlichen Experten durchgeführt. Die intellektuelle Indexierung ist zeitaufwendig und teuer. Eine Lösung des Problems besteht in der automatischen Indexierung, bei der die Zuordnung von Deskriptoren durch ein Computerprogramm erfolgt. Solche Computerprogramme werden im Folgenden auch als Klassifikatoren bezeichnet. In diesem Beitrag geht es um ein System zur automatischen Indexierung von deutschsprachigen Dokumenten im Bereich Bauwesen mit Deskriptoren aus der Schlagwortliste IRB.
Source: B.I.T.online. 22(2019) H.6, S.465-469

Hauer, M.: Automatische Indexierung (2000) 0.12

0.116628006 = product of:
  0.23325601 = sum of:
    0.011695079 = weight(_text_:in in 5887) [ClassicSimilarity], result of:
      0.011695079 = score(doc=5887,freq=2.0), product of:
        0.06484802 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.047673445 = queryNorm
        0.18034597 = fieldWeight in 5887, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.09375 = fieldNorm(doc=5887)
    0.18280637 = weight(_text_:indexierung in 5887) [ClassicSimilarity], result of:
      0.18280637 = score(doc=5887,freq=2.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.71301806 = fieldWeight in 5887, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.09375 = fieldNorm(doc=5887)
    0.03875456 = product of:
      0.07750912 = sum of:
        0.07750912 = weight(_text_:22 in 5887) [ClassicSimilarity], result of:
          0.07750912 = score(doc=5887,freq=2.0), product of:
            0.16694428 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.047673445 = queryNorm
            0.46428138 = fieldWeight in 5887, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=5887)
      0.5 = coord(1/2)
  0.5 = coord(3/6)

Source: Wissen in Aktion: Wege des Knowledge Managements. 22. Online-Tagung der DGI, Frankfurt am Main, 2.-4.5.2000. Proceedings. Hrsg.: R. Schmidt

Scherer, B.: Automatische Indexierung und ihre Anwendung im DFG-Projekt "Gemeinsames Portal für Bibliotheken, Archive und Museen (BAM)" (2003) 0.11
```
0.11275513 = product of:
  0.22551025 = sum of:
    0.01193624 = weight(_text_:in in 4283) [ClassicSimilarity], result of:
      0.01193624 = score(doc=4283,freq=12.0), product of:
        0.06484802 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.047673445 = queryNorm
        0.18406484 = fieldWeight in 4283, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4283)
    0.20152509 = weight(_text_:indexierung in 4283) [ClassicSimilarity], result of:
      0.20152509 = score(doc=4283,freq=14.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.78602856 = fieldWeight in 4283, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4283)
    0.012048915 = product of:
      0.02409783 = sum of:
        0.02409783 = weight(_text_:retrieval in 4283) [ClassicSimilarity], result of:
          0.02409783 = score(doc=4283,freq=2.0), product of:
            0.14420812 = queryWeight, product of:
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.047673445 = queryNorm
            0.16710453 = fieldWeight in 4283, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.024915 = idf(docFreq=5836, maxDocs=44218)
              0.0390625 = fieldNorm(doc=4283)
      0.5 = coord(1/2)
  0.5 = coord(3/6)
```
Abstract

Automatische Indexierung verzeichnet schon seit einigen Jahren aufgrund steigender Informationsflut ein wachsendes Interesse. Allerdings gibt es immer noch Vorbehalte gegenüber der intellektuellen Indexierung in Bezug auf Qualität und größerem Aufwand der Systemimplementierung bzw. -pflege. Neuere Entwicklungen aus dem Bereich des Wissensmanagements, wie beispielsweise Verfahren aus der Künstlichen Intelligenz, der Informationsextraktion, dem Text Mining bzw. der automatischen Klassifikation sollen die automatische Indexierung aufwerten und verbessern. Damit soll eine intelligentere und mehr inhaltsbasierte Erschließung geleistet werden. In dieser Masterarbeit wird außerhalb der Darstellung von Grundlagen und Verfahren der automatischen Indexierung sowie neueren Entwicklungen auch Möglichkeiten der Evaluation dargestellt. Die mögliche Anwendung der automatischen Indexierung im DFG-ProjektGemeinsames Portal für Bibliotheken, Archive und Museen (BAM)" bilden den Schwerpunkt der Arbeit. Im Portal steht die bibliothekarische Erschließung von Texten im Vordergrund. In einem umfangreichen Test werden drei deutsche, linguistische Systeme mit statistischen Verfahren kombiniert (die aber teilweise im System bereits integriert ist) und evaluiert, allerdings nur auf der Basis der ausgegebenen Indexate. Abschließend kann festgestellt werden, dass die Ergebnisse und damit die Qualität (bezogen auf die Indexate) von intellektueller und automatischer Indexierung noch signifikant unterschiedlich sind. Die Gründe liegen in noch zu lösenden semantischen Problemen bzw, in der Obereinstimmung mit Worten aus einem Thesaurus, die von einem automatischen Indexierungssystem nicht immer nachvollzogen werden kann. Eine Inhaltsanreicherung mit den Indexaten zum Vorteil beim Retrieval kann, je nach System oder auch über die Einbindung durch einen Thesaurus, erreicht werden.

Footnote

Masterarbeit im Studiengang Information Engineering zur Erlagung des Grades eines Master of Science in Information science,

Lepsky, K.: Automatische Indexierung (2013) 0.11

0.109279804 = product of:
  0.21855961 = sum of:
    0.0097459 = weight(_text_:in in 720) [ClassicSimilarity], result of:
      0.0097459 = score(doc=720,freq=2.0), product of:
        0.06484802 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.047673445 = queryNorm
        0.15028831 = fieldWeight in 720, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.078125 = fieldNorm(doc=720)
    0.15233864 = weight(_text_:indexierung in 720) [ClassicSimilarity], result of:
      0.15233864 = score(doc=720,freq=2.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.5941817 = fieldWeight in 720, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.078125 = fieldNorm(doc=720)
    0.056475073 = weight(_text_:u in 720) [ClassicSimilarity], result of:
      0.056475073 = score(doc=720,freq=2.0), product of:
        0.15610404 = queryWeight, product of:
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.047673445 = queryNorm
        0.3617784 = fieldWeight in 720, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          3.2744443 = idf(docFreq=4547, maxDocs=44218)
          0.078125 = fieldNorm(doc=720)
  0.5 = coord(3/6)

Source: Grundlagen der praktischen Information und Dokumentation. Handbuch zur Einführung in die Informationswissenschaft und -praxis. 6., völlig neu gefaßte Ausgabe. Hrsg. von R. Kuhlen, W. Semar u. D. Strauch. Begründet von Klaus Laisiepen, Ernst Lutterbeck, Karl-Heinrich Meyer-Uhlenried

Glaesener, L.: Automatisches Indexieren einer informationswissenschaftlichen Datenbank mit Mehrwortgruppen (2012) 0.10

0.10460706 = product of:
  0.20921412 = sum of:
    0.011026227 = weight(_text_:in in 401) [ClassicSimilarity], result of:
      0.011026227 = score(doc=401,freq=4.0), product of:
        0.06484802 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.047673445 = queryNorm
        0.17003182 = fieldWeight in 401, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0625 = fieldNorm(doc=401)
    0.17235151 = weight(_text_:indexierung in 401) [ClassicSimilarity], result of:
      0.17235151 = score(doc=401,freq=4.0), product of:
        0.25638393 = queryWeight, product of:
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.047673445 = queryNorm
        0.6722399 = fieldWeight in 401, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.377919 = idf(docFreq=554, maxDocs=44218)
          0.0625 = fieldNorm(doc=401)
    0.025836375 = product of:
      0.05167275 = sum of:
        0.05167275 = weight(_text_:22 in 401) [ClassicSimilarity], result of:
          0.05167275 = score(doc=401,freq=2.0), product of:
            0.16694428 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.047673445 = queryNorm
            0.30952093 = fieldWeight in 401, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0625 = fieldNorm(doc=401)
      0.5 = coord(1/2)
  0.5 = coord(3/6)

Abstract: Ein Bericht über die Ergebnisse und die Prozessanalyse einer automatischen Indexierung mit Mehrwortgruppen. Diese Bachelorarbeit beschreibt, inwieweit der Inhalt informationswissenschaftlicher Fachtexte durch informationswissenschaftliches Fachvokabular erschlossen werden kann und sollte und dass in diesen wissenschaftlichen Texten ein Großteil der fachlichen Inhalte in Mehrwortgruppen vorkommt. Die Ergebnisse wurden durch eine automatische Indexierung mit Mehrwortgruppen mithilfe des Programme Lingo an einer informationswissenschaftlichen Datenbank ermittelt.
Date: 11. 9.2012 19:43:22

Search (371 results, page 1 of 19)

Authors

Years

Languages

Types

Themes

Subjects

Classifications