-
Hotho, A.; Bloehdorn, S.: Data Mining 2004 : Text classification by boosting weak learners based on terms and concepts (2004)
0.16
0.15868267 = product of:
0.2115769 = sum of:
0.051574364 = product of:
0.1547231 = sum of:
0.1547231 = weight(_text_:3a in 562) [ClassicSimilarity], result of:
0.1547231 = score(doc=562,freq=2.0), product of:
0.27529916 = queryWeight, product of:
8.478011 = idf(docFreq=24, maxDocs=44218)
0.03247214 = queryNorm
0.56201804 = fieldWeight in 562, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
8.478011 = idf(docFreq=24, maxDocs=44218)
0.046875 = fieldNorm(doc=562)
0.33333334 = coord(1/3)
0.1547231 = weight(_text_:2f in 562) [ClassicSimilarity], result of:
0.1547231 = score(doc=562,freq=2.0), product of:
0.27529916 = queryWeight, product of:
8.478011 = idf(docFreq=24, maxDocs=44218)
0.03247214 = queryNorm
0.56201804 = fieldWeight in 562, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
8.478011 = idf(docFreq=24, maxDocs=44218)
0.046875 = fieldNorm(doc=562)
0.0052794325 = product of:
0.026397161 = sum of:
0.026397161 = weight(_text_:22 in 562) [ClassicSimilarity], result of:
0.026397161 = score(doc=562,freq=2.0), product of:
0.11371191 = queryWeight, product of:
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.03247214 = queryNorm
0.23214069 = fieldWeight in 562, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.046875 = fieldNorm(doc=562)
0.2 = coord(1/5)
0.75 = coord(3/4)
- Content
- Vgl.: http://www.google.de/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&ved=0CEAQFjAA&url=http%3A%2F%2Fciteseerx.ist.psu.edu%2Fviewdoc%2Fdownload%3Fdoi%3D10.1.1.91.4940%26rep%3Drep1%26type%3Dpdf&ei=dOXrUMeIDYHDtQahsIGACg&usg=AFQjCNHFWVh6gNPvnOrOS9R3rkrXCNVD-A&sig2=5I2F5evRfMnsttSgFF9g7Q&bvm=bv.1357316858,d.Yms.
- Date
- 8. 1.2013 10:22:32
-
Schrodt, R.: Tiefen und Untiefen im wissenschaftlichen Sprachgebrauch (2008)
0.14
0.13753164 = product of:
0.27506328 = sum of:
0.06876582 = product of:
0.20629746 = sum of:
0.20629746 = weight(_text_:3a in 140) [ClassicSimilarity], result of:
0.20629746 = score(doc=140,freq=2.0), product of:
0.27529916 = queryWeight, product of:
8.478011 = idf(docFreq=24, maxDocs=44218)
0.03247214 = queryNorm
0.7493574 = fieldWeight in 140, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
8.478011 = idf(docFreq=24, maxDocs=44218)
0.0625 = fieldNorm(doc=140)
0.33333334 = coord(1/3)
0.20629746 = weight(_text_:2f in 140) [ClassicSimilarity], result of:
0.20629746 = score(doc=140,freq=2.0), product of:
0.27529916 = queryWeight, product of:
8.478011 = idf(docFreq=24, maxDocs=44218)
0.03247214 = queryNorm
0.7493574 = fieldWeight in 140, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
8.478011 = idf(docFreq=24, maxDocs=44218)
0.0625 = fieldNorm(doc=140)
0.5 = coord(2/4)
- Content
- Vgl. auch: https://studylibde.com/doc/13053640/richard-schrodt. Vgl. auch: http%3A%2F%2Fwww.univie.ac.at%2FGermanistik%2Fschrodt%2Fvorlesung%2Fwissenschaftssprache.doc&usg=AOvVaw1lDLDR6NFf1W0-oC9mEUJf.
-
Vetere, G.; Lenzerini, M.: Models for semantic interoperability in service-oriented architectures (2005)
0.12
0.12034019 = product of:
0.24068038 = sum of:
0.060170095 = product of:
0.18051028 = sum of:
0.18051028 = weight(_text_:3a in 306) [ClassicSimilarity], result of:
0.18051028 = score(doc=306,freq=2.0), product of:
0.27529916 = queryWeight, product of:
8.478011 = idf(docFreq=24, maxDocs=44218)
0.03247214 = queryNorm
0.65568775 = fieldWeight in 306, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
8.478011 = idf(docFreq=24, maxDocs=44218)
0.0546875 = fieldNorm(doc=306)
0.33333334 = coord(1/3)
0.18051028 = weight(_text_:2f in 306) [ClassicSimilarity], result of:
0.18051028 = score(doc=306,freq=2.0), product of:
0.27529916 = queryWeight, product of:
8.478011 = idf(docFreq=24, maxDocs=44218)
0.03247214 = queryNorm
0.65568775 = fieldWeight in 306, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
8.478011 = idf(docFreq=24, maxDocs=44218)
0.0546875 = fieldNorm(doc=306)
0.5 = coord(2/4)
- Content
- Vgl.: http://ieeexplore.ieee.org/xpl/login.jsp?tp=&arnumber=5386707&url=http%3A%2F%2Fieeexplore.ieee.org%2Fxpls%2Fabs_all.jsp%3Farnumber%3D5386707.
-
Mas, S.; Marleau, Y.: Proposition of a faceted classification model to support corporate information organization and digital records management (2009)
0.10
0.10314873 = product of:
0.20629746 = sum of:
0.051574364 = product of:
0.1547231 = sum of:
0.1547231 = weight(_text_:3a in 2918) [ClassicSimilarity], result of:
0.1547231 = score(doc=2918,freq=2.0), product of:
0.27529916 = queryWeight, product of:
8.478011 = idf(docFreq=24, maxDocs=44218)
0.03247214 = queryNorm
0.56201804 = fieldWeight in 2918, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
8.478011 = idf(docFreq=24, maxDocs=44218)
0.046875 = fieldNorm(doc=2918)
0.33333334 = coord(1/3)
0.1547231 = weight(_text_:2f in 2918) [ClassicSimilarity], result of:
0.1547231 = score(doc=2918,freq=2.0), product of:
0.27529916 = queryWeight, product of:
8.478011 = idf(docFreq=24, maxDocs=44218)
0.03247214 = queryNorm
0.56201804 = fieldWeight in 2918, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
8.478011 = idf(docFreq=24, maxDocs=44218)
0.046875 = fieldNorm(doc=2918)
0.5 = coord(2/4)
- Footnote
- Vgl.: http://ieeexplore.ieee.org/Xplore/login.jsp?reload=true&url=http%3A%2F%2Fieeexplore.ieee.org%2Fiel5%2F4755313%2F4755314%2F04755480.pdf%3Farnumber%3D4755480&authDecision=-203.
-
Donsbach, W.: Wahrheit in den Medien : über den Sinn eines methodischen Objektivitätsbegriffes (2001)
0.09
0.08595728 = product of:
0.17191456 = sum of:
0.04297864 = product of:
0.12893592 = sum of:
0.12893592 = weight(_text_:3a in 5895) [ClassicSimilarity], result of:
0.12893592 = score(doc=5895,freq=2.0), product of:
0.27529916 = queryWeight, product of:
8.478011 = idf(docFreq=24, maxDocs=44218)
0.03247214 = queryNorm
0.46834838 = fieldWeight in 5895, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
8.478011 = idf(docFreq=24, maxDocs=44218)
0.0390625 = fieldNorm(doc=5895)
0.33333334 = coord(1/3)
0.12893592 = weight(_text_:2f in 5895) [ClassicSimilarity], result of:
0.12893592 = score(doc=5895,freq=2.0), product of:
0.27529916 = queryWeight, product of:
8.478011 = idf(docFreq=24, maxDocs=44218)
0.03247214 = queryNorm
0.46834838 = fieldWeight in 5895, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
8.478011 = idf(docFreq=24, maxDocs=44218)
0.0390625 = fieldNorm(doc=5895)
0.5 = coord(2/4)
- Source
- Politische Meinung. 381(2001) Nr.1, S.65-74 [https%3A%2F%2Fwww.dgfe.de%2Ffileadmin%2FOrdnerRedakteure%2FSektionen%2FSek02_AEW%2FKWF%2FPublikationen_Reihe_1989-2003%2FBand_17%2FBd_17_1994_355-406_A.pdf&usg=AOvVaw2KcbRsHy5UQ9QRIUyuOLNi]
-
Nohr, H.: Grundlagen der automatischen Indexierung : ein Lehrbuch (2003)
0.08
0.07658472 = product of:
0.15316944 = sum of:
0.14964981 = weight(_text_:indexierung in 1767) [ClassicSimilarity], result of:
0.14964981 = score(doc=1767,freq=26.0), product of:
0.17463255 = queryWeight, product of:
5.377919 = idf(docFreq=554, maxDocs=44218)
0.03247214 = queryNorm
0.8569411 = fieldWeight in 1767, product of:
5.0990195 = tf(freq=26.0), with freq of:
26.0 = termFreq=26.0
5.377919 = idf(docFreq=554, maxDocs=44218)
0.03125 = fieldNorm(doc=1767)
0.0035196214 = product of:
0.017598107 = sum of:
0.017598107 = weight(_text_:22 in 1767) [ClassicSimilarity], result of:
0.017598107 = score(doc=1767,freq=2.0), product of:
0.11371191 = queryWeight, product of:
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.03247214 = queryNorm
0.15476047 = fieldWeight in 1767, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.03125 = fieldNorm(doc=1767)
0.2 = coord(1/5)
0.5 = coord(2/4)
- Date
- 22. 6.2009 12:46:51
- Footnote
- Rez. in: nfd 54(2003) H.5, S.314 (W. Ratzek): "Um entscheidungsrelevante Daten aus der ständig wachsenden Flut von mehr oder weniger relevanten Dokumenten zu extrahieren, müssen Unternehmen, öffentliche Verwaltung oder Einrichtungen der Fachinformation effektive und effiziente Filtersysteme entwickeln, einsetzen und pflegen. Das vorliegende Lehrbuch von Holger Nohr bietet erstmalig eine grundlegende Einführung in das Thema "automatische Indexierung". Denn: "Wie man Information sammelt, verwaltet und verwendet, wird darüber entscheiden, ob man zu den Gewinnern oder Verlierern gehört" (Bill Gates), heißt es einleitend. Im ersten Kapitel "Einleitung" stehen die Grundlagen im Mittelpunkt. Die Zusammenhänge zwischen Dokumenten-Management-Systeme, Information Retrieval und Indexierung für Planungs-, Entscheidungs- oder Innovationsprozesse, sowohl in Profit- als auch Non-Profit-Organisationen werden beschrieben. Am Ende des einleitenden Kapitels geht Nohr auf die Diskussion um die intellektuelle und automatische Indexierung ein und leitet damit über zum zweiten Kapitel "automatisches Indexieren. Hier geht der Autor überblickartig unter anderem ein auf - Probleme der automatischen Sprachverarbeitung und Indexierung - verschiedene Verfahren der automatischen Indexierung z.B. einfache Stichwortextraktion / Volltextinvertierung, - statistische Verfahren, Pattern-Matching-Verfahren. Die "Verfahren der automatischen Indexierung" behandelt Nohr dann vertiefend und mit vielen Beispielen versehen im umfangreichsten dritten Kapitel. Das vierte Kapitel "Keyphrase Extraction" nimmt eine Passpartout-Status ein: "Eine Zwischenstufe auf dem Weg von der automatischen Indexierung hin zur automatischen Generierung textueller Zusammenfassungen (Automatic Text Summarization) stellen Ansätze dar, die Schlüsselphrasen aus Dokumenten extrahieren (Keyphrase Extraction). Die Grenzen zwischen den automatischen Verfahren der Indexierung und denen des Text Summarization sind fließend." (S. 91). Am Beispiel NCR"s Extractor/Copernic Summarizer beschreibt Nohr die Funktionsweise.
Im fünften Kapitel "Information Extraction" geht Nohr auf eine Problemstellung ein, die in der Fachwelt eine noch stärkere Betonung verdiente: "Die stetig ansteigende Zahl elektronischer Dokumente macht neben einer automatischen Erschließung auch eine automatische Gewinnung der relevanten Informationen aus diesen Dokumenten wünschenswert, um diese z.B. für weitere Bearbeitungen oder Auswertungen in betriebliche Informationssysteme übernehmen zu können." (S. 103) "Indexierung und Retrievalverfahren" als voneinander abhängige Verfahren werden im sechsten Kapitel behandelt. Hier stehen Relevance Ranking und Relevance Feedback sowie die Anwendung informationslinguistischer Verfahren in der Recherche im Mittelpunkt. Die "Evaluation automatischer Indexierung" setzt den thematischen Schlusspunkt. Hier geht es vor allem um die Oualität einer Indexierung, um gängige Retrievalmaße in Retrievaltest und deren Einssatz. Weiterhin ist hervorzuheben, dass jedes Kapitel durch die Vorgabe von Lernzielen eingeleitet wird und zu den jeweiligen Kapiteln (im hinteren Teil des Buches) einige Kontrollfragen gestellt werden. Die sehr zahlreichen Beispiele aus der Praxis, ein Abkürzungsverzeichnis und ein Sachregister erhöhen den Nutzwert des Buches. Die Lektüre förderte beim Rezensenten das Verständnis für die Zusammenhänge von BID-Handwerkzeug, Wirtschaftsinformatik (insbesondere Data Warehousing) und Künstlicher Intelligenz. Die "Grundlagen der automatischen Indexierung" sollte auch in den bibliothekarischen Studiengängen zur Pflichtlektüre gehören. Holger Nohrs Lehrbuch ist auch für den BID-Profi geeignet, um die mehr oder weniger fundierten Kenntnisse auf dem Gebiet "automatisches Indexieren" schnell, leicht verständlich und informativ aufzufrischen."
-
Lepsky, K.; Vorhauer, J.: Lingo - ein open source System für die Automatische Indexierung deutschsprachiger Dokumente (2006)
0.08
0.07540907 = product of:
0.15081814 = sum of:
0.14377889 = weight(_text_:indexierung in 3581) [ClassicSimilarity], result of:
0.14377889 = score(doc=3581,freq=6.0), product of:
0.17463255 = queryWeight, product of:
5.377919 = idf(docFreq=554, maxDocs=44218)
0.03247214 = queryNorm
0.8233224 = fieldWeight in 3581, product of:
2.4494898 = tf(freq=6.0), with freq of:
6.0 = termFreq=6.0
5.377919 = idf(docFreq=554, maxDocs=44218)
0.0625 = fieldNorm(doc=3581)
0.007039243 = product of:
0.035196215 = sum of:
0.035196215 = weight(_text_:22 in 3581) [ClassicSimilarity], result of:
0.035196215 = score(doc=3581,freq=2.0), product of:
0.11371191 = queryWeight, product of:
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.03247214 = queryNorm
0.30952093 = fieldWeight in 3581, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.0625 = fieldNorm(doc=3581)
0.2 = coord(1/5)
0.5 = coord(2/4)
- Abstract
- Lingo ist ein frei verfügbares System (open source) zur automatischen Indexierung der deutschen Sprache. Bei der Entwicklung von lingo standen hohe Konfigurierbarkeit und Flexibilität des Systems für unterschiedliche Einsatzmöglichkeiten im Vordergrund. Der Beitrag zeigt den Nutzen einer linguistisch basierten automatischen Indexierung für das Information Retrieval auf. Die für eine Retrievalverbesserung zur Verfügung stehende linguistische Funktionalität von lingo wird vorgestellt und an Beispielen erläutert: Grundformerkennung, Kompositumerkennung bzw. Kompositumzerlegung, Wortrelationierung, lexikalische und algorithmische Mehrwortgruppenerkennung, OCR-Fehlerkorrektur. Der offene Systemaufbau von lingo wird beschrieben, mögliche Einsatzszenarien und Anwendungsgrenzen werden benannt.
- Date
- 24. 3.2006 12:22:02
-
Stojanovic, N.: Ontology-based Information Retrieval : methods and tools for cooperative query answering (2005)
0.07
0.06876582 = product of:
0.13753164 = sum of:
0.03438291 = product of:
0.10314873 = sum of:
0.10314873 = weight(_text_:3a in 701) [ClassicSimilarity], result of:
0.10314873 = score(doc=701,freq=2.0), product of:
0.27529916 = queryWeight, product of:
8.478011 = idf(docFreq=24, maxDocs=44218)
0.03247214 = queryNorm
0.3746787 = fieldWeight in 701, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
8.478011 = idf(docFreq=24, maxDocs=44218)
0.03125 = fieldNorm(doc=701)
0.33333334 = coord(1/3)
0.10314873 = weight(_text_:2f in 701) [ClassicSimilarity], result of:
0.10314873 = score(doc=701,freq=2.0), product of:
0.27529916 = queryWeight, product of:
8.478011 = idf(docFreq=24, maxDocs=44218)
0.03247214 = queryNorm
0.3746787 = fieldWeight in 701, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
8.478011 = idf(docFreq=24, maxDocs=44218)
0.03125 = fieldNorm(doc=701)
0.5 = coord(2/4)
- Content
- Vgl.: http%3A%2F%2Fdigbib.ubka.uni-karlsruhe.de%2Fvolltexte%2Fdocuments%2F1627&ei=tAtYUYrBNoHKtQb3l4GYBw&usg=AFQjCNHeaxKkKU3-u54LWxMNYGXaaDLCGw&sig2=8WykXWQoDKjDSdGtAakH2Q&bvm=bv.44442042,d.Yms.
-
Hauer, M.: Automatische Indexierung (2000)
0.07
0.06753751 = product of:
0.13507502 = sum of:
0.12451616 = weight(_text_:indexierung in 5887) [ClassicSimilarity], result of:
0.12451616 = score(doc=5887,freq=2.0), product of:
0.17463255 = queryWeight, product of:
5.377919 = idf(docFreq=554, maxDocs=44218)
0.03247214 = queryNorm
0.71301806 = fieldWeight in 5887, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
5.377919 = idf(docFreq=554, maxDocs=44218)
0.09375 = fieldNorm(doc=5887)
0.010558865 = product of:
0.052794322 = sum of:
0.052794322 = weight(_text_:22 in 5887) [ClassicSimilarity], result of:
0.052794322 = score(doc=5887,freq=2.0), product of:
0.11371191 = queryWeight, product of:
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.03247214 = queryNorm
0.46428138 = fieldWeight in 5887, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.09375 = fieldNorm(doc=5887)
0.2 = coord(1/5)
0.5 = coord(2/4)
- Source
- Wissen in Aktion: Wege des Knowledge Managements. 22. Online-Tagung der DGI, Frankfurt am Main, 2.-4.5.2000. Proceedings. Hrsg.: R. Schmidt
-
Probst, M.; Mittelbach, J.: Maschinelle Indexierung in der Sacherschließung wissenschaftlicher Bibliotheken (2006)
0.06
0.062217105 = product of:
0.12443421 = sum of:
0.11739497 = weight(_text_:indexierung in 1755) [ClassicSimilarity], result of:
0.11739497 = score(doc=1755,freq=4.0), product of:
0.17463255 = queryWeight, product of:
5.377919 = idf(docFreq=554, maxDocs=44218)
0.03247214 = queryNorm
0.6722399 = fieldWeight in 1755, product of:
2.0 = tf(freq=4.0), with freq of:
4.0 = termFreq=4.0
5.377919 = idf(docFreq=554, maxDocs=44218)
0.0625 = fieldNorm(doc=1755)
0.007039243 = product of:
0.035196215 = sum of:
0.035196215 = weight(_text_:22 in 1755) [ClassicSimilarity], result of:
0.035196215 = score(doc=1755,freq=2.0), product of:
0.11371191 = queryWeight, product of:
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.03247214 = queryNorm
0.30952093 = fieldWeight in 1755, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.0625 = fieldNorm(doc=1755)
0.2 = coord(1/5)
0.5 = coord(2/4)
- Abstract
- Obwohl fast alle größeren Bibliotheken intellektuelle Sacherschließung betreiben, sind elektronische Kataloge für die zielgerichtete sachliche Suche nur eingeschränkt nutzbar. Durch maschinelle Indexierung können ohne nennenswerten personellen Mehraufwand ausreichend große Datenmengen für Informationsretrievalsysteme erzeugt und somit die Auffindbarkeit von Dokumenten erhöht werden. Geeignete Sprachanalysetechniken zur Indextermerzeugung sind bekannt und bieten im Gegensatz zur gebräuchlichen Freitextinvertierung entscheidende Vorteile beim Retrieval. Im Fokus steht die Betrachtung der Vor- und Nachteile der gängigen Indexierungssysteme MILOS und intelligentCAPTURE.
- Date
- 22. 3.2008 12:35:19
-
Boyack, K.W.; Wylie,B.N.; Davidson, G.S.: Information Visualization, Human-Computer Interaction, and Cognitive Psychology : Domain Visualizations (2002)
0.06
0.058103606 = product of:
0.11620721 = sum of:
0.10376347 = weight(_text_:indexierung in 1352) [ClassicSimilarity], result of:
0.10376347 = score(doc=1352,freq=2.0), product of:
0.17463255 = queryWeight, product of:
5.377919 = idf(docFreq=554, maxDocs=44218)
0.03247214 = queryNorm
0.5941817 = fieldWeight in 1352, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
5.377919 = idf(docFreq=554, maxDocs=44218)
0.078125 = fieldNorm(doc=1352)
0.012443742 = product of:
0.062218707 = sum of:
0.062218707 = weight(_text_:22 in 1352) [ClassicSimilarity], result of:
0.062218707 = score(doc=1352,freq=4.0), product of:
0.11371191 = queryWeight, product of:
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.03247214 = queryNorm
0.54716086 = fieldWeight in 1352, product of:
2.0 = tf(freq=4.0), with freq of:
4.0 = termFreq=4.0
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.078125 = fieldNorm(doc=1352)
0.2 = coord(1/5)
0.5 = coord(2/4)
- Date
- 22. 2.2003 17:25:39
22. 2.2003 18:17:40
- Theme
- Semantisches Umfeld in Indexierung u. Retrieval
-
Zillmann, H.: OSIRIS und eLib : Information Retrieval und Search Engines in Full-text Databases (2001)
0.05
0.04502501 = product of:
0.09005002 = sum of:
0.08301078 = weight(_text_:indexierung in 5937) [ClassicSimilarity], result of:
0.08301078 = score(doc=5937,freq=2.0), product of:
0.17463255 = queryWeight, product of:
5.377919 = idf(docFreq=554, maxDocs=44218)
0.03247214 = queryNorm
0.47534537 = fieldWeight in 5937, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
5.377919 = idf(docFreq=554, maxDocs=44218)
0.0625 = fieldNorm(doc=5937)
0.007039243 = product of:
0.035196215 = sum of:
0.035196215 = weight(_text_:22 in 5937) [ClassicSimilarity], result of:
0.035196215 = score(doc=5937,freq=2.0), product of:
0.11371191 = queryWeight, product of:
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.03247214 = queryNorm
0.30952093 = fieldWeight in 5937, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.0625 = fieldNorm(doc=5937)
0.2 = coord(1/5)
0.5 = coord(2/4)
- Abstract
- OSIRIS und ELIB sind von der Deutschen Forschungsgemeinschaft (DFG) und dem Niedersächsischen Ministerium für Wissenschaft und Kultur (MWK) geförderte Projekte an der Universität Osnabrück. Sie beschäftigen sich mit intuitiv-natürlichsprachlichen Retrievalsystemen und mit Fragen der Indexierung großer Volltexdatenbanken in dieser Technik. Die Entwicklungen haben dazu geführt, daß an sich aufwendige und komplexe Verfahren der syntaktisch-semantischen Analyse und Bewertung von textuellen Phrasen in relationale Datenbanken für Massendaten eingebettet werden konnten und nun im Produktionsbetrieb eingesetzt werden können
- Date
- 14. 6.2001 12:22:31
-
Nicoletti, M.: Automatische Indexierung (2001)
0.04
0.044023115 = product of:
0.17609246 = sum of:
0.17609246 = weight(_text_:indexierung in 4326) [ClassicSimilarity], result of:
0.17609246 = score(doc=4326,freq=4.0), product of:
0.17463255 = queryWeight, product of:
5.377919 = idf(docFreq=554, maxDocs=44218)
0.03247214 = queryNorm
1.0083599 = fieldWeight in 4326, product of:
2.0 = tf(freq=4.0), with freq of:
4.0 = termFreq=4.0
5.377919 = idf(docFreq=554, maxDocs=44218)
0.09375 = fieldNorm(doc=4326)
0.25 = coord(1/4)
- Content
- Inhalt: 1. Aufgabe - 2. Ermittlung von Mehrwortgruppen - 2.1 Definition - 3. Kennzeichnung der Mehrwortgruppen - 4. Grundformen - 5. Term- und Dokumenthäufigkeit --- Termgewichtung - 6. Steuerungsinstrument Schwellenwert - 7. Invertierter Index. Vgl. unter: http://www.grin.com/de/e-book/104966/automatische-indexierung.
-
Sacco, G.M.: Dynamic taxonomies and guided searches (2006)
0.04
0.040672526 = product of:
0.08134505 = sum of:
0.07263443 = weight(_text_:indexierung in 5295) [ClassicSimilarity], result of:
0.07263443 = score(doc=5295,freq=2.0), product of:
0.17463255 = queryWeight, product of:
5.377919 = idf(docFreq=554, maxDocs=44218)
0.03247214 = queryNorm
0.4159272 = fieldWeight in 5295, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
5.377919 = idf(docFreq=554, maxDocs=44218)
0.0546875 = fieldNorm(doc=5295)
0.008710619 = product of:
0.043553095 = sum of:
0.043553095 = weight(_text_:22 in 5295) [ClassicSimilarity], result of:
0.043553095 = score(doc=5295,freq=4.0), product of:
0.11371191 = queryWeight, product of:
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.03247214 = queryNorm
0.38301262 = fieldWeight in 5295, product of:
2.0 = tf(freq=4.0), with freq of:
4.0 = termFreq=4.0
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.0546875 = fieldNorm(doc=5295)
0.2 = coord(1/5)
0.5 = coord(2/4)
- Date
- 22. 7.2006 17:56:22
- Theme
- Semantisches Umfeld in Indexierung u. Retrieval
-
Faaborg, A.; Lagoze, C.: Semantic browsing (2003)
0.04
0.039396882 = product of:
0.078793764 = sum of:
0.07263443 = weight(_text_:indexierung in 1026) [ClassicSimilarity], result of:
0.07263443 = score(doc=1026,freq=2.0), product of:
0.17463255 = queryWeight, product of:
5.377919 = idf(docFreq=554, maxDocs=44218)
0.03247214 = queryNorm
0.4159272 = fieldWeight in 1026, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
5.377919 = idf(docFreq=554, maxDocs=44218)
0.0546875 = fieldNorm(doc=1026)
0.0061593377 = product of:
0.030796688 = sum of:
0.030796688 = weight(_text_:22 in 1026) [ClassicSimilarity], result of:
0.030796688 = score(doc=1026,freq=2.0), product of:
0.11371191 = queryWeight, product of:
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.03247214 = queryNorm
0.2708308 = fieldWeight in 1026, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.0546875 = fieldNorm(doc=1026)
0.2 = coord(1/5)
0.5 = coord(2/4)
- Source
- Research and advanced technology for digital libraries : 7th European Conference, proceedings / ECDL 2003, Trondheim, Norway, August 17-22, 2003
- Theme
- Semantisches Umfeld in Indexierung u. Retrieval
-
Knorz, G.; Rein, B.: Semantische Suche in einer Hochschulontologie (2005)
0.04
0.039396882 = product of:
0.078793764 = sum of:
0.07263443 = weight(_text_:indexierung in 1852) [ClassicSimilarity], result of:
0.07263443 = score(doc=1852,freq=2.0), product of:
0.17463255 = queryWeight, product of:
5.377919 = idf(docFreq=554, maxDocs=44218)
0.03247214 = queryNorm
0.4159272 = fieldWeight in 1852, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
5.377919 = idf(docFreq=554, maxDocs=44218)
0.0546875 = fieldNorm(doc=1852)
0.0061593377 = product of:
0.030796688 = sum of:
0.030796688 = weight(_text_:22 in 1852) [ClassicSimilarity], result of:
0.030796688 = score(doc=1852,freq=2.0), product of:
0.11371191 = queryWeight, product of:
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.03247214 = queryNorm
0.2708308 = fieldWeight in 1852, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.0546875 = fieldNorm(doc=1852)
0.2 = coord(1/5)
0.5 = coord(2/4)
- Date
- 11. 2.2011 18:22:58
- Theme
- Semantisches Umfeld in Indexierung u. Retrieval
-
Knorz, G.; Rein, B.: Semantische Suche in einer Hochschulontologie : Ontologie-basiertes Information-Filtering und -Retrieval mit relationalen Datenbanken (2005)
0.04
0.039396882 = product of:
0.078793764 = sum of:
0.07263443 = weight(_text_:indexierung in 4324) [ClassicSimilarity], result of:
0.07263443 = score(doc=4324,freq=2.0), product of:
0.17463255 = queryWeight, product of:
5.377919 = idf(docFreq=554, maxDocs=44218)
0.03247214 = queryNorm
0.4159272 = fieldWeight in 4324, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
5.377919 = idf(docFreq=554, maxDocs=44218)
0.0546875 = fieldNorm(doc=4324)
0.0061593377 = product of:
0.030796688 = sum of:
0.030796688 = weight(_text_:22 in 4324) [ClassicSimilarity], result of:
0.030796688 = score(doc=4324,freq=2.0), product of:
0.11371191 = queryWeight, product of:
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.03247214 = queryNorm
0.2708308 = fieldWeight in 4324, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.0546875 = fieldNorm(doc=4324)
0.2 = coord(1/5)
0.5 = coord(2/4)
- Date
- 11. 2.2011 18:22:25
- Theme
- Semantisches Umfeld in Indexierung u. Retrieval
-
Stock, W.G.: Qualitätskriterien von Suchmaschinen : Checkliste für Retrievalsysteme (2000)
0.04
0.03888569 = product of:
0.07777138 = sum of:
0.07337185 = weight(_text_:indexierung in 5773) [ClassicSimilarity], result of:
0.07337185 = score(doc=5773,freq=4.0), product of:
0.17463255 = queryWeight, product of:
5.377919 = idf(docFreq=554, maxDocs=44218)
0.03247214 = queryNorm
0.42014992 = fieldWeight in 5773, product of:
2.0 = tf(freq=4.0), with freq of:
4.0 = termFreq=4.0
5.377919 = idf(docFreq=554, maxDocs=44218)
0.0390625 = fieldNorm(doc=5773)
0.004399527 = product of:
0.021997634 = sum of:
0.021997634 = weight(_text_:22 in 5773) [ClassicSimilarity], result of:
0.021997634 = score(doc=5773,freq=2.0), product of:
0.11371191 = queryWeight, product of:
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.03247214 = queryNorm
0.19345059 = fieldWeight in 5773, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.0390625 = fieldNorm(doc=5773)
0.2 = coord(1/5)
0.5 = coord(2/4)
- Abstract
- Suchmaschinen im World Wide Web wird nachgesagt, dass sie - insbesondere im Vergleich zur Retrievalsoftware kommerzieller Online-Archive suboptimale Methoden und Werkzeuge einsetzen. Elaborierte befehlsorientierte Retrievalsysteme sind vom Laien gar nicht und vom Professional nur dann zu bedienen, wenn man stets damit arbeitet. Die Suchsysteme einiger "independents", also isolierter Informationsproduzenten im Internet, zeichnen sich durch einen Minimalismus aus, der an den Befehlsumfang anfangs der 70er Jahre erinnert. Retrievalsoftware in Intranets, wenn sie denn überhaupt benutzt wird, setzt fast ausnahmslos auf automatische Methoden von Indexierung und Retrieval und ignoriert dabei nahezu vollständig dokumentarisches Know how. Suchmaschinen bzw. Retrievalsysteme - wir wollen beide Bezeichnungen synonym verwenden - bereiten demnach, egal wo sie vorkommen, Schwierigkeiten. An ihrer Qualität wird gezweifelt. Aber was heißt überhaupt: Qualität von Suchmaschinen? Was zeichnet ein gutes Retrievalsystem aus? Und was fehlt einem schlechten? Wir wollen eine Liste von Kriterien entwickeln, die für gutes Suchen (und Finden!) wesentlich sind. Es geht also ausschließlich um Quantität und Qualität der Suchoptionen, nicht um weitere Leistungsindikatoren wie Geschwindigkeit oder ergonomische Benutzerschnittstellen. Stillschweigend vorausgesetzt wirdjedoch der Abschied von ausschließlich befehlsorientierten Systemen, d.h. wir unterstellen Bildschirmgestaltungen, die die Befehle intuitiv einleuchtend darstellen. Unsere Checkliste enthält nur solche Optionen, die entweder (bei irgendwelchen Systemen) schon im Einsatz sind (und wiederholt damit zum Teil Altbekanntes) oder deren technische Realisierungsmöglichkeit bereits in experimentellen Umgebungen aufgezeigt worden ist. insofern ist die Liste eine Minimalforderung an Retrievalsysteme, die durchaus erweiterungsfähig ist. Gegliedert wird der Kriterienkatalog nach (1.) den Basisfunktionen zur Suche singulärer Datensätze, (2.) den informetrischen Funktionen zur Charakterisierunggewisser Nachweismengen sowie (3.) den Kriterien zur Mächtigkeit automatischer Indexierung und natürlichsprachiger Suche
- Source
- Password. 2000, H.5, S.22-31
-
Rädler, K.: Kataloganreicherung mit digitalen Inhaltsverzeichnissen eröffnet neue Geschäftsfelder : Erfahrungen aus der Vorarlberger Landesbibliothek (2008)
0.04
0.03888569 = product of:
0.07777138 = sum of:
0.07337185 = weight(_text_:indexierung in 1942) [ClassicSimilarity], result of:
0.07337185 = score(doc=1942,freq=4.0), product of:
0.17463255 = queryWeight, product of:
5.377919 = idf(docFreq=554, maxDocs=44218)
0.03247214 = queryNorm
0.42014992 = fieldWeight in 1942, product of:
2.0 = tf(freq=4.0), with freq of:
4.0 = termFreq=4.0
5.377919 = idf(docFreq=554, maxDocs=44218)
0.0390625 = fieldNorm(doc=1942)
0.004399527 = product of:
0.021997634 = sum of:
0.021997634 = weight(_text_:22 in 1942) [ClassicSimilarity], result of:
0.021997634 = score(doc=1942,freq=2.0), product of:
0.11371191 = queryWeight, product of:
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.03247214 = queryNorm
0.19345059 = fieldWeight in 1942, product of:
1.4142135 = tf(freq=2.0), with freq of:
2.0 = termFreq=2.0
3.5018296 = idf(docFreq=3622, maxDocs=44218)
0.0390625 = fieldNorm(doc=1942)
0.2 = coord(1/5)
0.5 = coord(2/4)
- Abstract
- Vom verflixten siebten Jahr kann man in Bregenz bisher nicht sprechen, im Gegenteil: Die Vorarlberger Landesbibliothek (VLB) hat kurz vor Ostern 2008 ihr 100.000. Inhaltsverzeichnis mit intelligentCAPTURE gescannt. Damit ist der Katalogeintrag von etwa 70 Prozent des betroffenen Freihandbestandes und sämtlicher Neuzugänge ab 2002 zusätzlich mit dem Inhaltsverzeichnis und zum Teil mit der Abbildung des Buchdeckels versehen. Die derzeitige Durchsatzrate beträgt pro Jahr 30.000 bibliographische Einheiten bei einem Personaleinsatz von 40 Stunden pro Woche. Die vollständige Erschließung des Buchbestandes in der Freihandaufstellung ist in Reichweite; ganz ohne Fördermittel im laufenden Betrieb; eine schlanke Lösung sowohl organisatorisch als auch finanziell. Da im Rahmen der Zusammenarbeit mit dandelon.com inzwischen weitere Bibliotheken in einem elegant gelösten Arbeitsablauf kooperativ erschließen, können wir bei Neuerscheinungen bereits die Hälfte als Fremddaten übernehmen. Die VLB hat mit der Digitalisierung, OCR-Konvertierung und maschinellen Indexierung von Inhaltsverzeichnissen und dem mehrsprachigen, semantischen Retrieval in der Suchmaschine dandelon.com zusammen mit der Firma AGI. Information Management Consultants Impulse im Bibliothekswesen gesetzt. Wer 2002 noch bezweifelte, dass dieser Ansatz erfolgreich sein wurde, wurde inzwischen eines Besseren belehrt. Zu offensichtlich ist der Mehrwert, den allein die Moglichkeit der entscheidend verbesserten Relevanzbeurteilung uber den OPAC bietet (http://vlb-katalog.vorarlberg.de). Er erfordert von einer zeitgemasen Bibliothek geradezu das Angebot solcher Zusatzinformationen. Aber die Anreicherung mit den Angaben aus den Inhaltsverzeichnissen bieten weit mehr, denn es entsteht durch die maschinelle Indexierung eine vollig neue Dimension an Retrievalmoglichkeiten. Die vollständige Erfassung unseres Bestandes war immer erklärtes Ziel unseres Projektes, weil wir gesehen haben, dass wir den Nutzern dadurch einen erheblichen Zusatznutzen bieten können, der in einem unbeschreiblich günstigen Verhältnis zum personellen und finanziellen Einsatz steht. Damit, dass wir dieses Ziel so schnell erreichen könnten, hatten wir nicht gerechnet.
- Date
- 22. 6.2008 17:14:24
-
Cleveland, D.B.; Cleveland, A.D.: Introduction to abstracting and indexing (2001)
0.04
0.036685925 = product of:
0.1467437 = sum of:
0.1467437 = weight(_text_:indexierung in 316) [ClassicSimilarity], result of:
0.1467437 = score(doc=316,freq=4.0), product of:
0.17463255 = queryWeight, product of:
5.377919 = idf(docFreq=554, maxDocs=44218)
0.03247214 = queryNorm
0.84029984 = fieldWeight in 316, product of:
2.0 = tf(freq=4.0), with freq of:
4.0 = termFreq=4.0
5.377919 = idf(docFreq=554, maxDocs=44218)
0.078125 = fieldNorm(doc=316)
0.25 = coord(1/4)
- RSWK
- Indexierung <Inhaltserschließung> (GBV)
- Subject
- Indexierung <Inhaltserschließung> (GBV)