Search (273 results, page 1 of 14)

Renker, L.: Exploration von Textkorpora : Topic Models als Grundlage der Interaktion (2015) 0.19

0.18525653 = product of:
  0.29641044 = sum of:
    0.09162703 = weight(_text_:informatik in 2380) [ClassicSimilarity], result of:
      0.09162703 = score(doc=2380,freq=4.0), product of:
        0.22985439 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.045047637 = queryNorm
        0.39863077 = fieldWeight in 2380, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2380)
    0.015271572 = weight(_text_:in in 2380) [ClassicSimilarity], result of:
      0.015271572 = score(doc=2380,freq=22.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.24922498 = fieldWeight in 2380, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2380)
    0.04882597 = weight(_text_:zu in 2380) [ClassicSimilarity], result of:
      0.04882597 = score(doc=2380,freq=10.0), product of:
        0.13343859 = queryWeight, product of:
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.045047637 = queryNorm
        0.36590594 = fieldWeight in 2380, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2380)
    0.10834292 = weight(_text_:mensch in 2380) [ClassicSimilarity], result of:
      0.10834292 = score(doc=2380,freq=4.0), product of:
        0.24994317 = queryWeight, product of:
          5.548419 = idf(docFreq=467, maxDocs=44218)
          0.045047637 = queryNorm
        0.43347025 = fieldWeight in 2380, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.548419 = idf(docFreq=467, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2380)
    0.032342933 = weight(_text_:und in 2380) [ClassicSimilarity], result of:
      0.032342933 = score(doc=2380,freq=14.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.32394084 = fieldWeight in 2380, product of:
          3.7416575 = tf(freq=14.0), with freq of:
            14.0 = termFreq=14.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2380)
  0.625 = coord(5/8)

Abstract: Das Internet birgt schier endlose Informationen. Ein zentrales Problem besteht heutzutage darin diese auch zugänglich zu machen. Es ist ein fundamentales Domänenwissen erforderlich, um in einer Volltextsuche die korrekten Suchanfragen zu formulieren. Das ist jedoch oftmals nicht vorhanden, so dass viel Zeit aufgewandt werden muss, um einen Überblick des behandelten Themas zu erhalten. In solchen Situationen findet sich ein Nutzer in einem explorativen Suchvorgang, in dem er sich schrittweise an ein Thema heranarbeiten muss. Für die Organisation von Daten werden mittlerweile ganz selbstverständlich Verfahren des Machine Learnings verwendet. In den meisten Fällen bleiben sie allerdings für den Anwender unsichtbar. Die interaktive Verwendung in explorativen Suchprozessen könnte die menschliche Urteilskraft enger mit der maschinellen Verarbeitung großer Datenmengen verbinden. Topic Models sind ebensolche Verfahren. Sie finden in einem Textkorpus verborgene Themen, die sich relativ gut von Menschen interpretieren lassen und sind daher vielversprechend für die Anwendung in explorativen Suchprozessen. Nutzer können damit beim Verstehen unbekannter Quellen unterstützt werden. Bei der Betrachtung entsprechender Forschungsarbeiten fiel auf, dass Topic Models vorwiegend zur Erzeugung statischer Visualisierungen verwendet werden. Das Sensemaking ist ein wesentlicher Bestandteil der explorativen Suche und wird dennoch nur in sehr geringem Umfang genutzt, um algorithmische Neuerungen zu begründen und in einen umfassenden Kontext zu setzen. Daraus leitet sich die Vermutung ab, dass die Verwendung von Modellen des Sensemakings und die nutzerzentrierte Konzeption von explorativen Suchen, neue Funktionen für die Interaktion mit Topic Models hervorbringen und einen Kontext für entsprechende Forschungsarbeiten bieten können.
Footnote: Masterthesis zur Erlangung des akademischen Grades Master of Science (M.Sc.) vorgelegt an der Fachhochschule Köln / Fakultät für Informatik und Ingenieurswissenschaften im Studiengang Medieninformatik.
Imprint: Gummersbach : Fakultät für Informatik und Ingenieurswissenschaften
RSWK: Mensch-Maschine-Kommunikation
Subject: Mensch-Maschine-Kommunikation
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Context: nature, impact, and role : 5th International Conference on Conceptions of Library and Information Science, CoLIS 2005, Glasgow 2005; Proceedings (2005) 0.17
```
0.16520259 = product of:
  0.22027011 = sum of:
    0.05610987 = weight(_text_:informatik in 42) [ClassicSimilarity], result of:
      0.05610987 = score(doc=42,freq=6.0), product of:
        0.22985439 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.045047637 = queryNorm
        0.24411051 = fieldWeight in 42, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.01953125 = fieldNorm(doc=42)
    0.010296092 = weight(_text_:in in 42) [ClassicSimilarity], result of:
      0.010296092 = score(doc=42,freq=40.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.16802745 = fieldWeight in 42, product of:
          6.3245554 = tf(freq=40.0), with freq of:
            40.0 = termFreq=40.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.01953125 = fieldNorm(doc=42)
    0.053467765 = weight(_text_:beziehung in 42) [ClassicSimilarity], result of:
      0.053467765 = score(doc=42,freq=2.0), product of:
        0.29529732 = queryWeight, product of:
          6.5552235 = idf(docFreq=170, maxDocs=44218)
          0.045047637 = queryNorm
        0.18106417 = fieldWeight in 42, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          6.5552235 = idf(docFreq=170, maxDocs=44218)
          0.01953125 = fieldNorm(doc=42)
    0.024412986 = weight(_text_:zu in 42) [ClassicSimilarity], result of:
      0.024412986 = score(doc=42,freq=10.0), product of:
        0.13343859 = queryWeight, product of:
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.045047637 = queryNorm
        0.18295297 = fieldWeight in 42, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.01953125 = fieldNorm(doc=42)
    0.038305007 = weight(_text_:mensch in 42) [ClassicSimilarity], result of:
      0.038305007 = score(doc=42,freq=2.0), product of:
        0.24994317 = queryWeight, product of:
          5.548419 = idf(docFreq=467, maxDocs=44218)
          0.045047637 = queryNorm
        0.15325487 = fieldWeight in 42, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.548419 = idf(docFreq=467, maxDocs=44218)
          0.01953125 = fieldNorm(doc=42)
    0.03767838 = weight(_text_:und in 42) [ClassicSimilarity], result of:
      0.03767838 = score(doc=42,freq=76.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.3773797 = fieldWeight in 42, product of:
          8.717798 = tf(freq=76.0), with freq of:
            76.0 = termFreq=76.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.01953125 = fieldNorm(doc=42)
  0.75 = coord(6/8)
```
Classification

SS 4800 [Informatik # Enzyklopädien und Handbücher. Kongreßberichte Schriftenreihe. Tafeln und Formelsammlungen # Schriftenreihen (indiv. Sign.) # Lecture notes in computer science]

Content

Das Buch ist in die Abschnitte Invited Papers (1 Beitrag, 1 Abstract), Representing Context (3 Beiträge), Context and Relevance in Information Seeking (3), Context and Information (3), Contextualised Information Seeking (3), Agendas for Context (3), Context and Documents (2) und Workshops (2 Ankündigungstexte) gegliedert und enthält ein simples Autoren-, jedoch kein Sachregister. Die Autoren der Beiträge stammen mit einigen Ausnahmen (Italien, Frankreich, Russland) aus den angelsächsischen und skandinavischen Ländern.

Footnote

Rez. in: Mitt. VÖB 59(2006) H.3, S.100-103 (O. Oberhauser): "Dieses als Band 3507 der bekannten, seit 1973 erscheinenden Springer-Serie Lecture Notes in Computer Science (LNCS) publizierte Buch versammelt die Vorträge der 5. Tagung "Conceptions of Library and Information Science". CoLIS hat sich in den letzten anderthalb Jahrzehnten als internationales Forum für die Präsentation und Rezeption von Forschung auf den Fachgebieten Informatik und Informationswissenschaft etabliert. Auf die 1992 in Tampere (Finnland) anlässlich des damals 20jährigen Bestehens des dortigen Instituts für Informationswissenschaft abgehaltene erste Tagung folgten weitere in Kopenhagen (1996), Dubrovnik (1999) und Seattle, WA (2002). Die zuletzt an der Strathclyde University in Glasgow (2005) veranstaltete Konferenz war dem Thema "Context" im Rahmen der informationsbezogenen Forschung gewidmet, einem komplexen, dynamischen und multidimensionalen Begriff von grosser Bedeutung für das Verhalten und die Interaktion von Mensch und Maschine. . . .
Am interessantesten und wichtigsten erschien mir der Grundsatzartikel von Peter Ingwersen und Kalervo Järvelin (Kopenhagen/Tampere), The sense of information: Understanding the cognitive conditional information concept in relation to information acquisition (S. 7-19). Hier versuchen die Autoren, den ursprünglich von Ingwersen1 vorgeschlagenen und damals ausschliesslich im Zusammenhang mit dem interaktiven Information Retrieval verwendeten Begriff "conditional cognitive information" anhand eines erweiterten Modells nicht nur auf das Gesamtgebiet von "information seeking and retrieval" (IS&R) auszuweiten, sondern auch auf den menschlichen Informationserwerb aus der Sinneswahrnehmung, wie z.B. im Alltag oder im Rahmen der wissenschaftlichen Erkenntnistätigkeit. Dabei werden auch alternative Informationsbegriffe sowie die Beziehung von Information und Bedeutung diskutiert. Einen ebenfalls auf Ingwersen zurückgehenden Ansatz thematisiert der Beitrag von Birger Larsen (Kopenhagen), indem er sich mit dessen vor über 10 Jahren veröffentlichten2 Principle of Polyrepresentation befasst. Dieses beruht auf der Hypothese, wonach die Überlappung zwischen unterschiedlichen kognitiven Repräsentationen - nämlich jenen der Situation des Informationssuchenden und der Dokumente - zur Reduktion der einer Retrievalsituation anhaftenden Unsicherheit und damit zur Verbesserung der Performance des IR-Systems genutzt werden könne. Das Prinzip stellt die Dokumente, ihre Autoren und Indexierer, aber auch die sie zugänglich machende IT-Lösung in einen umfassenden und kohärenten theoretischen Bezugsrahmen, der die benutzerorientierte Forschungsrichtung "Information-Seeking" mit der systemorientierten IR-Forschung zu integrieren trachtet. Auf der Basis theoretischer Überlegungen sowie der (wenigen) dazu vorliegenden empirischen Studien hält Larsen das Model, das von Ingwersen sowohl für "exact match-IR" als auch für "best match-IR" intendiert war, allerdings schon in seinen Grundzügen für "Boolean" (d.h. "exact match"-orientiert) und schlägt ein "polyrepresentation continuum" als Verbesserungsmöglichkeit vor.
Mehrere Beiträge befassen sich mit dem Problem der Relevanz. Erica Cosijn und Theo Bothma (Pretoria) argumentieren, dass für das Benutzerverhalten neben der thematischen Relevanz auch verschiedene andere Relevanzdimensionen eine Rolle spielen und schlagen auf der Basis eines (abermals auf Ingwersen zurückgehenden) erweiterten Relevanzmodells vor, dass IR-Systeme die Möglichkeit zur Abgabe auch kognitiver, situativer und sozio-kognitiver Relevanzurteile bieten sollten. Elaine Toms et al. (Kanada) berichten von einer Studie, in der versucht wurde, die schon vor 30 Jahren von Tefko Saracevic3 erstellten fünf Relevanzdimensionen (kognitiv, motivational, situativ, thematisch und algorithmisch) zu operationalisieren und anhand von Recherchen mit einer Web-Suchmaschine zu untersuchen. Die Ergebnisse zeigten, dass sich diese fünf Dimensionen in drei Typen vereinen lassen, die Benutzer, System und Aufgabe repräsentieren. Von einer völlig anderen Seite nähern sich Olof Sundin und Jenny Johannison (Boras, Schweden) der Relevanzthematik, indem sie einen kommunikationsorientierten, neo-pragmatistischen Ansatz (nach Richard Rorty) wählen, um Informationssuche und Relevanz zu analysieren, und dabei auch auf das Werk von Michel Foucault zurückgreifen. Weitere interessante Artikel befassen sich mit Bradford's Law of Scattering (Hjørland & Nicolaisen), Information Sharing and Timing (Widén-Wulff & Davenport), Annotations as Context for Searching Documents (Agosti & Ferro), sowie dem Nutzen von neuen Informationsquellen wie Web Links, Newsgroups und Blogs für die sozial- und informationswissenschaftliche Forschung (Thelwall & Wouters). In Summe liegt hier ein interessantes und anspruchsvolles Buch vor - inhaltlich natürlich nicht gerade einheitlich und geschlossen, doch dies darf man bei einem Konferenzband ohnedies nicht erwarten. Manche der abgedruckten Beiträge sind sicher nicht einfach zu lesen, lohnen aber die Mühe. Auch für Praktiker aus Bibliothek und Information ist einiges dabei, sofern sie sich für die wissenschaftliche Basis ihrer Tätigkeit interessieren. Fachlich einschlägige Spezial- und grössere Allgemeinbibliotheken sollten das Werk daher unbedingt führen.
Context: Nature, Impact and Role ist ein typischer LNCS-Softcover-Band in sauberem TeX-Design und mutet mit knapp 50 Euro zwar nicht als wohlfeil an, liegt aber angesichts heutiger Buchpreise im Rahmen. Die Zahl der Tippfehler hält sich in Grenzen, ist jedoch gelegentlich peinlich (z.B. wenn man auf S. 2, noch dazu im Fettdruck, "Tractaus" anstelle von "Tractatus" lesen muss). Als Kuriosum am Rande sei erwähnt, dass die einleitend abgedruckte Namensliste des CoLIS-Programmkomitees, immerhin rund 50 Personen, vom Computer fein säuberlich sortiert wurde - dies allerdings nach dem Alphabet der Vornamen der Komiteemitglieder, was offenbar weder den Herausgebern noch dem Verlag aufgefallen ist."

RVK

SS 4800 [Informatik # Enzyklopädien und Handbücher. Kongreßberichte Schriftenreihe. Tafeln und Formelsammlungen # Schriftenreihen (indiv. Sign.) # Lecture notes in computer science]

Series

Lecture notes in computer science; 3507

Theme

Semantisches Umfeld in Indexierung u. Retrieval

Frederichs, A.: Natürlichsprachige Abfrage und 3-D-Visualisierung von Wissenszusammenhängen (2007) 0.12

0.11956524 = product of:
  0.23913048 = sum of:
    0.007975319 = weight(_text_:in in 566) [ClassicSimilarity], result of:
      0.007975319 = score(doc=566,freq=6.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.1301535 = fieldWeight in 566, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=566)
    0.053486172 = weight(_text_:zu in 566) [ClassicSimilarity], result of:
      0.053486172 = score(doc=566,freq=12.0), product of:
        0.13343859 = queryWeight, product of:
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.045047637 = queryNorm
        0.40082988 = fieldWeight in 566, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.0390625 = fieldNorm(doc=566)
    0.15322003 = weight(_text_:mensch in 566) [ClassicSimilarity], result of:
      0.15322003 = score(doc=566,freq=8.0), product of:
        0.24994317 = queryWeight, product of:
          5.548419 = idf(docFreq=467, maxDocs=44218)
          0.045047637 = queryNorm
        0.61301947 = fieldWeight in 566, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          5.548419 = idf(docFreq=467, maxDocs=44218)
          0.0390625 = fieldNorm(doc=566)
    0.024448961 = weight(_text_:und in 566) [ClassicSimilarity], result of:
      0.024448961 = score(doc=566,freq=8.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.24487628 = fieldWeight in 566, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=566)
  0.5 = coord(4/8)

Abstract: Eine der größten Herausforderungen für alle technischen Anwendungen ist die sogenannte Mensch-Maschine-Schnittstelle, also der Problemkreis, wie der bedienende Mensch mit der zu bedienenden Technik kommunizieren kann. Waren die Benutzungsschnittstellen bis Ende der Achtziger Jahre vor allem durch die Notwendigkeit des Benutzers geprägt, sich an die Erfordernisse der Maschine anzupassen, so wurde mit Durchsetzung grafischer Benutzungsoberflächen zunehmend versucht, die Bedienbarkeit so zu gestalten, dass ein Mensch auch ohne größere Einarbeitung in die Lage versetzt werden sollte, seine Befehle der Technik - letztlich also dem Computer - zu übermitteln. Trotz aller Fortschritte auf diesem Gebiet blieb immer die Anforderung, der Mensch solle auf die ihm natürlichste Art und Weise kommunizieren können, mit menschlicher Sprache. Diese Anforderung gilt gerade auch für das Retrieval von Informationen: Warum ist es nötig, die Nutzung von Booleschen Operatoren zu erlernen, nur um eine Suchanfrage stellen zu können? Ein anderes Thema ist die Frage nach der Visualisierung von Wissenszusammenhängen, die sich der Herausforderung stellt, in einem geradezu uferlos sich ausweitenden Informationsangebot weiterhin den Überblick behalten und relevante Informationen schnellstmöglich finden zu können.
Series: Schriften der Vereinigung Österreichischer Bibliothekarinnen und Bibliothekare (VÖB); Bd. 2
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Rahmstorf, G.: Integriertes Management inhaltlicher Datenarten (2001) 0.08

0.080400854 = product of:
  0.16080171 = sum of:
    0.011050926 = weight(_text_:in in 5856) [ClassicSimilarity], result of:
      0.011050926 = score(doc=5856,freq=8.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.18034597 = fieldWeight in 5856, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=5856)
    0.06418341 = weight(_text_:zu in 5856) [ClassicSimilarity], result of:
      0.06418341 = score(doc=5856,freq=12.0), product of:
        0.13343859 = queryWeight, product of:
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.045047637 = queryNorm
        0.48099583 = fieldWeight in 5856, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.046875 = fieldNorm(doc=5856)
    0.04400813 = weight(_text_:und in 5856) [ClassicSimilarity], result of:
      0.04400813 = score(doc=5856,freq=18.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.4407773 = fieldWeight in 5856, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=5856)
    0.041559253 = product of:
      0.083118506 = sum of:
        0.083118506 = weight(_text_:gesellschaft in 5856) [ClassicSimilarity], result of:
          0.083118506 = score(doc=5856,freq=4.0), product of:
            0.19984774 = queryWeight, product of:
              4.4363647 = idf(docFreq=1422, maxDocs=44218)
              0.045047637 = queryNorm
            0.41590917 = fieldWeight in 5856, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.4363647 = idf(docFreq=1422, maxDocs=44218)
              0.046875 = fieldNorm(doc=5856)
      0.5 = coord(1/2)
  0.5 = coord(4/8)

Abstract: Inhaltliche Daten sind im Unterschied zu Messdaten, Zahlen, Analogsignalen und anderen Informationen solche Daten, die sich auch sprachlich interpretieren lassen. Sie transportieren Inhalte, die sich benennen lassen. Zu inhaltlichen Daten gehören z. B. Auftragsdaten, Werbetexte, Produktbezeichnungen und Patentklassifikationen. Die meisten Daten, die im Internet kommuniziert werden, sind inhaltliche Daten. Man kann inhaltliche Daten in vier Klassen einordnen: * Wissensdaten - formatierte Daten (Fakten u. a. Daten in strukturierter Form), - nichtformatierte Daten (vorwiegend Texte); * Zugriffsdaten - Benennungsdaten (Wortschatz, Terminologie, Themen u. a.), - Begriffsdaten (Ordnungs- und Bedeutungsstrukturen). In der Wissensorganisation geht es hauptsächlich darum, die unüberschaubare Fülle des Wissens zu ordnen und wiederauffindbar zu machen. Daher befasst sich das Fach nicht nur mit dem Wissen selbst, selbst sondern auch mit den Mitteln, die dazu verwendet werden, das Wissen zu ordnen und auffindbar zu machen
Series: Tagungen der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis; 4
Source: Information Research & Content Management: Orientierung, Ordnung und Organisation im Wissensmarkt; 23. DGI-Online-Tagung der DGI und 53. Jahrestagung der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis e.V. DGI, Frankfurt am Main, 8.-10.5.2001. Proceedings. Hrsg.: R. Schmidt
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Weiermann, S.L.: Semantische Netze und Begriffsdeskription in der Wissensrepräsentation (2000) 0.07

0.06512693 = product of:
  0.17367183 = sum of:
    0.12827784 = weight(_text_:informatik in 3001) [ClassicSimilarity], result of:
      0.12827784 = score(doc=3001,freq=4.0), product of:
        0.22985439 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.045047637 = queryNorm
        0.55808306 = fieldWeight in 3001, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3001)
    0.011165447 = weight(_text_:in in 3001) [ClassicSimilarity], result of:
      0.011165447 = score(doc=3001,freq=6.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.1822149 = fieldWeight in 3001, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3001)
    0.034228545 = weight(_text_:und in 3001) [ClassicSimilarity], result of:
      0.034228545 = score(doc=3001,freq=8.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.34282678 = fieldWeight in 3001, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=3001)
  0.375 = coord(3/8)

BK: 18.00 Einzelne Sprachen und Literaturen allgemein
Classification: 18.00 Einzelne Sprachen und Literaturen allgemein
Content: Inhalt (in Kürze): Einleitung. Wissensrepräsentation. Semantische Netze. Wissensrepräsentationssysteme. Empirische Analyse und Systemerweiterungen.
RSWK: FILCOM <Programm> / Definition / Vererbung <Informatik>
Subject: FILCOM <Programm> / Definition / Vererbung <Informatik>
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Mandalka, M.: Open semantic search zum unabhängigen und datenschutzfreundlichen Erschliessen von Dokumenten (2015) 0.06
```
0.06390092 = product of:
  0.12780184 = sum of:
    0.009570383 = weight(_text_:in in 2133) [ClassicSimilarity], result of:
      0.009570383 = score(doc=2133,freq=24.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.1561842 = fieldWeight in 2133, product of:
          4.8989797 = tf(freq=24.0), with freq of:
            24.0 = termFreq=24.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0234375 = fieldNorm(doc=2133)
    0.032091703 = weight(_text_:zu in 2133) [ClassicSimilarity], result of:
      0.032091703 = score(doc=2133,freq=12.0), product of:
        0.13343859 = queryWeight, product of:
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.045047637 = queryNorm
        0.24049792 = fieldWeight in 2133, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.0234375 = fieldNorm(doc=2133)
    0.045966007 = weight(_text_:mensch in 2133) [ClassicSimilarity], result of:
      0.045966007 = score(doc=2133,freq=2.0), product of:
        0.24994317 = queryWeight, product of:
          5.548419 = idf(docFreq=467, maxDocs=44218)
          0.045047637 = queryNorm
        0.18390584 = fieldWeight in 2133, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.548419 = idf(docFreq=467, maxDocs=44218)
          0.0234375 = fieldNorm(doc=2133)
    0.04017374 = weight(_text_:und in 2133) [ClassicSimilarity], result of:
      0.04017374 = score(doc=2133,freq=60.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.40237278 = fieldWeight in 2133, product of:
          7.745967 = tf(freq=60.0), with freq of:
            60.0 = termFreq=60.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0234375 = fieldNorm(doc=2133)
  0.5 = coord(4/8)
```
Abstract

Ob grösserer Leak oder Zusammenwürfeln oder (wieder) Erschliessen umfangreicherer (kollaborativer) Recherche(n) oder Archive: Immer öfter müssen im Journalismus größere Datenberge und Dokumentenberge erschlossen werden. In eine Suchmaschine integrierte Analyse-Tools helfen (halb)automatisch.

Content

"Open Semantic Desktop Search Zur Tagung des Netzwerk Recherche ist die Desktop Suchmaschine Open Semantic Desktop Search zum unabhängigen und datenschutzfreundlichen Erschliessen und Analysieren von Dokumentenbergen nun erstmals auch als deutschsprachige Version verfügbar. Dank mächtiger Open Source Basis kann die auf Debian GNU/Linux und Apache Solr basierende freie Software als unter Linux, Windows oder Mac lauffähige virtuelle Maschine kostenlos heruntergeladen, genutzt, weitergegeben und weiterentwickelt werden. Dokumentenberge erschliessen Ob grösserer Leak oder Zusammenwürfeln oder (wieder) Erschliessen umfangreicherer (kollaborativer) Recherche(n) oder Archive: Hin und wieder müssen größere Datenberge bzw. Dokumentenberge erschlossen werden, die so viele Dokumente enthalten, dass Mensch diese Masse an Dokumenten nicht mehr alle nacheinander durchschauen und einordnen kann. Auch bei kontinuierlicher Recherche zu Fachthemen sammeln sich mit der Zeit größere Mengen digitalisierter oder digitaler Dokumente zu grösseren Datenbergen an, die immer weiter wachsen und deren Informationen mit einer Suchmaschine für das Archiv leichter auffindbar bleiben. Moderne Tools zur Datenanalyse in Verbindung mit Enterprise Search Suchlösungen und darauf aufbauender Recherche-Tools helfen (halb)automatisch.
Unabhängiges Durchsuchen und Analysieren grosser Datenmengen Damit können investigativ arbeitende Journalisten selbstständig und auf eigener Hardware datenschutzfreundlich hunderte, tausende, hunderttausende oder gar Millionen von Dokumenten oder hunderte Megabyte, Gigabytes oder gar einige Terabytes an Daten mit Volltextsuche durchsuchbar machen. Automatische Datenanreicherung und Erschliessung mittels Hintergrundwissen Zudem wird anhand von konfigurierbaren Hintergrundwissen automatisch eine interaktive Navigation zu in Dokumenten enthaltenen Namen von Bundestagsabgeordneten oder Orten in Deutschland generiert oder anhand Textmustern strukturierte Informationen wie Geldbeträge extrahiert. Mittels Named Entities Manager für Personen, Organisationen, Begriffe und Orte können eigene Rechercheschwerpunkte konfiguriert werden, aus denen dann automatisch eine interaktive Navigation (Facettensuche) und aggregierte Übersichten generiert werden. Automatische Datenvisualisierung Diese lassen sich auch visualisieren: So z.B. die zeitliche Verteilung von Suchergebnissen als Trand Diagramm oder durch gleichzeitige Nennung in Dokumenten abgeleitete Verbindungen als Netzwerk bzw. Graph.
Automatische Texterkennung (OCR) Dokumente, die nicht im Textformat, sondern als Grafiken vorliegen, wie z.B. Scans werden automatisch durch automatische Texterkennung (OCR) angereichert und damit auch der extrahierte Text durchsuchbar. Auch für eingebettete Bilddateien bzw. Scans innerhalb von PDF-Dateien. Unscharfe Suche mit Listen Ansonsten ist auch das Recherche-Tool bzw. die Such-Applikation "Suche mit Listen" integriert, mit denen sich schnell und komfortabel abgleichen lässt, ob es zu den einzelnen Einträgen in Listen jeweils Treffer in der durchsuchbaren Dokumentensammlung gibt. Mittels unscharfer Suche findet das Tool auch Ergebnisse, die in fehlerhaften oder unterschiedlichen Schreibweisen vorliegen. Semantische Suche und Textmining Im Recherche, Textanalyse und Document Mining Tutorial zu den enthaltenen Recherche-Tools und verschiedenen kombinierten Methoden zur Datenanalyse, Anreicherung und Suche wird ausführlicher beschrieben, wie auch eine große heterogene und unstrukturierte Dokumentensammlung bzw. eine grosse Anzahl von Dokumenten in verschiedenen Formaten leicht durchsucht und analysiert werden kann.
Virtuelle Maschine für mehr Plattformunabhängigkeit Die nun auch deutschsprachig verfügbare und mit deutschen Daten wie Ortsnamen oder Bundestagsabgeordneten vorkonfigurierte virtuelle Maschine Open Semantic Desktop Search ermöglicht nun auch auf einzelnen Desktop Computern oder Notebooks mit Windows oder iOS (Mac) die Suche und Analyse von Dokumenten mit der Suchmaschine Open Semantic Search. Als virtuelle Maschine (VM) lässt sich die Suchmaschine Open Semantic Search nicht nur für besonders sensible Dokumente mit dem verschlüsselten Live-System InvestigateIX als abgeschottetes System auf verschlüsselten externen Datenträgern installieren, sondern als virtuelle Maschine für den Desktop auch einfach unter Windows oder auf einem Mac in eine bzgl. weiterer Software und Daten bereits existierende Systemumgebung integrieren, ohne hierzu auf einen (für gemeinsame Recherchen im Team oder für die Redaktion auch möglichen) Suchmaschinen Server angewiesen zu sein. Datenschutz & Unabhängigkeit: Grössere Unabhängigkeit von zentralen IT-Infrastrukturen für unabhängigen investigativen Datenjournalismus Damit ist investigative Recherche weitmöglichst unabhängig möglich: ohne teure, zentrale und von Administratoren abhängige Server, ohne von der Dokumentenanzahl abhängige teure Software-Lizenzen, ohne Internet und ohne spionierende Cloud-Dienste. Datenanalyse und Suche finden auf dem eigenen Computer statt, nicht wie bei vielen anderen Lösungen in der sogenannten Cloud."

Source

http://www.linux-community.de/Internal/Nachrichten/Open-Semantic-Search-zum-unabhaengigen-und-datenschutzfreundlichen-Erschliessen-von-Dokumenten

Theme

Semantisches Umfeld in Indexierung u. Retrieval

Boteram, F.: Typisierung semantischer Relationen in integrierten Systemen der Wissensorganisation (2013) 0.06

0.05833357 = product of:
  0.11666714 = sum of:
    0.013813656 = weight(_text_:in in 919) [ClassicSimilarity], result of:
      0.013813656 = score(doc=919,freq=18.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.22543246 = fieldWeight in 919, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=919)
    0.03782044 = weight(_text_:zu in 919) [ClassicSimilarity], result of:
      0.03782044 = score(doc=919,freq=6.0), product of:
        0.13343859 = queryWeight, product of:
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.045047637 = queryNorm
        0.28342956 = fieldWeight in 919, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.0390625 = fieldNorm(doc=919)
    0.040544014 = weight(_text_:und in 919) [ClassicSimilarity], result of:
      0.040544014 = score(doc=919,freq=22.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.40608138 = fieldWeight in 919, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=919)
    0.024489027 = product of:
      0.048978053 = sum of:
        0.048978053 = weight(_text_:gesellschaft in 919) [ClassicSimilarity], result of:
          0.048978053 = score(doc=919,freq=2.0), product of:
            0.19984774 = queryWeight, product of:
              4.4363647 = idf(docFreq=1422, maxDocs=44218)
              0.045047637 = queryNorm
            0.24507684 = fieldWeight in 919, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.4363647 = idf(docFreq=1422, maxDocs=44218)
              0.0390625 = fieldNorm(doc=919)
      0.5 = coord(1/2)
  0.5 = coord(4/8)

Abstract: Die, differenzierte Typisierung semantischer Relationen hinsichtlich ihrer bedeutungstragenden inhaltlichen und formallogischen Eigenschaften in Systemen der Wissensorganisation ist eine Voraussetzung für leistungsstarke und benutzerfreundliche Modelle des information Retrieval und der Wissensexploration. Systeme, die mehrere Dokumentationssprachen miteinander verknüpfen und funktional integrieren, erfordern besondere Ansätze für die Typisierung der verwendeten oder benötigten Relationen. Aufbauend auf vorangegangenen Überlegungen zu Modellen der semantischen Interoperabilität in verteilten Systemen, welche durch ein zentrales Kernsystem miteinander verbunden und so in den übergeordneten Funktionszusammenhang der Wissensorganisation gestellt werden, werden differenzierte und funktionale Strategien zur Typisierung und stratifizierten Definition der unterschiedlichen Relationen in diesem System entwickelt. Um die von fortschrittlichen Retrievalparadigmen erforderten Funktionalitäten im Kontext vernetzter Systeme zur Wissensorganisation unterstützen zu können, werden die formallogischen, typologischen und strukturellen Eigenschaften sowie der eigentliche semantische Gehalt aller Relationstypen definiert, die zur Darstellung von Begriffsbeziehungen verwendet werden. Um die Vielzahl unterschiedlicher aber im Funktionszusammenhang des Gesamtsystems auf einander bezogenen Relationstypen präzise und effizient ordnen zu können, wird eine mehrfach gegliederte Struktur benötigt, welche die angestrebten Inventare in einer Ear den Nutzer übersichtlichen und intuitiv handhabbaren Form präsentieren und somit für eine Verwendung in explorativen Systemen vorhalten kann.
Series: Fortschritte in der Wissensorganisation; Bd.12
Source: Wissen - Wissenschaft - Organisation: Proceedings der 12. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation Bonn, 19. bis 21. Oktober 2009. Hrsg.: H.P. Ohly
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Knorz, G.; Rein, B.: Semantische Suche in einer Hochschulontologie (2005) 0.06

0.057815902 = product of:
  0.115631804 = sum of:
    0.009116549 = weight(_text_:in in 1852) [ClassicSimilarity], result of:
      0.009116549 = score(doc=1852,freq=4.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.14877784 = fieldWeight in 1852, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0546875 = fieldNorm(doc=1852)
    0.04323236 = weight(_text_:zu in 1852) [ClassicSimilarity], result of:
      0.04323236 = score(doc=1852,freq=4.0), product of:
        0.13343859 = queryWeight, product of:
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.045047637 = queryNorm
        0.32398695 = fieldWeight in 1852, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.0546875 = fieldNorm(doc=1852)
    0.041921236 = weight(_text_:und in 1852) [ClassicSimilarity], result of:
      0.041921236 = score(doc=1852,freq=12.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.41987535 = fieldWeight in 1852, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=1852)
    0.021361664 = product of:
      0.042723328 = sum of:
        0.042723328 = weight(_text_:22 in 1852) [ClassicSimilarity], result of:
          0.042723328 = score(doc=1852,freq=2.0), product of:
            0.15774915 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.045047637 = queryNorm
            0.2708308 = fieldWeight in 1852, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=1852)
      0.5 = coord(1/2)
  0.5 = coord(4/8)

Abstract: Ontologien werden eingesetzt, um durch semantische Fundierung insbesondere für das Dokumentenretrieval eine grundlegend bessere Basis zu haben, als dies gegenwärtiger Stand der Technik ist. Vorgestellt wird eine an der FH Darmstadt entwickelte und eingesetzte Ontologie, die den Gegenstandsbereich Hochschule sowohl breit abdecken und gleichzeitig differenziert semantisch beschreiben soll. Das Problem der semantischen Suche besteht nun darin, dass sie für Informationssuchende so einfach wie bei gängigen Suchmaschinen zu nutzen sein soll, und gleichzeitig auf der Grundlage des aufwendigen Informationsmodells hochwertige Ergebnisse liefern muss. Es wird beschrieben, welche Möglichkeiten die verwendete Software K-Infinity bereitstellt und mit welchem Konzept diese Möglichkeiten für eine semantische Suche nach Dokumenten und anderen Informationseinheiten (Personen, Veranstaltungen, Projekte etc.) eingesetzt werden.
Date: 11. 2.2011 18:22:58
Source: Information - Wissenschaft und Praxis. 56(2005) H.5/6, S.281-290
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Knorz, G.; Rein, B.: Semantische Suche in einer Hochschulontologie : Ontologie-basiertes Information-Filtering und -Retrieval mit relationalen Datenbanken (2005) 0.06

0.057815902 = product of:
  0.115631804 = sum of:
    0.009116549 = weight(_text_:in in 4324) [ClassicSimilarity], result of:
      0.009116549 = score(doc=4324,freq=4.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.14877784 = fieldWeight in 4324, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4324)
    0.04323236 = weight(_text_:zu in 4324) [ClassicSimilarity], result of:
      0.04323236 = score(doc=4324,freq=4.0), product of:
        0.13343859 = queryWeight, product of:
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.045047637 = queryNorm
        0.32398695 = fieldWeight in 4324, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4324)
    0.041921236 = weight(_text_:und in 4324) [ClassicSimilarity], result of:
      0.041921236 = score(doc=4324,freq=12.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.41987535 = fieldWeight in 4324, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0546875 = fieldNorm(doc=4324)
    0.021361664 = product of:
      0.042723328 = sum of:
        0.042723328 = weight(_text_:22 in 4324) [ClassicSimilarity], result of:
          0.042723328 = score(doc=4324,freq=2.0), product of:
            0.15774915 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.045047637 = queryNorm
            0.2708308 = fieldWeight in 4324, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0546875 = fieldNorm(doc=4324)
      0.5 = coord(1/2)
  0.5 = coord(4/8)

Abstract: Ontologien werden eingesetzt, um durch semantische Fundierung insbesondere für das Dokumentenretrieval eine grundlegend bessere Basis zu haben, als dies gegenwärtiger Stand der Technik ist. Vorgestellt wird eine an der FH Darmstadt entwickelte und eingesetzte Ontologie, die den Gegenstandsbereich Hochschule sowohl breit abdecken und gleichzeitig differenziert semantisch beschreiben soll. Das Problem der semantischen Suche besteht nun darin, dass sie für Informationssuchende so einfach wie bei gängigen Suchmaschinen zu nutzen sein soll, und gleichzeitig auf der Grundlage des aufwendigen Informationsmodells hochwertige Ergebnisse liefern muss. Es wird beschrieben, welche Möglichkeiten die verwendete Software K-Infinity bereitstellt und mit welchem Konzept diese Möglichkeiten für eine semantische Suche nach Dokumenten und anderen Informationseinheiten (Personen, Veranstaltungen, Projekte etc.) eingesetzt werden.
Date: 11. 2.2011 18:22:25
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Gradmann, S.; Olensky, M.: Semantische Kontextualisierung von Museumsbeständen in Europeana (2013) 0.06

0.05597301 = product of:
  0.11194602 = sum of:
    0.009570383 = weight(_text_:in in 939) [ClassicSimilarity], result of:
      0.009570383 = score(doc=939,freq=6.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.1561842 = fieldWeight in 939, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=939)
    0.037056312 = weight(_text_:zu in 939) [ClassicSimilarity], result of:
      0.037056312 = score(doc=939,freq=4.0), product of:
        0.13343859 = queryWeight, product of:
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.045047637 = queryNorm
        0.2777031 = fieldWeight in 939, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.046875 = fieldNorm(doc=939)
    0.035932485 = weight(_text_:und in 939) [ClassicSimilarity], result of:
      0.035932485 = score(doc=939,freq=12.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.35989314 = fieldWeight in 939, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=939)
    0.02938683 = product of:
      0.05877366 = sum of:
        0.05877366 = weight(_text_:gesellschaft in 939) [ClassicSimilarity], result of:
          0.05877366 = score(doc=939,freq=2.0), product of:
            0.19984774 = queryWeight, product of:
              4.4363647 = idf(docFreq=1422, maxDocs=44218)
              0.045047637 = queryNorm
            0.29409218 = fieldWeight in 939, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.4363647 = idf(docFreq=1422, maxDocs=44218)
              0.046875 = fieldNorm(doc=939)
      0.5 = coord(1/2)
  0.5 = coord(4/8)

Abstract: Europeana ist eine Initiative der Europäischen Kommission, die 2005 den Aufbau einer "Europäischen digitalen Bibliothek" als Teil ihrer i2010 Agenda ankündigte. Europeana soll ein gemeinsamer multilingualer Zugangspunkt zu Europas digitalem Kulturerbe und gleichzeitig mehr als "nur" eine digitale Bibliothek werden: eine offene Schnittstelle (API) für Wissenschaftsanwendungen, die ein Netzwerk von Objektsurrogaren darstellt, die semantikbasiertes Objektretrieval und - verwendung ermöglichen. Einerseits ist die semantische Kontextualisierung der digitalen Objekte eine unabdingbare Voraussetzung für effektives Information Retrieval, da aufgrund der Beschaffenheit der Öbjekte (bildlich, multimedial) deskriptive Metadaten meist nicht ausreichen, auf der anderen Seite bildet sie die Grundlage für neues Wissen. Kern geisteswissenschaftlicher Arbeit ist immer schon die Reaggregation und Interpretation kultureller Artefakte gewesen und Europeana ermöglicht nun mit (teil-)automatisierbaren, semantikbasierten Öperationen über große kulturelle Quellcorpora völlig neue Perspektiven für die digital humanities. Folglich hat Europeans das Potenzial eine Schlüsselressource der Geistes- und Kulturwissenschaften und damit Teil deren zukünftiger digitaler Arbeitsumgebungen zu werden.
Series: Fortschritte in der Wissensorganisation; Bd.12
Source: Wissen - Wissenschaft - Organisation: Proceedings der 12. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation Bonn, 19. bis 21. Oktober 2009. Hrsg.: H.P. Ohly
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Gillitzer, B.: Yewno (2017) 0.05
```
0.04702659 = product of:
  0.09405318 = sum of:
    0.011648699 = weight(_text_:in in 3447) [ClassicSimilarity], result of:
      0.011648699 = score(doc=3447,freq=20.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.19010136 = fieldWeight in 3447, product of:
          4.472136 = tf(freq=20.0), with freq of:
            20.0 = termFreq=20.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.03125 = fieldNorm(doc=3447)
    0.03493702 = weight(_text_:zu in 3447) [ClassicSimilarity], result of:
      0.03493702 = score(doc=3447,freq=8.0), product of:
        0.13343859 = queryWeight, product of:
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.045047637 = queryNorm
        0.26182097 = fieldWeight in 3447, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.03125 = fieldNorm(doc=3447)
    0.035260793 = weight(_text_:und in 3447) [ClassicSimilarity], result of:
      0.035260793 = score(doc=3447,freq=26.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.3531656 = fieldWeight in 3447, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=3447)
    0.012206665 = product of:
      0.02441333 = sum of:
        0.02441333 = weight(_text_:22 in 3447) [ClassicSimilarity], result of:
          0.02441333 = score(doc=3447,freq=2.0), product of:
            0.15774915 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.045047637 = queryNorm
            0.15476047 = fieldWeight in 3447, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.03125 = fieldNorm(doc=3447)
      0.5 = coord(1/2)
  0.5 = coord(4/8)
```
Abstract

Yewno findet Themen und Konzepte (Suchbegriffe und ihre Abstraktionen) in englischsprachigen digitalen Texten mit Methoden des maschinellen Lernens und der künstlichen Intelligenz. Als Ergebnis Ihrer Suchanfrage werden die Konzepte, die Ihre Anfrage betreffen, in vielfältigen sachlichen Beziehungen als graphisches Netzwerk präsentiert, über das Sie einfach navigieren können. Auch versteckte thematische Beziehungen werden hier sichtbar gemacht, die vom Bekannten zu neuen Entdeckungen führen. Im Rahmen einer Pilotphase können Sie über einen interdisziplinären Ausschnitt aus aktuellen englischsprachigen Fachzeitschriften verschiedenster Fachgebiete recherchieren. Die zu den Themen gehörigen Artikel werden in Ausschnitten unmittelbar angezeigt und können in den meisten Fällen direkt als Volltext aufgerufen werden.
"Die Bayerische Staatsbibliothek testet den semantischen "Discovery Service" Yewno als zusätzliche thematische Suchmaschine für digitale Volltexte. Der Service ist unter folgendem Link erreichbar: https://www.bsb-muenchen.de/recherche-und-service/suchen-und-finden/yewno/. Das Identifizieren von Themen, um die es in einem Text geht, basiert bei Yewno alleine auf Methoden der künstlichen Intelligenz und des maschinellen Lernens. Dabei werden sie nicht - wie bei klassischen Katalogsystemen - einem Text als Ganzem zugeordnet, sondern der jeweiligen Textstelle. Die Eingabe eines Suchwortes bzw. Themas, bei Yewno "Konzept" genannt, führt umgehend zu einer grafischen Darstellung eines semantischen Netzwerks relevanter Konzepte und ihrer inhaltlichen Zusammenhänge. So ist ein Navigieren über thematische Beziehungen bis hin zu den Fundstellen im Text möglich, die dann in sogenannten Snippets angezeigt werden. In der Test-Anwendung der Bayerischen Staatsbibliothek durchsucht Yewno aktuell 40 Millionen englischsprachige Dokumente aus Publikationen namhafter Wissenschaftsverlage wie Cambridge University Press, Oxford University Press, Wiley, Sage und Springer, sowie Dokumente, die im Open Access verfügbar sind. Nach der dreimonatigen Testphase werden zunächst die Rückmeldungen der Nutzer ausgewertet. Ob und wann dann der Schritt von der klassischen Suchmaschine zum semantischen "Discovery Service" kommt und welche Bedeutung Anwendungen wie Yewno in diesem Zusammenhang einnehmen werden, ist heute noch nicht abzusehen. Die Software Yewno wurde vom gleichnamigen Startup in Zusammenarbeit mit der Stanford University entwickelt, mit der auch die Bayerische Staatsbibliothek eng kooperiert. [Inetbib-Posting vom 22.02.2017].

Date

22. 2.2017 10:16:49

Source

https://www.bsb-muenchen.de/recherche-und-service/suchen-und-finden/yewno/

Theme

Semantisches Umfeld in Indexierung u. Retrieval
Schmitz-Esser, W.: EXPO-INFO 2000 : Visuelles Besucherinformationssystem für Weltausstellungen (2000) 0.05
```
0.046004903 = product of:
  0.12267974 = sum of:
    0.06479009 = weight(_text_:informatik in 1404) [ClassicSimilarity], result of:
      0.06479009 = score(doc=1404,freq=2.0), product of:
        0.22985439 = queryWeight, product of:
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.045047637 = queryNorm
        0.2818745 = fieldWeight in 1404, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          5.1024737 = idf(docFreq=730, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1404)
    0.013813656 = weight(_text_:in in 1404) [ClassicSimilarity], result of:
      0.013813656 = score(doc=1404,freq=18.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.22543246 = fieldWeight in 1404, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1404)
    0.044075992 = weight(_text_:und in 1404) [ClassicSimilarity], result of:
      0.044075992 = score(doc=1404,freq=26.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.441457 = fieldWeight in 1404, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=1404)
  0.375 = coord(3/8)
```
Abstract

Das aktuelle Wissen der Welt im Spiegel einer Weltausstellung: Wie stellt man das dar und wie macht man es Interessierten zugänglich - in der Ausstellung, in Publikationen, im Funk und über das Internet? Was man alles auf einer Weltausstellung an der Schwelle zum dritten Jahrtausend sehen und erfahren kann, sprengt in Fülle und Vielfalt jeden individuell faßbaren Rahmen. Schmitz-Esser zeigt in seinem Buch, wie der Besucher wahlweise in vier Sprachen die Weltausstellung erleben und die Quintessenz davon mitnehmen kann. Ermöglicht wird dies durch das Konzept des virtuellen "Wissens in der Kapsel", das so aufbereitet ist, daß es in allen gängigen medialen Formen und für unterschiedlichste Wege der Aneignung eingesetzt werden kann. Die Lösung ist nicht nur eine Sache der Informatik und Informationstechnologie, sondern vielmehr auch eine Herausforderung an Informationswissenschaft und Computerlinguistik. Das Buch stellt Ziel, Ansatz, Komponenten und Voraussetzungen dafür dar.

Content

Willkommene Anregung schon am Eingang.- Vertiefung des Wissens während der Ausstellung.- Alles für das Wohlbefinden.- Die Systemstruktur und ihre einzelnen Elemente.- Wovon alles ausgeht.- Den Stoff als Topics und Subtopics strukturieren.- Die Nutshells.- Der Proxy-Text.Der Thesaurus.- Gedankenraumreisen.- Und zurück in die reale Welt.- Weitergehende Produkte.- Das EXPO-Infosystem auf einen Blick.- Register.- Literaturverzeichnis.

Theme

Semantisches Umfeld in Indexierung u. Retrieval
Konzeption und Anwendung des Prinzips Thesaurus
Otto, A.: Ordnungssysteme als Wissensbasis für die Suche in textbasierten Datenbeständen : dargestellt am Beispiel einer soziologischen Bibliographie (1998) 0.05
```
0.045882396 = product of:
  0.09176479 = sum of:
    0.0132815605 = weight(_text_:in in 6625) [ClassicSimilarity], result of:
      0.0132815605 = score(doc=6625,freq=26.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.2167489 = fieldWeight in 6625, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.03125 = fieldNorm(doc=6625)
    0.03493702 = weight(_text_:zu in 6625) [ClassicSimilarity], result of:
      0.03493702 = score(doc=6625,freq=8.0), product of:
        0.13343859 = queryWeight, product of:
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.045047637 = queryNorm
        0.26182097 = fieldWeight in 6625, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.03125 = fieldNorm(doc=6625)
    0.023954991 = weight(_text_:und in 6625) [ClassicSimilarity], result of:
      0.023954991 = score(doc=6625,freq=12.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.23992877 = fieldWeight in 6625, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.03125 = fieldNorm(doc=6625)
    0.01959122 = product of:
      0.03918244 = sum of:
        0.03918244 = weight(_text_:gesellschaft in 6625) [ClassicSimilarity], result of:
          0.03918244 = score(doc=6625,freq=2.0), product of:
            0.19984774 = queryWeight, product of:
              4.4363647 = idf(docFreq=1422, maxDocs=44218)
              0.045047637 = queryNorm
            0.19606146 = fieldWeight in 6625, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.4363647 = idf(docFreq=1422, maxDocs=44218)
              0.03125 = fieldNorm(doc=6625)
      0.5 = coord(1/2)
  0.5 = coord(4/8)
```
Abstract

Es wird eine Methode vorgestellt, wie sich Ordnungssysteme für die Suche in textbasierten Datenbeständen verwenden lassen. "Ordnungssystem" wird hier als Oberbegriff für beliebige geordnete Begriffssammlungen verwendet. Dies sind beispielsweise Thesauri, Klassifikationen und formale Systematiken. Weil Thesauri dabei die leistungsfähigsten Ordnungssysteme sind, finden sie eine besondere Berücksichtigung. Der Beitrag ist streng praxisbezogenen und auf die Nutzerschnittstelle konzentriert. Die Basis für die Nutzerschnittstelle bilden Ordnungssysteme, die über eine WWW-Schnittstelle angeboten werden. Je nach Fachgebiet kann der Nutzer ein spezielles Ordnungssystem für die Suche auswählen. Im Unterschied zu klassischen Verfahren werden die Ordnungssysteme nicht zur ausschließlichen Suche in Deskriptorenfeldern, sondern für die Suche in einem Basic Index verwendet. In der Anwendung auf den Basic Index sind die Ordnungssysteme quasi "entkoppelt" von der ursprünglichen Datenbank und den Deskriptorenfeldern, für die das Ordnungssystem entwickelt wurde. Die Inhalte einer Datenbank spielen bei der Wahl der Ordnungssysteme zunächst keine Rolle. Sie machen sich erst bei der Suche in der Anzahl der Treffer bemerkbar: so findet ein rechtswissenschaftlicher Thesaurus natürlicherweise in einer Medizin-Datenbank weniger relevante Dokumente als in einer Rechts-Datenbank, weil das im Rechts-Thesaurus abgebildete Begriffsgut eher in einer Rechts-Datenbank zu finden ist. Das Verfahren ist modular aufgebaut und sieht in der Konzeption nachgeordnete semantische Retrievalverfahren vor, die zu einer Verbesserung von Retrievaleffektivität und -effizienz führen werden. So werden aus einer Ergebnismenge, die ausschließlich durch exakten Zeichenkettenabgleich gefunden wurde, in einem nachfolgenden Schritt durch eine semantische Analyse diejenigen Dokumente herausgefiltert, die für die Suchfrage relevant sind. Die WWW-Nutzerschnittstelle und die Verwendung bereits bestehender Ordnungssysteme führen zu einer Minimierung des Arbeitsaufwands auf Nutzerseite. Die Kosten für eine Suche lassen sich sowohl auf der Input-Seite verringern, indem eine aufwendige "manuelle" Indexierung entfällt, als auch auf der Output-Seite, indem den Nutzern leicht bedienbare Suchoptionen zur Verfügung gestellt werden

Series

Fortschritte in der Wissensorganisation; Bd.5

Source

Herausforderungen an die Wissensorganisation: Visualisierung, multimediale Dokumente, Internetstrukturen. 5. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation Berlin, 07.-10. Oktober 1997. Hrsg.: H. Czap u.a

Theme

Semantisches Umfeld in Indexierung u. Retrieval
Rädler, K.: In Bibliothekskatalogen "googlen" : Integration von Inhaltsverzeichnissen, Volltexten und WEB-Ressourcen in Bibliothekskataloge (2004) 0.04
```
0.040677857 = product of:
  0.108474284 = sum of:
    0.01302364 = weight(_text_:in in 2432) [ClassicSimilarity], result of:
      0.01302364 = score(doc=2432,freq=16.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.21253976 = fieldWeight in 2432, product of:
          4.0 = tf(freq=16.0), with freq of:
            16.0 = termFreq=16.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2432)
    0.06550691 = weight(_text_:zu in 2432) [ClassicSimilarity], result of:
      0.06550691 = score(doc=2432,freq=18.0), product of:
        0.13343859 = queryWeight, product of:
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.045047637 = queryNorm
        0.49091431 = fieldWeight in 2432, product of:
          4.2426405 = tf(freq=18.0), with freq of:
            18.0 = termFreq=18.0
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2432)
    0.029943738 = weight(_text_:und in 2432) [ClassicSimilarity], result of:
      0.029943738 = score(doc=2432,freq=12.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.29991096 = fieldWeight in 2432, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=2432)
  0.375 = coord(3/8)
```
Abstract

Ausgangslage Die Katalog-Recherchen über Internet, also von außerhalb der Bibliothek, nehmen erwartungsgemäß stark zu bzw. sind mittlerweile die Regel. Damit ist natürlich das Bedürfnis und die Notwendigkeit gewachsen, über den Titel hinaus zusätzliche inhaltliche Informationen zu erhalten, die es erlauben, die Zweckmäßigkeit wesentlich besser abschätzen zu können, eine Bestellung vorzunehmen oder vielleicht auch 50 km in die Bibliothek zu fahren, um ein Buch zu entleihen. Dieses Informationsdefizit wird zunehmend als gravierender Mangel erfahren. Inhaltsverzeichnisse referieren den Inhalt kurz und prägnant. Sie sind die erste Stelle, welche zur Relevanz-Beurteilung herangezogen wird. Fast alle relevanten Terme einer Fachbuchpublikation finden sich bereits dort. Andererseits wird immer deutlicher, dass die dem bibliothekarischen Paradigma entsprechende intellektuelle Indexierung der einzelnen dokumentarischen Einheiten mit den engsten umfassenden dokumentationssprachlichen Termen (Schlagwörter, Klassen) zwar eine notwendige, aber keinesfalls hinreichende Methode darstellt, das teuer erworbene Bibliotheksgut Information für den Benutzer in seiner spezifischen Problemstellung zu aktivieren und als Informationsdienstleistung anbieten zu können. Informationen zu sehr speziellen Fragestellungen, die oft nur in kürzeren Abschnitten (Kapitel) erörtert werden, sind derzeit nur indirekt, mit großem Zeitaufwand und oft überhaupt nicht auffindbar. Sie liegen sozusagen brach. Die Tiefe der intellektuellen Indexierung bis in einzelne inhaltliche Details zu erweitern, ist aus personellen und damit auch finanziellen Gesichtspunkten nicht vertretbar. Bibliotheken fallen deshalb in der Wahrnehmung von Informationssuchenden immer mehr zurück. Die enorme Informationsvielfalt liegt hinter dem Informations- bzw. Recherchehorizont der bibliographischen Aufnahmen im Katalog.

Theme

Semantisches Umfeld in Indexierung u. Retrieval

Hauer, M.: Neue OPACs braucht das Land ... dandelon.com (2006) 0.04

0.037585437 = product of:
  0.10022783 = sum of:
    0.012355312 = weight(_text_:in in 6047) [ClassicSimilarity], result of:
      0.012355312 = score(doc=6047,freq=10.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.20163295 = fieldWeight in 6047, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=6047)
    0.037056312 = weight(_text_:zu in 6047) [ClassicSimilarity], result of:
      0.037056312 = score(doc=6047,freq=4.0), product of:
        0.13343859 = queryWeight, product of:
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.045047637 = queryNorm
        0.2777031 = fieldWeight in 6047, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.046875 = fieldNorm(doc=6047)
    0.05081621 = weight(_text_:und in 6047) [ClassicSimilarity], result of:
      0.05081621 = score(doc=6047,freq=24.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.5089658 = fieldWeight in 6047, product of:
          4.8989797 = tf(freq=24.0), with freq of:
            24.0 = termFreq=24.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=6047)
  0.375 = coord(3/8)

Abstract: In dandelon.com werden im Gegensatz zu den bisherigen Federated Search-Portal-Ansätzen die Titel von Medien neu mittels intelligentCAPTURE dezentral und kollaborativ erschlossen und inhaltlich stark erweitert. intelligentCAPTURE erschließt maschinell bisher Buchinhaltsverzeichnisse, Bücher, Klappentexte, Aufsätze und Websites, übernimmt bibliografische Daten aus Bibliotheken (XML, Z.39.50), von Verlagen (ONIX + Cover Pages), Zeitschriftenagenturen (Swets) und Buchhandel (SOAP) und exportierte maschinelle Indexate und aufbereitete Dokumente an die Bibliothekskataloge (MAB, MARC, XML) oder Dokumentationssysteme, an dandelon.com und teils auch an Fachportale. Die Daten werden durch Scanning und OCR, durch Import von Dateien und Lookup auf Server und durch Web-Spidering/-Crawling gewonnen. Die Qualität der Suche in dandelon.com ist deutlich besser als in bisherigen Bibliothekssystemen. Die semantische, multilinguale Suche mit derzeit 1,2 Millionen Fachbegriffen trägt zu den guten Suchergebnissen stark bei.
Source: Spezialbibliotheken zwischen Auftrag und Ressourcen: 6.-9. September 2005 in München, 30. Arbeits- und Fortbildungstagung der ASpB e.V. / Sektion 5 im Deutschen Bibliotheksverband. Red.: M. Brauer
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Schek, M.: Automatische Klassifizierung und Visualisierung im Archiv der Süddeutschen Zeitung (2005) 0.04
```
0.03652399 = product of:
  0.09739731 = sum of:
    0.007207265 = weight(_text_:in in 4884) [ClassicSimilarity], result of:
      0.007207265 = score(doc=4884,freq=10.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.11761922 = fieldWeight in 4884, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.02734375 = fieldNorm(doc=4884)
    0.03744032 = weight(_text_:zu in 4884) [ClassicSimilarity], result of:
      0.03744032 = score(doc=4884,freq=12.0), product of:
        0.13343859 = queryWeight, product of:
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.045047637 = queryNorm
        0.2805809 = fieldWeight in 4884, product of:
          3.4641016 = tf(freq=12.0), with freq of:
            12.0 = termFreq=12.0
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.02734375 = fieldNorm(doc=4884)
    0.05274973 = weight(_text_:und in 4884) [ClassicSimilarity], result of:
      0.05274973 = score(doc=4884,freq=76.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.5283316 = fieldWeight in 4884, product of:
          8.717798 = tf(freq=76.0), with freq of:
            76.0 = termFreq=76.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02734375 = fieldNorm(doc=4884)
  0.375 = coord(3/8)
```
Abstract

Die Süddeutsche Zeitung (SZ) verfügt seit ihrer Gründung 1945 über ein Pressearchiv, das die Texte der eigenen Redakteure und zahlreicher nationaler und internationaler Publikationen dokumentiert und auf Anfrage für Recherchezwecke bereitstellt. Die Einführung der EDV begann Anfang der 90er Jahre mit der digitalen Speicherung zunächst der SZ-Daten. Die technische Weiterentwicklung ab Mitte der 90er Jahre diente zwei Zielen: (1) dem vollständigen Wechsel von der Papierablage zur digitalen Speicherung und (2) dem Wandel von einer verlagsinternen Dokumentations- und Auskunftsstelle zu einem auch auf dem Markt vertretenen Informationsdienstleister. Um die dabei entstehenden Aufwände zu verteilen und gleichzeitig Synergieeffekte zwischen inhaltlich verwandten Archiven zu erschließen, gründeten der Süddeutsche Verlag und der Bayerische Rundfunk im Jahr 1998 die Dokumentations- und Informationszentrum (DIZ) München GmbH, in der die Pressearchive der beiden Gesellschafter und das Bildarchiv des Süddeutschen Verlags zusammengeführt wurden. Die gemeinsam entwickelte Pressedatenbank ermöglichte das standortübergreifende Lektorat, die browserbasierte Recherche für Redakteure und externe Kunden im Intraund Internet und die kundenspezifischen Content Feeds für Verlage, Rundfunkanstalten und Portale. Die DIZPressedatenbank enthält zur Zeit 6,9 Millionen Artikel, die jeweils als HTML oder PDF abrufbar sind. Täglich kommen ca. 3.500 Artikel hinzu, von denen ca. 1.000 lektoriert werden. Das Lektorat erfolgt im DIZ nicht durch die Vergabe von Schlagwörtern am Dokument, sondern durch die Verlinkung der Artikel mit "virtuellen Mappen", den Dossiers. Diese stellen die elektronische Repräsentation einer Papiermappe dar und sind das zentrale Erschließungsobjekt. Im Gegensatz zu statischen Klassifikationssystemen ist die Dossierstruktur dynamisch und aufkommensabhängig, d.h. neue Dossiers werden hauptsächlich anhand der aktuellen Berichterstattung erstellt. Insgesamt enthält die DIZ-Pressedatenbank ca. 90.000 Dossiers, davon sind 68.000 Sachthemen (Topics), Personen und Institutionen. Die Dossiers sind untereinander zum "DIZ-Wissensnetz" verlinkt.
DIZ definiert das Wissensnetz als Alleinstellungsmerkmal und wendet beträchtliche personelle Ressourcen für die Aktualisierung und Oualitätssicherung der Dossiers auf. Nach der Umstellung auf den komplett digitalisierten Workflow im April 2001 identifizierte DIZ vier Ansatzpunkte, wie die Aufwände auf der Inputseite (Lektorat) zu optimieren sind und gleichzeitig auf der Outputseite (Recherche) das Wissensnetz besser zu vermarkten ist: 1. (Teil-)Automatische Klassifizierung von Pressetexten (Vorschlagwesen) 2. Visualisierung des Wissensnetzes (Topic Mapping) 3. (Voll-)Automatische Klassifizierung und Optimierung des Wissensnetzes 4. Neue Retrievalmöglichkeiten (Clustering, Konzeptsuche) Die Projekte 1 und 2 "Automatische Klassifizierung und Visualisierung" starteten zuerst und wurden beschleunigt durch zwei Entwicklungen: - Der Bayerische Rundfunk (BR), ursprünglich Mitbegründer und 50%-Gesellschafter der DIZ München GmbH, entschloss sich aus strategischen Gründen, zum Ende 2003 aus der Kooperation auszusteigen. - Die Medienkrise, hervorgerufen durch den massiven Rückgang der Anzeigenerlöse, erforderte auch im Süddeutschen Verlag massive Einsparungen und die Suche nach neuen Erlösquellen. Beides führte dazu, dass die Kapazitäten im Bereich Pressedokumentation von ursprünglich rund 20 (nur SZ, ohne BR-Anteil) auf rund 13 zum 1. Januar 2004 sanken und gleichzeitig die Aufwände für die Pflege des Wissensnetzes unter verstärkten Rechtfertigungsdruck gerieten. Für die Projekte 1 und 2 ergaben sich daraus drei quantitative und qualitative Ziele: - Produktivitätssteigerung im Lektorat - Konsistenzverbesserung im Lektorat - Bessere Vermarktung und intensivere Nutzung der Dossiers in der Recherche Alle drei genannten Ziele konnten erreicht werden, wobei insbesondere die Produktivität im Lektorat gestiegen ist. Die Projekte 1 und 2 "Automatische Klassifizierung und Visualisierung" sind seit Anfang 2004 erfolgreich abgeschlossen. Die Folgeprojekte 3 und 4 laufen seit Mitte 2004 und sollen bis Mitte 2005 abgeschlossen sein. Im folgenden wird in Abschnitt 2 die Produktauswahl und Arbeitsweise der Automatischen Klassifizierung beschrieben. Abschnitt 3 schildert den Einsatz der Wissensnetz-Visualisierung in Lektorat und Recherche. Abschnitt 4 fasst die Ergebnisse der Projekte 1 und 2 zusammen und gibt einen Ausblick auf die Ziele der Projekte 3 und 4.

Theme

Semantisches Umfeld in Indexierung u. Retrieval
Kasprzik, A.; Kett, J.: Vorschläge für eine Weiterentwicklung der Sacherschließung und Schritte zur fortgesetzten strukturellen Aufwertung der GND (2018) 0.04
```
0.035441767 = product of:
  0.09451138 = sum of:
    0.010296092 = weight(_text_:in in 4599) [ClassicSimilarity], result of:
      0.010296092 = score(doc=4599,freq=10.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.16802745 = fieldWeight in 4599, product of:
          3.1622777 = tf(freq=10.0), with freq of:
            10.0 = termFreq=10.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4599)
    0.043671276 = weight(_text_:zu in 4599) [ClassicSimilarity], result of:
      0.043671276 = score(doc=4599,freq=8.0), product of:
        0.13343859 = queryWeight, product of:
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.045047637 = queryNorm
        0.32727623 = fieldWeight in 4599, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4599)
    0.040544014 = weight(_text_:und in 4599) [ClassicSimilarity], result of:
      0.040544014 = score(doc=4599,freq=22.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.40608138 = fieldWeight in 4599, product of:
          4.690416 = tf(freq=22.0), with freq of:
            22.0 = termFreq=22.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0390625 = fieldNorm(doc=4599)
  0.375 = coord(3/8)
```
Abstract

Aufgrund der fortgesetzten Publikationsflut stellt sich immer dringender die Frage, wie die Schwellen für die Titel- und Normdatenpflege gesenkt werden können - sowohl für die intellektuelle als auch die automatisierte Sacherschließung. Zu einer Verbesserung der Daten- und Arbeitsqualität in der Sacherschließung kann beigetragen werden a) durch eine flexible Visualisierung der Gemeinsamen Normdatei (GND) und anderer Wissensorganisationssysteme, so dass deren Graphstruktur intuitiv erfassbar wird, und b) durch eine investigative Analyse ihrer aktuellen Struktur und die Entwicklung angepasster automatisierter Methoden zur Ermittlung und Korrektur fehlerhafter Muster. Die Deutsche Nationalbibliothek (DNB) prüft im Rahmen des GND-Entwicklungsprogramms 2017-2021, welche Bedingungen für eine fruchtbare community-getriebene Open-Source-Entwicklung entsprechender Werkzeuge gegeben sein müssen. Weiteres Potential steckt in einem langfristigen Übergang zu einer Darstellung von Titel- und Normdaten in Beschreibungssprachen im Sinne des Semantic Web (RDF; OWL, SKOS). So profitiert die GND von der Interoperabilität mit anderen kontrollierten Vokabularen und von einer erleichterten Interaktion mit anderen Fach-Communities und kann umgekehrt auch außerhalb des Bibliothekswesens zu einem noch attraktiveren Wissensorganisationssystem werden. Darüber hinaus bieten die Ansätze aus dem Semantic Web die Möglichkeit, stärker formalisierte, strukturierende Satellitenvokabulare rund um die GND zu entwickeln. Daraus ergeben sich nicht zuletzt auch neue Perspektiven für die automatisierte Sacherschließung. Es wäre lohnend, näher auszuloten, wie und inwieweit semantisch-logische Verfahren den bestehenden Methodenmix bereichern können.

Content

Vortrag anlässlich des 107. Deutschen Bibliothekartages 2018 in Berlin, Themenkreis "Fokus Erschließen & Bewahren". https://www.o-bib.de/article/view/5390/7450. https://doi.org/10.5282/o-bib/2018H4S127-140.

Theme

Semantisches Umfeld in Indexierung u. Retrieval

red: Alles Wissen gleich einer großen Stadt (2002) 0.03

0.034798205 = product of:
  0.09279521 = sum of:
    0.011050926 = weight(_text_:in in 1484) [ClassicSimilarity], result of:
      0.011050926 = score(doc=1484,freq=8.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.18034597 = fieldWeight in 1484, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.046875 = fieldNorm(doc=1484)
    0.052405532 = weight(_text_:zu in 1484) [ClassicSimilarity], result of:
      0.052405532 = score(doc=1484,freq=8.0), product of:
        0.13343859 = queryWeight, product of:
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.045047637 = queryNorm
        0.39273146 = fieldWeight in 1484, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.046875 = fieldNorm(doc=1484)
    0.029338751 = weight(_text_:und in 1484) [ClassicSimilarity], result of:
      0.029338751 = score(doc=1484,freq=8.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.29385152 = fieldWeight in 1484, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.046875 = fieldNorm(doc=1484)
  0.375 = coord(3/8)

Content: "Das rasant wachsende Wissen muss gut verwaltet werden, um es zu nutzen. Dies erfordert intelligente Wissensmanagementsysteme, wie sie Andreas Rauber von der Technischen Uni Wien über digitale Bibliotheken konzipiert hat. Seine "Wissenslandkarte" erlaubt es, große Datenmengen übersichtlich darzustellen, Wissen rasch auffindbar und damit optimal einsetzbar zu machen. Dafür erhielt er nun den Cor Baayen Award 2002 für aussichtsreiche Nachwuchsforscher im Bereich der Informationstechnologie vom European Research Consortium for Informatics and Mathematics. Rauber entwickelte eine Bibliothek, die auf einer sich selbst organisierenden Landkarte basiert: Einer geographischen Landkarte gleich, ist themenverwandtes Wissen in Form eines Clusters abgebildet, quasi als städtischer Ballungsraum. Damit verbundene Inhalte sind räumlich gesehen in kurzer Distanz dazu abgebildet, vergleichbar den Randgebieten des Ballungsraumes. So ist auf einen Blick ersichtlich, wo bestimmte Themenkomplexe und damit verbundene Inhalte in der Bibliothek abgelegt sind. Die Wissenslandkarte bedient sich der Forschungen zu neuronalen Netzen. Durch ein Verfahren erlernt die "Self-Organizing-Map" (SOM) die Inhalte der einzelnen Dokumente und schafft es, mit zunehmender Datenmenge selbst eine Struktur des vorhandenen Wissens zu erstellen. Dieses Verfahren ist sprachunabhängig und daher weltweit einsetzbar."
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Kramer, A.: Herrscher über das Chaos : Strategien, um im Dokumentenwust den Überblick zu wahren (2006) 0.03

0.03393404 = product of:
  0.09049078 = sum of:
    0.010418912 = weight(_text_:in in 181) [ClassicSimilarity], result of:
      0.010418912 = score(doc=181,freq=4.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.17003182 = fieldWeight in 181, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0625 = fieldNorm(doc=181)
    0.060512703 = weight(_text_:zu in 181) [ClassicSimilarity], result of:
      0.060512703 = score(doc=181,freq=6.0), product of:
        0.13343859 = queryWeight, product of:
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.045047637 = queryNorm
        0.45348728 = fieldWeight in 181, product of:
          2.4494898 = tf(freq=6.0), with freq of:
            6.0 = termFreq=6.0
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.0625 = fieldNorm(doc=181)
    0.019559167 = weight(_text_:und in 181) [ClassicSimilarity], result of:
      0.019559167 = score(doc=181,freq=2.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.19590102 = fieldWeight in 181, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=181)
  0.375 = coord(3/8)

Abstract: Volltextsuchmaschinen sind längst nicht mehr in der Lage, das Informationsbedürfnis angesichts ständig wachsender Datenmengen zu erfüllen. Gerade Unternehmen suchen nach Alternativen und Ergänzungen, um ihre Wissensressourcen effizient zu nutzen. Verschiedene Wissensmanagement-Lösungen erfreuen sich daher wachsender Beliebtheit.
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Ziegler, C.: Deus ex Machina : Das Web soll lernen, sich und uns zu verstehen (2002) 0.03

0.032808058 = product of:
  0.08748816 = sum of:
    0.010418912 = weight(_text_:in in 530) [ClassicSimilarity], result of:
      0.010418912 = score(doc=530,freq=4.0), product of:
        0.061276253 = queryWeight, product of:
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.045047637 = queryNorm
        0.17003182 = fieldWeight in 530, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          1.3602545 = idf(docFreq=30841, maxDocs=44218)
          0.0625 = fieldNorm(doc=530)
    0.04940841 = weight(_text_:zu in 530) [ClassicSimilarity], result of:
      0.04940841 = score(doc=530,freq=4.0), product of:
        0.13343859 = queryWeight, product of:
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.045047637 = queryNorm
        0.3702708 = fieldWeight in 530, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.9621663 = idf(docFreq=6214, maxDocs=44218)
          0.0625 = fieldNorm(doc=530)
    0.027660841 = weight(_text_:und in 530) [ClassicSimilarity], result of:
      0.027660841 = score(doc=530,freq=4.0), product of:
        0.099842094 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.045047637 = queryNorm
        0.27704588 = fieldWeight in 530, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=530)
  0.375 = coord(3/8)

Abstract: Das WWW ist dumm. Ein neuer Ansatz soll jetzt dafür sorgen, dass Maschinen Bedeutungen erfassen und Informationen richtig einordnen können. Das ist noch nicht alles: Wenn die Server erst mal das Verstehen gelernt haben sollten, würden sie auch in der Lage sein, uns von den Ergebnissen ihrer Plaudereien untereinander zu berichten - das 'semantische Web' wäre geboren
Theme: Semantisches Umfeld in Indexierung u. Retrieval

Search (273 results, page 1 of 14)

Authors

Years

Languages

Types

Themes

Subjects

Classifications