Search (122 results, page 1 of 7)

  • × theme_ss:"Semantisches Umfeld in Indexierung u. Retrieval"
  1. Rahmstorf, G.: Integriertes Management inhaltlicher Datenarten (2001) 0.05
    0.049943082 = product of:
      0.22474387 = sum of:
        0.02530789 = weight(_text_:und in 5856) [ClassicSimilarity], result of:
          0.02530789 = score(doc=5856,freq=18.0), product of:
            0.0574165 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.025905682 = queryNorm
            0.4407773 = fieldWeight in 5856, product of:
              4.2426405 = tf(freq=18.0), with freq of:
                18.0 = termFreq=18.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.046875 = fieldNorm(doc=5856)
        0.04928321 = weight(_text_:informationswissenschaft in 5856) [ClassicSimilarity], result of:
          0.04928321 = score(doc=5856,freq=4.0), product of:
            0.11669745 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.025905682 = queryNorm
            0.42231607 = fieldWeight in 5856, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.046875 = fieldNorm(doc=5856)
        0.04928321 = weight(_text_:informationswissenschaft in 5856) [ClassicSimilarity], result of:
          0.04928321 = score(doc=5856,freq=4.0), product of:
            0.11669745 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.025905682 = queryNorm
            0.42231607 = fieldWeight in 5856, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.046875 = fieldNorm(doc=5856)
        0.10086956 = weight(_text_:informationspraxis in 5856) [ClassicSimilarity], result of:
          0.10086956 = score(doc=5856,freq=4.0), product of:
            0.16695212 = queryWeight, product of:
              6.444614 = idf(docFreq=190, maxDocs=44218)
              0.025905682 = queryNorm
            0.60418254 = fieldWeight in 5856, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              6.444614 = idf(docFreq=190, maxDocs=44218)
              0.046875 = fieldNorm(doc=5856)
      0.22222222 = coord(4/18)
    
    Abstract
    Inhaltliche Daten sind im Unterschied zu Messdaten, Zahlen, Analogsignalen und anderen Informationen solche Daten, die sich auch sprachlich interpretieren lassen. Sie transportieren Inhalte, die sich benennen lassen. Zu inhaltlichen Daten gehören z. B. Auftragsdaten, Werbetexte, Produktbezeichnungen und Patentklassifikationen. Die meisten Daten, die im Internet kommuniziert werden, sind inhaltliche Daten. Man kann inhaltliche Daten in vier Klassen einordnen: * Wissensdaten - formatierte Daten (Fakten u. a. Daten in strukturierter Form), - nichtformatierte Daten (vorwiegend Texte); * Zugriffsdaten - Benennungsdaten (Wortschatz, Terminologie, Themen u. a.), - Begriffsdaten (Ordnungs- und Bedeutungsstrukturen). In der Wissensorganisation geht es hauptsächlich darum, die unüberschaubare Fülle des Wissens zu ordnen und wiederauffindbar zu machen. Daher befasst sich das Fach nicht nur mit dem Wissen selbst, selbst sondern auch mit den Mitteln, die dazu verwendet werden, das Wissen zu ordnen und auffindbar zu machen
    Series
    Tagungen der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis; 4
    Source
    Information Research & Content Management: Orientierung, Ordnung und Organisation im Wissensmarkt; 23. DGI-Online-Tagung der DGI und 53. Jahrestagung der Deutschen Gesellschaft für Informationswissenschaft und Informationspraxis e.V. DGI, Frankfurt am Main, 8.-10.5.2001. Proceedings. Hrsg.: R. Schmidt
  2. Schmitz-Esser, W.: EXPO-INFO 2000 : Visuelles Besucherinformationssystem für Weltausstellungen (2000) 0.04
    0.036966704 = product of:
      0.13308012 = sum of:
        0.043749522 = weight(_text_:buch in 1404) [ClassicSimilarity], result of:
          0.043749522 = score(doc=1404,freq=4.0), product of:
            0.1204451 = queryWeight, product of:
              4.64937 = idf(docFreq=1149, maxDocs=44218)
              0.025905682 = queryNorm
            0.36323205 = fieldWeight in 1404, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.64937 = idf(docFreq=1149, maxDocs=44218)
              0.0390625 = fieldNorm(doc=1404)
        0.025346916 = weight(_text_:und in 1404) [ClassicSimilarity], result of:
          0.025346916 = score(doc=1404,freq=26.0), product of:
            0.0574165 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.025905682 = queryNorm
            0.441457 = fieldWeight in 1404, product of:
              5.0990195 = tf(freq=26.0), with freq of:
                26.0 = termFreq=26.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0390625 = fieldNorm(doc=1404)
        0.02904041 = weight(_text_:informationswissenschaft in 1404) [ClassicSimilarity], result of:
          0.02904041 = score(doc=1404,freq=2.0), product of:
            0.11669745 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.025905682 = queryNorm
            0.24885213 = fieldWeight in 1404, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0390625 = fieldNorm(doc=1404)
        0.02904041 = weight(_text_:informationswissenschaft in 1404) [ClassicSimilarity], result of:
          0.02904041 = score(doc=1404,freq=2.0), product of:
            0.11669745 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.025905682 = queryNorm
            0.24885213 = fieldWeight in 1404, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0390625 = fieldNorm(doc=1404)
        0.005902871 = product of:
          0.017708613 = sum of:
            0.017708613 = weight(_text_:29 in 1404) [ClassicSimilarity], result of:
              0.017708613 = score(doc=1404,freq=2.0), product of:
                0.09112809 = queryWeight, product of:
                  3.5176873 = idf(docFreq=3565, maxDocs=44218)
                  0.025905682 = queryNorm
                0.19432661 = fieldWeight in 1404, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5176873 = idf(docFreq=3565, maxDocs=44218)
                  0.0390625 = fieldNorm(doc=1404)
          0.33333334 = coord(1/3)
      0.2777778 = coord(5/18)
    
    Abstract
    Das aktuelle Wissen der Welt im Spiegel einer Weltausstellung: Wie stellt man das dar und wie macht man es Interessierten zugänglich - in der Ausstellung, in Publikationen, im Funk und über das Internet? Was man alles auf einer Weltausstellung an der Schwelle zum dritten Jahrtausend sehen und erfahren kann, sprengt in Fülle und Vielfalt jeden individuell faßbaren Rahmen. Schmitz-Esser zeigt in seinem Buch, wie der Besucher wahlweise in vier Sprachen die Weltausstellung erleben und die Quintessenz davon mitnehmen kann. Ermöglicht wird dies durch das Konzept des virtuellen "Wissens in der Kapsel", das so aufbereitet ist, daß es in allen gängigen medialen Formen und für unterschiedlichste Wege der Aneignung eingesetzt werden kann. Die Lösung ist nicht nur eine Sache der Informatik und Informationstechnologie, sondern vielmehr auch eine Herausforderung an Informationswissenschaft und Computerlinguistik. Das Buch stellt Ziel, Ansatz, Komponenten und Voraussetzungen dafür dar.
    Content
    Willkommene Anregung schon am Eingang.- Vertiefung des Wissens während der Ausstellung.- Alles für das Wohlbefinden.- Die Systemstruktur und ihre einzelnen Elemente.- Wovon alles ausgeht.- Den Stoff als Topics und Subtopics strukturieren.- Die Nutshells.- Der Proxy-Text.Der Thesaurus.- Gedankenraumreisen.- Und zurück in die reale Welt.- Weitergehende Produkte.- Das EXPO-Infosystem auf einen Blick.- Register.- Literaturverzeichnis.
    Footnote
    Rez.in: KO 29(2002) no.2, S.103-104 (G.J.A. Riesthuis)
    Theme
    Konzeption und Anwendung des Prinzips Thesaurus
  3. Ingwersen, P.; Järvelin, K.: ¬The turn : integration of information seeking and retrieval in context (2005) 0.03
    0.025050933 = product of:
      0.11272919 = sum of:
        0.030935582 = weight(_text_:buch in 1323) [ClassicSimilarity], result of:
          0.030935582 = score(doc=1323,freq=8.0), product of:
            0.1204451 = queryWeight, product of:
              4.64937 = idf(docFreq=1149, maxDocs=44218)
              0.025905682 = queryNorm
            0.25684384 = fieldWeight in 1323, product of:
              2.828427 = tf(freq=8.0), with freq of:
                8.0 = termFreq=8.0
              4.64937 = idf(docFreq=1149, maxDocs=44218)
              0.01953125 = fieldNorm(doc=1323)
        0.016857274 = weight(_text_:und in 1323) [ClassicSimilarity], result of:
          0.016857274 = score(doc=1323,freq=46.0), product of:
            0.0574165 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.025905682 = queryNorm
            0.29359633 = fieldWeight in 1323, product of:
              6.78233 = tf(freq=46.0), with freq of:
                46.0 = termFreq=46.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.01953125 = fieldNorm(doc=1323)
        0.032468166 = weight(_text_:informationswissenschaft in 1323) [ClassicSimilarity], result of:
          0.032468166 = score(doc=1323,freq=10.0), product of:
            0.11669745 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.025905682 = queryNorm
            0.27822515 = fieldWeight in 1323, product of:
              3.1622777 = tf(freq=10.0), with freq of:
                10.0 = termFreq=10.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.01953125 = fieldNorm(doc=1323)
        0.032468166 = weight(_text_:informationswissenschaft in 1323) [ClassicSimilarity], result of:
          0.032468166 = score(doc=1323,freq=10.0), product of:
            0.11669745 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.025905682 = queryNorm
            0.27822515 = fieldWeight in 1323, product of:
              3.1622777 = tf(freq=10.0), with freq of:
                10.0 = termFreq=10.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.01953125 = fieldNorm(doc=1323)
      0.22222222 = coord(4/18)
    
    Field
    Informationswissenschaft
    Footnote
    Rez. in: Mitt. VÖB 59(2006) H.2, S.81-83 (O. Oberhauser): "Mit diesem Band haben zwei herausragende Vertreter der europäischen Informationswissenschaft, die Professoren Peter Ingwersen (Kopenhagen) und Kalervo Järvelin (Tampere) ein Werk vorgelegt, das man vielleicht dereinst als ihr opus magnum bezeichnen wird. Mich würde dies nicht überraschen, denn die Autoren unternehmen hier den ambitionierten Versuch, zwei informations wissenschaftliche Forschungstraditionen, die einander bisher in eher geringem Ausmass begegneten, unter einem gesamtheitlichen kognitiven Ansatz zu vereinen - das primär im sozialwissenschaftlichen Bereich verankerte Forschungsgebiet "Information Seeking and Retrieval" (IS&R) und das vorwiegend im Informatikbereich angesiedelte "Information Retrieval" (IR). Dabei geht es ihnen auch darum, den seit etlichen Jahren zwar dominierenden, aber auch als zu individualistisch kritisierten kognitiven Ansatz so zu erweitern, dass technologische, verhaltensbezogene und kooperative Aspekte in kohärenter Weise berücksichtigt werden. Dies geschieht auf folgende Weise in neun Kapiteln: - Zunächst werden die beiden "Lager" - die an Systemen und Laborexperimenten orientierte IR-Tradition und die an Benutzerfragen orientierte IS&R-Fraktion - einander gegenübergestellt und einige zentrale Begriffe geklärt. - Im zweiten Kapitel erfolgt eine ausführliche Darstellung der kognitiven Richtung der Informationswissenschaft, insbesondere hinsichtlich des Informationsbegriffes. - Daran schliesst sich ein Überblick über die bisherige Forschung zu "Information Seeking" (IS) - eine äusserst brauchbare Einführung in die Forschungsfragen und Modelle, die Forschungsmethodik sowie die in diesem Bereich offenen Fragen, z.B. die aufgrund der einseitigen Ausrichtung des Blickwinkels auf den Benutzer mangelnde Betrachtung der Benutzer-System-Interaktion. - In analoger Weise wird im vierten Kapitel die systemorientierte IRForschung in einem konzentrierten Überblick vorgestellt, in dem es sowohl um das "Labormodell" als auch Ansätze wie die Verarbeitung natürlicher Sprache und Expertensysteme geht. Aspekte wie Relevanz, Anfragemodifikation und Performanzmessung werden ebenso angesprochen wie die Methodik - von den ersten Laborexperimenten bis zu TREC und darüber hinaus.
    - Kapitel fünf enthält einen entsprechenden Überblick über die kognitive und benutzerorientierte IR-Tradition. Es zeigt, welche anderen (als nur die labororientierten) IR-Studien durchgeführt werden können, wobei sich die Betrachtung von frühen Modellen (z.B. Taylor) über Belkins ASK-Konzept bis zu Ingwersens Modell der Polyrepräsentation, und von Bates Berrypicking-Ansatz bis zu Vakkaris "taskbased" IR-Modell erstreckt. Auch Web-IR, OKAPI und Diskussionen zum Relevanzbegriff werden hier thematisiert. - Im folgenden Kapitel schlagen die Autoren ein integriertes IS&R Forschungsmodell vor, bei dem die vielfältigen Beziehungen zwischen Informationssuchenden, Systementwicklern, Oberflächen und anderen beteiligten Aspekten berücksichtigt werden. Ihr Ansatz vereint die traditionelle Laborforschung mit verschiedenen benutzerorientierten Traditionen aus IS&R, insbesondere mit den empirischen Ansätzen zu IS und zum interaktiven IR, in einem holistischen kognitiven Modell. - Kapitel sieben untersucht die Implikationen dieses Modells für IS&R, wobei besonders ins Auge fällt, wie komplex die Anfragen von Informationssuchenden im Vergleich mit der relativen Einfachheit der Algorithmen zum Auffinden relevanter Dokumente sind. Die Abbildung der vielfältig variierenden kognitiven Zustände der Anfragesteller im Rahmen der der Systementwicklung ist sicherlich keine triviale Aufgabe. Wie dabei das Problem der Einbeziehung des zentralen Aspektes der Bedeutung gelöst werden kann, sei dahingestellt. - Im achten Kapitel wird der Versuch unternommen, die zuvor diskutierten Punkte in ein IS&R-Forschungsprogramm (Prozesse - Verhalten - Systemfunktionalität - Performanz) umzusetzen, wobei auch einige kritische Anmerkungen zur bisherigen Forschungspraxis getroffen werden. - Das abschliessende neunte Kapitel fasst das Buch kurz zusammen und kann somit auch als Einstieg in dieThematik gelesen werden. Darauffolgen noch ein sehr nützliches Glossar zu allen wichtigen Begriffen, die in dem Buch Verwendung finden, eine Bibliographie und ein Sachregister. Ingwersen und Järvelin haben hier ein sehr anspruchsvolles und dennoch lesbares Buch vorgelegt. Die gebotenen Übersichtskapitel und Diskussionen sind zwar keine Einführung in die Informationswissenschaft, decken aber einen grossen Teil der heute in dieser Disziplin aktuellen und durch laufende Forschungsaktivitäten und Publikationen berührten Teilbereiche ab. Man könnte es auch - vielleicht ein wenig überspitzt - so formulieren: Was hier thematisiert wird, ist eigentlich die moderne Informationswissenschaft. Der Versuch, die beiden Forschungstraditionen zu vereinen, wird diesem Werk sicherlich einen Platz in der Geschichte der Disziplin sichern. Nicht ganz glücklich erscheint der Titel des Buches. "The Turn" soll eine Wende bedeuten, nämlich jene hin zu einer integrierten Sicht von IS und IR. Das geht vermutlich aus dem Untertitel besser hervor, doch dieser erschien den Autoren wohl zu trocken. Schade, denn "The Turn" gibt es z.B. in unserem Verbundkatalog bereits, allerdings mit dem Zusatz "from the Cold War to a new era; the United States and the Soviet Union 1983-1990". Der Verlag, der abgesehen davon ein gediegenes (wenn auch nicht gerade wohlfeiles) Produkt vorgelegt hat, hätte derlei unscharfe Duplizierend besser verhindert. Ungeachtet dessen empfehle ich dieses wichtige Buch ohne Vorbehalt zur Anschaffung; es sollte in keiner grösseren Bibliothek fehlen."
  4. Heinz, S.: Realisierung und Evaluierung eines virtuellen Bibliotheksregals für die Informationswissenschaft an der Universitätsbibliothek Hildesheim (2003) 0.02
    0.022006823 = product of:
      0.13204093 = sum of:
        0.017046768 = weight(_text_:und in 5982) [ClassicSimilarity], result of:
          0.017046768 = score(doc=5982,freq=6.0), product of:
            0.0574165 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.025905682 = queryNorm
            0.2968967 = fieldWeight in 5982, product of:
              2.4494898 = tf(freq=6.0), with freq of:
                6.0 = termFreq=6.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5982)
        0.05749708 = weight(_text_:informationswissenschaft in 5982) [ClassicSimilarity], result of:
          0.05749708 = score(doc=5982,freq=4.0), product of:
            0.11669745 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.025905682 = queryNorm
            0.4927021 = fieldWeight in 5982, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5982)
        0.05749708 = weight(_text_:informationswissenschaft in 5982) [ClassicSimilarity], result of:
          0.05749708 = score(doc=5982,freq=4.0), product of:
            0.11669745 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.025905682 = queryNorm
            0.4927021 = fieldWeight in 5982, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0546875 = fieldNorm(doc=5982)
      0.16666667 = coord(3/18)
    
    Abstract
    Im Rahmen der vorliegenden Magisterarbeit wurde ein virtuelles Bibliotheksregal für die Informationswissenschaft entwickelt. Es ermöglicht den BenutzerInnen den Browsing-Zugang zum informationswissenschaftlichen Literaturbestand der Universitätsbibliothek Hildesheim über drei verschiedene hierarchische Ordnungssystematiken. Die BenutzerInnen können eine Systematik auswählen, nach der sich der Bestand entsprechend anordnet. Die vorliegende Arbeit beschreibt die einzelnen Schritte der Realisierung des virtuellen Bibliotheksregals sowie seine anschließende Evaluierung durch einen Benutzertest, der mit Studierenden der Universität Hildesheim durchgeführt wurde.
    Content
    [Magisterarbeit im Studiengang Internationales Informationsmanagement am Fachbereich Informations- und Kommunikationswissenschaften der Universität Hildesheim]
    Imprint
    Hildesheim] : Fachbereich Informations- und Kommunikationswissenschaften
  5. Context: nature, impact, and role : 5th International Conference on Conceptions of Library and Information Science, CoLIS 2005, Glasgow 2005; Proceedings (2005) 0.02
    0.019895148 = product of:
      0.089528166 = sum of:
        0.026791 = weight(_text_:buch in 42) [ClassicSimilarity], result of:
          0.026791 = score(doc=42,freq=6.0), product of:
            0.1204451 = queryWeight, product of:
              4.64937 = idf(docFreq=1149, maxDocs=44218)
              0.025905682 = queryNorm
            0.2224333 = fieldWeight in 42, product of:
              2.4494898 = tf(freq=6.0), with freq of:
                6.0 = termFreq=6.0
              4.64937 = idf(docFreq=1149, maxDocs=44218)
              0.01953125 = fieldNorm(doc=42)
        0.02166782 = weight(_text_:und in 42) [ClassicSimilarity], result of:
          0.02166782 = score(doc=42,freq=76.0), product of:
            0.0574165 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.025905682 = queryNorm
            0.3773797 = fieldWeight in 42, product of:
              8.717798 = tf(freq=76.0), with freq of:
                76.0 = termFreq=76.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.01953125 = fieldNorm(doc=42)
        0.020534672 = weight(_text_:informationswissenschaft in 42) [ClassicSimilarity], result of:
          0.020534672 = score(doc=42,freq=4.0), product of:
            0.11669745 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.025905682 = queryNorm
            0.17596504 = fieldWeight in 42, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.01953125 = fieldNorm(doc=42)
        0.020534672 = weight(_text_:informationswissenschaft in 42) [ClassicSimilarity], result of:
          0.020534672 = score(doc=42,freq=4.0), product of:
            0.11669745 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.025905682 = queryNorm
            0.17596504 = fieldWeight in 42, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.01953125 = fieldNorm(doc=42)
      0.22222222 = coord(4/18)
    
    Classification
    SS 4800 [Informatik # Enzyklopädien und Handbücher. Kongreßberichte Schriftenreihe. Tafeln und Formelsammlungen # Schriftenreihen (indiv. Sign.) # Lecture notes in computer science]
    Content
    Das Buch ist in die Abschnitte Invited Papers (1 Beitrag, 1 Abstract), Representing Context (3 Beiträge), Context and Relevance in Information Seeking (3), Context and Information (3), Contextualised Information Seeking (3), Agendas for Context (3), Context and Documents (2) und Workshops (2 Ankündigungstexte) gegliedert und enthält ein simples Autoren-, jedoch kein Sachregister. Die Autoren der Beiträge stammen mit einigen Ausnahmen (Italien, Frankreich, Russland) aus den angelsächsischen und skandinavischen Ländern.
    Footnote
    Rez. in: Mitt. VÖB 59(2006) H.3, S.100-103 (O. Oberhauser): "Dieses als Band 3507 der bekannten, seit 1973 erscheinenden Springer-Serie Lecture Notes in Computer Science (LNCS) publizierte Buch versammelt die Vorträge der 5. Tagung "Conceptions of Library and Information Science". CoLIS hat sich in den letzten anderthalb Jahrzehnten als internationales Forum für die Präsentation und Rezeption von Forschung auf den Fachgebieten Informatik und Informationswissenschaft etabliert. Auf die 1992 in Tampere (Finnland) anlässlich des damals 20jährigen Bestehens des dortigen Instituts für Informationswissenschaft abgehaltene erste Tagung folgten weitere in Kopenhagen (1996), Dubrovnik (1999) und Seattle, WA (2002). Die zuletzt an der Strathclyde University in Glasgow (2005) veranstaltete Konferenz war dem Thema "Context" im Rahmen der informationsbezogenen Forschung gewidmet, einem komplexen, dynamischen und multidimensionalen Begriff von grosser Bedeutung für das Verhalten und die Interaktion von Mensch und Maschine. . . .
    Am interessantesten und wichtigsten erschien mir der Grundsatzartikel von Peter Ingwersen und Kalervo Järvelin (Kopenhagen/Tampere), The sense of information: Understanding the cognitive conditional information concept in relation to information acquisition (S. 7-19). Hier versuchen die Autoren, den ursprünglich von Ingwersen1 vorgeschlagenen und damals ausschliesslich im Zusammenhang mit dem interaktiven Information Retrieval verwendeten Begriff "conditional cognitive information" anhand eines erweiterten Modells nicht nur auf das Gesamtgebiet von "information seeking and retrieval" (IS&R) auszuweiten, sondern auch auf den menschlichen Informationserwerb aus der Sinneswahrnehmung, wie z.B. im Alltag oder im Rahmen der wissenschaftlichen Erkenntnistätigkeit. Dabei werden auch alternative Informationsbegriffe sowie die Beziehung von Information und Bedeutung diskutiert. Einen ebenfalls auf Ingwersen zurückgehenden Ansatz thematisiert der Beitrag von Birger Larsen (Kopenhagen), indem er sich mit dessen vor über 10 Jahren veröffentlichten2 Principle of Polyrepresentation befasst. Dieses beruht auf der Hypothese, wonach die Überlappung zwischen unterschiedlichen kognitiven Repräsentationen - nämlich jenen der Situation des Informationssuchenden und der Dokumente - zur Reduktion der einer Retrievalsituation anhaftenden Unsicherheit und damit zur Verbesserung der Performance des IR-Systems genutzt werden könne. Das Prinzip stellt die Dokumente, ihre Autoren und Indexierer, aber auch die sie zugänglich machende IT-Lösung in einen umfassenden und kohärenten theoretischen Bezugsrahmen, der die benutzerorientierte Forschungsrichtung "Information-Seeking" mit der systemorientierten IR-Forschung zu integrieren trachtet. Auf der Basis theoretischer Überlegungen sowie der (wenigen) dazu vorliegenden empirischen Studien hält Larsen das Model, das von Ingwersen sowohl für "exact match-IR" als auch für "best match-IR" intendiert war, allerdings schon in seinen Grundzügen für "Boolean" (d.h. "exact match"-orientiert) und schlägt ein "polyrepresentation continuum" als Verbesserungsmöglichkeit vor.
    Mehrere Beiträge befassen sich mit dem Problem der Relevanz. Erica Cosijn und Theo Bothma (Pretoria) argumentieren, dass für das Benutzerverhalten neben der thematischen Relevanz auch verschiedene andere Relevanzdimensionen eine Rolle spielen und schlagen auf der Basis eines (abermals auf Ingwersen zurückgehenden) erweiterten Relevanzmodells vor, dass IR-Systeme die Möglichkeit zur Abgabe auch kognitiver, situativer und sozio-kognitiver Relevanzurteile bieten sollten. Elaine Toms et al. (Kanada) berichten von einer Studie, in der versucht wurde, die schon vor 30 Jahren von Tefko Saracevic3 erstellten fünf Relevanzdimensionen (kognitiv, motivational, situativ, thematisch und algorithmisch) zu operationalisieren und anhand von Recherchen mit einer Web-Suchmaschine zu untersuchen. Die Ergebnisse zeigten, dass sich diese fünf Dimensionen in drei Typen vereinen lassen, die Benutzer, System und Aufgabe repräsentieren. Von einer völlig anderen Seite nähern sich Olof Sundin und Jenny Johannison (Boras, Schweden) der Relevanzthematik, indem sie einen kommunikationsorientierten, neo-pragmatistischen Ansatz (nach Richard Rorty) wählen, um Informationssuche und Relevanz zu analysieren, und dabei auch auf das Werk von Michel Foucault zurückgreifen. Weitere interessante Artikel befassen sich mit Bradford's Law of Scattering (Hjørland & Nicolaisen), Information Sharing and Timing (Widén-Wulff & Davenport), Annotations as Context for Searching Documents (Agosti & Ferro), sowie dem Nutzen von neuen Informationsquellen wie Web Links, Newsgroups und Blogs für die sozial- und informationswissenschaftliche Forschung (Thelwall & Wouters). In Summe liegt hier ein interessantes und anspruchsvolles Buch vor - inhaltlich natürlich nicht gerade einheitlich und geschlossen, doch dies darf man bei einem Konferenzband ohnedies nicht erwarten. Manche der abgedruckten Beiträge sind sicher nicht einfach zu lesen, lohnen aber die Mühe. Auch für Praktiker aus Bibliothek und Information ist einiges dabei, sofern sie sich für die wissenschaftliche Basis ihrer Tätigkeit interessieren. Fachlich einschlägige Spezial- und grössere Allgemeinbibliotheken sollten das Werk daher unbedingt führen.
    Context: Nature, Impact and Role ist ein typischer LNCS-Softcover-Band in sauberem TeX-Design und mutet mit knapp 50 Euro zwar nicht als wohlfeil an, liegt aber angesichts heutiger Buchpreise im Rahmen. Die Zahl der Tippfehler hält sich in Grenzen, ist jedoch gelegentlich peinlich (z.B. wenn man auf S. 2, noch dazu im Fettdruck, "Tractaus" anstelle von "Tractatus" lesen muss). Als Kuriosum am Rande sei erwähnt, dass die einleitend abgedruckte Namensliste des CoLIS-Programmkomitees, immerhin rund 50 Personen, vom Computer fein säuberlich sortiert wurde - dies allerdings nach dem Alphabet der Vornamen der Komiteemitglieder, was offenbar weder den Herausgebern noch dem Verlag aufgefallen ist."
    RVK
    SS 4800 [Informatik # Enzyklopädien und Handbücher. Kongreßberichte Schriftenreihe. Tafeln und Formelsammlungen # Schriftenreihen (indiv. Sign.) # Lecture notes in computer science]
  6. Deuschel, T.; Heuss, T.; Humm, B.: ¬Die Medienplattform : ein System für gerichtete und ungerichtete semantische Suchen (2015) 0.02
    0.018139387 = product of:
      0.108836316 = sum of:
        0.015907004 = weight(_text_:und in 2233) [ClassicSimilarity], result of:
          0.015907004 = score(doc=2233,freq=4.0), product of:
            0.0574165 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.025905682 = queryNorm
            0.27704588 = fieldWeight in 2233, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0625 = fieldNorm(doc=2233)
        0.046464656 = weight(_text_:informationswissenschaft in 2233) [ClassicSimilarity], result of:
          0.046464656 = score(doc=2233,freq=2.0), product of:
            0.11669745 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.025905682 = queryNorm
            0.3981634 = fieldWeight in 2233, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0625 = fieldNorm(doc=2233)
        0.046464656 = weight(_text_:informationswissenschaft in 2233) [ClassicSimilarity], result of:
          0.046464656 = score(doc=2233,freq=2.0), product of:
            0.11669745 = queryWeight, product of:
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.025905682 = queryNorm
            0.3981634 = fieldWeight in 2233, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.504705 = idf(docFreq=1328, maxDocs=44218)
              0.0625 = fieldNorm(doc=2233)
      0.16666667 = coord(3/18)
    
    Content
    Beitrag innerhalb einer Beitragsfolge des "Darmstädter Symposiums Informationswissenschaft", 2015.
    Source
    Information - Wissenschaft und Praxis. 66(2015) H.4, S.201-206
  7. Gödert, W.: Inhaltliche Dokumenterschließung, Information Retrieval und Navigation in Informationsräumen (1995) 0.02
    0.016128093 = product of:
      0.09676856 = sum of:
        0.015907004 = weight(_text_:und in 4438) [ClassicSimilarity], result of:
          0.015907004 = score(doc=4438,freq=4.0), product of:
            0.0574165 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.025905682 = queryNorm
            0.27704588 = fieldWeight in 4438, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0625 = fieldNorm(doc=4438)
        0.022749731 = product of:
          0.045499463 = sum of:
            0.045499463 = weight(_text_:bibliothekswesen in 4438) [ClassicSimilarity], result of:
              0.045499463 = score(doc=4438,freq=2.0), product of:
                0.11547904 = queryWeight, product of:
                  4.457672 = idf(docFreq=1392, maxDocs=44218)
                  0.025905682 = queryNorm
                0.39400625 = fieldWeight in 4438, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  4.457672 = idf(docFreq=1392, maxDocs=44218)
                  0.0625 = fieldNorm(doc=4438)
          0.5 = coord(1/2)
        0.058111824 = weight(_text_:indexing in 4438) [ClassicSimilarity], result of:
          0.058111824 = score(doc=4438,freq=6.0), product of:
            0.099163525 = queryWeight, product of:
              3.8278677 = idf(docFreq=2614, maxDocs=44218)
              0.025905682 = queryNorm
            0.5860202 = fieldWeight in 4438, product of:
              2.4494898 = tf(freq=6.0), with freq of:
                6.0 = termFreq=6.0
              3.8278677 = idf(docFreq=2614, maxDocs=44218)
              0.0625 = fieldNorm(doc=4438)
      0.16666667 = coord(3/18)
    
    Abstract
    Examines the advantages and disadvantages of precoordinated, postcoordinated and automatic indexing with regard to existing information storage systems, such as card catalogues, OPACs, CR-ROM databases, and online databases. Presents a general model of document content representation and concludes that the library profession needs to address the development of databank design models, relevance feedback methods and automatic indexing assessment methods, to make indexing more effective
    Source
    Zeitschrift für Bibliothekswesen und Bibliographie. 42(1995) H.2, S.137-155
  8. Gödert, W.; Lepsky, K.: Semantische Umfeldsuche im Information Retrieval (1998) 0.01
    0.014654535 = product of:
      0.08792721 = sum of:
        0.017046768 = weight(_text_:und in 606) [ClassicSimilarity], result of:
          0.017046768 = score(doc=606,freq=6.0), product of:
            0.0574165 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.025905682 = queryNorm
            0.2968967 = fieldWeight in 606, product of:
              2.4494898 = tf(freq=6.0), with freq of:
                6.0 = termFreq=6.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0546875 = fieldNorm(doc=606)
        0.019906014 = product of:
          0.03981203 = sum of:
            0.03981203 = weight(_text_:bibliothekswesen in 606) [ClassicSimilarity], result of:
              0.03981203 = score(doc=606,freq=2.0), product of:
                0.11547904 = queryWeight, product of:
                  4.457672 = idf(docFreq=1392, maxDocs=44218)
                  0.025905682 = queryNorm
                0.34475547 = fieldWeight in 606, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  4.457672 = idf(docFreq=1392, maxDocs=44218)
                  0.0546875 = fieldNorm(doc=606)
          0.5 = coord(1/2)
        0.05097443 = weight(_text_:automatisches in 606) [ClassicSimilarity], result of:
          0.05097443 = score(doc=606,freq=2.0), product of:
            0.13066888 = queryWeight, product of:
              5.044024 = idf(docFreq=774, maxDocs=44218)
              0.025905682 = queryNorm
            0.39010382 = fieldWeight in 606, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.044024 = idf(docFreq=774, maxDocs=44218)
              0.0546875 = fieldNorm(doc=606)
      0.16666667 = coord(3/18)
    
    Abstract
    Sachliche Suchen in bibliothekarischen Online-Katalogen enden häufig mit unbefriedigenden Ergebnissen. Als eine Ursache dafür kann angesehen werden, daß die Gestaltung des Suchprozesses das semantische Umfeld einer Suchanfrage nicht mit einbezieht, daß in Übertragung der Verhältnisse in konventionellen Katalogen am Paradigma des Wort-Matching zwischen Suchwort und Indexat festgehalten wird. Es wird statt dessen das Konzept einer semantischen Umfeldsuche entwickelt und gezeigt, welche Rolle die Verwendung strukturierten Vokabulars dafür spielen kann. Insbesondere wird dargestellt, welche Möglichkeiten Verfahren der wörterbuchgestützten maschinellen Indexierung in diesem Zusammenhang spielen können. Die Ausführungen werden durch Beispiele illustriert
    Source
    Zeitschrift für Bibliothekswesen und Bibliographie. 45(1998) H.4, S.401-423
    Theme
    Automatisches Indexieren
  9. Rädler, K.: In Bibliothekskatalogen "googlen" : Integration von Inhaltsverzeichnissen, Volltexten und WEB-Ressourcen in Bibliothekskataloge (2004) 0.01
    0.014094288 = product of:
      0.08456573 = sum of:
        0.030935582 = weight(_text_:buch in 2432) [ClassicSimilarity], result of:
          0.030935582 = score(doc=2432,freq=2.0), product of:
            0.1204451 = queryWeight, product of:
              4.64937 = idf(docFreq=1149, maxDocs=44218)
              0.025905682 = queryNorm
            0.25684384 = fieldWeight in 2432, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.64937 = idf(docFreq=1149, maxDocs=44218)
              0.0390625 = fieldNorm(doc=2432)
        0.017219838 = weight(_text_:und in 2432) [ClassicSimilarity], result of:
          0.017219838 = score(doc=2432,freq=12.0), product of:
            0.0574165 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.025905682 = queryNorm
            0.29991096 = fieldWeight in 2432, product of:
              3.4641016 = tf(freq=12.0), with freq of:
                12.0 = termFreq=12.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0390625 = fieldNorm(doc=2432)
        0.036410306 = weight(_text_:automatisches in 2432) [ClassicSimilarity], result of:
          0.036410306 = score(doc=2432,freq=2.0), product of:
            0.13066888 = queryWeight, product of:
              5.044024 = idf(docFreq=774, maxDocs=44218)
              0.025905682 = queryNorm
            0.27864558 = fieldWeight in 2432, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.044024 = idf(docFreq=774, maxDocs=44218)
              0.0390625 = fieldNorm(doc=2432)
      0.16666667 = coord(3/18)
    
    Abstract
    Ausgangslage Die Katalog-Recherchen über Internet, also von außerhalb der Bibliothek, nehmen erwartungsgemäß stark zu bzw. sind mittlerweile die Regel. Damit ist natürlich das Bedürfnis und die Notwendigkeit gewachsen, über den Titel hinaus zusätzliche inhaltliche Informationen zu erhalten, die es erlauben, die Zweckmäßigkeit wesentlich besser abschätzen zu können, eine Bestellung vorzunehmen oder vielleicht auch 50 km in die Bibliothek zu fahren, um ein Buch zu entleihen. Dieses Informationsdefizit wird zunehmend als gravierender Mangel erfahren. Inhaltsverzeichnisse referieren den Inhalt kurz und prägnant. Sie sind die erste Stelle, welche zur Relevanz-Beurteilung herangezogen wird. Fast alle relevanten Terme einer Fachbuchpublikation finden sich bereits dort. Andererseits wird immer deutlicher, dass die dem bibliothekarischen Paradigma entsprechende intellektuelle Indexierung der einzelnen dokumentarischen Einheiten mit den engsten umfassenden dokumentationssprachlichen Termen (Schlagwörter, Klassen) zwar eine notwendige, aber keinesfalls hinreichende Methode darstellt, das teuer erworbene Bibliotheksgut Information für den Benutzer in seiner spezifischen Problemstellung zu aktivieren und als Informationsdienstleistung anbieten zu können. Informationen zu sehr speziellen Fragestellungen, die oft nur in kürzeren Abschnitten (Kapitel) erörtert werden, sind derzeit nur indirekt, mit großem Zeitaufwand und oft überhaupt nicht auffindbar. Sie liegen sozusagen brach. Die Tiefe der intellektuellen Indexierung bis in einzelne inhaltliche Details zu erweitern, ist aus personellen und damit auch finanziellen Gesichtspunkten nicht vertretbar. Bibliotheken fallen deshalb in der Wahrnehmung von Informationssuchenden immer mehr zurück. Die enorme Informationsvielfalt liegt hinter dem Informations- bzw. Recherchehorizont der bibliographischen Aufnahmen im Katalog.
    Theme
    Automatisches Indexieren
  10. Harman, D.: Automatic indexing (1994) 0.01
    0.013928695 = product of:
      0.12535825 = sum of:
        0.05825649 = weight(_text_:automatisches in 7729) [ClassicSimilarity], result of:
          0.05825649 = score(doc=7729,freq=2.0), product of:
            0.13066888 = queryWeight, product of:
              5.044024 = idf(docFreq=774, maxDocs=44218)
              0.025905682 = queryNorm
            0.44583294 = fieldWeight in 7729, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.044024 = idf(docFreq=774, maxDocs=44218)
              0.0625 = fieldNorm(doc=7729)
        0.06710176 = weight(_text_:indexing in 7729) [ClassicSimilarity], result of:
          0.06710176 = score(doc=7729,freq=8.0), product of:
            0.099163525 = queryWeight, product of:
              3.8278677 = idf(docFreq=2614, maxDocs=44218)
              0.025905682 = queryNorm
            0.6766778 = fieldWeight in 7729, product of:
              2.828427 = tf(freq=8.0), with freq of:
                8.0 = termFreq=8.0
              3.8278677 = idf(docFreq=2614, maxDocs=44218)
              0.0625 = fieldNorm(doc=7729)
      0.11111111 = coord(2/18)
    
    Content
    Enthält die Abschnitte: What constitutes a record; What constitutes a word and what 'words' to index; Use of stop lists; Use of suffixing or stemming; Advanced automatic indexing techniques (term weighting, query expansion, the use of multiple-word phrases for indexing)
    Source
    Challenges in indexing electronic text and images. Ed.: R. Fidel et al
    Theme
    Automatisches Indexieren
  11. Looking for information : a survey on research on information seeking, needs, and behavior (2016) 0.01
    0.009554355 = product of:
      0.0859892 = sum of:
        0.06588109 = weight(_text_:allgemeines in 3803) [ClassicSimilarity], result of:
          0.06588109 = score(doc=3803,freq=4.0), product of:
            0.14780287 = queryWeight, product of:
              5.705423 = idf(docFreq=399, maxDocs=44218)
              0.025905682 = queryNorm
            0.44573617 = fieldWeight in 3803, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.705423 = idf(docFreq=399, maxDocs=44218)
              0.0390625 = fieldNorm(doc=3803)
        0.020108113 = product of:
          0.040216226 = sum of:
            0.040216226 = weight(_text_:bibliothekswesen in 3803) [ClassicSimilarity], result of:
              0.040216226 = score(doc=3803,freq=4.0), product of:
                0.11547904 = queryWeight, product of:
                  4.457672 = idf(docFreq=1392, maxDocs=44218)
                  0.025905682 = queryNorm
                0.34825563 = fieldWeight in 3803, product of:
                  2.0 = tf(freq=4.0), with freq of:
                    4.0 = termFreq=4.0
                  4.457672 = idf(docFreq=1392, maxDocs=44218)
                  0.0390625 = fieldNorm(doc=3803)
          0.5 = coord(1/2)
      0.11111111 = coord(2/18)
    
    BK
    06.30 (Bibliothekswesen / Dokumentationswesen: Allgemeines)
    Classification
    06.30 (Bibliothekswesen / Dokumentationswesen: Allgemeines)
  12. Jarvelin, K.: ¬A deductive data model for thesaurus navigation and query expansion (1996) 0.01
    0.009040572 = product of:
      0.054243427 = sum of:
        0.011247951 = weight(_text_:und in 5625) [ClassicSimilarity], result of:
          0.011247951 = score(doc=5625,freq=2.0), product of:
            0.0574165 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.025905682 = queryNorm
            0.19590102 = fieldWeight in 5625, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0625 = fieldNorm(doc=5625)
        0.03355088 = weight(_text_:indexing in 5625) [ClassicSimilarity], result of:
          0.03355088 = score(doc=5625,freq=2.0), product of:
            0.099163525 = queryWeight, product of:
              3.8278677 = idf(docFreq=2614, maxDocs=44218)
              0.025905682 = queryNorm
            0.3383389 = fieldWeight in 5625, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.8278677 = idf(docFreq=2614, maxDocs=44218)
              0.0625 = fieldNorm(doc=5625)
        0.009444593 = product of:
          0.02833378 = sum of:
            0.02833378 = weight(_text_:29 in 5625) [ClassicSimilarity], result of:
              0.02833378 = score(doc=5625,freq=2.0), product of:
                0.09112809 = queryWeight, product of:
                  3.5176873 = idf(docFreq=3565, maxDocs=44218)
                  0.025905682 = queryNorm
                0.31092256 = fieldWeight in 5625, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5176873 = idf(docFreq=3565, maxDocs=44218)
                  0.0625 = fieldNorm(doc=5625)
          0.33333334 = coord(1/3)
      0.16666667 = coord(3/18)
    
    Abstract
    Describes a deductive data model based on 3 abstraction levels for representing vocabularies for information retrieval: conceptual level; expression level; and occurrence level. The proposed data model can be used for the representation and navigation of indexing and retrieval thesauri and as a vocabulary source for concept based query expansion in heterogeneous retrieval environments
    Date
    2. 3.1997 17:29:07
    Theme
    Konzeption und Anwendung des Prinzips Thesaurus
  13. Ma, N.; Zheng, H.T.; Xiao, X.: ¬An ontology-based latent semantic indexing approach using long short-term memory networks (2017) 0.01
    0.008705434 = product of:
      0.078348905 = sum of:
        0.036410306 = weight(_text_:automatisches in 3810) [ClassicSimilarity], result of:
          0.036410306 = score(doc=3810,freq=2.0), product of:
            0.13066888 = queryWeight, product of:
              5.044024 = idf(docFreq=774, maxDocs=44218)
              0.025905682 = queryNorm
            0.27864558 = fieldWeight in 3810, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.044024 = idf(docFreq=774, maxDocs=44218)
              0.0390625 = fieldNorm(doc=3810)
        0.041938595 = weight(_text_:indexing in 3810) [ClassicSimilarity], result of:
          0.041938595 = score(doc=3810,freq=8.0), product of:
            0.099163525 = queryWeight, product of:
              3.8278677 = idf(docFreq=2614, maxDocs=44218)
              0.025905682 = queryNorm
            0.42292362 = fieldWeight in 3810, product of:
              2.828427 = tf(freq=8.0), with freq of:
                8.0 = termFreq=8.0
              3.8278677 = idf(docFreq=2614, maxDocs=44218)
              0.0390625 = fieldNorm(doc=3810)
      0.11111111 = coord(2/18)
    
    Abstract
    Nowadays, online data shows an astonishing increase and the issue of semantic indexing remains an open question. Ontologies and knowledge bases have been widely used to optimize performance. However, researchers are placing increased emphasis on internal relations of ontologies but neglect latent semantic relations between ontologies and documents. They generally annotate instances mentioned in documents, which are related to concepts in ontologies. In this paper, we propose an Ontology-based Latent Semantic Indexing approach utilizing Long Short-Term Memory networks (LSTM-OLSI). We utilize an importance-aware topic model to extract document-level semantic features and leverage ontologies to extract word-level contextual features. Then we encode the above two levels of features and match their embedding vectors utilizing LSTM networks. Finally, the experimental results reveal that LSTM-OLSI outperforms existing techniques and demonstrates deep comprehension of instances and articles.
    Object
    Latent Semantic Indexing
    Theme
    Automatisches Indexieren
  14. Ross, J.: ¬A new way of information retrieval : 3-D indexing and concept mapping (2000) 0.01
    0.007165912 = product of:
      0.06449321 = sum of:
        0.05032632 = weight(_text_:indexing in 6171) [ClassicSimilarity], result of:
          0.05032632 = score(doc=6171,freq=2.0), product of:
            0.099163525 = queryWeight, product of:
              3.8278677 = idf(docFreq=2614, maxDocs=44218)
              0.025905682 = queryNorm
            0.5075084 = fieldWeight in 6171, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.8278677 = idf(docFreq=2614, maxDocs=44218)
              0.09375 = fieldNorm(doc=6171)
        0.01416689 = product of:
          0.042500667 = sum of:
            0.042500667 = weight(_text_:29 in 6171) [ClassicSimilarity], result of:
              0.042500667 = score(doc=6171,freq=2.0), product of:
                0.09112809 = queryWeight, product of:
                  3.5176873 = idf(docFreq=3565, maxDocs=44218)
                  0.025905682 = queryNorm
                0.46638384 = fieldWeight in 6171, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5176873 = idf(docFreq=3565, maxDocs=44218)
                  0.09375 = fieldNorm(doc=6171)
          0.33333334 = coord(1/3)
      0.11111111 = coord(2/18)
    
    Date
    25. 2.1997 10:29:16
  15. Chen, H.; Martinez, J.; Kirchhoff, A.; Ng, T.D.; Schatz, B.R.: Alleviating search uncertainty through concept associations : automatic indexing, co-occurence analysis, and parallel computing (1998) 0.01
    0.0065291426 = product of:
      0.058762282 = sum of:
        0.008435963 = weight(_text_:und in 5202) [ClassicSimilarity], result of:
          0.008435963 = score(doc=5202,freq=2.0), product of:
            0.0574165 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.025905682 = queryNorm
            0.14692576 = fieldWeight in 5202, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.046875 = fieldNorm(doc=5202)
        0.05032632 = weight(_text_:indexing in 5202) [ClassicSimilarity], result of:
          0.05032632 = score(doc=5202,freq=8.0), product of:
            0.099163525 = queryWeight, product of:
              3.8278677 = idf(docFreq=2614, maxDocs=44218)
              0.025905682 = queryNorm
            0.5075084 = fieldWeight in 5202, product of:
              2.828427 = tf(freq=8.0), with freq of:
                8.0 = termFreq=8.0
              3.8278677 = idf(docFreq=2614, maxDocs=44218)
              0.046875 = fieldNorm(doc=5202)
      0.11111111 = coord(2/18)
    
    Abstract
    In this article, we report research on an algorithmic approach to alleviating search uncertainty in a large information space. Grounded on object filtering, automatic indexing, and co-occurence analysis, we performed a large-scale experiment using a parallel supercomputer (SGI Power Challenge) to analyze 400.000+ abstracts in an INSPEC computer engineering collection. Two system-generated thesauri, one based on a combined object filtering and automatic indexing method, and the other based on automatic indexing only, were compaed with the human-generated INSPEC subject thesaurus. Our user evaluation revealed that the system-generated thesauri were better than the INSPEC thesaurus in 'concept recall', but in 'concept precision' the 3 thesauri were comparable. Our analysis also revealed that the terms suggested by the 3 thesauri were complementary and could be used to significantly increase 'variety' in search terms the thereby reduce search uncertainty
    Theme
    Konzeption und Anwendung des Prinzips Thesaurus
  16. Schek, M.: Automatische Klassifizierung und Visualisierung im Archiv der Süddeutschen Zeitung (2005) 0.01
    0.0062024626 = product of:
      0.055822164 = sum of:
        0.03033495 = weight(_text_:und in 4884) [ClassicSimilarity], result of:
          0.03033495 = score(doc=4884,freq=76.0), product of:
            0.0574165 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.025905682 = queryNorm
            0.5283316 = fieldWeight in 4884, product of:
              8.717798 = tf(freq=76.0), with freq of:
                76.0 = termFreq=76.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.02734375 = fieldNorm(doc=4884)
        0.025487214 = weight(_text_:automatisches in 4884) [ClassicSimilarity], result of:
          0.025487214 = score(doc=4884,freq=2.0), product of:
            0.13066888 = queryWeight, product of:
              5.044024 = idf(docFreq=774, maxDocs=44218)
              0.025905682 = queryNorm
            0.19505191 = fieldWeight in 4884, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.044024 = idf(docFreq=774, maxDocs=44218)
              0.02734375 = fieldNorm(doc=4884)
      0.11111111 = coord(2/18)
    
    Abstract
    Die Süddeutsche Zeitung (SZ) verfügt seit ihrer Gründung 1945 über ein Pressearchiv, das die Texte der eigenen Redakteure und zahlreicher nationaler und internationaler Publikationen dokumentiert und auf Anfrage für Recherchezwecke bereitstellt. Die Einführung der EDV begann Anfang der 90er Jahre mit der digitalen Speicherung zunächst der SZ-Daten. Die technische Weiterentwicklung ab Mitte der 90er Jahre diente zwei Zielen: (1) dem vollständigen Wechsel von der Papierablage zur digitalen Speicherung und (2) dem Wandel von einer verlagsinternen Dokumentations- und Auskunftsstelle zu einem auch auf dem Markt vertretenen Informationsdienstleister. Um die dabei entstehenden Aufwände zu verteilen und gleichzeitig Synergieeffekte zwischen inhaltlich verwandten Archiven zu erschließen, gründeten der Süddeutsche Verlag und der Bayerische Rundfunk im Jahr 1998 die Dokumentations- und Informationszentrum (DIZ) München GmbH, in der die Pressearchive der beiden Gesellschafter und das Bildarchiv des Süddeutschen Verlags zusammengeführt wurden. Die gemeinsam entwickelte Pressedatenbank ermöglichte das standortübergreifende Lektorat, die browserbasierte Recherche für Redakteure und externe Kunden im Intraund Internet und die kundenspezifischen Content Feeds für Verlage, Rundfunkanstalten und Portale. Die DIZPressedatenbank enthält zur Zeit 6,9 Millionen Artikel, die jeweils als HTML oder PDF abrufbar sind. Täglich kommen ca. 3.500 Artikel hinzu, von denen ca. 1.000 lektoriert werden. Das Lektorat erfolgt im DIZ nicht durch die Vergabe von Schlagwörtern am Dokument, sondern durch die Verlinkung der Artikel mit "virtuellen Mappen", den Dossiers. Diese stellen die elektronische Repräsentation einer Papiermappe dar und sind das zentrale Erschließungsobjekt. Im Gegensatz zu statischen Klassifikationssystemen ist die Dossierstruktur dynamisch und aufkommensabhängig, d.h. neue Dossiers werden hauptsächlich anhand der aktuellen Berichterstattung erstellt. Insgesamt enthält die DIZ-Pressedatenbank ca. 90.000 Dossiers, davon sind 68.000 Sachthemen (Topics), Personen und Institutionen. Die Dossiers sind untereinander zum "DIZ-Wissensnetz" verlinkt.
    DIZ definiert das Wissensnetz als Alleinstellungsmerkmal und wendet beträchtliche personelle Ressourcen für die Aktualisierung und Oualitätssicherung der Dossiers auf. Nach der Umstellung auf den komplett digitalisierten Workflow im April 2001 identifizierte DIZ vier Ansatzpunkte, wie die Aufwände auf der Inputseite (Lektorat) zu optimieren sind und gleichzeitig auf der Outputseite (Recherche) das Wissensnetz besser zu vermarkten ist: 1. (Teil-)Automatische Klassifizierung von Pressetexten (Vorschlagwesen) 2. Visualisierung des Wissensnetzes (Topic Mapping) 3. (Voll-)Automatische Klassifizierung und Optimierung des Wissensnetzes 4. Neue Retrievalmöglichkeiten (Clustering, Konzeptsuche) Die Projekte 1 und 2 "Automatische Klassifizierung und Visualisierung" starteten zuerst und wurden beschleunigt durch zwei Entwicklungen: - Der Bayerische Rundfunk (BR), ursprünglich Mitbegründer und 50%-Gesellschafter der DIZ München GmbH, entschloss sich aus strategischen Gründen, zum Ende 2003 aus der Kooperation auszusteigen. - Die Medienkrise, hervorgerufen durch den massiven Rückgang der Anzeigenerlöse, erforderte auch im Süddeutschen Verlag massive Einsparungen und die Suche nach neuen Erlösquellen. Beides führte dazu, dass die Kapazitäten im Bereich Pressedokumentation von ursprünglich rund 20 (nur SZ, ohne BR-Anteil) auf rund 13 zum 1. Januar 2004 sanken und gleichzeitig die Aufwände für die Pflege des Wissensnetzes unter verstärkten Rechtfertigungsdruck gerieten. Für die Projekte 1 und 2 ergaben sich daraus drei quantitative und qualitative Ziele: - Produktivitätssteigerung im Lektorat - Konsistenzverbesserung im Lektorat - Bessere Vermarktung und intensivere Nutzung der Dossiers in der Recherche Alle drei genannten Ziele konnten erreicht werden, wobei insbesondere die Produktivität im Lektorat gestiegen ist. Die Projekte 1 und 2 "Automatische Klassifizierung und Visualisierung" sind seit Anfang 2004 erfolgreich abgeschlossen. Die Folgeprojekte 3 und 4 laufen seit Mitte 2004 und sollen bis Mitte 2005 abgeschlossen sein. Im folgenden wird in Abschnitt 2 die Produktauswahl und Arbeitsweise der Automatischen Klassifizierung beschrieben. Abschnitt 3 schildert den Einsatz der Wissensnetz-Visualisierung in Lektorat und Recherche. Abschnitt 4 fasst die Ergebnisse der Projekte 1 und 2 zusammen und gibt einen Ausblick auf die Ziele der Projekte 3 und 4.
    Theme
    Automatisches Klassifizieren
  17. Hauer, M: Silicon Valley Vorarlberg : Maschinelle Indexierung und semantisches Retrieval verbessert den Katalog der Vorarlberger Landesbibliothek (2004) 0.01
    0.0061122063 = product of:
      0.055009857 = sum of:
        0.01859955 = weight(_text_:und in 2489) [ClassicSimilarity], result of:
          0.01859955 = score(doc=2489,freq=14.0), product of:
            0.0574165 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.025905682 = queryNorm
            0.32394084 = fieldWeight in 2489, product of:
              3.7416575 = tf(freq=14.0), with freq of:
                14.0 = termFreq=14.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.0390625 = fieldNorm(doc=2489)
        0.036410306 = weight(_text_:automatisches in 2489) [ClassicSimilarity], result of:
          0.036410306 = score(doc=2489,freq=2.0), product of:
            0.13066888 = queryWeight, product of:
              5.044024 = idf(docFreq=774, maxDocs=44218)
              0.025905682 = queryNorm
            0.27864558 = fieldWeight in 2489, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.044024 = idf(docFreq=774, maxDocs=44218)
              0.0390625 = fieldNorm(doc=2489)
      0.11111111 = coord(2/18)
    
    Abstract
    10 Jahre Internet haben die WeIt um die Bibliotheken herum stark geändert. Der Web-OPAC war eine Antwort der Bibliotheken. Doch reicht ein Web-OPAC im Zeitalter des Internets noch aus? Außer Web ist es doch der alte Katalog. Ca. 90% aller Bibliotheksrecherchen durch Benutzer sind Themenrecherchen. Ein Anteil dieser Recherchen bringt kein Ergebnis. Es kann leicht gemessen werden, dass null Medien gefunden wurden. Die Gründe hierfür wurden auch immer wieder untersucht: Plural- anstelle Singularformen, zu spezifische Suchbegriffe, Schreib- oder Bedienungsfehler. Zu wenig untersucht sind aber die Recherchen, die nicht mit einer Ausleihe enden, denn auch dann kann man in vielen Fällen von einem Retrieval-Mangel ausgehen. Schließlich: Von den ausgeliehenen Büchern werden nach Einschätzung vieler Bibliothekare 80% nicht weiter als bis zum Inhaltsverzeichnis gelesen (außer in Präsenzbibliotheken) - und erst nach Wochen zurückgegeben. Ein Politiker würde dies neudeutsch als "ein Vermittlungsproblem" bezeichnen. Ein Controller als nicht hinreichende Kapitalnutzung. Einfacher machen es sich immer mehr Studenten und Wissenschaftler, ihr Wissensaustausch vollzieht sich zunehmend an anderen Orten. Bibliotheken (als Funktion) sind unverzichtbar für die wissenschaftliche Kommunikation. Deshalb geht es darum, Wege zu finden und auch zu beschreiten, welche die Schätze von Bibliotheken (als Institution) effizienter an die Zielgruppe bringen. Der Einsatz von Information Retrieval-Technologie, neue Erschließungsmethoden und neuer Content sind Ansätze dazu. Doch die bisherigen Verbundstrukturen und Abhängigkeit haben das hier vorgestellte innovative Projekt keineswegs gefördert. Innovation entsteht wie die Innvoationsforschung zeigt eigentlich immer an der Peripherie: in Bregenz fing es an.
    Source
    Mitteilungen der Vereinigung Österreichischer Bibliothekarinnen und Bibliothekare. 57(2004) H.3/4, S.33-38
    Theme
    Automatisches Indexieren
  18. Rekabsaz, N. et al.: Toward optimized multimodal concept indexing (2016) 0.01
    0.005959793 = product of:
      0.053638138 = sum of:
        0.041938595 = weight(_text_:indexing in 2751) [ClassicSimilarity], result of:
          0.041938595 = score(doc=2751,freq=2.0), product of:
            0.099163525 = queryWeight, product of:
              3.8278677 = idf(docFreq=2614, maxDocs=44218)
              0.025905682 = queryNorm
            0.42292362 = fieldWeight in 2751, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.8278677 = idf(docFreq=2614, maxDocs=44218)
              0.078125 = fieldNorm(doc=2751)
        0.0116995415 = product of:
          0.035098623 = sum of:
            0.035098623 = weight(_text_:22 in 2751) [ClassicSimilarity], result of:
              0.035098623 = score(doc=2751,freq=2.0), product of:
                0.090717286 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.025905682 = queryNorm
                0.38690117 = fieldWeight in 2751, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.078125 = fieldNorm(doc=2751)
          0.33333334 = coord(1/3)
      0.11111111 = coord(2/18)
    
    Date
    1. 2.2016 18:25:22
  19. Schek, M.: Automatische Klassifizierung in Erschließung und Recherche eines Pressearchivs (2006) 0.01
    0.0056566456 = product of:
      0.05090981 = sum of:
        0.021781564 = weight(_text_:und in 6043) [ClassicSimilarity], result of:
          0.021781564 = score(doc=6043,freq=30.0), product of:
            0.0574165 = queryWeight, product of:
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.025905682 = queryNorm
            0.3793607 = fieldWeight in 6043, product of:
              5.477226 = tf(freq=30.0), with freq of:
                30.0 = termFreq=30.0
              2.216367 = idf(docFreq=13101, maxDocs=44218)
              0.03125 = fieldNorm(doc=6043)
        0.029128244 = weight(_text_:automatisches in 6043) [ClassicSimilarity], result of:
          0.029128244 = score(doc=6043,freq=2.0), product of:
            0.13066888 = queryWeight, product of:
              5.044024 = idf(docFreq=774, maxDocs=44218)
              0.025905682 = queryNorm
            0.22291647 = fieldWeight in 6043, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.044024 = idf(docFreq=774, maxDocs=44218)
              0.03125 = fieldNorm(doc=6043)
      0.11111111 = coord(2/18)
    
    Abstract
    Die Süddeutsche Zeitung (SZ) verfügt seit ihrer Gründung 1945 über ein Pressearchiv, das die Texte der eigenen Redakteure und zahlreicher nationaler und internationaler Publikationen dokumentiert und für Recherchezwecke bereitstellt. Die DIZ-Pressedatenbank (www.medienport.de) ermöglicht die browserbasierte Recherche für Redakteure und externe Kunden im Intra- und Internet und die kundenspezifischen Content Feeds für Verlage, Rundfunkanstalten und Portale. Die DIZ-Pressedatenbank enthält z. Zt. 7,8 Millionen Artikel, die jeweils als HTML oder PDF abrufbar sind. Täglich kommen ca. 3.500 Artikel hinzu, von denen ca. 1.000 durch Dokumentare inhaltlich erschlossen werden. Die Informationserschließung erfolgt im DIZ nicht durch die Vergabe von Schlagwörtern am Dokument, sondern durch die Verlinkung der Artikel mit "virtuellen Mappen", den Dossiers. Insgesamt enthält die DIZ-Pressedatenbank ca. 90.000 Dossiers, die untereinander zum "DIZ-Wissensnetz" verlinkt sind. DIZ definiert das Wissensnetz als Alleinstellungsmerkmal und wendet beträchtliche personelle Ressourcen für die Aktualisierung und Qualitätssicherung der Dossiers auf. Im Zuge der Medienkrise mussten sich DIZ der Herausforderung stellen, bei sinkenden Lektoratskapazitäten die Qualität der Informationserschließung im Input zu erhalten. Auf der Outputseite gilt es, eine anspruchsvolle Zielgruppe - u.a. die Redakteure der Süddeutschen Zeitung - passgenau und zeitnah mit den Informationen zu versorgen, die sie für ihre tägliche Arbeit benötigt. Bezogen auf die Ausgangssituation in der Dokumentation der Süddeutschen Zeitung identifizierte DIZ drei Ansatzpunkte, wie die Aufwände auf der Inputseite (Lektorat) zu optimieren sind und gleichzeitig auf der Outputseite (Recherche) das Wissensnetz besser zu vermarkten ist: - (Teil-)Automatische Klassifizierung von Pressetexten (Vorschlagwesen) - Visualisierung des Wissensnetzes - Neue Retrievalmöglichkeiten (Ähnlichkeitssuche, Clustering) Im Bereich "Visualisierung" setzt DIZ auf den Net-Navigator von intelligent views, eine interaktive Visualisierung allgemeiner Graphen, basierend auf einem physikalischen Modell. In den Bereichen automatische Klassifizierung, Ähnlichkeitssuche und Clustering hat DIZ sich für das Produkt nextBot der Firma Brainbot entschieden.
    Source
    Spezialbibliotheken zwischen Auftrag und Ressourcen: 6.-9. September 2005 in München, 30. Arbeits- und Fortbildungstagung der ASpB e.V. / Sektion 5 im Deutschen Bibliotheksverband. Red.: M. Brauer
    Theme
    Automatisches Klassifizieren
  20. Faaborg, A.; Lagoze, C.: Semantic browsing (2003) 0.00
    0.0041718553 = product of:
      0.037546698 = sum of:
        0.02935702 = weight(_text_:indexing in 1026) [ClassicSimilarity], result of:
          0.02935702 = score(doc=1026,freq=2.0), product of:
            0.099163525 = queryWeight, product of:
              3.8278677 = idf(docFreq=2614, maxDocs=44218)
              0.025905682 = queryNorm
            0.29604656 = fieldWeight in 1026, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.8278677 = idf(docFreq=2614, maxDocs=44218)
              0.0546875 = fieldNorm(doc=1026)
        0.008189679 = product of:
          0.024569036 = sum of:
            0.024569036 = weight(_text_:22 in 1026) [ClassicSimilarity], result of:
              0.024569036 = score(doc=1026,freq=2.0), product of:
                0.090717286 = queryWeight, product of:
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.025905682 = queryNorm
                0.2708308 = fieldWeight in 1026, product of:
                  1.4142135 = tf(freq=2.0), with freq of:
                    2.0 = termFreq=2.0
                  3.5018296 = idf(docFreq=3622, maxDocs=44218)
                  0.0546875 = fieldNorm(doc=1026)
          0.33333334 = coord(1/3)
      0.11111111 = coord(2/18)
    
    Abstract
    We have created software applications that allow users to both author and use Semantic Web metadata. To create and use a layer of semantic content on top of the existing Web, we have (1) implemented a user interface that expedites the task of attributing metadata to resources on the Web, and (2) augmented a Web browser to leverage this semantic metadata to provide relevant information and tasks to the user. This project provides a framework for annotating and reorganizing existing files, pages, and sites on the Web that is similar to Vannevar Bushrsquos original concepts of trail blazing and associative indexing.
    Source
    Research and advanced technology for digital libraries : 7th European Conference, proceedings / ECDL 2003, Trondheim, Norway, August 17-22, 2003

Years

Languages

  • e 81
  • d 39
  • f 1
  • More… Less…

Types

  • a 104
  • el 11
  • m 8
  • r 4
  • x 3
  • s 2
  • More… Less…