Search (115 results, page 1 of 6)

Gabler, S.: Vergabe von DDC-Sachgruppen mittels eines Schlagwort-Thesaurus (2021) 0.12
```
0.11929205 = sum of:
  0.0675677 = product of:
    0.20270309 = sum of:
      0.20270309 = weight(_text_:3a in 1000) [ClassicSimilarity], result of:
        0.20270309 = score(doc=1000,freq=2.0), product of:
          0.43280408 = queryWeight, product of:
            8.478011 = idf(docFreq=24, maxDocs=44218)
            0.05105019 = queryNorm
          0.46834838 = fieldWeight in 1000, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            8.478011 = idf(docFreq=24, maxDocs=44218)
            0.0390625 = fieldNorm(doc=1000)
    0.33333334 = coord(1/3)
  0.051724356 = product of:
    0.10344871 = sum of:
      0.10344871 = weight(_text_:dokumente in 1000) [ClassicSimilarity], result of:
        0.10344871 = score(doc=1000,freq=4.0), product of:
          0.25999573 = queryWeight, product of:
            5.092943 = idf(docFreq=737, maxDocs=44218)
            0.05105019 = queryNorm
          0.3978862 = fieldWeight in 1000, product of:
            2.0 = tf(freq=4.0), with freq of:
              4.0 = termFreq=4.0
            5.092943 = idf(docFreq=737, maxDocs=44218)
            0.0390625 = fieldNorm(doc=1000)
    0.5 = coord(1/2)
```
Abstract

Vorgestellt wird die Konstruktion eines thematisch geordneten Thesaurus auf Basis der Sachschlagwörter der Gemeinsamen Normdatei (GND) unter Nutzung der darin enthaltenen DDC-Notationen. Oberste Ordnungsebene dieses Thesaurus werden die DDC-Sachgruppen der Deutschen Nationalbibliothek. Die Konstruktion des Thesaurus erfolgt regelbasiert unter der Nutzung von Linked Data Prinzipien in einem SPARQL Prozessor. Der Thesaurus dient der automatisierten Gewinnung von Metadaten aus wissenschaftlichen Publikationen mittels eines computerlinguistischen Extraktors. Hierzu werden digitale Volltexte verarbeitet. Dieser ermittelt die gefundenen Schlagwörter über Vergleich der Zeichenfolgen Benennungen im Thesaurus, ordnet die Treffer nach Relevanz im Text und gibt die zugeordne-ten Sachgruppen rangordnend zurück. Die grundlegende Annahme dabei ist, dass die gesuchte Sachgruppe unter den oberen Rängen zurückgegeben wird. In einem dreistufigen Verfahren wird die Leistungsfähigkeit des Verfahrens validiert. Hierzu wird zunächst anhand von Metadaten und Erkenntnissen einer Kurzautopsie ein Goldstandard aus Dokumenten erstellt, die im Online-Katalog der DNB abrufbar sind. Die Dokumente vertei-len sich über 14 der Sachgruppen mit einer Losgröße von jeweils 50 Dokumenten. Sämtliche Dokumente werden mit dem Extraktor erschlossen und die Ergebnisse der Kategorisierung do-kumentiert. Schließlich wird die sich daraus ergebende Retrievalleistung sowohl für eine harte (binäre) Kategorisierung als auch eine rangordnende Rückgabe der Sachgruppen beurteilt.

Content

Master thesis Master of Science (Library and Information Studies) (MSc), Universität Wien. Advisor: Christoph Steiner. Vgl.: https://www.researchgate.net/publication/371680244_Vergabe_von_DDC-Sachgruppen_mittels_eines_Schlagwort-Thesaurus. DOI: 10.25365/thesis.70030. Vgl. dazu die Präsentation unter: https://www.google.com/url?sa=i&rct=j&q=&esrc=s&source=web&cd=&ved=0CAIQw7AJahcKEwjwoZzzytz_AhUAAAAAHQAAAAAQAg&url=https%3A%2F%2Fwiki.dnb.de%2Fdownload%2Fattachments%2F252121510%2FDA3%2520Workshop-Gabler.pdf%3Fversion%3D1%26modificationDate%3D1671093170000%26api%3Dv2&psig=AOvVaw0szwENK1or3HevgvIDOfjx&ust=1687719410889597&opi=89978449.
Wiesenmüller, H.: Verbale Erschließung in Katalogen und Discovery-Systemen : Überlegungen zur Qualität (2021) 0.07
```
0.069015846 = product of:
  0.13803169 = sum of:
    0.13803169 = sum of:
      0.10344871 = weight(_text_:dokumente in 374) [ClassicSimilarity], result of:
        0.10344871 = score(doc=374,freq=4.0), product of:
          0.25999573 = queryWeight, product of:
            5.092943 = idf(docFreq=737, maxDocs=44218)
            0.05105019 = queryNorm
          0.3978862 = fieldWeight in 374, product of:
            2.0 = tf(freq=4.0), with freq of:
              4.0 = termFreq=4.0
            5.092943 = idf(docFreq=737, maxDocs=44218)
            0.0390625 = fieldNorm(doc=374)
      0.03458298 = weight(_text_:22 in 374) [ClassicSimilarity], result of:
        0.03458298 = score(doc=374,freq=2.0), product of:
          0.17876907 = queryWeight, product of:
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.05105019 = queryNorm
          0.19345059 = fieldWeight in 374, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            3.5018296 = idf(docFreq=3622, maxDocs=44218)
            0.0390625 = fieldNorm(doc=374)
  0.5 = coord(1/2)
```
Abstract

Beschäftigt man sich mit Inhaltserschließung, so sind zunächst zwei Dimensionen zu unterscheiden - die Wissensorganisationssysteme selbst (z. B. Normdateien, Thesauri, Schlagwortsprachen, Klassifikationen und Ontologien) und die Metadaten für Dokumente, die mit diesen Wissensorganisationssystemen erschlossen sind. Beides steht in einer Wechselwirkung zueinander: Die Wissensorganisationssysteme sind die Werkzeuge für die Erschließungsarbeit und bilden die Grundlage für die Erstellung konkreter Erschließungsmetadaten. Die praktische Anwendung der Wissensorganisationssysteme in der Erschließung wiederum ist die Basis für deren Pflege und Weiterentwicklung. Zugleich haben Wissensorganisationssysteme auch einen Eigenwert unabhängig von den Erschließungsmetadaten für einzelne Dokumente, indem sie bestimmte Bereiche von Welt- oder Fachwissen modellartig abbilden. Will man nun Aussagen über die Qualität von inhaltlicher Erschließung treffen, so genügt es nicht, den Input - also die Wissensorganisationssysteme und die damit generierten Metadaten - zu betrachten. Man muss auch den Output betrachten, also das, was die Recherchewerkzeuge daraus machen und was folglich bei den Nutzer:innen konkret ankommt. Im vorliegenden Beitrag werden Überlegungen zur Qualität von Recherchewerkzeugen in diesem Bereich angestellt - gewissermaßen als Fortsetzung und Vertiefung der dazu im Thesenpapier des Expertenteams RDA-Anwendungsprofil für die verbale Inhaltserschließung (ET RAVI) gegebenen Hinweise. Im Zentrum steht die verbale Erschließung nach den Regeln für die Schlagwortkatalogisierung (RSWK), wie sie sich in Bibliothekskatalogen manifestiert - gleich, ob es sich dabei um herkömmliche Kataloge oder um Resource-Discovery-Systeme (RDS) handelt.

Date

24. 9.2021 12:22:02

Graf, K.: DNB, die "schlechteste Nationalbibliothek der Galaxis" (Graf), laesst einmal mehr URN-Links ins Leere laufen (2023) 0.04

0.04388957 = product of:
  0.08777914 = sum of:
    0.08777914 = product of:
      0.17555828 = sum of:
        0.17555828 = weight(_text_:dokumente in 978) [ClassicSimilarity], result of:
          0.17555828 = score(doc=978,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.6752353 = fieldWeight in 978, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.09375 = fieldNorm(doc=978)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Theme: Elektronische Dokumente

Giesselbach, S.; Estler-Ziegler, T.: Dokumente schneller analysieren mit Künstlicher Intelligenz (2021) 0.04
```
0.040891692 = product of:
  0.081783384 = sum of:
    0.081783384 = product of:
      0.16356677 = sum of:
        0.16356677 = weight(_text_:dokumente in 128) [ClassicSimilarity], result of:
          0.16356677 = score(doc=128,freq=10.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.6291133 = fieldWeight in 128, product of:
              3.1622777 = tf(freq=10.0), with freq of:
                10.0 = termFreq=10.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.0390625 = fieldNorm(doc=128)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Künstliche Intelligenz (KI) und natürliches Sprachverstehen (natural language understanding/NLU) verändern viele Aspekte unseres Alltags und unserer Arbeitsweise. Besondere Prominenz erlangte NLU durch Sprachassistenten wie Siri, Alexa und Google Now. NLU bietet Firmen und Einrichtungen das Potential, Prozesse effizienter zu gestalten und Mehrwert aus textuellen Inhalten zu schöpfen. So sind NLU-Lösungen in der Lage, komplexe, unstrukturierte Dokumente inhaltlich zu erschließen. Für die semantische Textanalyse hat das NLU-Team des IAIS Sprachmodelle entwickelt, die mit Deep-Learning-Verfahren trainiert werden. Die NLU-Suite analysiert Dokumente, extrahiert Eckdaten und erstellt bei Bedarf sogar eine strukturierte Zusammenfassung. Mit diesen Ergebnissen, aber auch über den Inhalt der Dokumente selbst, lassen sich Dokumente vergleichen oder Texte mit ähnlichen Informationen finden. KI-basierten Sprachmodelle sind der klassischen Verschlagwortung deutlich überlegen. Denn sie finden nicht nur Texte mit vordefinierten Schlagwörtern, sondern suchen intelligent nach Begriffen, die in ähnlichem Zusammenhang auftauchen oder als Synonym gebraucht werden. Der Vortrag liefert eine Einordnung der Begriffe "Künstliche Intelligenz" und "Natural Language Understanding" und zeigt Möglichkeiten, Grenzen, aktuelle Forschungsrichtungen und Methoden auf. Anhand von Praxisbeispielen wird anschließend demonstriert, wie NLU zur automatisierten Belegverarbeitung, zur Katalogisierung von großen Datenbeständen wie Nachrichten und Patenten und zur automatisierten thematischen Gruppierung von Social Media Beiträgen und Publikationen genutzt werden kann.

Noever, D.; Ciolino, M.: ¬The Turing deception (2022) 0.04

0.040540617 = product of:
  0.081081234 = sum of:
    0.081081234 = product of:
      0.2432437 = sum of:
        0.2432437 = weight(_text_:3a in 862) [ClassicSimilarity], result of:
          0.2432437 = score(doc=862,freq=2.0), product of:
            0.43280408 = queryWeight, product of:
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.05105019 = queryNorm
            0.56201804 = fieldWeight in 862, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.046875 = fieldNorm(doc=862)
      0.33333334 = coord(1/3)
  0.5 = coord(1/2)

Source: https%3A%2F%2Farxiv.org%2Fabs%2F2212.06721&usg=AOvVaw3i_9pZm9y_dQWoHi6uv0EN

Sack, H.: Hybride Künstliche Intelligenz in der automatisierten Inhaltserschließung (2021) 0.04
```
0.038009487 = product of:
  0.076018974 = sum of:
    0.076018974 = product of:
      0.15203795 = sum of:
        0.15203795 = weight(_text_:dokumente in 372) [ClassicSimilarity], result of:
          0.15203795 = score(doc=372,freq=6.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.5847709 = fieldWeight in 372, product of:
              2.4494898 = tf(freq=6.0), with freq of:
                6.0 = termFreq=6.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.046875 = fieldNorm(doc=372)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Effizienter (Online-)Zugang zu Bibliotheks- und Archivmaterialien erfordert eine qualitativ hinreichende inhaltliche Erschließung dieser Dokumente. Die passgenaue Verschlagwortung und Kategorisierung dieser unstrukturierten Dokumente ermöglichen einen strukturell gegliederten Zugang sowohl in der analogen als auch in der digitalen Welt. Darüber hinaus erweitert eine vollständige Transkription der Dokumente den Zugang über die Möglichkeiten der Volltextsuche. Angesichts der in jüngster Zeit erzielten spektakulären Erfolge der Künstlichen Intelligenz liegt die Schlussfolgerung nahe, dass auch das Problem der automatisierten Inhaltserschließung für Bibliotheken und Archive als mehr oder weniger gelöst anzusehen wäre. Allerdings lassen sich die oftmals nur in thematisch engen Teilbereichen erzielten Erfolge nicht immer problemlos verallgemeinern oder in einen neuen Kontext übertragen. Das Ziel der vorliegenden Darstellung liegt in der Diskussion des aktuellen Stands der Technik der automatisierten inhaltlichen Erschließung anhand ausgewählter Beispiele sowie möglicher Fortschritte und Prognosen basierend auf aktuellen Entwicklungen des maschinellen Lernens und der Künstlichen Intelligenz einschließlich deren Kritik.
Dietz, K.: en.wikipedia.org > 6 Mio. Artikel (2020) 0.03
```
0.03378385 = product of:
  0.0675677 = sum of:
    0.0675677 = product of:
      0.20270309 = sum of:
        0.20270309 = weight(_text_:3a in 5669) [ClassicSimilarity], result of:
          0.20270309 = score(doc=5669,freq=2.0), product of:
            0.43280408 = queryWeight, product of:
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.05105019 = queryNorm
            0.46834838 = fieldWeight in 5669, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.0390625 = fieldNorm(doc=5669)
      0.33333334 = coord(1/3)
  0.5 = coord(1/2)
```
Content

"Die Englischsprachige Wikipedia verfügt jetzt über mehr als 6 Millionen Artikel. An zweiter Stelle kommt die deutschsprachige Wikipedia mit 2.3 Millionen Artikeln, an dritter Stelle steht die französischsprachige Wikipedia mit 2.1 Millionen Artikeln (via Researchbuzz: Firehose <https://rbfirehose.com/2020/01/24/techcrunch-wikipedia-now-has-more-than-6-million-articles-in-english/> und Techcrunch <https://techcrunch.com/2020/01/23/wikipedia-english-six-million-articles/?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+Techcrunch+%28TechCrunch%29&guccounter=1&guce_referrer=aHR0cHM6Ly9yYmZpcmVob3NlLmNvbS8yMDIwLzAxLzI0L3RlY2hjcnVuY2gtd2lraXBlZGlhLW5vdy1oYXMtbW9yZS10aGFuLTYtbWlsbGlvbi1hcnRpY2xlcy1pbi1lbmdsaXNoLw&guce_referrer_sig=AQAAAK0zHfjdDZ_spFZBF_z-zDjtL5iWvuKDumFTzm4HvQzkUfE2pLXQzGS6FGB_y-VISdMEsUSvkNsg2U_NWQ4lwWSvOo3jvXo1I3GtgHpP8exukVxYAnn5mJspqX50VHIWFADHhs5AerkRn3hMRtf_R3F1qmEbo8EROZXp328HMC-o>). 250120 via digithek ch = #fineBlog s.a.: Angesichts der Veröffentlichung des 6-millionsten Artikels vergangene Woche in der englischsprachigen Wikipedia hat die Community-Zeitungsseite "Wikipedia Signpost" ein Moratorium bei der Veröffentlichung von Unternehmensartikeln gefordert. Das sei kein Vorwurf gegen die Wikimedia Foundation, aber die derzeitigen Maßnahmen, um die Enzyklopädie gegen missbräuchliches undeklariertes Paid Editing zu schützen, funktionierten ganz klar nicht. *"Da die ehrenamtlichen Autoren derzeit von Werbung in Gestalt von Wikipedia-Artikeln überwältigt werden, und da die WMF nicht in der Lage zu sein scheint, dem irgendetwas entgegenzusetzen, wäre der einzige gangbare Weg für die Autoren, fürs erste die Neuanlage von Artikeln über Unternehmen zu untersagen"*, schreibt der Benutzer Smallbones in seinem Editorial <https://en.wikipedia.org/wiki/Wikipedia:Wikipedia_Signpost/2020-01-27/From_the_editor> zur heutigen Ausgabe."

Neudecker, C.: Zur Kuratierung digitalisierter Dokumente mit Künstlicher Intelligenz : das Qurator-Projekt (2020) 0.03

0.031034613 = product of:
  0.062069226 = sum of:
    0.062069226 = product of:
      0.12413845 = sum of:
        0.12413845 = weight(_text_:dokumente in 47) [ClassicSimilarity], result of:
          0.12413845 = score(doc=47,freq=4.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.47746342 = fieldWeight in 47, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.046875 = fieldNorm(doc=47)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Theme: Elektronische Dokumente

Neudecker, C.; Zaczynska, K.; Baierer, K.; Rehm, G.; Gerber, M.; Moreno Schneider, J.: Methoden und Metriken zur Messung von OCR-Qualität für die Kuratierung von Daten und Metadaten (2021) 0.03
```
0.025862178 = product of:
  0.051724356 = sum of:
    0.051724356 = product of:
      0.10344871 = sum of:
        0.10344871 = weight(_text_:dokumente in 369) [ClassicSimilarity], result of:
          0.10344871 = score(doc=369,freq=4.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.3978862 = fieldWeight in 369, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.0390625 = fieldNorm(doc=369)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Durch die systematische Digitalisierung der Bestände in Bibliotheken und Archiven hat die Verfügbarkeit von Bilddigitalisaten historischer Dokumente rasant zugenommen. Das hat zunächst konservatorische Gründe: Digitalisierte Dokumente lassen sich praktisch nach Belieben in hoher Qualität vervielfältigen und sichern. Darüber hinaus lässt sich mit einer digitalisierten Sammlung eine wesentlich höhere Reichweite erzielen, als das mit dem Präsenzbestand allein jemals möglich wäre. Mit der zunehmenden Verfügbarkeit digitaler Bibliotheks- und Archivbestände steigen jedoch auch die Ansprüche an deren Präsentation und Nachnutzbarkeit. Neben der Suche auf Basis bibliothekarischer Metadaten erwarten Nutzer:innen auch, dass sie die Inhalte von Dokumenten durchsuchen können. Im wissenschaftlichen Bereich werden mit maschinellen, quantitativen Analysen von Textmaterial große Erwartungen an neue Möglichkeiten für die Forschung verbunden. Neben der Bilddigitalisierung wird daher immer häufiger auch eine Erfassung des Volltextes gefordert. Diese kann entweder manuell durch Transkription oder automatisiert mit Methoden der Optical Character Recognition (OCR) geschehen (Engl et al. 2020). Der manuellen Erfassung wird im Allgemeinen eine höhere Qualität der Zeichengenauigkeit zugeschrieben. Im Bereich der Massendigitalisierung fällt die Wahl aus Kostengründen jedoch meist auf automatische OCR-Verfahren.
Lepsky, K.: Automatisches Indexieren (2023) 0.03
```
0.02560225 = product of:
  0.0512045 = sum of:
    0.0512045 = product of:
      0.102409 = sum of:
        0.102409 = weight(_text_:dokumente in 781) [ClassicSimilarity], result of:
          0.102409 = score(doc=781,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.39388722 = fieldWeight in 781, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.0546875 = fieldNorm(doc=781)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Unter Indexierung versteht man die Zuordnung von inhaltskennzeichnenden Ausdrücken (Indextermen, Indexaten, Erschließungsmerkmalen) zu Dokumenten. Über die zugeteilten Indexterme soll ein gezieltes Auffinden der Dokumente ermöglicht werden. Indexterme können inhaltsbeschreibende Merkmale wie Notationen, Deskriptoren, kontrollierte oder freie Schlagwörter sein; es kann sich auch um reine Stichwörter handeln, die aus dem Text des Dokuments gewonnen werden. Eine Indexierung kann intellektuell, computerunterstützt oder automatisch erfolgen. Computerunterstützte Indexierungsverfahren kombinieren die intellektuelle Indexierung mit automatischen Vorarbeiten. Bei der automatischen Indexierung werden die Indexterme automatisch aus dem Dokumenttext ermittelt und dem Dokument zugeordnet. Automatische Indexierung bedient sich für die Verarbeitung der Zeichenketten im Dokument linguistischer und statistischer Verfahren.

¬Der Student aus dem Computer (2023) 0.02

0.024208086 = product of:
  0.04841617 = sum of:
    0.04841617 = product of:
      0.09683234 = sum of:
        0.09683234 = weight(_text_:22 in 1079) [ClassicSimilarity], result of:
          0.09683234 = score(doc=1079,freq=2.0), product of:
            0.17876907 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.05105019 = queryNorm
            0.5416616 = fieldWeight in 1079, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.109375 = fieldNorm(doc=1079)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Date: 27. 1.2023 16:22:55

Scherschel, F.A.: Corona-Tracking : SAP und Deutsche Telekom veröffentlichen erste Details zur Tracing- und Warn-App (2020) 0.02
```
0.021944785 = product of:
  0.04388957 = sum of:
    0.04388957 = product of:
      0.08777914 = sum of:
        0.08777914 = weight(_text_:dokumente in 5857) [ClassicSimilarity], result of:
          0.08777914 = score(doc=5857,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.33761764 = fieldWeight in 5857, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.046875 = fieldNorm(doc=5857)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Im Auftrag der Bundesregierung entwickeln SAP und die Deutsche Telekom momentan eine Contact-Tracing-App im Rahmen von Apples und Googles Exposure-Notification-Framework. Die sogenannte Corona-Warn-App und alle von ihr genutzten Serverkomponenten sollen im Vorfeld der für kommenden Monat geplanten Veröffentlichung der App unter der Apache-2.0-Lizenz als Open-Source-Software auf GitHub bereitgestellt werden. Nun haben die Projektverantwortlichen erste Dokumente dazu herausgegeben, wie die App später funktionieren soll: https://github.com/corona-warn-app/cwa-documentation.
Gellman, B.: ¬Der dunkle Spiegel : Edward Snowden und die globale Überwachungsindustrie (2020) 0.02
```
0.021944785 = product of:
  0.04388957 = sum of:
    0.04388957 = product of:
      0.08777914 = sum of:
        0.08777914 = weight(_text_:dokumente in 5991) [ClassicSimilarity], result of:
          0.08777914 = score(doc=5991,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.33761764 = fieldWeight in 5991, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.046875 = fieldNorm(doc=5991)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Der Journalist Barton Gellman erhielt vom Whistleblower Edward Snowden eine Fülle streng geheimer Dokumente. Seitdem wird er von der US-Regierung überwacht. In seinem neuen Buch berichtet der Pulitzer-Preisträger, wie er mit der Überwachung umgeht und was das mit ihm macht. »Verax« - unter diesem Namen kontaktierte ein geheimnisvoller Informant Barton Gellman. Der Journalist konnte nicht ahnen, dass sich dahinter Edward Snowden verbarg - und der größte Überwachungsskandal aller Zeiten. Jetzt legt der dreifache Pulitzer-Preisträger die definitive Gesamtdarstellung der globalen Überwachung vor. »Der dunkle Spiegel« ist alles zusammen: Spionage-Thriller, Insider-Bericht, investigative Reportage - und ein einzigartiges Zeugnis der unersetzlichen Rolle des Journalismus. Wie in einem Krimi erzählt Gellman von Snowdens Leak bis zum heutigen Überwachungskapitalismus des Silicon Valley die ganze Geschichte. Gegen den Widerstand von Geheimdiensten der ganzen Welt gelingt es ihm, die Puzzleteile zusammenzusetzen. Als sein Rechner vor seinen eigenen Augen gehackt wird, ist ihm klar: Hier sind Mächte am Werk, die kaum zu kontrollieren sind. Doch wer spioniert uns aus und warum? Sein Buch ist die Antwort auf diese Fragen.
Lewandowski, D.: Suchmaschinen (2023) 0.02
```
0.021944785 = product of:
  0.04388957 = sum of:
    0.04388957 = product of:
      0.08777914 = sum of:
        0.08777914 = weight(_text_:dokumente in 793) [ClassicSimilarity], result of:
          0.08777914 = score(doc=793,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.33761764 = fieldWeight in 793, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.046875 = fieldNorm(doc=793)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Eine Suchmaschine (auch: Web-Suchmaschine, Universalsuchmaschine) ist ein Computersystem, das Inhalte aus dem World Wide Web (WWW) mittels Crawling erfasst und über eine Benutzerschnittstelle durchsuchbar macht, wobei die Ergebnisse in einer nach systemseitig angenommener Relevanz geordneten Darstellung aufgeführt werden. Dies bedeutet, dass Suchmaschinen im Gegensatz zu anderen Informationssystemen nicht auf einem klar abgegrenzten Datenbestand aufbauen, sondern diesen aus den verstreut vorliegenden Dokumenten des WWW zusammenstellen. Dieser Datenbestand wird über eine Benutzerschnittstelle zugänglich gemacht, die so gestaltet ist, dass die Suchmaschine von Laien problemlos genutzt werden kann. Die zu einer Suchanfrage ausgegebenen Treffer werden so sortiert, dass den Nutzenden die aus Systemsicht relevantesten Dokumente zuerst angezeigt werden. Dabei handelt es sich um komplexe Bewertungsverfahren, denen zahlreiche Annahmen über die Relevanz von Dokumenten in Bezug auf Suchanfragen zugrunde liegen.
Petras, V.; Womser-Hacker, C.: Evaluation im Information Retrieval (2023) 0.02
```
0.021944785 = product of:
  0.04388957 = sum of:
    0.04388957 = product of:
      0.08777914 = sum of:
        0.08777914 = weight(_text_:dokumente in 808) [ClassicSimilarity], result of:
          0.08777914 = score(doc=808,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.33761764 = fieldWeight in 808, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.046875 = fieldNorm(doc=808)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Das Ziel einer Evaluation ist die Überprüfung, ob bzw. in welchem Ausmaß ein Informationssystem die an das System gestellten Anforderungen erfüllt. Informationssysteme können aus verschiedenen Perspektiven evaluiert werden. Für eine ganzheitliche Evaluation (als Synonym wird auch Evaluierung benutzt), die unterschiedliche Qualitätsaspekte betrachtet (z. B. wie gut ein System relevante Dokumente rankt, wie schnell ein System die Suche durchführt, wie die Ergebnispräsentation gestaltet ist oder wie Suchende durch das System geführt werden) und die Erfüllung mehrerer Anforderungen überprüft, empfiehlt es sich, sowohl eine perspektivische als auch methodische Triangulation (d. h. der Einsatz von mehreren Ansätzen zur Qualitätsüberprüfung) vorzunehmen. Im Information Retrieval (IR) konzentriert sich die Evaluation auf die Qualitätseinschätzung der Suchfunktion eines Information-Retrieval-Systems (IRS), wobei oft zwischen systemzentrierter und nutzerzentrierter Evaluation unterschieden wird. Dieses Kapitel setzt den Fokus auf die systemzentrierte Evaluation, während andere Kapitel dieses Handbuchs andere Evaluationsansätze diskutieren (s. Kapitel C 4 Interaktives Information Retrieval, C 7 Cross-Language Information Retrieval und D 1 Information Behavior).

Jaeger, L.: Wissenschaftler versus Wissenschaft (2020) 0.02

0.020749787 = product of:
  0.041499574 = sum of:
    0.041499574 = product of:
      0.08299915 = sum of:
        0.08299915 = weight(_text_:22 in 4156) [ClassicSimilarity], result of:
          0.08299915 = score(doc=4156,freq=2.0), product of:
            0.17876907 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.05105019 = queryNorm
            0.46428138 = fieldWeight in 4156, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=4156)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Date: 2. 3.2020 14:08:22

Ibrahim, G.M.; Taylor, M.: Krebszellen manipulieren Neurone : Gliome (2023) 0.02

0.020749787 = product of:
  0.041499574 = sum of:
    0.041499574 = product of:
      0.08299915 = sum of:
        0.08299915 = weight(_text_:22 in 1203) [ClassicSimilarity], result of:
          0.08299915 = score(doc=1203,freq=2.0), product of:
            0.17876907 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.05105019 = queryNorm
            0.46428138 = fieldWeight in 1203, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.09375 = fieldNorm(doc=1203)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Source: Spektrum der Wissenschaft. 2023, H.10, S.22-24

Menzel, S.; Schnaitter, H.; Zinck, J.; Petras, V.; Neudecker, C.; Labusch, K.; Leitner, E.; Rehm, G.: Named Entity Linking mit Wikidata und GND : das Potenzial handkuratierter und strukturierter Datenquellen für die semantische Anreicherung von Volltexten (2021) 0.02
```
0.018287322 = product of:
  0.036574643 = sum of:
    0.036574643 = product of:
      0.073149286 = sum of:
        0.073149286 = weight(_text_:dokumente in 373) [ClassicSimilarity], result of:
          0.073149286 = score(doc=373,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.28134802 = fieldWeight in 373, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.0390625 = fieldNorm(doc=373)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Named Entities (benannte Entitäten) - wie Personen, Organisationen, Orte, Ereignisse und Werke - sind wichtige inhaltstragende Komponenten eines Dokuments und sind daher maßgeblich für eine gute inhaltliche Erschließung. Die Erkennung von Named Entities, deren Auszeichnung (Annotation) und Verfügbarmachung für die Suche sind wichtige Instrumente, um Anwendungen wie z. B. die inhaltliche oder semantische Suche in Texten, dokumentübergreifende Kontextualisierung oder das automatische Textzusammenfassen zu verbessern. Inhaltlich präzise und nachhaltig erschlossen werden die erkannten Named Entities eines Dokuments allerdings erst, wenn sie mit einer oder mehreren Quellen verknüpft werden (Grundprinzip von Linked Data, Berners-Lee 2006), die die Entität eindeutig identifizieren und gegenüber gleichlautenden Entitäten disambiguieren (vergleiche z. B. Berlin als Hauptstadt Deutschlands mit dem Komponisten Irving Berlin). Dazu wird die im Dokument erkannte Entität mit dem Entitätseintrag einer Normdatei oder einer anderen zuvor festgelegten Wissensbasis (z. B. Gazetteer für geografische Entitäten) verknüpft, gewöhnlich über den persistenten Identifikator der jeweiligen Wissensbasis oder Normdatei. Durch die Verknüpfung mit einer Normdatei erfolgt nicht nur die Disambiguierung und Identifikation der Entität, sondern es wird dadurch auch Interoperabilität zu anderen Systemen hergestellt, in denen die gleiche Normdatei benutzt wird, z. B. die Suche nach der Hauptstadt Berlin in verschiedenen Datenbanken bzw. Portalen. Die Entitätenverknüpfung (Named Entity Linking, NEL) hat zudem den Vorteil, dass die Normdateien oftmals Relationen zwischen Entitäten enthalten, sodass Dokumente, in denen Named Entities erkannt wurden, zusätzlich auch im Kontext einer größeren Netzwerkstruktur von Entitäten verortet und suchbar gemacht werden können

Late, E.; Kumpulainen, S.: Interacting with digitised historical newspapers : understanding the use of digital surrogates as primary sources (2022) 0.02

0.018287322 = product of:
  0.036574643 = sum of:
    0.036574643 = product of:
      0.073149286 = sum of:
        0.073149286 = weight(_text_:dokumente in 685) [ClassicSimilarity], result of:
          0.073149286 = score(doc=685,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.28134802 = fieldWeight in 685, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.0390625 = fieldNorm(doc=685)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Theme: Elektronische Dokumente

Koch, C.: Was ist Bewusstsein? (2020) 0.02

0.01729149 = product of:
  0.03458298 = sum of:
    0.03458298 = product of:
      0.06916596 = sum of:
        0.06916596 = weight(_text_:22 in 5723) [ClassicSimilarity], result of:
          0.06916596 = score(doc=5723,freq=2.0), product of:
            0.17876907 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.05105019 = queryNorm
            0.38690117 = fieldWeight in 5723, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.078125 = fieldNorm(doc=5723)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Date: 17. 1.2020 22:15:11

Search (115 results, page 1 of 6)

Authors

Languages

Types

Themes

Subjects

Classifications