Search (61 results, page 1 of 4)

Gabler, S.: Vergabe von DDC-Sachgruppen mittels eines Schlagwort-Thesaurus (2021) 0.12
```
0.11929205 = sum of:
  0.0675677 = product of:
    0.20270309 = sum of:
      0.20270309 = weight(_text_:3a in 1000) [ClassicSimilarity], result of:
        0.20270309 = score(doc=1000,freq=2.0), product of:
          0.43280408 = queryWeight, product of:
            8.478011 = idf(docFreq=24, maxDocs=44218)
            0.05105019 = queryNorm
          0.46834838 = fieldWeight in 1000, product of:
            1.4142135 = tf(freq=2.0), with freq of:
              2.0 = termFreq=2.0
            8.478011 = idf(docFreq=24, maxDocs=44218)
            0.0390625 = fieldNorm(doc=1000)
    0.33333334 = coord(1/3)
  0.051724356 = product of:
    0.10344871 = sum of:
      0.10344871 = weight(_text_:dokumente in 1000) [ClassicSimilarity], result of:
        0.10344871 = score(doc=1000,freq=4.0), product of:
          0.25999573 = queryWeight, product of:
            5.092943 = idf(docFreq=737, maxDocs=44218)
            0.05105019 = queryNorm
          0.3978862 = fieldWeight in 1000, product of:
            2.0 = tf(freq=4.0), with freq of:
              4.0 = termFreq=4.0
            5.092943 = idf(docFreq=737, maxDocs=44218)
            0.0390625 = fieldNorm(doc=1000)
    0.5 = coord(1/2)
```
Abstract

Vorgestellt wird die Konstruktion eines thematisch geordneten Thesaurus auf Basis der Sachschlagwörter der Gemeinsamen Normdatei (GND) unter Nutzung der darin enthaltenen DDC-Notationen. Oberste Ordnungsebene dieses Thesaurus werden die DDC-Sachgruppen der Deutschen Nationalbibliothek. Die Konstruktion des Thesaurus erfolgt regelbasiert unter der Nutzung von Linked Data Prinzipien in einem SPARQL Prozessor. Der Thesaurus dient der automatisierten Gewinnung von Metadaten aus wissenschaftlichen Publikationen mittels eines computerlinguistischen Extraktors. Hierzu werden digitale Volltexte verarbeitet. Dieser ermittelt die gefundenen Schlagwörter über Vergleich der Zeichenfolgen Benennungen im Thesaurus, ordnet die Treffer nach Relevanz im Text und gibt die zugeordne-ten Sachgruppen rangordnend zurück. Die grundlegende Annahme dabei ist, dass die gesuchte Sachgruppe unter den oberen Rängen zurückgegeben wird. In einem dreistufigen Verfahren wird die Leistungsfähigkeit des Verfahrens validiert. Hierzu wird zunächst anhand von Metadaten und Erkenntnissen einer Kurzautopsie ein Goldstandard aus Dokumenten erstellt, die im Online-Katalog der DNB abrufbar sind. Die Dokumente vertei-len sich über 14 der Sachgruppen mit einer Losgröße von jeweils 50 Dokumenten. Sämtliche Dokumente werden mit dem Extraktor erschlossen und die Ergebnisse der Kategorisierung do-kumentiert. Schließlich wird die sich daraus ergebende Retrievalleistung sowohl für eine harte (binäre) Kategorisierung als auch eine rangordnende Rückgabe der Sachgruppen beurteilt.

Content

Master thesis Master of Science (Library and Information Studies) (MSc), Universität Wien. Advisor: Christoph Steiner. Vgl.: https://www.researchgate.net/publication/371680244_Vergabe_von_DDC-Sachgruppen_mittels_eines_Schlagwort-Thesaurus. DOI: 10.25365/thesis.70030. Vgl. dazu die Präsentation unter: https://www.google.com/url?sa=i&rct=j&q=&esrc=s&source=web&cd=&ved=0CAIQw7AJahcKEwjwoZzzytz_AhUAAAAAHQAAAAAQAg&url=https%3A%2F%2Fwiki.dnb.de%2Fdownload%2Fattachments%2F252121510%2FDA3%2520Workshop-Gabler.pdf%3Fversion%3D1%26modificationDate%3D1671093170000%26api%3Dv2&psig=AOvVaw0szwENK1or3HevgvIDOfjx&ust=1687719410889597&opi=89978449.

Verwer, K.: Freiheit und Verantwortung bei Hans Jonas (2011) 0.08

0.081081234 = product of:
  0.16216247 = sum of:
    0.16216247 = product of:
      0.4864874 = sum of:
        0.4864874 = weight(_text_:3a in 973) [ClassicSimilarity], result of:
          0.4864874 = score(doc=973,freq=2.0), product of:
            0.43280408 = queryWeight, product of:
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.05105019 = queryNorm
            1.1240361 = fieldWeight in 973, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.09375 = fieldNorm(doc=973)
      0.33333334 = coord(1/3)
  0.5 = coord(1/2)

Content: Vgl.: http%3A%2F%2Fcreativechoice.org%2Fdoc%2FHansJonas.pdf&usg=AOvVaw1TM3teaYKgABL5H9yoIifA&opi=89978449.

Buschbeck, C.A.: Inhaltserschließung audio-visueller Dokumente (1995) 0.06

0.058519427 = product of:
  0.11703885 = sum of:
    0.11703885 = product of:
      0.2340777 = sum of:
        0.2340777 = weight(_text_:dokumente in 2769) [ClassicSimilarity], result of:
          0.2340777 = score(doc=2769,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.9003137 = fieldWeight in 2769, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.125 = fieldNorm(doc=2769)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Schulze, M.: ¬Das Projekt "nestor" : Aufbau eines Kompetenznetzwerks Langzeitarchivierung und Langzeitverfügbarkeit digitaler Ressourcen für Deutschland (2004) 0.05

0.0512045 = product of:
  0.102409 = sum of:
    0.102409 = product of:
      0.204818 = sum of:
        0.204818 = weight(_text_:dokumente in 4534) [ClassicSimilarity], result of:
          0.204818 = score(doc=4534,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.78777444 = fieldWeight in 4534, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.109375 = fieldNorm(doc=4534)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Form: Elektronische Dokumente

Garbe, H.: ¬Das Projekt SSG-FI (Sondersammelgebiets-Fachinformation) der SUB Göttingen : Sacherschließung von ausgewählten Internet-Dokumenten (1999) 0.04

0.04388957 = product of:
  0.08777914 = sum of:
    0.08777914 = product of:
      0.17555828 = sum of:
        0.17555828 = weight(_text_:dokumente in 3812) [ClassicSimilarity], result of:
          0.17555828 = score(doc=3812,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.6752353 = fieldWeight in 3812, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.09375 = fieldNorm(doc=3812)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Form: Elektronische Dokumente

Farazi, M.: Faceted lightweight ontologies : a formalization and some experiments (2010) 0.03

0.03378385 = product of:
  0.0675677 = sum of:
    0.0675677 = product of:
      0.20270309 = sum of:
        0.20270309 = weight(_text_:3a in 4997) [ClassicSimilarity], result of:
          0.20270309 = score(doc=4997,freq=2.0), product of:
            0.43280408 = queryWeight, product of:
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.05105019 = queryNorm
            0.46834838 = fieldWeight in 4997, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.0390625 = fieldNorm(doc=4997)
      0.33333334 = coord(1/3)
  0.5 = coord(1/2)

Content: PhD Dissertation at International Doctorate School in Information and Communication Technology. Vgl.: https%3A%2F%2Fcore.ac.uk%2Fdownload%2Fpdf%2F150083013.pdf&usg=AOvVaw2n-qisNagpyT0lli_6QbAQ.

Shala, E.: ¬Die Autonomie des Menschen und der Maschine : gegenwärtige Definitionen von Autonomie zwischen philosophischem Hintergrund und technologischer Umsetzbarkeit (2014) 0.03

0.03378385 = product of:
  0.0675677 = sum of:
    0.0675677 = product of:
      0.20270309 = sum of:
        0.20270309 = weight(_text_:3a in 4388) [ClassicSimilarity], result of:
          0.20270309 = score(doc=4388,freq=2.0), product of:
            0.43280408 = queryWeight, product of:
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.05105019 = queryNorm
            0.46834838 = fieldWeight in 4388, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.0390625 = fieldNorm(doc=4388)
      0.33333334 = coord(1/3)
  0.5 = coord(1/2)

Footnote: Vgl. unter: https://www.google.de/url?sa=t&rct=j&q=&esrc=s&source=web&cd=2&cad=rja&uact=8&ved=2ahUKEwizweHljdbcAhVS16QKHXcFD9QQFjABegQICRAB&url=https%3A%2F%2Fwww.researchgate.net%2Fpublication%2F271200105_Die_Autonomie_des_Menschen_und_der_Maschine_-_gegenwartige_Definitionen_von_Autonomie_zwischen_philosophischem_Hintergrund_und_technologischer_Umsetzbarkeit_Redigierte_Version_der_Magisterarbeit_Karls&usg=AOvVaw06orrdJmFF2xbCCp_hL26q.

Piros, A.: Az ETO-jelzetek automatikus interpretálásának és elemzésének kérdései (2018) 0.03

0.03378385 = product of:
  0.0675677 = sum of:
    0.0675677 = product of:
      0.20270309 = sum of:
        0.20270309 = weight(_text_:3a in 855) [ClassicSimilarity], result of:
          0.20270309 = score(doc=855,freq=2.0), product of:
            0.43280408 = queryWeight, product of:
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.05105019 = queryNorm
            0.46834838 = fieldWeight in 855, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.0390625 = fieldNorm(doc=855)
      0.33333334 = coord(1/3)
  0.5 = coord(1/2)

Content: Vgl. auch: New automatic interpreter for complex UDC numbers. Unter: <https%3A%2F%2Fudcc.org%2Ffiles%2FAttilaPiros_EC_36-37_2014-2015.pdf&usg=AOvVaw3kc9CwDDCWP7aArpfjrs5b>

Mayr, P.: Re-Ranking auf Basis von Bradfordizing für die verteilte Suche in Digitalen Bibliotheken (2009) 0.03
```
0.032713354 = product of:
  0.06542671 = sum of:
    0.06542671 = product of:
      0.13085341 = sum of:
        0.13085341 = weight(_text_:dokumente in 4302) [ClassicSimilarity], result of:
          0.13085341 = score(doc=4302,freq=10.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.50329065 = fieldWeight in 4302, product of:
              3.1622777 = tf(freq=10.0), with freq of:
                10.0 = termFreq=10.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.03125 = fieldNorm(doc=4302)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Trotz großer Dokumentmengen für datenbankübergreifende Literaturrecherchen erwarten akademische Nutzer einen möglichst hohen Anteil an relevanten und qualitativen Dokumenten in den Trefferergebnissen. Insbesondere die Reihenfolge und Struktur der gelisteten Ergebnisse (Ranking) spielt, neben dem direkten Volltextzugriff auf die Dokumente, inzwischen eine entscheidende Rolle beim Design von Suchsystemen. Nutzer erwarten weiterhin flexible Informationssysteme, die es unter anderem zulassen, Einfluss auf das Ranking der Dokumente zu nehmen bzw. alternative Rankingverfahren zu verwenden. In dieser Arbeit werden zwei Mehrwertverfahren für Suchsysteme vorgestellt, die die typischen Probleme bei der Recherche nach wissenschaftlicher Literatur behandeln und damit die Recherchesituation messbar verbessern können. Die beiden Mehrwertdienste semantische Heterogenitätsbehandlung am Beispiel Crosskonkordanzen und Re-Ranking auf Basis von Bradfordizing, die in unterschiedlichen Phasen der Suche zum Einsatz kommen, werden hier ausführlich beschrieben und im empirischen Teil der Arbeit bzgl. der Effektivität für typische fachbezogene Recherchen evaluiert. Vorrangiges Ziel der Promotion ist es, zu untersuchen, ob das hier vorgestellte alternative Re-Rankingverfahren Bradfordizing im Anwendungsbereich bibliographischer Datenbanken zum einen operabel ist und zum anderen voraussichtlich gewinnbringend in Informationssystemen eingesetzt und dem Nutzer angeboten werden kann. Für die Tests wurden Fragestellungen und Daten aus zwei Evaluationsprojekten (CLEF und KoMoHe) verwendet. Die intellektuell bewerteten Dokumente stammen aus insgesamt sieben wissenschaftlichen Fachdatenbanken der Fächer Sozialwissenschaften, Politikwissenschaft, Wirtschaftswissenschaften, Psychologie und Medizin. Die Evaluation der Crosskonkordanzen (insgesamt 82 Fragestellungen) zeigt, dass sich die Retrievalergebnisse signifikant für alle Crosskonkordanzen verbessern; es zeigt sich zudem, dass interdisziplinäre Crosskonkordanzen den stärksten (positiven) Effekt auf die Suchergebnisse haben. Die Evaluation des Re-Ranking nach Bradfordizing (insgesamt 164 Fragestellungen) zeigt, dass die Dokumente der Kernzone (Kernzeitschriften) für die meisten Testreihen eine signifikant höhere Precision als Dokumente der Zone 2 und Zone 3 (Peripheriezeitschriften) ergeben. Sowohl für Zeitschriften als auch für Monographien kann dieser Relevanzvorteil nach Bradfordizing auf einer sehr breiten Basis von Themen und Fragestellungen an zwei unabhängigen Dokumentkorpora empirisch nachgewiesen werden.
Weiß, B.: Verwandte Seiten finden : "Ähnliche Seiten" oder "What's Related" (2005) 0.03
```
0.03167457 = product of:
  0.06334914 = sum of:
    0.06334914 = product of:
      0.12669829 = sum of:
        0.12669829 = weight(_text_:dokumente in 868) [ClassicSimilarity], result of:
          0.12669829 = score(doc=868,freq=6.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.4873091 = fieldWeight in 868, product of:
              2.4494898 = tf(freq=6.0), with freq of:
                6.0 = termFreq=6.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.0390625 = fieldNorm(doc=868)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Die Link-Struktur-Analyse (LSA) ist nicht nur beim Crawling, dem Webseitenranking, der Abgrenzung geographischer Bereiche, der Vorhersage von Linkverwendungen, dem Auffinden von "Mirror"-Seiten, dem Kategorisieren von Webseiten und beim Generieren von Webseitenstatistiken eines der wichtigsten Analyseverfahren, sondern auch bei der Suche nach verwandten Seiten. Um qualitativ hochwertige verwandte Seiten zu finden, bildet sie nach herrschender Meinung den Hauptbestandteil bei der Identifizierung von ähnlichen Seiten innerhalb themenspezifischer Graphen vernetzter Dokumente. Dabei wird stets von zwei Annahmen ausgegangen: Links zwischen zwei Dokumenten implizieren einen verwandten Inhalt beider Dokumente und wenn die Dokumente aus unterschiedlichen Quellen (von unterschiedlichen Autoren, Hosts, Domänen, .) stammen, so bedeutet dies das eine Quelle die andere über einen Link empfiehlt. Aufbauend auf dieser Idee entwickelte Kleinberg 1998 den HITS Algorithmus um verwandte Seiten über die Link-Struktur-Analyse zu bestimmen. Dieser Ansatz wurde von Bharat und Henzinger weiterentwickelt und später auch in Algorithmen wie dem Companion und Cocitation Algorithmus zur Suche von verwandten Seiten basierend auf nur einer Anfrage-URL weiter verfolgt. In der vorliegenden Seminararbeit sollen dabei die Algorithmen, die hinter diesen Überlegungen stehen, näher erläutert werden und im Anschluss jeweils neuere Forschungsansätze auf diesem Themengebiet aufgezeigt werden.
Schneider, W.: ¬Ein verteiltes Bibliotheks-Informationssystem auf Basis des Z39.50 Protokolls (1999) 0.03
```
0.029259713 = product of:
  0.058519427 = sum of:
    0.058519427 = product of:
      0.11703885 = sum of:
        0.11703885 = weight(_text_:dokumente in 4773) [ClassicSimilarity], result of:
          0.11703885 = score(doc=4773,freq=2.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.45015684 = fieldWeight in 4773, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.0625 = fieldNorm(doc=4773)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Diese Diplomarbeit beschreibt ein verteiltes Bibliothes-Informationssystem für bibliographische Datenbnaken im Internet. Der Name des Systems ist ZACK. Der Benutzer kann mit ZACK in einer oder mehreren bibliographischen Datenbanken nach einem Dokument suchen und die Treffer in die eigene lokale Datenbank übernehmen. Mit der Übernahme der Datensätze aus einer fremden Datenbank wird die Erfassung neuer Dokumente wesentlich erleichtert, da die Eigenkatalogisierung auf ein Minimum beschränkt werden kann. Bei der verteilten Suche mit ZACK wird parallel in mehreren Datenbanken gesucht. Dubletten werden als solche erkannt
Tavakolizadeh-Ravari, M.: Analysis of the long term dynamics in thesaurus developments and its consequences (2017) 0.03
```
0.029259713 = product of:
  0.058519427 = sum of:
    0.058519427 = product of:
      0.11703885 = sum of:
        0.11703885 = weight(_text_:dokumente in 3081) [ClassicSimilarity], result of:
          0.11703885 = score(doc=3081,freq=8.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.45015684 = fieldWeight in 3081, product of:
              2.828427 = tf(freq=8.0), with freq of:
                8.0 = termFreq=8.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.03125 = fieldNorm(doc=3081)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Die Arbeit analysiert die dynamische Entwicklung und den Gebrauch von Thesaurusbegriffen. Zusätzlich konzentriert sie sich auf die Faktoren, die die Zahl von Indexbegriffen pro Dokument oder Zeitschrift beeinflussen. Als Untersuchungsobjekt dienten der MeSH und die entsprechende Datenbank "MEDLINE". Die wichtigsten Konsequenzen sind: 1. Der MeSH-Thesaurus hat sich durch drei unterschiedliche Phasen jeweils logarithmisch entwickelt. Solch einen Thesaurus sollte folgenden Gleichung folgen: "T = 3.076,6 Ln (d) - 22.695 + 0,0039d" (T = Begriffe, Ln = natürlicher Logarithmus und d = Dokumente). Um solch einen Thesaurus zu konstruieren, muss man demnach etwa 1.600 Dokumente von unterschiedlichen Themen des Bereiches des Thesaurus haben. Die dynamische Entwicklung von Thesauri wie MeSH erfordert die Einführung eines neuen Begriffs pro Indexierung von 256 neuen Dokumenten. 2. Die Verteilung der Thesaurusbegriffe erbrachte drei Kategorien: starke, normale und selten verwendete Headings. Die letzte Gruppe ist in einer Testphase, während in der ersten und zweiten Kategorie die neu hinzukommenden Deskriptoren zu einem Thesauruswachstum führen. 3. Es gibt ein logarithmisches Verhältnis zwischen der Zahl von Index-Begriffen pro Aufsatz und dessen Seitenzahl für die Artikeln zwischen einer und einundzwanzig Seiten. 4. Zeitschriftenaufsätze, die in MEDLINE mit Abstracts erscheinen erhalten fast zwei Deskriptoren mehr. 5. Die Findablity der nicht-englisch sprachigen Dokumente in MEDLINE ist geringer als die englische Dokumente. 6. Aufsätze der Zeitschriften mit einem Impact Factor 0 bis fünfzehn erhalten nicht mehr Indexbegriffe als die der anderen von MEDINE erfassten Zeitschriften. 7. In einem Indexierungssystem haben unterschiedliche Zeitschriften mehr oder weniger Gewicht in ihrem Findability. Die Verteilung der Indexbegriffe pro Seite hat gezeigt, dass es bei MEDLINE drei Kategorien der Publikationen gibt. Außerdem gibt es wenige stark bevorzugten Zeitschriften."

Stünkel, M.: Neuere Methoden der inhaltlichen Erschließung schöner Literatur in öffentlichen Bibliotheken (1986) 0.03

0.027666384 = product of:
  0.05533277 = sum of:
    0.05533277 = product of:
      0.11066554 = sum of:
        0.11066554 = weight(_text_:22 in 5815) [ClassicSimilarity], result of:
          0.11066554 = score(doc=5815,freq=2.0), product of:
            0.17876907 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.05105019 = queryNorm
            0.61904186 = fieldWeight in 5815, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.125 = fieldNorm(doc=5815)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Date: 4. 8.2006 21:35:22

Stojanovic, N.: Ontology-based Information Retrieval : methods and tools for cooperative query answering (2005) 0.03

0.027027078 = product of:
  0.054054156 = sum of:
    0.054054156 = product of:
      0.16216247 = sum of:
        0.16216247 = weight(_text_:3a in 701) [ClassicSimilarity], result of:
          0.16216247 = score(doc=701,freq=2.0), product of:
            0.43280408 = queryWeight, product of:
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.05105019 = queryNorm
            0.3746787 = fieldWeight in 701, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.03125 = fieldNorm(doc=701)
      0.33333334 = coord(1/3)
  0.5 = coord(1/2)

Content: Vgl.: http%3A%2F%2Fdigbib.ubka.uni-karlsruhe.de%2Fvolltexte%2Fdocuments%2F1627&ei=tAtYUYrBNoHKtQb3l4GYBw&usg=AFQjCNHeaxKkKU3-u54LWxMNYGXaaDLCGw&sig2=8WykXWQoDKjDSdGtAakH2Q&bvm=bv.44442042,d.Yms.

Xiong, C.: Knowledge based text representations for information retrieval (2016) 0.03

0.027027078 = product of:
  0.054054156 = sum of:
    0.054054156 = product of:
      0.16216247 = sum of:
        0.16216247 = weight(_text_:3a in 5820) [ClassicSimilarity], result of:
          0.16216247 = score(doc=5820,freq=2.0), product of:
            0.43280408 = queryWeight, product of:
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.05105019 = queryNorm
            0.3746787 = fieldWeight in 5820, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              8.478011 = idf(docFreq=24, maxDocs=44218)
              0.03125 = fieldNorm(doc=5820)
      0.33333334 = coord(1/3)
  0.5 = coord(1/2)

Content: Submitted in partial fulfillment of the requirements for the degree of Doctor of Philosophy in Language and Information Technologies. Vgl.: https%3A%2F%2Fwww.cs.cmu.edu%2F~cx%2Fpapers%2Fknowledge_based_text_representation.pdf&usg=AOvVaw0SaTSvhWLTh__Uz_HtOtl3.

Fuchs, C.: Entwurf einer einheitlichen und formalisierbaren Beschreibung von Dokumenten-Management-Systemen (DMS) auf der Basis einer vergleichenden Untersuchung bestehender DMS (2001) 0.03
```
0.025862178 = product of:
  0.051724356 = sum of:
    0.051724356 = product of:
      0.10344871 = sum of:
        0.10344871 = weight(_text_:dokumente in 802) [ClassicSimilarity], result of:
          0.10344871 = score(doc=802,freq=4.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.3978862 = fieldWeight in 802, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.0390625 = fieldNorm(doc=802)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Seitdem die Menschheit Informationen für eine dauerhafte Aufbewahrung aufzeichnete, mussten Wege gefunden werden, bei Bedarf diese Informationen wieder aufzufinden. Solange für die Aufzeichnungen noch kein Papier zur Verfügung stand, hielt sich der dabei zu treibende Aufwand in recht überschaubaren Grenzen. Mit Aufkommen des Papiers und seiner massenhaften Produktion, insbesondere im Zusammenhang mit der industriellen Entwicklung des 19. Jahrhunderts, ergab sich ein sprunghafter Anstieg der zu handhabenden Dokumente. Das Wiederauffinden und der schnelle Zugriff gestalteten sich mit den damals üblichen Organisationsmitteln wie Handablage, Aktenplan und Kartei zunehmend schwieriger. Mit Hilfe von Mikroverfilmung versuchte man vor der Einführung der elektronischen Datenverarbeitung die wachsende Informationsflut besser zu beherrschen. Das Vordringen des Computers in der Bürotätigkeit erhöhte nochmals den Umfang zu handhabender Dokumente, ergab aber auch die Möglichkeit, neue Wege bei der Arbeit mit Dokumenten zu beschreiten. Die Fähigkeit elektronische Informationen in großem Umfang zu speichern, führte zur Erarbeitung von Methoden zur computergestützten Handhabung großer Dokumentenmengen, zu dem, was wir heute als Dokumenten-Management-Systeme (DMS) bezeichnen. Ziel der Arbeit ist es, aus einer vergleichenden Untersuchung bestehender DMS eine einheitliche formalisierbare Beschreibung der Eigenschaften von DMS abzuleiten. Die einheitliche formalisierbare Beschreibung soll auf bestehende DMS angewendet werden, um deren spezifische Eigenschaften in einheitlicher Form zu erfassen. Auf der Basis der einheitlich erfassten Systemeigenschaften ist eine vergleichende Auswertung wichtiger DMS vorzunehmen. Ausgehend von einer Analyse der Systemeigenschaften wichtiger DMS besteht die Aufgabe, einen Anforderungskatalog für moderne DMS abzuleiten. Die Untersuchung soll Aussagen über die Unterstützung von HTML- und XMLDokumenten enthalten.
Effenberger, C.: ¬Die Dewey Dezimalklassifikation als Erschließungsinstrument : optimiertes Retrieval durch eine Versionierung der DDC (2011) 0.03
```
0.025862178 = product of:
  0.051724356 = sum of:
    0.051724356 = product of:
      0.10344871 = sum of:
        0.10344871 = weight(_text_:dokumente in 4321) [ClassicSimilarity], result of:
          0.10344871 = score(doc=4321,freq=4.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.3978862 = fieldWeight in 4321, product of:
              2.0 = tf(freq=4.0), with freq of:
                4.0 = termFreq=4.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.0390625 = fieldNorm(doc=4321)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Unsere Welt ist voller Informationen. Diese werden seit jeher in eine systematische Ordnung gebracht. In der Geschichte der Wissensreprasentation spielen Bibliotheken und Bibliothekare eine grose Rolle. Bereits in der Antike gab es Kataloge. In der Bibliothek der Ptolemaer in Alexandria erarbeitete der Bibliothekar Kallimachos (ca. 305 . ca. 240 v.Chr.) die .Pinakes_g (Pinax: altgriechisch fur Tafel und Verzeichnis), die sehr wahrscheinlich gleichzeitig einen systematischen Katalog und eine Bibliographie verkorperten. Zusatzlich wurden die Dokumente rudimentar mittels eines vorgegebenen Ordnungssystems erschlossen und der Inhalt ruckte in den Mittelpunkt. Auch Philosophen hatten ihren Anteil an den Grundlagen der Wissensreprasentation. Aristoteles (384_]322 v.Chr.) arbeitete Kriterien aus, nach denen Begriffe voneinander zu differenzieren sind und nach denen Begriffe in eine hierarchische Ordnung gebracht werden. Das waren die Grundlagen fur Klassifikationen. Eine methodische Revolution erleben Klassifikationsforschung und .praxis mit der .Decimal Classification_g (1876) des amerikanischen Bibliothekars Melvil Dewey (1851_]1931). Die Grundidee der Klassifikation war einfach. Das Wissen wurde in maximal zehn Unterbegriffe unterteilt und durch Dezimalzeichen dargestellt. Die Aufstellung der Bucher in der Bibliothek folgte der Klassifikation, so dass thematisch verwandte Werke dicht beieinander standen. Die Dewey Dezimalklassifikation (DDC) wird auch heute noch haufig fur die inhaltliche Erschliesung genutzt und im Umkehrschluss um Dokumente aus einer Fulle von Informationen herausfinden zu konnen.
Oberhauser, O.: Automatisches Klassifizieren : Verfahren zur Erschließung elektronischer Dokumente (2004) 0.03
```
0.025339657 = product of:
  0.050679315 = sum of:
    0.050679315 = product of:
      0.10135863 = sum of:
        0.10135863 = weight(_text_:dokumente in 2487) [ClassicSimilarity], result of:
          0.10135863 = score(doc=2487,freq=6.0), product of:
            0.25999573 = queryWeight, product of:
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.05105019 = queryNorm
            0.38984728 = fieldWeight in 2487, product of:
              2.4494898 = tf(freq=6.0), with freq of:
                6.0 = termFreq=6.0
              5.092943 = idf(docFreq=737, maxDocs=44218)
              0.03125 = fieldNorm(doc=2487)
      0.5 = coord(1/2)
  0.5 = coord(1/2)
```
Abstract

Automatisches Klassifizieren von Textdokumenten bedeutet die maschinelle Zuordnung jeweils einer oder mehrerer Notationen eines vorgegebenen Klassifikationssystems zu natürlich-sprachlichen Texten mithilfe eines geeigneten Algorithmus. In der vorliegenden Arbeit wird in Form einer umfassenden Literaturstudie ein aktueller Kenntnisstand zu den Ein-satzmöglichkeiten des automatischen Klassifizierens für die sachliche Erschliessung von elektronischen Dokumenten, insbesondere von Web-Ressourcen, erarbeitet. Dies betrifft zum einen den methodischen Aspekt und zum anderen die in relevanten Projekten und Anwendungen gewonnenen Erfahrungen. In methodischer Hinsicht gelten heute statistische Verfahren, die auf dem maschinellen Lernen basieren und auf der Grundlage bereits klassifizierter Beispieldokumente ein Modell - einen "Klassifikator" - erstellen, das zur Klassifizierung neuer Dokumente verwendet werden kann, als "state-of-the-art". Die vier in den 1990er Jahren an den Universitäten Lund, Wolverhampton und Oldenburg sowie bei OCLC (Dublin, OH) durchgeführten "grossen" Projekte zum automatischen Klassifizieren von Web-Ressourcen, die in dieser Arbeit ausführlich analysiert werden, arbeiteten allerdings noch mit einfacheren bzw. älteren methodischen Ansätzen. Diese Projekte bedeuten insbesondere aufgrund ihrer Verwendung etablierter bibliothekarischer Klassifikationssysteme einen wichtigen Erfahrungsgewinn, selbst wenn sie bisher nicht zu permanenten und qualitativ zufriedenstellenden Diensten für die Erschliessung elektronischer Ressourcen geführt haben. Die Analyse der weiteren einschlägigen Anwendungen und Projekte lässt erkennen, dass derzeit in den Bereichen Patent- und Mediendokumentation die aktivsten Bestrebungen bestehen, Systeme für die automatische klassifikatorische Erschliessung elektronischer Dokumente im laufenden operativen Betrieb einzusetzen. Dabei dominieren jedoch halbautomatische Systeme, die menschliche Bearbeiter durch Klassifizierungsvorschläge unterstützen, da die gegenwärtig erreichbare Klassifizierungsgüte für eine Vollautomatisierung meist noch nicht ausreicht. Weitere interessante Anwendungen und Projekte finden sich im Bereich von Web-Portalen, Suchmaschinen und (kommerziellen) Informationsdiensten, während sich etwa im Bibliothekswesen kaum nennenswertes Interesse an einer automatischen Klassifizierung von Büchern bzw. bibliographischen Datensätzen registrieren lässt. Die Studie schliesst mit einer Diskussion der wichtigsten Projekte und Anwendungen sowie einiger im Zusammenhang mit dem automatischen Klassifizieren relevanter Fragestellungen und Themen.

Menges, T.: Möglichkeiten und Grenzen der Übertragbarkeit eines Buches auf Hypertext am Beispiel einer französischen Grundgrammatik (Klein; Kleineidam) (1997) 0.02

0.024208086 = product of:
  0.04841617 = sum of:
    0.04841617 = product of:
      0.09683234 = sum of:
        0.09683234 = weight(_text_:22 in 1496) [ClassicSimilarity], result of:
          0.09683234 = score(doc=1496,freq=2.0), product of:
            0.17876907 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.05105019 = queryNorm
            0.5416616 = fieldWeight in 1496, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.109375 = fieldNorm(doc=1496)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Date: 22. 7.1998 18:23:25

Schneider, A.: ¬Die Verzeichnung und sachliche Erschließung der Belletristik in Kaysers Bücherlexikon und im Schlagwortkatalog Georg/Ost (1980) 0.02

0.024208086 = product of:
  0.04841617 = sum of:
    0.04841617 = product of:
      0.09683234 = sum of:
        0.09683234 = weight(_text_:22 in 5309) [ClassicSimilarity], result of:
          0.09683234 = score(doc=5309,freq=2.0), product of:
            0.17876907 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.05105019 = queryNorm
            0.5416616 = fieldWeight in 5309, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.109375 = fieldNorm(doc=5309)
      0.5 = coord(1/2)
  0.5 = coord(1/2)

Date: 5. 8.2006 13:07:22

Search (61 results, page 1 of 4)

Authors

Years

Languages

Types

Themes

Subjects

Classifications