Search (8 results, page 1 of 1)

Bredack, J.: Terminologieextraktion von Mehrwortgruppen in kunsthistorischen Fachtexten (2013) 0.02
```
0.015458269 = product of:
  0.046374805 = sum of:
    0.032362055 = weight(_text_:und in 1054) [ClassicSimilarity], result of:
      0.032362055 = score(doc=1054,freq=26.0), product of:
        0.104724824 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04725067 = queryNorm
        0.3090199 = fieldWeight in 1054, product of:
          5.0990195 = tf(freq=26.0), with freq of:
            26.0 = termFreq=26.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.02734375 = fieldNorm(doc=1054)
    0.014012752 = weight(_text_:des in 1054) [ClassicSimilarity], result of:
      0.014012752 = score(doc=1054,freq=2.0), product of:
        0.13085164 = queryWeight, product of:
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.04725067 = queryNorm
        0.10708885 = fieldWeight in 1054, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.7693076 = idf(docFreq=7536, maxDocs=44218)
          0.02734375 = fieldNorm(doc=1054)
  0.33333334 = coord(2/6)
```
Abstract

Mit Hilfe eines algorithmisch arbeitenden Verfahrens können Mehrwortgruppen aus elektronisch vorliegenden Texten identifiziert und extrahiert werden. Als Datengrundlage für diese Arbeit dienen kunsthistorische Lexikonartikel des Reallexikons zur Deutschen Kunstgeschichte. Die linguistisch, wörterbuchbasierte Open-Source-Software Lingo wurde in dieser Studie genutzt. Mit Lingo ist es möglich, auf Basis erstellter Wortmuster, bestimmte Wortfolgen aus elektronisch vorliegenden Daten algorithmisch zu identifizieren und zu extrahieren. Die erstellten Wortmuster basieren auf Wortklassen, mit denen die lexikalisierten Einträge in den Wörterbüchern getaggt sind und dadurch näher definiert werden. So wurden individuelle Wortklassen für Fachterminologie, Eigennamen, oder Adjektive vergeben. In der vorliegenden Arbeit werden zusätzlich Funktionswörter in die Musterbildung mit einbezogen. Dafür wurden neue Wortklassen definiert. Funktionswörter bestimmen Artikel, Konjunktionen und Präpositionen. Ziel war es fachterminologische Mehrwortgruppen mit kunsthistorischen Inhalten zu extrahieren unter der gezielten Einbindung von Funktionswörtern. Anhand selbst gebildeter Kriterien, wurden die extrahierten Mehrwortgruppen qualitativ analysiert. Es konnte festgestellt werden, dass die Verwendung von Funktionswörtern fachterminologische Mehrwortgruppen erzeugt, die als potentielle Indexterme weitere Verwendung im Information Retrieval finden können.
Mehrwortgruppen sind als lexikalische Einheit zu betrachten und bestehen aus mindestens zwei miteinander in Verbindung stehenden Begriffen. Durch die Ver-bindung mehrerer Fachwörter transportieren sie in Fachtexten aussagekräftige Informationen. Sie vermitteln eindeutige Informationen, da aus den resultierenden Beziehungen zwischen den in Verbindung stehenden Fachbegriffen die inhaltliche Bedeutung eines Fachtextes ersichtlich wird. Demzufolge ist es sinnvoll, Mehrwort-gruppen aus Fachtexten zu extrahieren, da diese die Inhalte eindeutig repräsentieren. So können Mehrwortgruppen für eine inhaltliche Erschließung genutzt und beispiels-weise als Indexterme im Information Retrieval bereitgestellt werden. Mehrwortgruppen enthalten Informationen eines Textes, die in natürlicher Sprache vorliegen. Zur Extraktion von Informationen eines elektronisch vorliegenden Textes kommen maschinelle Verfahren zum Einsatz, da Sprache Strukturen aufweist, die maschinell verarbeitet werden können. Eine mögliche Methode Mehrwortgruppen innerhalb von elektronisch vorliegenden Fachtexten zu identifizieren und extrahieren ist ein algorithmisches Verfahren. Diese Methode erkennt Wortfolgen durch das Bilden von Wortmustern, aus denen sich eine Mehrwortgruppe in einem Text zusammensetzt. Die Wortmuster repräsentieren somit die einzelnen Bestandteile einer Mehrwortgruppe. Bereits an mathematischen Fachtexten wurde dieses Verfahren untersucht und analysiert. Relevante Mehrwortgruppen, die ein mathematisches Konzept oder mathe-matischen Inhalt repräsentierten, konnten erfolgreich extrahiert werden. Zum Einsatz kam das Indexierungssystem Lingo, mit dessen Programmodul sequencer eine algorithmische Identifizierung und Extraktion von Mehrwortgruppen möglich ist. In der vorliegenden Arbeit wird dieses algorithmische Verfahren unter Einsatz der Software Lingo genutzt, um Mehrwortgruppen aus kunsthistorischen Fachtexten zu extrahieren. Als Datenquelle dienen kunsthistorische Lexikonartikel aus dem Reallexikon zur Deutschen Kunstgeschichte, welches in deutscher Sprache vorliegt. Es wird untersucht, ob positive Ergebnisse im Sinne von fachterminologischen Mehrwort-gruppen mit kunsthistorischen Inhalten erzeugt werden können. Dabei soll zusätzlich die Einbindung von Funktionswörtern innerhalb einer Mehrwortgruppe erfolgen. Funktionswörter definieren Artikel, Konjunktionen und Präpositionen, die für sich alleinstehend keine inhaltstragende Bedeutung besitzen, allerdings innerhalb einer Mehrwortgruppe syntaktische Funktionen erfüllen. Anhand der daraus resultierenden Ergebnisse wird analysiert, ob das Hinzufügen von Funktionswörtern innerhalb einer Mehrwortgruppe zu positiven Ergebnissen führt. Ziel soll es demnach sein, fach-terminologische Mehrwortgruppen mit kunsthistorischen Inhalten zu erzeugen, unter Einbindung von Funktionswörtern. Bei der Extraktion fachterminologischer Mehrwortgruppen wird im Folgenden insbesondere auf die Erstellung von Wortmustern eingegangen, da diese die Basis liefern, mit welchen das Programmmodul sequencer Wortfolgen innerhalb der kunst-historischen Lexikonartikel identifiziert. Eine Einordung der Indexierungsergebnisse erfolgt anhand selbst gebildeter Kriterien, die definieren, was unter einer fach-terminologischen Mehrwortgruppe zu verstehen ist.

Content

Beiliegende CD enthält die Arbeitsergebnisse und Hilfsdateien

Footnote

Bachelorarbeit, Studiengang Bibliothekswesen, Fakultät für Informations- und Kommunikationswissenschaften, Fachhochschule Köln.

Imprint

Köln : Fachhochschule, Fakultät für Informations- und Kommunikationswissenschaften

Benediktsson, D.: Problems of subject access to Icelandic collections throughout OPACs (1990) 0.01

0.0074320463 = product of:
  0.044592276 = sum of:
    0.044592276 = product of:
      0.08918455 = sum of:
        0.08918455 = weight(_text_:thesaurus in 5546) [ClassicSimilarity], result of:
          0.08918455 = score(doc=5546,freq=2.0), product of:
            0.21834905 = queryWeight, product of:
              4.6210785 = idf(docFreq=1182, maxDocs=44218)
              0.04725067 = queryNorm
            0.40844947 = fieldWeight in 5546, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              4.6210785 = idf(docFreq=1182, maxDocs=44218)
              0.0625 = fieldNorm(doc=5546)
      0.5 = coord(1/2)
  0.16666667 = coord(1/6)

Abstract: Suggest reasons why there is no operational OPAC station yet in Iceland. Obstacles include the lack of compatability among computer systems adopted by the major libraries, the differing classification schemes used by them and the lack of a controlled indexing vocabulary or thesaurus for subject analysis in the Icelandic language. The Rejkjavik Municipal Library and the National Hospital Library, both users of the DOBIS/LIBIS system, will be the first users of a potential network of OPACs.

Czermak, J.-M.: Fachinformationspolitik : Deutschland (1995) 0.01

0.006838567 = product of:
  0.0410314 = sum of:
    0.0410314 = weight(_text_:und in 2327) [ClassicSimilarity], result of:
      0.0410314 = score(doc=2327,freq=8.0), product of:
        0.104724824 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04725067 = queryNorm
        0.39180204 = fieldWeight in 2327, product of:
          2.828427 = tf(freq=8.0), with freq of:
            8.0 = termFreq=8.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=2327)
  0.16666667 = coord(1/6)

Abstract: 10 Jahre cogito bedeuten auch 10 Jahre Fachinformationspolitik, die ich in einigen Abschnitten in cogito bereits früher dargestellt habe. Zum Jubiläum möchte ich ihre wesentlichen Grundzüge aus meiner Sicht skizzieren und Rückblick und Ausblick diesmal an der Marktentwicklung, der Produktion, dem Angebot und der Nutzung darstellen, wie es sich in einer Zeitschrift für den Informationsmarkt und einer sich entwickelnden Informationsgesellschaft anbietet

Burkhardt, F.W.: Quo vadis, Informationsgesellschaft? (1995) 0.01

0.006044496 = product of:
  0.036266975 = sum of:
    0.036266975 = weight(_text_:und in 2325) [ClassicSimilarity], result of:
      0.036266975 = score(doc=2325,freq=4.0), product of:
        0.104724824 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04725067 = queryNorm
        0.34630734 = fieldWeight in 2325, product of:
          2.0 = tf(freq=4.0), with freq of:
            4.0 = termFreq=4.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=2325)
  0.16666667 = coord(1/6)

Abstract: Kaum jemand wird uns widersprechen, wenn wir sagen: Wir sind auf dem Weg zur Informationsgesellschaft. Vor zehn Jahren, als cogito gegründet wurde, war das schon genau so. Und wird es in weiteren 10 Jahren auch noch so sein? Wahrscheinlich! Wann wird sie endlich da sein, die Informationsgesellschaft? Wie sieht sie aus? Und was kommt danach? Wenn ich das wüßte!

Weckend, E.: Anwenders Ideal : Forderungen der entstehenden Information Community (1995) 0.00

0.0042741043 = product of:
  0.025644625 = sum of:
    0.025644625 = weight(_text_:und in 2326) [ClassicSimilarity], result of:
      0.025644625 = score(doc=2326,freq=2.0), product of:
        0.104724824 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04725067 = queryNorm
        0.24487628 = fieldWeight in 2326, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.078125 = fieldNorm(doc=2326)
  0.16666667 = coord(1/6)

Abstract: Die Nutzung von Online-Datenbanken war bis vor kurzem einem relativ kleinen Kreis von Spezialisten überlassen. Online ist heute jedoch für viele bereits zum Schlagwort einer neuen Kompetenz geworden, die die Bedeutung der elektronischen Informationsgewinnung als selbstverständliche Grundlage einer zeitgemäßen Entscheidungsfindung erkenntn und nutzt

Baguhn, J.: Volltextretrieval : stürmische Entwicklungen (1995) 0.00
```
0.0034192835 = product of:
  0.0205157 = sum of:
    0.0205157 = weight(_text_:und in 2329) [ClassicSimilarity], result of:
      0.0205157 = score(doc=2329,freq=2.0), product of:
        0.104724824 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04725067 = queryNorm
        0.19590102 = fieldWeight in 2329, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=2329)
  0.16666667 = coord(1/6)
```
Abstract

10 Jahre cogito lassen auch uns auf diesen in der Branche langen Zeitraum zurückblicken. Der Informationsmarkt 1985 war noch gut überschaubar und von der PSI noch gar nicht als attraktiv erkannt. Doch schon zu diesem Zeitpunkt machten wir uns Gedanken über die Verarbeitung von unstrukturierten Informationen, da mehrere Nachrichtenverteilsysteme für größere Behörden relalisiert wurden. Die Wünsche der Benutzer waren mit herkömmlichen Datenbanken nur schwer zu realisieren oder die Zugriffszeiten zu lang

Molbech, C.: Über Bibliothekswissenschaft oder Einrichtung und Verwaltung öffentlicher Bibliotheken (1833) 0.00

0.0034192835 = product of:
  0.0205157 = sum of:
    0.0205157 = weight(_text_:und in 1630) [ClassicSimilarity], result of:
      0.0205157 = score(doc=1630,freq=2.0), product of:
        0.104724824 = queryWeight, product of:
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.04725067 = queryNorm
        0.19590102 = fieldWeight in 1630, product of:
          1.4142135 = tf(freq=2.0), with freq of:
            2.0 = termFreq=2.0
          2.216367 = idf(docFreq=13101, maxDocs=44218)
          0.0625 = fieldNorm(doc=1630)
  0.16666667 = coord(1/6)

Graphic details : a scientific study of the importance of diagrams to science (2016) 0.00
```
0.0016004534 = product of:
  0.00960272 = sum of:
    0.00960272 = product of:
      0.01920544 = sum of:
        0.01920544 = weight(_text_:22 in 3035) [ClassicSimilarity], result of:
          0.01920544 = score(doc=3035,freq=2.0), product of:
            0.16546379 = queryWeight, product of:
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.04725067 = queryNorm
            0.116070345 = fieldWeight in 3035, product of:
              1.4142135 = tf(freq=2.0), with freq of:
                2.0 = termFreq=2.0
              3.5018296 = idf(docFreq=3622, maxDocs=44218)
              0.0234375 = fieldNorm(doc=3035)
      0.5 = coord(1/2)
  0.16666667 = coord(1/6)
```
Content

As the team describe in a paper posted (http://arxiv.org/abs/1605.04951) on arXiv, they found that figures did indeed matter-but not all in the same way. An average paper in PubMed Central has about one diagram for every three pages and gets 1.67 citations. Papers with more diagrams per page and, to a lesser extent, plots per page tended to be more influential (on average, a paper accrued two more citations for every extra diagram per page, and one more for every extra plot per page). By contrast, including photographs and equations seemed to decrease the chances of a paper being cited by others. That agrees with a study from 2012, whose authors counted (by hand) the number of mathematical expressions in over 600 biology papers and found that each additional equation per page reduced the number of citations a paper received by 22%. This does not mean that researchers should rush to include more diagrams in their next paper. Dr Howe has not shown what is behind the effect, which may merely be one of correlation, rather than causation. It could, for example, be that papers with lots of diagrams tend to be those that illustrate new concepts, and thus start a whole new field of inquiry. Such papers will certainly be cited a lot. On the other hand, the presence of equations really might reduce citations. Biologists (as are most of those who write and read the papers in PubMed Central) are notoriously mathsaverse. If that is the case, looking in a physics archive would probably produce a different result.

Search (8 results, page 1 of 1)

Authors

Years

Types

Themes