Literatur zur Informationserschließung
Diese Datenbank enthält über 40.000 Dokumente zu Themen aus den Bereichen Formalerschließung – Inhaltserschließung – Information Retrieval.
© 2015 W. Gödert, TH Köln, Institut für Informationswissenschaft
/
Powered by litecat, BIS Oldenburg
(Stand: 28. April 2022)
Suche
Suchergebnisse
Treffer 1–5 von 5
sortiert nach:
-
1Lobin, H: Computerlinguistik und Texttechnologie.
Paderborn : W. Fink, 2010. 124 S.
ISBN 978-3-8252-3282-5
(UTB; 3282)(LIBAC - Linguistik für Bachelor)
Abstract: Computerlinguistik (die Verarbeitung von Sprache mit dem Computer) und Texttechnologie (die automatisierte Handhabung elektronischer Texte) haben im letzten Jahrzehnt unterschiedliche Richtungen eingeschlagen. Beide Disziplinen speisen sich jedoch aus der gleichen Quelle: der formalen Grammatik. Deshalb ist eine gemeinsame Darstellung sinnvoll. Der Bezug auf die gemeinsamen Grundlagen und die kontrastierende Gegenüberstellung einzelner Teilbereiche fördern das Verständnis der jeweils anderen Disziplin und eröffnen interessante Querbezüge. Erstmals wird die Verknüpfung von Computerlinguistik und Texttechnologie mit dieser Einführung in knapper Form systematisch vollzogen, was sie insbesondere für Module im Bachelor-Studium geeignet macht.
Themenfeld: Computerlinguistik
RSWK: Computerlinguistik / Texttechnologie / Lehrbuch
BK: 17.46 Mathematische Linguistik ; 18.00 Einzelne Sprachen und Literaturen allgemein ; 54.75 Sprachverarbeitung Informatik
DDC: 410.285 / DDC22ger
GHBS: BFP (E) ; BFN (PB)
RVK: ES 900 ; ST 306 ; ES 935
-
2Carstensen, K.U. u.a. (Hrsg.): Computerlinguistik und Sprachtechnologie : Eine Einführung.3., überarb. u. erw. Aufl.
Heidelberg : Spektrum Akademischer Verlag, 2010. XVI, 736 S.
ISBN 978-3-8274-2023-7
Abstract: Dieses Lehrbuch bietet eine umfassende Einführung in Grundlagen und Methoden der Computerlinguistik und stellt die wichtigsten Anwendungsgebiete in der Sprachtechnologie vor. Es richtet sich gleichermaßen an Studierende der Computerlinguistik und verwandter Fächer mit Bezug zur Verarbeitung natürlicher Sprache wie an Entwickler sprachverarbeitender Systeme. Nach einem Überblick über Aufgaben und Ziele der Computerlinguistik werden die erforderlichen theoretischen Grundlagen zur Logik, den Formalen Sprachen, der Graphentheorie, den statistischen Verfahren sowie der Texttechnologie beispielbezogen erläutert. Es schließt sich eine Darstellung der verschiedenen Methoden für die Verarbeitung auf den linguistischen Beschreibungsebenen an. Dabei werden zunächst die grundlegenden Begriffe und Konzepte der Phonetik und Phonologie, Morphologie, Syntax, Semantik sowie der Pragmatik vermittelt und darauf aufbauend die Prinzipien der sprachtechnologischen Umsetzung behandelt. Die drei letzten Teile des Buchs geben Überblicke über die verwendeten sprachtechnologischen Informationsquellen, die vielfältigen Anwendungen in der Praxis sowie über Evaluationsverfahren für sprachverarbeitende Systeme. Anhand konkreter Fragestellungen - von der Entwicklung von Korrekturprogrammen über das Informationsmanagement bis zur Maschinellen Übersetzung - wird das Zusammenwirken der einzelnen Methoden aufgezeigt. Für die dritte Auflage wurden sämtliche Kapitel überarbeitet und aktualisiert sowie zum Teil zu eigenständigen, neuen Kapiteln zusammengeführt. Insbesondere trägt die dritte Auflage der rasanten Entwicklung in der Computerlinguistik und Sprachtechnologie durch eine stärkere Fokussierung auf statistische Grundlagen und Methoden Rechnung. "Durch dieses Handbuch wird für den deutschsprachigen Raum eine empfindliche Lücke geschlossen. Es umfasst die relevanten Aspekte computerlinguistischer Grundlagenwissenschaft und sprachtechnologischer Anwendung in eindrucksvoller Breite und auf aktuellem Stand." [Manfred Pinkal]
Themenfeld: Computerlinguistik ; Grundlagen u. Einführungen: Allgemeine Literatur
Wissenschaftsfach: Sprachwissenschaft
LCSH: Computational linguistics ; Computer science ; Translators (Computer programs) ; Computer science
RSWK: Computerlinguistik / Lehrbuch
BK: 17.46 Mathematische Linguistik ; 18.00 Einzelne Sprachen und Literaturen allgemein ; 54.75 Sprachverarbeitung Informatik
DDC: 410.285 / DDC22ger
GHBS: TVV (DU) ; BFP (DU) ; TZF (DU)
RVK: ES 900 ; ST 306 ; ER 900 ; ST 278 ; ST 670
-
3Jurafsky, D. ; Martin, J.H.: Speech and language processing : ani ntroduction to natural language processing, computational linguistics and speech recognition.2nd ed.
Upper Saddle River, NJ : Prentice Hall, 2009. 1024 S.
ISBN 978-0-13-504196-3
(Prentice Hall series in artificial intelligence)
Abstract: For undergraduate or advanced undergraduate courses in Classical Natural Language Processing, Statistical Natural Language Processing, Speech Recognition, Computational Linguistics, and Human Language Processing. An explosion of Web-based language techniques, merging of distinct fields, availability of phone-based dialogue systems, and much more make this an exciting time in speech and language processing. The first of its kind to thoroughly cover language technology at all levels and with all modern technologies this text takes an empirical approach to the subject, based on applying statistical and other machine-learning algorithms to large corporations. The authors cover areas that traditionally are taught in different courses, to describe a unified vision of speech and language processing. Emphasis is on practical applications and scientific evaluation. An accompanying Website contains teaching materials for instructors, with pointers to language processing resources on the Web. The Second Edition offers a significant amount of new and extended material.
Themenfeld: Computerlinguistik
Wissenschaftsfach: Sprachwissenschaft
LCSH: Computational linguistics / Automatic speech recognition
RSWK: Computerlinguistik / Automatische Spracherkennung / Lehrbuch
BK: 54.75 Sprachverarbeitung Informatik ; 17.46 Mathematische Linguistik ; 18.00 Einzelne Sprachen und Literaturen allgemein
DDC: 410.285
GHBS: TVV (DU) ; TZF (DU) ; BFP (DU) ; DKF (E) ; BFN (E)
LCC: P98
RVK: ES 900 ; ST 306
-
4Markó, K.G.: Foundation, implementation and evaluation of the MorphoSaurus system.
In: Subword indexing, lexical learning and word sense disambiguation for medical crosslanguage information retrieval. Jena : Friedrich-Schiller-Universität, 2008. x, 202 S.
Abstract: This work proposes an approach which is intended to meet the particular challenges of Medical Language Processing, in particular medical information retrieval. At its core lies a new type of dictionary, in which the entries are equivalence classes of subwords, i.e., semantically minimal units. These equivalence classes capture intralingual as well as interlingual synonymy. As equivalence classes abstract away from subtle particularities within and between languages and reference to them is realized via a language-independent conceptual system, they form an interlingua. In this work, the theoretical foundations of this approach are elaborated on. Furthermore, design considerations of applications based on the subword methodology are drawn up and showcase implementations are evaluated in detail. Starting with the introduction of Medical Linguistics as a field of active research in Chapter two, its consideration as a domain separated form general linguistics is motivated. In particular, morphological phenomena inherent to medical language are figured in more detail, which leads to an alternative view on medical terms and the introduction of the notion of subwords. Chapter three describes the formal foundation of subwords and the underlying linguistic declarative as well as procedural knowledge. An implementation of the subword model for the medical domain, the MorphoSaurus system, is presented in Chapter four. Emphasis will be given on the multilingual aspect of the proposed approach, including English, German, and Portuguese. The automatic acquisition of (medical) subwords for other languages (Spanish, French, and Swedish), and their integration in already available resources is described in the fifth Chapter. ; The proper handling of acronyms plays a crucial role in medical texts, e.g. in patient records, as well as in scientific literature. Chapter six presents an approach, in which acronyms are automatically acquired from (bio-) medical literature. Furthermore, acronyms and their definitions in different languages are linked to each other using the MorphoSaurus text processing system. Automatic word sense disambiguation is still one of the most challenging tasks in Natural Language Processing. In Chapter seven, cross-lingual considerations lead to a new methodology for automatic disambiguation applied to subwords. Beginning with Chapter eight, a series of applications based onMorphoSaurus are introduced. Firstly, the implementation of the subword approach within a crosslanguage information retrieval setting for the medical domain is described and evaluated on standard test document collections. In Chapter nine, this methodology is extended to multilingual information retrieval in the Web, for which user queries are translated into target languages based on the segmentation into subwords and their interlingual mappings. The cross-lingual, automatic assignment of document descriptors to documents is the topic of Chapter ten. A large-scale evaluation of a heuristic, as well as a statistical algorithm is carried out using a prominent medical thesaurus as a controlled vocabulary. In Chapter eleven, it will be shown how MorphoSaurus can be used to map monolingual, lexical resources across different languages. As a result, a large multilingual medical lexicon with high coverage and complete lexical information is built and evaluated against a comparable, already available and commonly used lexical repository for the medical domain. Chapter twelve sketches a few applications based on MorphoSaurus. The generality and applicability of the subword approach to other domains is outlined, and proof-of-concepts in real-world scenarios are presented. Finally, Chapter thirteen recapitulates the most important aspects of MorphoSaurus and the potential benefit of its employment in medical information systems is carefully assessed, both for medical experts in their everyday life, but also with regard to health care consumers and their existential information needs.
Inhalt: Jena, Univ., Diss., 2008. Vgl.: urn:nbn:de:gbv:27-20090305-111708-4; auch unter: http://d-nb.info/993373798/about/html.
Themenfeld: Multilinguale Probleme
Wissenschaftsfach: Medizin
Objekt: MorphoSaurus-Projekt
DDC: 610.28 / DDC22ger ; 410.285 / DDC22ger
-
5Whitelock, P. ; Kilby, K.: Linguistic and computational techniques in machine translation system design : 2nd ed.
London : UCL Press, 1995. XII,208 S.
ISBN 1-85728-216-7
(Studies in computational linguistics)
Anmerkung: Rez. in: Machine translation 12(1997) no.3, S.261-169 (W.P. Lehmann)
Themenfeld: Computerlinguistik
Compass: Linguistics / Use of / Computers
LCSH: Machine translating
DDC: 410.285