Search (261 results, page 14 of 14)
-
Crane, G.; Jones, A.: Text, information, knowledge and the evolving record of humanity (2006)
0.00
1.08939676E-4 = product of: 0.0026145522 = sum of: 0.0026145522 = product of: 0.007843656 = sum of: 0.007843656 = weight(_text_:p in 1182) [ClassicSimilarity], result of: 0.007843656 = score(doc=1182,freq=2.0), product of: 0.078979194 = queryWeight, product of: 3.5955126 = idf(docFreq=3298, maxDocs=44218) 0.021966046 = queryNorm 0.099312946 = fieldWeight in 1182, product of: 1.4142135 = tf(freq=2.0), with freq of: 2.0 = termFreq=2.0 3.5955126 = idf(docFreq=3298, maxDocs=44218) 0.01953125 = fieldNorm(doc=1182) 0.33333334 = coord(1/3) 0.041666668 = coord(1/24)
- Abstract
- Consider a sentence such as "the current price of tea in China is 35 cents per pound." In a library with millions of books we might find many statements of the above form that we could capture today with relatively simple rules: rather than pursuing every variation of a statement, programs can wait, like predators at a water hole, for their informational prey to reappear in a standard linguistic pattern. We can make inferences from sentences such as "NAME1 born at NAME2 in DATE" that NAME more likely than not represents a person and NAME a place and then convert the statement into a proposition about a person born at a given place and time. The changing price of tea in China, pedestrian birth and death dates, or other basic statements may not be truth and beauty in the Phaedrus, but a digital library that could plot the prices of various commodities in different markets over time, plot the various lifetimes of individuals, or extract and classify many events would be very useful. Services such as the Syllabus Finder1 and H-Bot2 (which Dan Cohen describes elsewhere in this issue of D-Lib) represent examples of information extraction already in use. H-Bot, in particular, builds on our evolving ability to extract information from very large corpora such as the billions of web pages available through the Google API. Aside from identifying higher order statements, however, users also want to search and browse named entities: they want to read about "C. P. E. Bach" rather than his father "Johann Sebastian" or about "Cambridge, Maryland", without hearing about "Cambridge, Massachusetts", Cambridge in the UK or any of the other Cambridges scattered around the world. Named entity identification is a well-established area with an ongoing literature. The Natural Language Processing Research Group at the University of Sheffield has developed its open source Generalized Architecture for Text Engineering (GATE) for years, while IBM's Unstructured Information Analysis and Search (UIMA) is "available as open source software to provide a common foundation for industry and academia." Powerful tools are thus freely available and more demanding users can draw upon published literature to develop their own systems. Major search engines such as Google and Yahoo also integrate increasingly sophisticated tools to categorize and identify places. The software resources are rich and expanding. The reference works on which these systems depend, however, are ill-suited for historical analysis. First, simple gazetteers and similar authority lists quickly grow too big for useful information extraction. They provide us with potential entities against which to match textual references, but existing electronic reference works assume that human readers can use their knowledge of geography and of the immediate context to pick the right Boston from the Bostons in the Getty Thesaurus of Geographic Names (TGN), but, with the crucial exception of geographic location, the TGN records do not provide any machine readable clues: we cannot tell which Bostons are large or small. If we are analyzing a document published in 1818, we cannot filter out those places that did not yet exist or that had different names: "Jefferson Davis" is not the name of a parish in Louisiana (tgn,2000880) or a county in Mississippi (tgn,2001118) until after the Civil War.
Authors
- Capurro, R. 5
- Gödert, W. 5
- Kuhlen, R. 5
- Hjoerland, B. 4
- Jochum, U. 3
- Weizenbaum, J. 3
- Wersig, G. 3
- Cronin, B. 2
- Eckert, A. 2
- Fugmann, R. 2
- Georgy, U. 2
- Henrichs, N. 2
- Janich, P. 2
- Lehner, C. 2
- Nerlich, H. 2
- Pöppel, E. 2
- Ratzek, W. 2
- Rauch, W. 2
- Roth, G. 2
- Thomssen, G. 2
- Umstätter, W. 2
- Zimmermann, H.H. 2
- Abele, J. 1
- Albrecht, C. 1
- Andretta, S. 1
- Antos, G. 1
- Atran, S. 1
- Barber, B.R. 1
- Bates, M.J. 1
- Baumard, P. 1
- Beger, G. 1
- Bell, G. 1
- Benkowsky, J. 1
- Bennett, C.H. 1
- Betz, F. 1
- Beyersdorff, G. 1
- Bhattacharjee, E. 1
- Bierwisch, M. 1
- Bocek, K. 1
- Bolz, N. 1
- Bonfadelli, H. 1
- Bonß, W. 1
- Boos, M. 1
- Bovenschulte, M. 1
- Braatz, B. 1
- Brandstetter, A. 1
- Bredekamp, H. 1
- Bredemeier, W. 1
- Buckland, M.K. 1
- Burnett, R. 1
- Bussmann, I. 1
- Bühring, B. 1
- Calvin, W.H. 1
- Chou, L. 1
- Cornelius, I. 1
- Crane, G. 1
- Currás, E. 1
- Darnton, R. 1
- Davenport, E. 1
- Degele, N. 1
- Dewald, U. 1
- Diefenbach, P. 1
- Donsbach, W. 1
- Draeger, F. 1
- Dribbusch, B. 1
- Dudeck, J. 1
- Eberlein, U. 1
- Eiriksson, J.M. 1
- Eisenberg, M.B. 1
- Ekert, S. 1
- Elbe, M. 1
- Ernst, W. 1
- Eurich, C. 1
- Evans, P. 1
- Fallis, D. 1
- Farb, S.E. 1
- Favre-Bulle, B. 1
- Feuck, J. 1
- Fisch, C. 1
- Floridi, L. 1
- Foerster, H. von 1
- Fonseca, F.T. 1
- Franken, G. 1
- Fraser, N. 1
- Frei, R. 1
- Frey, S. 1
- Fuchs, C. 1
- Fürnhammer, H. 1
- Garfinkel, S.L. 1
- Gemmell, J. 1
- Genth, P. 1
- Gering, E. 1
- Giesecke, M. 1
- Giessen, H.W. 1
- Glowalla, U. 1
- Gohlke, G. 1
- Gorz, A. 1
- Greve, J. 1
- Görnitz, B. 1
- Görnitz, T. 1
- More… Less…
Themes
- Internet 15
- Information Resources Management 12
- Rechtsfragen 6
- Biographische Darstellungen 3
- Hypertext 3
- Literaturübersicht 3
- Bilder 2
- Computer Based Training 2
- Begriffstheorie 1
- Elektronisches Publizieren 1
- Formalerschließung 1
- Geschichte der Sacherschließung 1
- Informationsdienstleistungen 1
- Informationsmittel 1
- Inhaltsanalyse 1
- Semantisches Umfeld in Indexierung u. Retrieval 1
- Vision 1
- Visualisierung 1
- Wissensrepräsentation 1
- More… Less…
Subjects
- Information 2
- Information society 2
- Knowledge management 2
- Knowledge, Sociology of 2
- Cognitive grammar 1
- Cologne (Electorate) / History / 16th century 1
- Cologne, Germany / History / 1582 / 1590 1
- Communication 1
- Communication / Philosophy 1
- Communication / Political aspects / Germany / Cologne / History / 16th century. 1
- Computer / Kommunikation / Augsburger Allgemeine / Mailbox 1
- Counter / Reformation / Germany / Cologne 1
- Davidson, Donald / Bedeutung / Handlung / Sprechakttheorie / Handlungstheoretische Semantik / Habermas, Jürgen 1
- Goldberg, Emanuel / Biographie 1
- Goldberg, Emanuel, 1881 / 1970 1
- Hirnfunktion / Neuropsychologie 1
- Human / computer interaction 1
- Hypertext 1
- Hypertext / Internet 1
- Hypertext / Wissensverarbeitung 1
- Information / Kognitionswissenschaft 1
- Information / Wissen / Kognition / Kommunikation (BVB) 1
- Information literacy / Examinations / Study guides 1
- Information networks 1
- Information science 1
- Information science / Examinations / Study guides 1
- Information technology 1
- Information technology / History 1
- Information theory 1
- Information und Dokumentation / Informationstechnik / Geschichte 1
- Informationsethik / Lehrbuch 1
- Informationsgesellschaft / Wissensmanagement 1
- Informationsgesellschaft / Wissenssoziologie (21) 1
- Informationskompetenz 1
- Informationsmanagement / Betriebswirtschaftslehre / Informationstheorie 1
- Informationstheorie 1
- Informationstheorie / Aufsatzsammlung 1
- Informationstheorie / Informationsbeschaffung 1
- Interactive computer systems 1
- Internet / Wissensmanagement / Informationsverarbeitung 1
- Inventors / Biography 1
- Kognitive Linguistik / Kongress / Mannheim <2007> 1
- Kybernetik / Metaphysik / Nichtklassische Logik 1
- Kölnischer Krieg / Öffentlichkeit / Druckmedien / Geschichte 1582-1590 1
- Künstliche Intelligenz / Bewusstsein 1
- Leib-Seele-Problem / Quantentheorie / Information / Kosmologie 1
- Linguistic Turn / Kulturwissenschaften / Kongress / Mannheim <2007> 1
- Linguistics 1
- Mass media and war / Germany / Cologne (Electorate) / History / 16th century. 1
- Neue Medien / Kommunikationsverhalten (BVB) 1
- Organisationsforschung 1
- Organizational sociology , Methodology 1
- Pamphlets / Germany / Cologne / History / 16th century 1
- Philosophie / Kongress / Konstanz <1999> 1
- Press / Germany / Cologne / History / 16th century. 1
- Psyche / Hirnforschung (21) 1
- Psychiatrie 1
- Psycholinguistics 1
- Public opinion / Political aspects / Germany / Cologne / History / 16th century. 1
- Publishers and publishing / Political aspects / Germany / Cologne / History / 16th century. 1
- Shannon, Claude Elwood / Informationstheorie 1
- Sociology 1
- Speech acts (Linguistics) 1
- Sprache / Kultur / Kongress / Mannheim <2007> 1
- Strategic planning 1
- War in mass media / Germany / Cologne (Electorate) / History / 16th century. 1
- Wiki / Wissensmanagement / Aufsatzsammlung 1
- Wissen / Informationsgesellschaft / Kongress / München <1999> (2134) 1
- Wissen / Konstruktivismus <Philosophie> 1
- Wissen / Wissensgesellschaft / Netzwerkgesellschaft / Wahrnehmung (SBB) 1
- Wissenschaft / Information / Begriff / Informationsgesellschaft 1
- Wissenschaftlich-technischer Fortschritt / Prognose 2000-2100 1
- Wissenserwerb / Computerunterstützte Kommunikation 1
- Wissensproduktion / Internet 1
- Zeitung / Online-Informationssystem / Benutzerverhalten (BVB) 1
- More… Less…
Classifications
- 05.20 / Kommunikation und Gesellschaft 3
- 53.71 / Theoretische Nachrichtentechnik 3
- 06.35 / Informationsmanagement 2
- 53.71 Theoretische Nachrichtentechnik 2
- 54.87 / Multimedia 2
- AN 92550 Allgemeines / Buch- und Bibliothekswesen, Informationswissenschaft / Informationswissenschaft / Nachschlagewerke, Allgemeine Darstellungen / Einführungen, Abrisse 2
- MS 6950 2
- SR 800 2
- 003.54 1
- 003.54 / DDC22ger 1
- 004.1/9 B 1
- 02.01 / Geschichte der Wissenschaft und Kultur 1
- 02.02 / Wissenschaftstheorie 1
- 02.02 Wissenschaftstheorie 1
- 02.10 (Wissenschaft und Gesellschaft) 1
- 02.13 Wissenschaftspraxis 1
- 025.04 1
- 025.5/24 / dc22 1
- 05.02 / Kommunikationstheorie 1
- 05.20 Kommunikation und Gesellschaft 1
- 05.38 / Neue elektronische Medien <Kommunikationswissenschaft> 1
- 05.39 / Massenkommunikation, Massenmedien: Sonstiges 1
- 06.00 Information und Dokumentation: Allgemeines 1
- 06.01 / Geschichte des Informations- und Dokumentationswesens 1
- 06.44 / IuD-Einrichtungen 1
- 08.25 (Zeitgenössische westliche Philosophie) 1
- 08.34 Sprachphilosophie 1
- 08.36 Philosophische Anthropologie 1
- 08.38 / Ethik 1
- 121 / DDC22ger 1
- 15.42 Deutsche Geschichte 1500-1800 1
- 15.53 Nordrhein-Westfalen Geschichte 1
- 17.10 Sprache in Beziehung zu anderen Bereichen der Wissenschaft und Kultur 1
- 17.25 Soziolinguistik: Sonstiges 1
- 17.34 Psycholinguistik: Sonstiges 1
- 17.40 / Angewandte Sprachwissenschaft: Allgemeines 1
- 18.00 Einzelne Sprachen und Literaturen allgemein 1
- 18.09 Deutsche Sprache 1
- 302.201 1
- 303.4833 / DDC22ger 1
- 306.42 1
- 306.44 1
- 33.23 Quantenphysik 1
- 39.30 Kosmologie 1
- 410.18 / DDC22ger 1
- 50.02 (Technikphilosophie) 1
- 53.71 (Theoretische Nachrichtentechnik) 1
- 54.00 Informatik: Allgemeines 1
- 54.01 / Geschichte der Informatik 1
- 54.08 / Informatik in Beziehung zu Mensch und Gesellschaft 1
- 54.08 Informatik in Beziehung zu Mensch und Gesellschaft 1
- 612.82 1
- 658.4'012 / dc21 1
- 658.4038 / DDC22ger 1
- 658.4038028567 / DDC22ger 1
- 71.43 (Technologische Faktoren) <Soziologie> 1
- 77.31 / Kognition 1
- 85.09 (Unternehmensorganisation) 1
- 943.5514034 / DDC22ger 1
- AGCI (SI) 1
- AGF (W) 1
- AGOM (SI) 1
- AKAH (SI) 1
- AN 92550 (BVB) 1
- AN 93000 (BVB) 1
- AN 93000 Allgemeines / Buch- und Bibliothekswesen, Informationswissenschaft / Informationswissenschaft / Grundlagen, Theorie / Informationstheorie, Kybernetik 1
- AN 96900 1
- AP 11850 1
- AP 13625 1
- AP 14000 Allgemeines / Medien- und Kommunikationswissenschaften, Kommunikationsdesign / Beziehungen, Ausstrahlungen, Einwirkungen / Kommunikation und Gesellschaft 1
- AP 16100 Allgemeines / Medien- und Kommunikationswissenschaften, Kommunikationsdesign / Aussagefunktion und Aussagegestaltung / Unterrichtung (Information) 1
- AWUI (SI) 1
- BAHK (FH K) 1
- BFG (PB) 1
- BHS (E) 1
- CC 3200 Philosophie / Systematische Philosophie / Allgemeine Wissenschaftstheorie / Abhandlungen zur allgemeinen Wissenschaftstheorie 1
- CC 4200 Philosophie / Systematische Philosophie / Erkenntnistheorie / Einführungen, Bibliographien, Nachschlagewerke (BSZ) 1
- CC 4400 (BVB) 1
- CC 4800 1
- CC 4800 (BVB) 1
- CC 5200 1
- CC 5200 (BVB) 1
- CC 5500 1
- CC 7260 1
- CCA (PB) 1
- CP 4000 1
- CV 3500 1
- DD901.C77 1
- DP 2600 1
- ER 300: Kongressberichte, Sammelwerke (verschiedener Autoren) / Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Allgemeine Sprachwissenschaft 1
- ER 940: Sprechen und Denken, Kompetenz und Performanz, Pragmatik / Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Allgemeine Sprachwissenschaft 1
- ER 965 1
- ER 990 1
- ES 110: Sprache und Kultur / Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft 1
- ES 360: Kultur- und Sozialwissenschaften / Allgemeine und vergleichende Sprach- und Literaturwissenschaft. Indogermanistik. Außereuropäische Sprachen und Literaturen / Spezialbereiche der allgemeinen Sprachwissenschaft 1
- GC 1001: Allgemeines / Germanistik. Niederlandistik. Skandinavistik / Deutsche Sprache 1
- HC79.I55E93 1999 1
- HKO (PB) 1
- HLB (E) 1
- HLG (PB) 1
- More… Less…