Literatur zur Informationserschließung
Diese Datenbank enthält über 40.000 Dokumente zu Themen aus den Bereichen Formalerschließung – Inhaltserschließung – Information Retrieval.
© 2015 W. Gödert, TH Köln, Institut für Informationswissenschaft
/
Powered by litecat, BIS Oldenburg
(Stand: 28. April 2022)
Suche
Suchergebnisse
Treffer 1–12 von 12
sortiert nach:
-
1Ferrer-i-Cancho, R. ; Vitevitch, M.S.: ¬The origins of Zipf's meaning-frequency law.
In: Journal of the Association for Information Science and Technology. 69(2018) no.11, S.1369-1379.
Abstract: In his pioneering research, G.K. Zipf observed that more frequent words tend to have more meanings, and showed that the number of meanings of a word grows as the square root of its frequency. He derived this relationship from two assumptions: that words follow Zipf's law for word frequencies (a power law dependency between frequency and rank) and Zipf's law of meaning distribution (a power law dependency between number of meanings and rank). Here we show that a single assumption on the joint probability of a word and a meaning suffices to infer Zipf's meaning-frequency law or relaxed versions. Interestingly, this assumption can be justified as the outcome of a biased random walk in the process of mental exploration.
Inhalt: Vgl.: https://onlinelibrary.wiley.com/doi/10.1002/asi.24057.
Themenfeld: Informetrie
Objekt: Zipf-Gesetz
-
2Chang, Y.-W.: Influence of human behavior and the principle of least effort on library and information science research.
In: Information processing and management. 52(2016) no.4, S.658-669.
Abstract: General graph random walk has been successfully applied in multi-document summarization, but it has some limitations to process documents by this way. In this paper, we propose a novel hypergraph based vertex-reinforced random walk framework for multi-document summarization. The framework first exploits the Hierarchical Dirichlet Process (HDP) topic model to learn a word-topic probability distribution in sentences. Then the hypergraph is used to capture both cluster relationship based on the word-topic probability distribution and pairwise similarity among sentences. Finally, a time-variant random walk algorithm for hypergraphs is developed to rank sentences which ensures sentence diversity by vertex-reinforcement in summaries. Experimental results on the public available dataset demonstrate the effectiveness of our framework.
Inhalt: Vgl.: http://www.sciencedirect.com/science/article/pii/S030645731500148X.
Themenfeld: Informetrie
Wissenschaftsfach: Bibliothekswesen ; Informationswissenschaft
Objekt: Zipf-Gesetz
-
3Ufen, F.: ¬Das System als Roman : Eine Regelmäßigkeit der Worthäufigkeit passt bemerkenswerterweise auch auf Unternehmensgrößen und die Größe von Städten.
In: Neues Deutschland vom 06.06.2015, S.26.
(Natur & Wissenschaft)
Abstract: Im Jahre 2010 hatte New York 8 175 000 Einwohner. Los Angeles war mit 3 793 000 Menschen die zweitgrößte Stadt der Vereinigten Staaten. Dann folgten Chicago mit 2 696 000, Houston mit 2 100 000 und Philadelphia mit 1 526 000 Einwohnern. Zwischen den Einwohnerzahlen sämtlicher amerikanischer Städte besteht ein verblüffender statistischer Zusammenhang: Die zweitgrößte Stadt der USA hat ungefähr halb so viele Einwohner wie New York, die drittgrößte Stadt hat etwa ein Drittel der Einwohnerzahl New Yorks, die viertgrößte Stadt etwa ein Viertel, die fünftgrößte etwa ein Fünftel, usw., usw. Dieser statistische Zusammenhang zwischen dem Rangplatz einer Stadt und ihrer Einwohnerzahl bedeutet, dass die Bevölkerungsverteilung dem Zipfschen Gesetz gehorcht - d.h. die Einwohnerzahl jeder Stadt verhält sich umgekehrt proportional zu ihrer Position in einer absteigenden Rangfolge. Der US-amerikanische Linguist George Kingsley Zipf (1902-1950) formulierte das nach ihm benannte Gesetz allerdings in einem ganz anderen Zusammenhang. Zipf hat entdeckt, dass in Texten jeder beliebigen indoeuropäischen Sprache (zum Beispiel in irgendeinem Roman) das am häufigsten gebrauchte Wort ungefähr doppelt so oft vorkommt wie das am zweithäufigsten verwendete, drei Mal so oft wi das am dritthäufigsten auftauchende usw. Zipf hat außerdem herausgefunden, dass die Wörter einer Sprache, die in der Alltagskommunikation am häufigsten verwendet werden, in aller Regel auch die kürzesten und die ältesten sind. Seine Untersuchungen machten ihn zu einem Pionier der quantitativen Erforschung sprachlicher Phänomene.
Inhalt: Vgl. auch: http://www.neues-deutschland.de/artikel/973475.das-system-als-roman.html.
Themenfeld: Informetrie
Objekt: Zipf-Gesetz
-
4Egghe, L. ; Guns, R.: Applications of the generalized law of Benford to informetric data.
In: Journal of the American Society for Information Science and Technology. 63(2012) no.8, S.1662-1665.
(Brief communication)
Abstract: In a previous work (Egghe, 2011), the first author showed that Benford's law (describing the logarithmic distribution of the numbers 1, 2, ... , 9 as first digits of data in decimal form) is related to the classical law of Zipf with exponent 1. The work of Campanario and Coslado (2011), however, shows that Benford's law does not always fit practical data in a statistical sense. In this article, we use a generalization of Benford's law related to the general law of Zipf with exponent ? > 0. Using data from Campanario and Coslado, we apply nonlinear least squares to determine the optimal ? and show that this generalized law of Benford fits the data better than the classical law of Benford.
Themenfeld: Informetrie
Objekt: Zipf-Gesetz ; Benford-Gesetz
-
5Egghe, L.: ¬A new short proof of Naranan's theorem, explaining Lotka's law and Zipf's law.
In: Journal of the American Society for Information Science and Technology. 61(2010) no.12, S.2581-2583.
(Brief communication)
Abstract: Naranan's important theorem, published in Nature in 1970, states that if the number of journals grows exponentially and if the number of articles in each journal grows exponentially (at the same rate for each journal), then the system satisfies Lotka's law and a formula for the Lotka's exponent is given in function of the growth rates of the journals and the articles. This brief communication re-proves this result by showing that the system satisfies Zipf's law, which is equivalent with Lotka's law. The proof is short and algebraic and does not use infinitesimal arguments.
Themenfeld: Informetrie
Objekt: Naranan-Theorem ; Zipf-Gesetz ; Lotka-Gesetz
-
6Rousseau, R.: Informetric laws.
In: Encyclopedia of library and information sciences. 3rd ed. Ed.: M.J. Bates. London : Taylor & Francis, 2009. S.xx-xx.
Abstract: In this entry we formulate the so-called informetric laws, recall their origin, indicate how it can be shown that they are basically equivalent representations of the same regularity, hint at some explanations, such as success-breeds-success or preferential attachment, and describe why they are so ubiquitous.
Anmerkung: Vgl.: http://www.tandfonline.com/doi/book/10.1081/E-ELIS3.
Themenfeld: Informetrie
Objekt: Bradford-Gesetz ; Lotka-Gesetz ; Zipf-Gesetz ; Mandelbrot-Gesetz ; Leimkuhler-Gesetz
-
7Rousseau, R.: On Egghe's construction of Lorenz curves.
In: Journal of the American Society for Information Science and Technology. 58(2007) no.10, S.1551-1552.
Abstract: Contrary to Burrell's statements, Egghe's theory of continuous concentration does include the construction of a standard Lorenz curve.
Themenfeld: Informetrie
Objekt: Zipf-Gesetz ; Lotka-Gesetz
-
8Egghe, L.: Zipfian and Lotkaian continuous concentration theory.
In: Journal of the American Society for Information Science and Technology. 56(2005) no.9, S.935-945.
Abstract: In this article concentration (i.e., inequality) aspects of the functions of Zipf and of Lotka are studied. Since both functions are power laws (i.e., they are mathematically the same) it suffices to develop one concentration theory for power laws and apply it twice for the different interpretations of the laws of Zipf and Lotka. After a brief repetition of the functional relationships between Zipf's law and Lotka's law, we prove that Price's law of concentration is equivalent with Zipf's law. A major part of this article is devoted to the development of continuous concentration theory, based an Lorenz curves. The Lorenz curve for power functions is calculated and, based an this, some important concentration measures such as the ones of Gini, Theil, and the variation coefficient. Using Lorenz curves, it is shown that the concentration of a power law increases with its exponent and this result is interpreted in terms of the functions of Zipf and Lotka.
Themenfeld: Informetrie
Objekt: Zipf-Gesetz ; Lotka-Gesetz
-
9Mat-Hassan, M. ; Levene, M.: Associating search and navigation behavior through log analysis.
In: Journal of the American Society for Information Science and Technology. 56(2005) no.9, S.913-934.
Abstract: We report on a study that was undertaken to better understand search and navigation behavior by exploiting the close association between the process underlying users' query submission and the navigational trails emanating from query clickthroughs. To our knowledge, there has been little research towards bridging the gap between these two important processes pertaining to users' online information searching activity. Based an log data obtained from a search and navigation documentation system called AutoDoc, we propose a model of user search sessions and provide analysis an users' link or clickthrough selection behavior, reformulation activities, and search strategy patterns. We also conducted a simple user study to gauge users' perceptions of their information seeking activity when interacting with the system. The results obtained show that analyzing both the query submissions and navigation starting from query clickthrough, reveals much more interesting patterns than analyzing these two processes independently. On average, AutoDoc users submitted only one query per search session and entered approximately two query terms. Specifically, our results show how AutoDoc users are more inclined to submit new queries or resubmit modified queries than to navigate by linkfollowing. We also show that users' behavior within this search system can be approximated by Zipf's Law distribution.
Themenfeld: Benutzerstudien ; Suchtaktik
Objekt: Zipf-Gesetz
-
10Wagner-Döbler, R.: Kognitive Mobilität und Zipfs "Principle of Least Effort".
In: Wissensorganisation in kooperativen Lern- und Arbeitsumgebungen: Proceedings der 8. Tagung der Deutschen Sektion der Internationalen Gesellschaft für Wissensorganisation, Regensburg, 9.-11. Oktober 2002. Hrsg.: G. Budin u. H.P. Ohly. Würzburg : Ergon Verlag, 2004. S.23-32.
(Fortschritte in der Wissensorganisation; Bd.8)
Abstract: Unter kognitiver Mobilität verstehe ich im folgenden nicht die Mobilität von Information, sondern die Bewegung des Denkens, und zwar hier des wissenschaftlichen Denkens. Wissenschaftliches Denken vollzieht sich disziplinär sowie interdisziplinär, im informationellen Austausch von Disziplinen und Forschungsgebieten. Dieser Austausch unterliegt, wie die Wissenschaftsgeschichte lehrt, einer Entwicklungsdynamik, die als Abfolge von Wanderungen oder Übergängen zwischen Forschungsgebieten in folgendem Sinn verständen werden kann. Beschäftigt sich ein Forscher A zum Zeitpunkt t1 mit Forschungsgebiet X und zum Zeitpunkt t2 als nächstes mit Forschungsgebiet Y, so liegt ein Übergang von X nach Y vor. Gibt es für diese Art von Übergängen charakteristische Eigenschaften oder Regularitäten.> Ein wichtiges Merkmal solcher Übergänge ist der Grad der Verwandtschaft, der kognitiven Affinität zwischen Ausgangs- und Zielgebiet der Migration. Am Beispiel der rund 150.000 Migrationen zwischen den mathematischen Subdisziplinen, wie sie sich in den Zeitschriftenartikel-Nachweisen der Mathematical Reviews von 1959 bis 1975 widerspiegeln, wurde das Verhältnis von kognitiver Mobilität und Affinität empirisch systematisch untersucht. Es bestätigte sich George K. Zipfs "Principle of Least Effort". Zählreiche Mechanismen und Faustregeln der Wissensorganisation dürften der Wirksamkeit dieses Prinzips zugrundeliegen.
Themenfeld: Informetrie
Wissenschaftsfach: Kognitionswissenschaft
Objekt: Zipf-Gesetz
-
11Losee, R.M.: Term dependence : a basis for Luhn and Zipf models.
In: Journal of the American Society for Information Science and technology. 52(2001) no.12, S.1019-1025.
Abstract: There are regularities in the statistical information provided by natural language terms about neighboring terms. We find that when phrase rank increases, moving from common to less common phrases, the value of the expected mutual information measure (EMIM) between the terms regularly decreases. Luhn's model suggests that midrange terms are the best index terms and relevance discriminators. We suggest reasons for this principle based on the empirical relationships shown here between the rank of terms within phrases and the average mutual information between terms, which we refer to as the Inverse Representation- EMIM principle. We also suggest an Inverse EMIM term weight for indexing or retrieval applications that is consistent with Luhn's distribution. An information theoretic interpretation of Zipf's Law is provided. Using the regularity noted here, we suggest that Zipf's Law is a consequence of the statistical dependencies that exist between terms, described here using information theoretic concepts.
Themenfeld: Informetrie
Objekt: Luhn-Modell ; Zipf-Gesetz
-
12Bookstein, A.: ¬The bibliometric distributions.
In: Library quarterly. 46(1976), S.416-423.
Abstract: One of the most surprising findings in the information sciences is the recurrence of a small number of frequency distributions. In this paper, these distributions are described, and a point of view is adopted that allows us to understand them a being different versions of a single distribution. The empirical distributions are shown to be special cases of a single theoretic distribution. It is found that when random fluctuations are introduced, the distributions are not strongly influenced
Themenfeld: Informetrie
Objekt: Lotka-Gesetz ; Zipf-Gesetz ; Bradford-Gesetz