Document (#25974)

Author
Kaluza, H.
Title
Methoden und Verfahren bei der Archivierung von Internetressourcen : "The Internet Archive" und PANDORA
Imprint
Köln : FH / FB Informationswissenschaft
Year
2002
Pages
82 S. + CD-ROM
Content
"Die vorliegende Arbeit befasst sich mit den Methoden und Verfahren bei der Archivierung von Internetressourcen. Ziel ist es, anhand einer vergleichenden Beschreibung zweier zur Zeit aktiver, bzw. im Aufbau befindlicher Projekte, die Grundprobleme dieser speziellen Art der Archivierung darzustellen und deren unterschiedliche Vorgehensweisen beim Aufbau des Archivs zu beschreiben und zu vergleichen. Daraus erfolgt eine Diskussion über grundsätzliche Fragestellungen zu diesem Thema. Hierzu ist es vonnöten, zuerst auf das besondere Medium Internet, insbesondere auf das World Wide Web (WWW), einzugehen, sowie dessen Geschichte und Entstehung zu betrachten. Weiterhin soll ein besonderes Augenmerk auf die Datenmenge, die Datenstruktur und die Datentypen (hier vor allem im World Wide Web) gelegt werden. Da die daraus entstehenden Probleme für Erschließung und Retrieval, die Qualität und die Fluktuation der Angebote im Web eine wichtige Rolle im Rahmen der Archivierung von Internetressourcen darstellen, werden diese gesondert mittels kurzer Beschreibungen bestimmter Instrumente und Projekte zur Lösung derselben beschrieben. Hier finden insbesondere Suchmaschinen und Webkataloge, deren Arbeitsweise und Aufbau besondere Beachtung. Weiterhin sollen die "Virtuelle Bibliothek" und das "Dublin Core"- Projekt erläutert werden. Auf dieser Basis wird dann speziell auf das allgemeine Thema der Archivierung von Internetressourcen eingegangen. Ihre Grundgedanken und ihre Ziele sollen beschrieben und erste Diskussionsfragen und Diskrepanzen aufgezeigt werden. Ein besonderes Augenmerk gilt hier vor allem den technischen und rechtlichen Problemen, sowie Fragen des Jugendschutzes und der Zugänglichkeit zu mittlerweile verbotenen Inhalten. Einzelne Methoden der Archivierung, die vor allem im folgenden Teil anhand von Beispielen Beachtung finden, werden kurz vorgestellt. Im darauf folgenden Teil werden zwei Archivierungsprojekte detailliert beschrieben und analysiert. Einem einführenden Überblick über das jeweilige Projekt, folgen detaillierte Beschreibungen zu Projektverlauf, Philosophie und Vorgehensweise. Die Datenbasis und das Angebot, sowie die Funktionalitäten werden einer genauen Untersuchung unterzogen. Stärken und Schwächen werden genannt, und wenn möglich, untereinander verglichen. Hier ist vor allem auch die Frage von Bedeutung, ob das Angebot a) den Ansprüchen und Zielsetzungen des Anbieters genügt, und ob es b) den allgemeinen Grundfragen der Archivierung von Internetressourcen gleichkommt, die in Kapitel 3 genannt worden sind. Auf Basis aller Teile soll dann abschließend der derzeitige Stand im Themengebiet diskutiert werden. Die Arbeit schließt mit einer endgültigen Bewertung und alternativen Lösungen."
Footnote
Diplomarbeit im Studiengang Bibliothekswesen
Theme
Internet
Object
Internet Archive
PANDORA

Similar documents (content)

  1. Wätjen, H.-J.: GERHARD : Automatisches Sammeln, Klassifizieren und Indexieren von wissenschaftlich relevanten Informationsressourcen im deutschen World Wide Web (1998) 0.43
    0.43171152 = sum of:
      0.43171152 = product of:
        0.86342305 = sum of:
          0.049571767 = weight(abstract_txt:internet in 3064) [ClassicSimilarity], result of:
            0.049571767 = score(doc=3064,freq=1.0), product of:
              0.12160056 = queryWeight, product of:
                3.7271836 = idf(docFreq=2891, maxDocs=44218)
                0.03262532 = queryNorm
              0.4076607 = fieldWeight in 3064, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                3.7271836 = idf(docFreq=2891, maxDocs=44218)
                0.109375 = fieldNorm(doc=3064)
          0.18315141 = weight(abstract_txt:verfahren in 3064) [ClassicSimilarity], result of:
            0.18315141 = score(doc=3064,freq=1.0), product of:
              0.29061598 = queryWeight, product of:
                1.5459375 = boost
                5.761993 = idf(docFreq=377, maxDocs=44218)
                0.03262532 = queryNorm
              0.63021797 = fieldWeight in 3064, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.761993 = idf(docFreq=377, maxDocs=44218)
                0.109375 = fieldNorm(doc=3064)
          0.6306999 = weight(abstract_txt:internetressourcen in 3064) [ClassicSimilarity], result of:
            0.6306999 = score(doc=3064,freq=1.0), product of:
              0.6627165 = queryWeight, product of:
                2.334512 = boost
                8.701155 = idf(docFreq=19, maxDocs=44218)
                0.03262532 = queryNorm
              0.95168877 = fieldWeight in 3064, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                8.701155 = idf(docFreq=19, maxDocs=44218)
                0.109375 = fieldNorm(doc=3064)
        0.5 = coord(3/6)
    
  2. Hingst, W.-C.: ¬Ein Fundament moderner Kommunikation : Verschlüsselungstechniken werden nicht nur für Geheimdienste, sondern auch für die Wirtschaft immer wichtiger (1997) 0.27
    0.26596937 = sum of:
      0.26596937 = product of:
        0.79790807 = sum of:
          0.16996036 = weight(abstract_txt:internet in 7652) [ClassicSimilarity], result of:
            0.16996036 = score(doc=7652,freq=1.0), product of:
              0.12160056 = queryWeight, product of:
                3.7271836 = idf(docFreq=2891, maxDocs=44218)
                0.03262532 = queryNorm
              1.3976939 = fieldWeight in 7652, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                3.7271836 = idf(docFreq=2891, maxDocs=44218)
                0.375 = fieldNorm(doc=7652)
          0.6279477 = weight(abstract_txt:verfahren in 7652) [ClassicSimilarity], result of:
            0.6279477 = score(doc=7652,freq=1.0), product of:
              0.29061598 = queryWeight, product of:
                1.5459375 = boost
                5.761993 = idf(docFreq=377, maxDocs=44218)
                0.03262532 = queryNorm
              2.1607473 = fieldWeight in 7652, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.761993 = idf(docFreq=377, maxDocs=44218)
                0.375 = fieldNorm(doc=7652)
        0.33333334 = coord(2/6)
    
  3. Tappenbeck, I.; Wessel, C.: CARMEN : Content Analysis, Retrieval and Metadata: Effective Net-working. Ein Halbzeitbericht (2001) 0.23
    0.23292384 = sum of:
      0.23292384 = product of:
        0.46584767 = sum of:
          0.15861377 = weight(abstract_txt:verfahren in 5900) [ClassicSimilarity], result of:
            0.15861377 = score(doc=5900,freq=3.0), product of:
              0.29061598 = queryWeight, product of:
                1.5459375 = boost
                5.761993 = idf(docFreq=377, maxDocs=44218)
                0.03262532 = queryNorm
              0.5457848 = fieldWeight in 5900, product of:
                1.7320508 = tf(freq=3.0), with freq of:
                  3.0 = termFreq=3.0
                5.761993 = idf(docFreq=377, maxDocs=44218)
                0.0546875 = fieldNorm(doc=5900)
          0.09259941 = weight(abstract_txt:methoden in 5900) [ClassicSimilarity], result of:
            0.09259941 = score(doc=5900,freq=1.0), product of:
              0.29277778 = queryWeight, product of:
                1.5516768 = boost
                5.7833843 = idf(docFreq=369, maxDocs=44218)
                0.03262532 = queryNorm
              0.31627882 = fieldWeight in 5900, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.7833843 = idf(docFreq=369, maxDocs=44218)
                0.0546875 = fieldNorm(doc=5900)
          0.2146345 = weight(abstract_txt:archivierung in 5900) [ClassicSimilarity], result of:
            0.2146345 = score(doc=5900,freq=1.0), product of:
              0.51278144 = queryWeight, product of:
                2.0535173 = boost
                7.653836 = idf(docFreq=56, maxDocs=44218)
                0.03262532 = queryNorm
              0.41856915 = fieldWeight in 5900, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                7.653836 = idf(docFreq=56, maxDocs=44218)
                0.0546875 = fieldNorm(doc=5900)
        0.5 = coord(3/6)
    
  4. Tappenbeck, I.; Wessel, C.: CARMEN : Content Analysis, Retrieval and Metadata: Effective Net-working. Bericht über den middleOfTheRoad Workshop (2001) 0.23
    0.23292384 = sum of:
      0.23292384 = product of:
        0.46584767 = sum of:
          0.15861377 = weight(abstract_txt:verfahren in 5901) [ClassicSimilarity], result of:
            0.15861377 = score(doc=5901,freq=3.0), product of:
              0.29061598 = queryWeight, product of:
                1.5459375 = boost
                5.761993 = idf(docFreq=377, maxDocs=44218)
                0.03262532 = queryNorm
              0.5457848 = fieldWeight in 5901, product of:
                1.7320508 = tf(freq=3.0), with freq of:
                  3.0 = termFreq=3.0
                5.761993 = idf(docFreq=377, maxDocs=44218)
                0.0546875 = fieldNorm(doc=5901)
          0.09259941 = weight(abstract_txt:methoden in 5901) [ClassicSimilarity], result of:
            0.09259941 = score(doc=5901,freq=1.0), product of:
              0.29277778 = queryWeight, product of:
                1.5516768 = boost
                5.7833843 = idf(docFreq=369, maxDocs=44218)
                0.03262532 = queryNorm
              0.31627882 = fieldWeight in 5901, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                5.7833843 = idf(docFreq=369, maxDocs=44218)
                0.0546875 = fieldNorm(doc=5901)
          0.2146345 = weight(abstract_txt:archivierung in 5901) [ClassicSimilarity], result of:
            0.2146345 = score(doc=5901,freq=1.0), product of:
              0.51278144 = queryWeight, product of:
                2.0535173 = boost
                7.653836 = idf(docFreq=56, maxDocs=44218)
                0.03262532 = queryNorm
              0.41856915 = fieldWeight in 5901, product of:
                1.0 = tf(freq=1.0), with freq of:
                  1.0 = termFreq=1.0
                7.653836 = idf(docFreq=56, maxDocs=44218)
                0.0546875 = fieldNorm(doc=5901)
        0.5 = coord(3/6)
    
  5. Krüger, C.: Evaluation des WWW-Suchdienstes GERHARD unter besonderer Beachtung automatischer Indexierung (1999) 0.23
    0.23099393 = sum of:
      0.23099393 = product of:
        0.6929818 = sum of:
          0.1832993 = weight(abstract_txt:methoden in 1777) [ClassicSimilarity], result of:
            0.1832993 = score(doc=1777,freq=3.0), product of:
              0.29277778 = queryWeight, product of:
                1.5516768 = boost
                5.7833843 = idf(docFreq=369, maxDocs=44218)
                0.03262532 = queryNorm
              0.6260697 = fieldWeight in 1777, product of:
                1.7320508 = tf(freq=3.0), with freq of:
                  3.0 = termFreq=3.0
                5.7833843 = idf(docFreq=369, maxDocs=44218)
                0.0625 = fieldNorm(doc=1777)
          0.5096825 = weight(abstract_txt:internetressourcen in 1777) [ClassicSimilarity], result of:
            0.5096825 = score(doc=1777,freq=2.0), product of:
              0.6627165 = queryWeight, product of:
                2.334512 = boost
                8.701155 = idf(docFreq=19, maxDocs=44218)
                0.03262532 = queryNorm
              0.7690807 = fieldWeight in 1777, product of:
                1.4142135 = tf(freq=2.0), with freq of:
                  2.0 = termFreq=2.0
                8.701155 = idf(docFreq=19, maxDocs=44218)
                0.0625 = fieldNorm(doc=1777)
        0.33333334 = coord(2/6)