Vo vnútri internetového archívu

Domov internetového archívu, neziskového, ktorý už 22 rokov zachováva našu online históriu: Milióny webových stránok, tweety, novinové články, videá a memes.
Nie je to jednoduché. Internet je obrovské, éterické miesto v neustálom stave rozkladu. Obsahuje 1.8B webových stránok (z ktorých iba 644 m je aktívnych) a zdvojnásobuje svoju veľkosť každých 2 až 5 rokov – avšak priemerná webová stránka ostane na internete len 100 dní. Bez zálohovania sa tieto položky časom stratia. Ale archivovanie všetkého so sebou prináša veľkú zodpovednosť: Čo si zvolíte ponechať? Ako to ponecháte? A prečo na tom všetkom záleží?

archiv
 
V polovici deväťdesiatych rokov sa Brewster Kahle stal úspešným podnikateľom. Po štúdiu spustil superpočítačovú firmu, založil prvú online platformu pre publikovanie, a spustila Alexa Internet, spoločnosť, ktorá "prehľadala" web.
Zakladateľ internetového archívu, s niekoľkými servermi, v roku 1996 začal používať softvér na "zálohovanie" internetu v jeho podkroví. Tento projekt, nazvaný internetový archív, sa snažil poskytnúť verejnosti "univerzálny prístup ku všetkým vedomostiam" a "znovuzrodiť" Alexandrijskú knižnicu-

Viac ako 6 rokov súkromne archivoval viac ako 10B webových stránok. Potom v roku 2001 debutoval s Wayback Machine. V súčasnosti má stroj Wayback 388B webových stránok a internetový archív, je najväčšou knižnicou na svete.
Koľko toho vlastne je? Predstavte si 80 miliónov 4-zásuvkových kartoték plných papiera. Alebo len o niečo menej ako všetky napísané diela ľudstva (vo všetkých jazykoch) od začiatku zaznamenanej histórie až po súčasnosť. Na porovnanie, Kongresová knižnica USA obsahuje približne 28 terabajtov textu – čo je menej ako 0,1% ukladacieho priestoru internetového archívu.
Tento internetový archív sa môže pochváliť pôsobivou zbierkou médií všetkého druhu.

Každý týždeň internetový archív používa 7 000 botov, ktorí prechádzajú internetom a vytvárajú kópie miliónov webových stránok. Tieto kópie, nazývané "snímky", sa ukladajú na rôznych frekvenciách (niekedy viackrát za deň, inokedy raz za pár mesiacov) a uchovávajú webové stránky v určitom okamihu.
Fungovanie týchto operácií vyžaduje obrovské množstvo technických zdrojov, vývoj softvéru, stroje, pevné disky, operačnú infraštruktúru – a peniaze (ktoré spolu vyčleňujú z grantov a darov, ako aj archívna služba Archív).
 
Politika zachovania
 Jednou z najväčších otázok pri archivovaní akéhokoľvek média je to, čo sa kurátor rozhodne zahrnúť.
Zálohuje sa množstvo webových stránok, ale nie všetko, vyberanie stránok , ktoré sa oplatí uchovať stojí neskutočné množstvo úsilia. Internet je jednoducho príliš rozsiahly na zachovanie všetkého v plnom rozsahu. Je to formát, ktorý sa neustále mení.

technologie

Avšak nemôžme dovoliť cenzúre alebo niekomu, aby odstraňoval stránky, ktoré sa mu nepáčia, preto uchová tieto materiály v bezpečí, a aj napriek tomu, že sú súkromné sú neustále dostupné.
Ak chceme vedieť, čo sa stalo pred 10 rokmi, pred dvadsiatimi rokmi je internet často jediným záznamom.  

Vo vnútri internetového archívu
Ohodnoťte příspěvek