Lembra quando a internet brasileira tinha nomes como Cadê, ZAZ e América Online? E lembra do webdesign anos 90 em sites como Universo Online, Zipmail e outros? Você pode reviver estes momentos com a Wayback Machine. Todos os grandes sites antigos estão guardados no Internet Archive, que esta semana ultrapassou 10 petabytes.

Este marco é um número enorme, levando em consideração que o Internet Archive escolhe o que vai guardar para a posteridade. Servidores do Facebook, Google e Dropbox devem guardar tanto ou mais dados, mas quanto disso é de fato relevante?

O Internet Archive guarda tudo em data centers com vários racks, chamados de Petabox, que armazenam até 650TB cada. Além da Wayback Machine, a entidade fornece um arquivo de 80 terabytes que capturou o conteúdo de 2,3 bilhões de URLs. Eles oferecem este conteúdo de forma experimental, para “explorar como outros podem interagir com este conteúdo ou aprender com ele”.

Mas 10 petabytes talvez sejam pouco em alguns anos, à medida que a internet explode em tamanho. Espero que o Internet Archive consigam manter o ritmo. De um jeito ou de outro, isso faz sua coleção de pornô com 1TB parecer quase insignificante, não? [The Internet Archive via Reddit via Gizmodo US]