A FABULOSA BIBLIOTECA DA WEB
É simples e prático. Basta digitar o endereço de um site que se perdeu no tempo e no espaço, digamos, há dez anos atrás, e ele, imediatamente, surge à sua frente.
A novidade faz parte de uma ousadia: a criação de uma superbiblioteca virtual, na qual será guardado todo o conteúdo online. Pelo menos é a promessa do Internet Archive, empresa norte-americana sem fins lucrativos.
O Internet Archive começou em 1996, por iniciativa de Brewster Kahle, 41 anos, engenheiro formado pelo MIT (Massachusetts Institute of Technology). Ele teve a idéia, depois de verificar que não existem registros históricos sobre as primeiras emissoras de televisão. “E o que será da memória da Web?”, ele pensou.
“Percebi que os documentos online – muitos deles valiosíssimos – podem, por alguma razão, desaparecer depois de 75 dias. E resolvi impedir que isso acontecesse.
Foi então que ele vendeu seu WAIS (Wide Area Information Server), uma espécie de editora eletrônica, para a America Online, que lhe pagou 15 milhões de dólares.
Kahle pegou o dinheiro, pediu ajuda de Bruce Gilliat, seu colega do MIT, e investiu no projeto que tinha na cabeça.
Primeiro, ele construiu o Alexa, software que analisa tendências de uso da Internet, fornecendo informações sobre qualquer site, como tempo de existência, seu criador, popularidade, velocidade e as páginas relacionadas à sua temática.
O Alexa (o nome é uma homenagem à famosa Biblioteca de Alexandria, jóia cultural do século III a.C), dança conforme a música, isto é, desenvolve novas ferramentas à medida que sua tecnologia é aperfeiçoada.
Uma de suas mais recentes façanhas é o serviço de ranking de sites. Agora não é preciso mais fazer uma busca de cada site de universidades norte-americanas para saber qual é o mais visitado.
É só ir na categoria Colleges (universidades) e descobrir que o mais popular é o MIT (Massachusetts Institute of Technology), seguido da Stanford University e da University of Pennsylvania.
De acordo com Kahle, mais de 80 milhões de sites já foram fisgados pelo Alexa, que atualmente conta com 700 mil usuários. E é a partir desse imenso catálogo que se alimenta o Internet Archive.
Em outubro de 2001, o Internet Archive comemorou seu quinto aniversário com o lançamento da Wayback Machine (nome da máquina do tempo de Rocky and Bullwinkle, desenho animado dos anos 60), serviço gratuito que dá a qualquer internauta acesso a páginas antigas da Web.
A Wayback Machine tem mais de 100 terabytes de dados - o que corresponde a mais de 10 bilhões de páginas - , que estão guardados em 400 servidores instalados no subsolo do prédio número 37 do Presídio National Park, em São Francisco, na Califórnia.
Seu acervo cresce à razão de 12 terabytes por mês (120 milhões de páginas) e, a cada seis semanas, os pesquisadores do Internet Archive coletam uma amostra do que aparece de novo na Internet.
“É uma tarefa árdua, pois, da mesma forma que “A Biblioteca de Babel”, sonhada pelo escritor Jorge Luiz Borges, a Wayback Machine nunca será completa, uma vez que a uma lista mais recente são adicionadas outras. E mais outras. E assim por diante”, esclarece Kahl.
Não só isso. Há uma série de problemas complicados, um dos quais é a restrição de acesso imposta por muitos sites. Há também limitações de ordem tecnológica e de espaço, que tornam muito difícil armazenar novos formatos de arquivos como os de áudio e vídeo. E a largura de banda, ainda pequena, impede que os downloads das páginas sejam feitos com rapidez.
De qualquer forma, entrar na Wayback Machine é uma aventura e tanto. Lembra, por exemplo, de como era a Amazon.com em seus primórdios? Volte a outubro de 1996.
Lá está ela, com sua home bem timida - fundo branco, links azuis básicos, poucas fotos e algumas resenhas de livros. Hoje, como se pode ver, é um portento de loja virtual. Curioso é o Netscape.com de novembro de 1997, um site linear, mal desenhado, que anunciava a versão 3.0 do navegador que perdeu a posição de líder para o Internet Explorer.
E o Yahoo! Criado em 1994, em um trailer na Universidade de Stanford por dois de seus alunos, o site deu as cartas na Web. Em 1996, ele tinha um menu modesto, o layout da época quase não mudou ao longo dos anos. Vale a pena pegar a Wayback Machine e dar um pulinho ao passado para conferir.
Notável é a preservação da primeira Webcam, criada em 1991, por pesquisadores do laboratório de computação de Cambridge e que transmitia a agitação da cafeteria da universidade. O sistema sobreviveu até 22 de agosto do ano passado, quando foi definitivamente desativado. Mas dezenas de suas imagens ainda podem ser vistas na Wayback Machine.
O Internet Archive, como um todo, conserva também cerca de 5 mil páginas sobre a Arpanet, a rede militar surgida em 1969 e que deu origem à Internet. Há ainda coleções especiais, como a dos sites relacionados com os atentados de 11 de setembro, nos Estados Unidos, acervo de filmes históricos e coleções do museu do Smithsonian Institute.
A iniciativa do Internet Archive produziu rebentos. O Google, o mais utilizado mecanismo de busca do momento, integrou os últimos 20 anos de arquivos da Usenet (grupos de discussão) aos Google Groups – são mais de 700 milhões de mensagens e artigos que circularam pela Rede, a partir de 1981.
Trata-se de um fascinante registro da vida no ciberespaço. Como prova esta mensagem, postada em 1991, no grupo alt.hipertex:
“O projeto WWW serve-se das técnicas do hipertexto para formar um simples mas poderoso sistema de informação global. Sua filosofia é a de que ele esteja ao alcance de qualquer um”. Era o embrião da Web, anunciado, nada mais, nada menos, por seu criador, Tim Berners-Lee.
Por João Magalhâes
1 comentário:
Amei.... está barbaro!
bj
Beth
Enviar um comentário