1.10.12

Internet Archive já soma 150 bilhões de sites

Internet Archive já soma 150 bilhões de sites


Ferramenta que "volta no tempo" e mostra versões de páginas como elas eram é o serviço mais popular do portal



Arquivo digital on-line, criado em 1996, reúne também mais de 6 milhões de documentos de texto, áudio e vídeo



Lianne Milton - 21.fev.2012/"The New York Times"

Brewster Kahle, fundador do Internet Archive, manuseia livro no arquivo físico da instituição
DE SÃO PAULO
O projeto mais ambicioso e que atrai mais visitantes ao Internet Archive é o Wayback Machine, espécie de radiografia do passado da web. Por meio de robôs, o site varre grande parte das páginas on-line e guarda cópias -24 horas por dia, desde 1996.

Hoje, é possível acessar pouco mais de 150 bilhões de sites antigos. O intuito, diz o fundador Brewster Kahle, é preservar a memória. "A internet é um registro de nosso tempo." Páginas que impedem a varrição por robôs, como o Facebook, não aparecem na ferramenta.

O Wayback Machine é uma das divisões do Internet Archive, que separa seus sistemas de busca por tipo de arquivo. Há textos, vídeos, música ao vivo e, com o TV News, programas jornalísticos da televisão. No total, são 6 milhões de documentos.

Inspirado na biblioteca visual da Universidade Vanderbilt, em Nashville (EUA), o TV News é pioneiro ao disponibilizar jornalísticos de maneira organizada e on-line.

"A Vanderbilt é a avó dos arquivos de TV nos Estados Unidos", diz Kahle. No entanto, o acervo da universidade, gravado desde 1968, possui apenas um sumário na rede. Para assistir ao material é preciso pagar uma taxa para recebê-lo em DVD, pelo correio.

A experiência foi importante para definir legislação em relação a direitos autorais. Em 1972, a rede de TV CBS processou a Vanderbilt e foi derrotada. "Desde então, podemos disponibilizar os vídeos da TV, desde que o acesso seja público", explica John Lynch, diretor da biblioteca.

ANTIGUIDADES

No caso dos livros, estão à disposição somente obras em domínio público segundo as leis americanas -ou seja, volumes com mais de 70 anos. Por meio de convênios com bibliotecas públicas e particulares, o Internet Archive financia a digitalização em troca de acesso às obras.

Desde 2010, outra iniciativa, a DPLA (Biblioteca Digital Pública da América, em inglês), negocia com donos de direitos autorais uma forma de acesso gratuito e on-line a ao menos parte de todas as obras lançadas nos EUA.

"A ideia final é realizar uma aliança de associações privadas e fazer uma biblioteca disponível para todas as pessoas", explicou o historiador Robert Darnton, diretor da biblioteca de Harvard e principal mentor do projeto, em visita à Folha em maio.

O processo de escaneamento de livros é custoso. Primeiro, é analisado o estado de conservação da obra. Em seguida, deve-se escolher o formato do arquivo para, então, começar a digitalização.

Além da complexidade técnica, o custo é o principal empecilho para o aumento do número de bibliotecas digitais no Brasil. "À medida que surgirem softwares gratuitos [de digitalização], a tendência é que haja mais bibliotecas", diz Fernando Modesto, professor do Departamento de Biblioteconomia e Documentação da USP.

Na própria instituição há um centro de escaneamento de obras antigas. A biblioteca Brasiliana surgiu a partir do acervo pessoal do empresário e bibliófilo José Mindlin, morto em 2010. Por meio do site brasiliana.usp.br, já é possível acessar e baixar parte dos livros.

(ALEXANDRE ARAGÃO)

Fonte: Folha de São Pauli 01/10/2012

Sem comentários: