O Tomba tem como missão recolher e arquivar todos os conteúdos Web nacionais. Projecto de biblioteca "on-line" premiado na Europa.
Um grupo de três investigadores da Faculdade de Ciências da Universidade de Lisboa (FCUL) desenvolveu um protótipo, chamado Tomba, que visa reunir e arquivar toda a informação contida na Web portuguesa.
Neste momento, o arquivo congrega 57 milhões de documentos num total de 1,5 milhões de megabytes. É possível consultar versões antigas de um "site" recolhidas pelo Tumba, o motor de pesquisa dedicado a conteúdos nacionais lançado em 2001 pelos mesmos investigadores, do grupo XLDB, do departamento de Informática da FCUL.
Mário Silva, docente da faculdade, Daniel Gomes, aluno de doutoramento, e Sérgio Freitas, aluno de mestrado, lançaram no ano passado o protótipo de arquivo da Web nacional. Agora, defendem que o Tomba deve ser continuado de forma institucional, criando uma instituição com edifício próprio e funcionários permanentes.
Depois de desenvolverem investigação sobre motores de pesquisa, o grupo de cientistas preocupou-se com a necessidade de "organizar os conteúdos no tempo" e elaborou o Tomba, "uma forma de arquivo cronológico de documentos da Web", explica ao JPN Mário Silva.
O armazenamento de páginas Web é apenas "um projecto de investigação"; agora é necessário "planear acções de implementação". A Fundação para a Computação Científica Nacional disponibiliza os recursos de hardware e alojamento do Tumba, mas o Tomba não tem ainda financiamento próprio.
A criação deste arquivo nacional permite "preservar a nossa cultura que, com o aparecimento da internet, se perdeu para a Web", afirma o professor da FCUL.
O Tomba quer "impedir o desaparecimento de conteúdos", uma preocupação que já é "comum em países do norte da Europa e América", conclui o investigador. O norte-americano Internet Archive, por exemplo, apoiado pela Biblioteca do Congresso, dedica-se a manter um arquivo de páginas Web e recursos multimédia.
O Tomba agrega páginas Web indexadas pelo Tumba desde 2002, mas os objectivos e funcionalidades de ambos distinguem-se. "O Tomba é um arquivo histórico, enquanto o Tumba consiste numa última actualização da Web". "A infra-estrutura que suporta os dois é mesma, o que difere é o interface", explica Mário Silva.
Em Setembro, o grupo de investigadores foi premiado na Conferência Europeia sobre Investigação e Tecnologia Avançada para Bibliotecas Digitais. Para Mário Silva, o prémio simboliza o "reconhecimento do trabalho desenvolvido durante cinco anos no campo da investigação".
Projecto muito interessante e relevante num futuro próximo. Cada vez mais, a Web é um suporte de informação por excelência, porém tem um problema: a sua uma natureza extremamente perecível.
Os comentários para esta entrada estão fechados.