Cientistas da FCUL criam projecto para arquivar a Web portuguesa

Cientistas da FCUL criam projecto para arquivar a Web portuguesa

O Tomba tem como missão recolher e arquivar todos os conteúdos Web nacionais. Projecto de biblioteca "on-line" premiado na Europa.

Um grupo de três investigadores da Faculdade de Ciências da Universidade de Lisboa (FCUL) desenvolveu um protótipo, chamado Tomba, que visa reunir e arquivar toda a informação contida na Web portuguesa.

Neste momento, o arquivo congrega 57 milhões de documentos num total de 1,5 milhões de megabytes. É possível consultar versões antigas de um "site" recolhidas pelo Tumba, o motor de pesquisa dedicado a conteúdos nacionais lançado em 2001 pelos mesmos investigadores, do grupo XLDB, do departamento de Informática da FCUL.

Mário Silva, docente da faculdade, Daniel Gomes, aluno de doutoramento, e Sérgio Freitas, aluno de mestrado, lançaram no ano passado o protótipo de arquivo da Web nacional. Agora, defendem que o Tomba deve ser continuado de forma institucional, criando uma instituição com edifício próprio e funcionários permanentes.

Depois de desenvolverem investigação sobre motores de pesquisa, o grupo de cientistas preocupou-se com a necessidade de "organizar os conteúdos no tempo" e elaborou o Tomba, "uma forma de arquivo cronológico de documentos da Web", explica ao JPN Mário Silva.

O armazenamento de páginas Web é apenas "um projecto de investigação"; agora é necessário "planear acções de implementação". A Fundação para a Computação Científica Nacional disponibiliza os recursos de hardware e alojamento do Tumba, mas o Tomba não tem ainda financiamento próprio.

Memória da Web portuguesa

A criação deste arquivo nacional permite "preservar a nossa cultura que, com o aparecimento da internet, se perdeu para a Web", afirma o professor da FCUL.

O Tomba quer "impedir o desaparecimento de conteúdos", uma preocupação que já é "comum em países do norte da Europa e América", conclui o investigador. O norte-americano Internet Archive, por exemplo, apoiado pela Biblioteca do Congresso, dedica-se a manter um arquivo de páginas Web e recursos multimédia.

O Tomba agrega páginas Web indexadas pelo Tumba desde 2002, mas os objectivos e funcionalidades de ambos distinguem-se. "O Tomba é um arquivo histórico, enquanto o Tumba consiste numa última actualização da Web". "A infra-estrutura que suporta os dois é mesma, o que difere é o interface", explica Mário Silva.

Em Setembro, o grupo de investigadores foi premiado na Conferência Europeia sobre Investigação e Tecnologia Avançada para Bibliotecas Digitais. Para Mário Silva, o prémio simboliza o "reconhecimento do trabalho desenvolvido durante cinco anos no campo da investigação".

Sandra Pinto
lj04061 @ icicom.up.pt
Votar:
  • a
Pontos: 0 | Classificação: 0
Em resposta ao comentário de Luís Gomes Por Luís Gomes
28.11.2006 - 16:12

Projecto muito interessante e relevante num futuro próximo. Cada vez mais, a Web é um suporte de informação por excelência, porém tem um problema: a sua uma natureza extremamente perecível.

Os comentários para esta entrada estão fechados.

zon startup pirates obciber noticiasup cdm parglobal ryanair

Logo da Creative Commons ERC ISSN 1646-3064