terça-feira, 28 de junho de 2011

Aperture: Framework JAVA para Extração Completa de Conteúdo e Metadados

Aperture é um framework Java para a extração e consulta completa de conteúdo e metadados de diversos sistemas de informação (ex. sistemas de arquivos, sites da web, caixas de e-mail ) e os formatos de arquivo (documentos, imagens) que podem ser encontrados com maior frequência nestes sistemas.

Simplificando, o Aperture é uma biblioteca em JAVA de rastreamento e indexação de fontes de informação, tais como sistemas de arquivos, sites e caixas de correio. Ele suporta um número de tipos de fonte comum, e formatos de documentos out-of-the-box, além de oferecer maneiras fáceis de estendê-lo com implementações personalizadas. O código de abertura é constituído por um número de elementos importantes relacionados, mas de forma independentemente utilizável.

Dessa forma, verificamos que o framework além de realizar rastreamentos de dados, faz identificação do type MIME, texto completo e extração de metadados de vários formatos de arquivo além de expansão de recursos rastreados. Para cada uma dessas funcionalidades, um conjunto de APIs foi desenvolvido e uma série de implementações é fornecida juntamente com o utilitário.


Nenhum comentário:

Postar um comentário