Por dentro da Brasiliana USP: como funciona a digitalização de uma biblioteca de raridades

Dentro da Universidade de São Paulo, a Biblioteca Brasiliana Guita e José Mindlin foi criada em 2005. O prédio construído especialmente para receber o acervo do Dr. José Mindlin, que tem mais de 40 mil volumes, só ficou pronto no começo de 2013, mas a digitalização de seu acervo começou bem antes: em 2008, foi formada a equipe que seria responsável pelo projeto da Brasiliana USP, a versão digital da Mindlin, que foi ao ar em julho de 2009. A empreitada incluía também a criação de uma plataforma de software para disponibilizar o conteúdo, além de providenciar a parte de hardware, como scanners, servidores e storage. Fomos conhecer de perto o processo de digitalização de tantos volumes raros e históricos.  (…)  Leia íntegra na fonte: Gizmodo

SONY DSC

O objetivo é reduzir ao máximo o tamanho do arquivo e, ao mesmo tempo, garantir a legibilidade. Por isso, os arquivos em .pdf, cada um deles com cerca de 10MB, podem não ter exatamente a mesma cor das páginas do livro original, além de o contraste ser muito mais marcante.

269ejA última etapa é o reconhecimento dos caracteres. Se você já sofreu com um programa de OCR, sabe o quanto é difícil. Aqui o problema é ainda maior, como explica Gomi. “O OCR é ainda, digamos, um problema em aberto. Para textos impressos com caracteres modernos, ele reconhece com uma certa precisão, mas nós estamos aqui tratando de textos antigos, além de muitos manuscritos.”

Deixe um comentário

Arquivado em Ciência da Informação: Biblioteconomia e arquivologia

Deixe um comentário

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair /  Alterar )

Foto do Google

Você está comentando utilizando sua conta Google. Sair /  Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair /  Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair /  Alterar )

Conectando a %s