FERRAMENTAS LINUX: Foi lançado o OCRmyPDF 15.0 para fazer o reconhecimento óptico de caracteres de arquivos PDF

terça-feira, 26 de setembro de 2023

Foi lançado o OCRmyPDF 15.0 para fazer o reconhecimento óptico de caracteres de arquivos PDF


A última versão do OCRmyPDF, o OCRmyPDF v15, trouxe várias melhorias e atualizações significativas para este projeto de código aberto que adiciona reconhecimento óptico de caracteres (OCR) a arquivos PDF digitalizados, permitindo que eles sejam pesquisáveis e que o texto possa ser copiado e colado. 

Abaixo estão algumas das principais mudanças e atualizações na versão 15:


Requisitos Python atualizados: O OCRmyPDF 15 atualizou seus requisitos Python, garantindo que o projeto esteja alinhado com as versões mais recentes da linguagem.

Suporte de arquitetura: A versão 15 abandonou o suporte para sistemas Windows e Linux de 32 bits, agora oferecendo suporte apenas para sistemas operacionais de 64 bits. Isso se deve ao fato de muitas dependências do projeto também terem migrado para versões de 64 bits.

Uso do Tesseract: O OCRmyPDF continua a usar o mecanismo de OCR Tesseract, que é amplamente reconhecido por sua precisão e qualidade no reconhecimento de texto em documentos digitalizados.

Melhorias de desempenho: A versão 15 traz várias melhorias de desempenho, tornando o processo de OCR mais rápido e eficiente.

Atualizações para pacote Snap: O projeto também trouxe atualizações para seu pacote Snap, tornando-o mais acessível e fácil de instalar em sistemas que suportam esse formato de empacotamento.

Correção de bugs: Foram corrigidos bugs relacionados a PDFs em que apenas uma pequena parte de uma imagem em uma página tinha uma resolução mais alta, melhorando a qualidade do OCR em tais casos.

Essas atualizações e melhorias tornam o OCRmyPDF v15 uma ferramenta ainda mais poderosa e eficaz para trabalhar com documentos PDF digitalizados, tornando-os pesquisáveis e permitindo a cópia do texto. Esta é uma ótima notícia para quem precisa lidar com documentos digitalizados com frequência, pois facilita o acesso ao conteúdo desses arquivos. 

A versão está disponível para download no GitHub para aqueles que desejam utilizá-la em seus projetos ou fluxos de trabalho.






Fonte 

Até a próxima !!

Nenhum comentário:

Postar um comentário