FERRAMENTAS LINUX: A Engine Tesseract 5.0 OCR está trazendo um desempenho mais rápido com os "Fast Floats"

terça-feira, 17 de agosto de 2021

A Engine Tesseract 5.0 OCR está trazendo um desempenho mais rápido com os "Fast Floats"

 

Confira !


O Tesseract é o principal mecanismo de reconhecimento óptico de caracteres (OCR) de código aberto que emprega redes neurais para converter imagens / digitalizações de texto em texto reconhecido real está se aproximando de seu lançamento 5.0.

O Tesseract 5.0 Alpha está disponível desde o final do ano passado, enquanto este fim de semana foi marcado o primeiro beta do Tesseract 5.0. As versões anteriores do Tesseract 5.0 Alpha trouxeram desempenho aprimorado, suporte para Apple Silicon, melhorias no sistema de construção, uma revisão em sua API pública e muitas melhorias de código.

O Tesseract 5.0 Beta de ontem trouxe mais trabalho de modernização de código, melhorou o uso do ARM NEON e muito mais.

Indiscutivelmente mais empolgante com o Tesseract 5.0 Beta é o suporte para o uso de flutuadores para treinamento de modelo LSTM e reconhecimento de texto. Tradicionalmente, o mecanismo de OCR do Tesseract depende de duplos, mas ao ativar a nova opção de "flutuação rápida" no momento da construção, os flutuadores podem ser usados ​​em seu lugar. Por sua vez, espera-se que isso leve a um treinamento e desempenho de OCR mais rápidos, ao mesmo tempo que exige menos memória do sistema do que as versões anteriores do Tesseract ou ao construir o Tesseract sem o recurso de flutuação rápida habilitado.

Os testes feitos por desenvolvedores do Tesseract descobriram que o modo de flutuação rápida está gerando operações de produto escalar cerca de 50% mais rápidas, enquanto outras operações também devem se beneficiar deste novo modo no Tesseract 5.0. Existem também mais otimizações de flutuação rápida pendentes, incluindo em torno de AVX / AVX-512.

Mais detalhes sobre a versão Beta do Tesseract 5.0 via GitHub .






Fonte

Até a próxima !!

Nenhum comentário:

Postar um comentário