FERRAMENTAS LINUX: O Tesseract 5.0 foi lançado para este mecanismo líder de OCR de código aberto

quinta-feira, 2 de dezembro de 2021

O Tesseract 5.0 foi lançado para este mecanismo líder de OCR de código aberto


 Confira !


O tão aguardado Tesseract 5.0 está agora disponível como uma grande atualização para este mecanismo líder de reconhecimento óptico de caracteres (OCR) de código aberto que via redes neurais oferece grande precisão e suporta mais de 100 idiomas para transformar imagens de texto em texto real.

O Tesseract 5.0 estava disponível como alfa desde o final de 2020 e o beta do Tesseract foi lançado em agosto. Na terça-feira, o Tesseract 5.0.0 foi lançado oficialmente. O Tesseract 5.0 oferece desempenho mais rápido por meio de "flutuadores rápidos" para usar flutuadores em vez de duplos agora para seu treinamento de modelo LSTM e reconhecimento de texto. Isso deve levar a um treinamento e desempenho de OCR muito mais rápidos, usando menos memória do sistema.

O Tesseract 5.0 também tem suporte nativo para Apple Silicon, melhorias no sistema de construção, melhorias na API para sua biblioteca, melhor suporte ARM e muito mais. Existem também outras melhorias de código além de flutuações rápidas que devem ajudar ainda mais o desempenho de OCR do Tesseract.

O desenvolvimento do Tesseract se originou na HP décadas atrás antes de ser open-source em 2005. O Google assumiu o desenvolvimento deste mecanismo de OCR depois que ele foi open-source, mas em 2018 eles pararam de contribuir tanto para o esforço, o que parece ser em parte o motivo do Tesseract 5.0 ter feito isso anseia por se materializar. Muitas das atividades recentes de Tesseract foram feitas por Stefan Weil, do UB Mannheim.

Os downloads do Tesseract 5.0 e mais detalhes sobre esta grande atualização de OCR de código aberto via GitHub 





Fonte

Até a próxima !!.

Nenhum comentário:

Postar um comentário