FERRAMENTAS LINUX: A Mozilla lança o DeepSpeech 0.6 com um melhor desempenho, mecanismo de fala para texto mais enxuto

domingo, 8 de dezembro de 2019

A Mozilla lança o DeepSpeech 0.6 com um melhor desempenho, mecanismo de fala para texto mais enxuto



Confira !!



Um dos projetos paralelos que a Mozilla continua desenvolvendo é o DeepSpeech, um mecanismo de fala para texto derivado de pesquisas do Baidu e construído no TensorFlow com aceleração de CPU e NVIDIA CUDA. Esta semana marcou o lançamento do Mozilla DeepSpeech 0.6 com otimizações de desempenho, construção do Windows, iluminação dos modelos de idiomas e outras alterações.

O DeepSpeech 0.6 atingiu atualmente uma taxa de erro de palavra de 7,5% para este mecanismo de fala para texto de código aberto. A nova versão apresenta várias alterações de API, melhor desempenho do treinamento com o suporte TDNORNow 1.14 cuDNN RNN para seu gráfico de treinamento, reduziu seu modelo de idioma para usar as 500 mil palavras mais importantes, adicionando várias técnicas de aumento de dados, uma ferramenta para transcrição em massa de arquivos de áudio grandes, e várias outras mudanças.

Aqueles que desejam experimentar o DeepSpeech 0.6 para transcrever fala de arquivos de áudio podem pegar as versões binárias do GitHub . No blog Mozilla Hacks, também há mais detalhes sobre as melhorias do DeepSpeech 0.6. Na minha lista de tarefas, ver também se o DeepSpeech 0.6 pode funcionar bem como outro benchmark do Phoronix Test Suite. ( Atualização: O DeepSpeech agora está disponível como perfil de teste do PTS / OpenBenchmarking.org .)

Fonte

Até a próxima !!

Nenhum comentário:

Postar um comentário