FERRAMENTAS LINUX: Uma nova versão do OpenBLAS já está disponível, a implementação de código aberto BLAS e LAPACK conhecida por sua ampla variedade de otimizações de processador.

quarta-feira, 29 de março de 2023

Uma nova versão do OpenBLAS já está disponível, a implementação de código aberto BLAS e LAPACK conhecida por sua ampla variedade de otimizações de processador.

 



Voltando ao final de 2021, foi o patch inicial do compilador GCC para "Ampere-1" para o processador de servidor AArch64 de última geração, enquanto no ano passado este sucessor do Ampere Altra (Max) foi formalmente anunciado sob a marca AmpereOne . Esse suporte inicial ao compilador apareceu no GCC 12, enquanto antes do lançamento do GCC 13 nas próximas semanas houve alguns ajustes de última hora para a tabela de custos do AmpereOne.



Philipp Tomsich obteve hoje uma informação de custo de vetorização AmpereOne (Ampere1) atualizada para o compilador GCC 13. Ele explicou naquele commit :

O envio original dos custos do AmpereOne (-mcpu=ampere1) ocorreu antes do teste exaustivo de cargas de trabalho vetorizáveis ​​em relação ao hardware.

Ajuste os custos do vetor para obter os melhores resultados e corresponder mais de perto ao hardware subjacente.

As informações de custos de vetorização atualizadas para AmpereOne reduzem pela metade o custo de armazenamento, diminuem os custos de carga alinhada/desalinhada de 5 para 4 e outras reduções, mas aumentam o custo escalar de ponto flutuante de 1 para 3. Resumindo, alguns ajustes de última hora para o AmpereOne

foram entrou no GCC 13 antes do próximo lançamento estável do GCC 13.1 nas próximas semanas para beneficiar aqueles que podem estar visando -march=ampere1 para desempenho otimizado nesses processadores Ampere Computing. O GCC 13 também apresenta uma nova variante Ampere-1A entre as muitas mudanças neste lançamento anual de recursos do compilador de código aberto.

O AmpereOne é a competição AArch64 da Ampere Computing para empresas como AMD 4th Gen EPYC "Genoa" e Intel Sapphire Rapids com fabricação 5nm TSMC, memória do sistema DDR5, PCIe 5.0 e muitas outras melhorias no espaço do chip do servidor Arm. O AmpereOne deveria ser lançado originalmente em 2022, mas até agora não foi oficialmente revelado.






Fonte

Até a próxima !!

Nenhum comentário:

Postar um comentário