FERRAMENTAS LINUX: O Compilador Intel oneAPI DPC ++ 2020-08 foi lançado com a extensão SIMD explícita

sexta-feira, 21 de agosto de 2020

O Compilador Intel oneAPI DPC ++ 2020-08 foi lançado com a extensão SIMD explícita




Confira !



Junto com esta semana marcando o lançamento de oneAPI Level Zero 1.0, o compilador oneAPI Data Parallel C ++ viu seu mais novo lançamento marcado.

O Intel oneAPI DPC ++ Compiler é o compilador baseado em LLVM da empresa em torno de sua iniciativa Data Parallel C ++ para um API construído sobre o padrão de programação de fonte única SYCL da Khronos e ISO C ++. Com o oneAPI DPC ++ Compiler 2020-08, uma das adições mais significativas é a introdução da extensão Intel Explicit SIMD para ajuste de otimização de desempenho de GPU de baixo nível. Esta extensão SIMD explícita é para os desenvolvedores que tentam escrever seu próprio código otimizado à mão, em vez de esperar que o compilador otimize de forma mais eficaz. O modo SIMD explícito permite a vetorização manual do código do dispositivo não dependente das habilidades de otimização do compilador e também fornece novas APIs de baixo nível que mapeiam muito bem para o hardware gráfico Intel Gen.

A versão DPC ++ 2020-08 também adiciona uma nova extensão SYCL (SYCL_INTEL_usm_address_spaces) fornecendo dois novos espaços de endereço e são adicionados para fornecer informações de otimização para seu compilador. A partir da especificação provisória, "O objetivo dessa divisão do espaço de endereço global é permitir que os usuários digam explicitamente ao compilador em qual espaço de endereço um ponteiro reside para fins de otimização. Embora a inferência automática de espaço de endereço seja frequentemente possível para os acessadores, é mais difícil para os ponteiros USM, pois requer otimização entre procedimentos com o código do host. Essas informações adicionais podem ser particularmente benéficas em alvos FPGA, onde saber que um ponteiro acessa apenas a memória do host ou do dispositivo pode permitir que os compiladores produzam um hardware de acesso à memória com maior eficiência de área. "

Outra extensão SYCL adicionada é INTEL_use_pinned_host_memory para utilizar memória de host fixada. Também há suporte para outros elementos da especificação provisória Khronos SYCL 2020. O oneAPI Data Parallel C ++ Compiler 2020-08 também tem uma série de melhorias em seu back-end NVIDIA CUDA, o pipeline de otimização padrão para o código do dispositivo agora está habilitado por padrão (um novo sinalizador adicionado para desabilitar), várias melhorias na biblioteca, e muitas correções de bugs.

Mais detalhes sobre a atualização do compilador DPC ++ baseado em LLVM deste mês via GitHub .

Fonte

Até a apróxima !!

Nenhum comentário:

Postar um comentário