nvidia tem publicou uma análise detalhada de sua próxima geração Grace CPU Superchipque superaria AMD EPYC CPUs em até 2,5 vezes.
A CPU Grace e os projetos de Superchip relacionados foram inicialmente introduzidos pela NVIDIA em GTC 2022. O Grace CPU é o primeiro processador da NVIDIA construído em um único BRAÇO arquitetura e é voltado para os mercados de servidor e computação de alto desempenho. Duas configurações diferentes de Superchip estão disponíveis para a CPU: um módulo Grace Superchip com duas CPUs Grace e um Grace+Hopper Superchip com uma CPU Grace acoplada a um Tremonha H100 GPU.
Grace, a primeira CPU de servidor da NVIDIA, possui 72 ARM v9.0 núcleos e suportes SVE2bem como várias extensões de virtualização, incluindo Virtualização aninhada e S-EL2. o 4N nó de processo de TSMCuma melhoria 5nm nó de fabricação projetado especificamente para NVIDIA, é usado para fabricar a CPU. Pico FP64 desempenho na nova arquitetura pode atingir até 7.1 TFLOPs.
da graça C2C A interface (Chip-To-Chip) é uma das características mais importantes do design, uma vez que se destina a ser usada em pares. A Grace faz isso eliminando todos os gargalos conectados a um arranjo tradicional de soquetes cruzados usando NVLINK, que é utilizado para criar os Superchips. A conexão C2C NVLINK opera em uma interface de energia muito baixa de apenas 1,3 pJ/bit ou 5 vezes mais eficiente do que o protocolo PCIe e oferece 900 GB/s de largura de banda bidirecional bruta. Aqui está uma tabela resumida das especificações do Grace Superchip da NVIDIA:
Recursos da arquitetura NVIDIA Grace CPU Superchip | |
Arquitetura principal | Núcleos Neoverse V2: Armv9 com 4x128b SVE2 |
Contagem de núcleos | 144 |
Cache | L1: 64 KB I-cache + 64 KB D-cache por núcleo L2: 1 MB por núcleo L3: 234 MB por superchip |
tecnologia de memória | LPDDR5X com ECC, co-embalado |
Memória bruta BW | Até 1 TB/s |
Tamanho da memória | Até 960GB |
pico FP64 | 7.1 TFLOPS |
PCI expresso | 8x interfaces PCIe Gen 5 x16; opção para bifurcar largura de banda PCIe total de 1 TB/s. Conectividade PCIe adicional de baixa velocidade para gerenciamento. |
Poder | TDP de 500 W com memória, alimentação de 12 V |
O Grace CPU Superchip compete contra AMD de soquete duplo (2P) EPYC 7763 “Milão” CPUs em termos de desempenho em uma variedade de aplicativos HPC, incluindo OpenFOAM, WRF, NEMOe BWA. O Grace CPU Superchip fornece uma incrível 2,5x ganho de velocidade com até 3,5x eficiência no OpenFOAM. Quando comparado aos CPUs EPYC Milan da AMD, o novo Grace CPU Superchip da NVIDIA deve ser capaz de obter ganhos de desempenho de 1,9x e 2,57x por watt, respectivamente. Em comparação com os CPUs de servidor mais recentes da AMD e Intel, isso também deve resultar em desempenho comparável.

De acordo com a NVIDIA, o processador Grace é altamente especializado e destina-se a tarefas como treinar modelos de NLP de última geração com mais de um trilhão de parâmetros. Um sistema baseado em CPU Grace funcionará 10 vezes mais rápido do que os sistemas baseados em NVIDIA DGX mais avançados disponíveis hoje quando firmemente emparelhado com GPUs NVIDIA. Embora quando forem lançados, estarão competindo com o Genoa da AMD e Sapphire Rapids da Intel CPUs, será fascinante ver como as CPUs Grace se comportam versus x86 processadores.