Press Room

Press Room

AMD a anunțat lansarea noului accelerator AMD Instinct™ MI100 - cel mai rapid GPU HPC din lume și primul GPU pentru server x86 care depășește bariera de performanță a celor 10 teraflops (FP64). Fiind suportat de HPE și Supermicro, acceleratoarele MI100, în combinație cu procesoare AMD EPYC și platforma open software ROCm™ 4.0, sunt concepute pentru a propulsa noi descoperiri în era exascale.

Construită cu ajutorul noii arhitecturi AMD CDNA, GPU-ul AMD Instinct MI100 permite o nouă clasă de sisteme accelerate pentru HPC și AI atunci când este asociat cu procesoare AMD EPYC de a doua generație.

MI100 oferă până la 11,5 TFLOPS performanță de vârf în FP64 pentru HPC și până la 46,1 TFLOPS în FP32 Matrix performanță de vârf pentru AI și sarcini de lucru de machine learning. Cu noua tehnologie AMD Matrix Core, MI100 oferă, de asemenea, o creștere de aproape 7 ori în performanța teoretică de vârf FP16 pentru sarcini de lucru de formare AI, comparativ cu acceleratoarele de generație anterioară ale AMD.

Software-ul de dezvoltator AMD ROCm oferă baza pentru calculul exascale. Ca un set de instrumente open source format din compilers, API-uri de programare și biblioteci, ROCm este utilizat de dezvoltatorii de software exascale pentru a crea aplicații de înaltă performanță.

ROCm 4.0 a fost optimizat pentru a oferi performanțe scalabile pentru sistemele bazate pe MI100. ROCm 4.0 a actualizat compiler-ul pentru a fi open source și unificat, pentru a suporta atât OpenMP® 5.0, cât și HIP. Framework-urile PyTorch și Tensorflow, care au fost optimizate cu ROCm 4.0, pot obține acum performanțe mai mari cu MI100. ROCm 4.0 este cea mai recentă ofertă pentru dezvoltatorii de aplicații HPC, ML și AI, cărora le permite să creeze software portabil de performanță.

Capabilitățile și caracteristicile cheie ale acceleratorului AMD Instinct MI100 includ:

  • Noua arhitectură AMD CDNA - Proiectată pentru a alimenta GPU-urile AMD pentru era exascale, fiind în centrul acceleratorului MI100, arhitectura AMD CDNA oferă performanțe excepționale și eficiență energetică
  • Performanță FP64 și FP32 de top pentru sarcinile de lucru HPC – oferă performanțe de vârf FP64 de 11,5 TFLOPS și performanțe de vârf FP32 de 23,1 TFLOPS, permițând oamenilor de știință și cercetătorilor din întreaga lume să accelereze descoperirile din varii industrii, inclusiv biologie, energie, finanțe, ştiinţe fundamentale, apărare.
  • Noua tehnologie Matrix Core pentru HPC și AI – performanță deosebită pentru o gamă completă de operații cu matrice de precizie unică și mixtă, cum ar fi FP32, FP16, bFloat16, Int8 și Int4, proiectate pentru a spori convergența în HPC și AI.
  • Tehnologia AMD Infinity Fabric™ de a doua generație - Instinct MI100 oferă lățimea de bandă agregată I/O de vârf peer-to-peer (P2P) peste PCIe® 4.0 de până la 340GB/s pe card cu trei AMD Infinity Fabric™ Links. Într-un server, GPU-urile MI100 pot fi configurate cu până la două „hive”-uri GPU quad complet conectate, fiecare furnizând până la 552 GB/s de lățime de bandă P2P I/O pentru partajarea rapidă a datelor.
  • Memorie HBM2 ultrarapidă - Dispune de memorie HBM2 cu lățime de bandă de 32 GB la o rată de clock de 1,2 GHz și oferă o lățime de bandă de memorie foarte mare de 1,23 TB/s pentru a susține seturi mari de date și pentru a ajuta la eliminarea blocajelor la transferul datelor din memorie.
  • Suport pentru cel mai recent PCIe® Gen 4.0 din industrie – proiectat cu cea mai recentă tehnologie PCIe Gen 4.0 care oferă până la 64 GB/s lățime teoretică de bandă pentru transportul datelor de la CPU la GPU.

Specificații MI100

Compute Units

Stream Processors

FP64 TFLOPS (Peak)

FP32 TFLOPS (Peak)

FP32 Matrix TFLOPS

(Peak)

FP16/FP16 Matrix
TFLOPS

(Peak)

INT4 | INT8 TOPS

(Peak)

bFloat16 TFLOPs

(Peak)

HBM2
ECC
Memory

Memory Bandwidth

120

7680

Up to 11.5

Up to 23.1

Up to 46.1

Up to 184.6

Up to 184.6

Up to 92.3 TFLOPS

32GB

Up to 1.23 TB/s

Suntem la dispozitia dumneavoastra !
Aveti nevoie de ajutor ?