Hirdetés

Teljesen az AI-ra fókuszál az új AMD Instinct sorozat

Az MI350-es generáció beveti az új, CDNA 4-es architektúrát.

Az AMD hivatalosan is bejelentette Instinct MI350 sorozatú gyorsítóit, amelyek az eddig ismert chiplet dizájnt viszik tovább, komplex 3D-s összeköttetéssel. Az alapokat 2 darab 6 nm-es IO chiplet adja, amelyek tartalmazzák a memóriavezérlőt, a memóriacsatornákat, illetve az összesen 256 MB-os Infinity Cache-t. Ezeknek a chipleteknek a tetejére kerülnek közvetlenül a számítást végző lapkák. Az MI350 sorozat IO chipletenként négy, azaz összesen nyolc darab, 3 nm-es, N3P jelzésű TSMC node-on készülő XCD-t kínál.


[+]

Az XCD-k a CDNA 4 architektúrára épülnek, és egy XCD-ben fizikailag 36 darab multiprocesszor található, viszont nem mind lesz aktív. A memória tekintetében a dizájn 8192 bites memóriavezérlőt biztosít, amelyhez összesen nyolc darab HBM3E szabványú memóriastack kapcsolódik. Az összkapacitás így 288 GB, míg a memória-sávszélesség 8 TB/s lesz. A teljes hardver 185 milliárd tranzisztorból áll.

Hirdetés

[+]

Az AMD kétféle kiépítést alkalmaz majd, ezek pontos paramétereit az alábbi táblázat részletezi:

AMD Instinct MI350 sorozat (CDNA 4 architektúrával)
Típus MI350X MI355X
IO chipletek száma
2
XCD-k chipletek száma 8
XCD architektúra CDNA 4
Maximális XCD magórajel 2200 MHz 2400 MHz
Shader részelemek száma 16 384
Int4 számítási teljesítmény 4600 TOPS 5000 TOPS
Int8 számítási teljesítmény 4600 TOPS 5000 TOPS
FP8 számítási teljesítmény 4600 TFLOPS 5000 TFLOPS
bfloat16 számítási teljesítmény 2300 TFLOPS 2500 TFLOPS
FP16 számítási teljesítmény 2300 TFLOPS 2500 TFLOPS
FP32 mátrix számítási teljesítmény 144,2 TFLOPS 157,3 TFLOPS
FP64 mátrix számítási teljesítmény 72,1 TFLOPS 78,6 TFLOPS
FP32 számítási teljesítmény 144,2 TFLOPS 157,3 TFLOPS
FP64 számítási teljesítmény 72,1 TFLOPS 78,6 TFLOPS
Effektív memória-órajel 8000 MHz
Memória típusa HBM3E
Memóriabusz 8192 bit
VRAM kapacitása 288 GB
Memória-sávszélesség 8 TB/s
ECC támogatás
van
Maximális fogyasztási keret 1000 watt 1400 watt
Formátum/Tokozás OAM
PCI Express vezérlő
x16-os PCI Express 5.0
Infinity Fabric linkek száma 7
RAS és Page Retirement
van

Az MI350 sorozat OAM formátumban érkezik, és alapvetően passzív hűtést használ (itt a szervernek kell megoldania a légáramlást), de a csúcsmodellnek van aktív, vízhűtésre optimalizált verziója is. Az AMD platformszintű implementációt is kínál, ami lényegében nyolc darab MI350X-et vagy MI355X-et köt össze 1075 GB/s-os adatátviteli sebesség mellett, UBB 2.0-s platformformátumon.

A hardverek mellé érkezik a ROCm 7, amely a generatív AI feladatokra lett optimalizálva. A friss csomag nagymértékű optimalizálást tartalmaz, és értelemszerűen leginkább az Instinct MI350-es dizájnokhoz illeszkedik.

A friss fejlesztéseket az AMD fő szerverpartnerei már megkapták, ezen vállalatok később leplezik le a saját szerverdizájnjaikat.

Hirdetés

Fotóznál vagy videóznál? Mutatjuk, melyik okostelefon mire való igazán!

PR Vásárlás előtt érdemes megnézni, mit kínálnak az aktuális telefonok, ha igazán ütős képeket vagy profi mozgóképeket szeretnénk készíteni.

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények