Uusimmat

NVIDIA julkaisi ison Pascalin – GP100-grafiikkapiirissä 3840 CUDA-ydintä ja 16 gigatavua HBM2-muistia

05.04.2016 21:36 Sampsa Kurri

tesla-p100-6-05042016

NVIDIAn toimitusjohtaja Jen-Hsun Huang esitteli GTC-tapahtuman keynote-puheessaan uuden Pascal-sukupolven ja -arkkitehtuurin isoimman grafiikkapiirin, joka tunnetaan nimellä GP100.

Huang alusti julkaisua kertomalla, että NVIDIAn yrityskulttuurissa ison tuotejulkaisun yhteydessä on oltava vähintään kolme ”ihmettä”. GP100:n kehitys aloitettiin kolme vuotta sitten ja se tuo mukanaan viisi ihmettä. Huangin mukaan todennäköisyys sille, että kaikki viisi osa-aluetta saataisiin toimimaan, oli lähellä nollaa ja sen toteuttamiseksi vaadittiin toivoa ja uskoa.

GP100 on TSMC:n 16 nanometrin FinFET-prosessilla valmistettu grafiikkapiiri, joka rakentuu jopa 15,3 miljardista transistorista ja piisirun pinta-ala on 610 neliömillimetriä.

tesla-p100-4-05042016

Täydessä GP100-grafiikkapiirissä on yhteensä 3840 CUDA-ydintä ja 240 tekstuuriyksikköä. Muistirekistereiden kesken jaettua muistia on 14 megatavua ja L2-välimuistia neljä megatavua.

Grafiikkapiirin vieressä interposer-alustalla sijaitsee 16 gigatavua toisen sukupolven 3D- eli HBM2-muistia CoWoS-tekniikalla (Chip-on Wafer-on-Substrate). Muistiväylä on 4096-bittinen ja kaistanleveys on 720 gigatavua sekunnissa.

 

Tesla P100 -kiihdytin HPC-laskentaan

tesla-p100-5-05042016

Ensimmäisenä markkinoille tuleva GP100-grafiikkapiirin perustuva tuote on Tesla P100 -kiihdytin, joka on suunnattu suorituskykyiseen HPC-laskentaan sekä syvien neuroverkkojen, tekoälyn ja koneoppimisen sovelluksiin.

Kiihdytin käyttää SXM 2.0 form factoria, jossa piirilevyllä on BGA-koteloitu interposer-alusta, grafiikkapiiri ja HBM2-muistit sekä virransyöttö. Tesla P100 on yhteydessä muihin grafiikkapiireihin uuden NVLink-väylän kautta, joka mahdollistaa teoriassa maksimissaan 160 gigatavua / sekunnissa tiedonsiirtonopeuden.

Tesla P100:ssa on käytössä hieman ominaisuuksiltaan karsittu versio GP100:sta. SM-yksiköitä on käytössä 56/60, joka tarkoittaa 3584 CUDA-ydintä ja 224 tekstuuriyksikköä.

Grafiikkapiiri toimii 1328 MHz:n peruskellotaajuudella ja 3D- tai laskentarasituksessa Boost-kellotaajuus nousee 1480 MHz:iin. TDP-arvoksi on ilmoitettu 300 wattia.

Tesla P100:n suorituskyvyksi on kerrottu teraflopseina liukulukulaskujen eri tarkkuuksilla:

  • 5,3 TF FP64
  • 10,6 TF FP32
  • 21,2 TF FP16

Huang yllätti kertomalla, että GP100-grafiikkapiiri ja Tesla P100 ovat parhaillaan massatuotannossa ja ensimmäiset palvelimet IBM:ltä, HP:lta, Delliltä ja Craylta saapuvat markkinoille ensi vuoden ensimmäisellä neljänneksellä (Q1/2017).

Sampsa Kurri

Muropaketin uusimmat