UUSIMMAT

Raportti: NVIDIA hyppää laskentakorteissa Maxwellin yli, Pascal vuonna 2016

02.01.2015 13:44 | Petrus Laine | 9

Japanilainen 4Gamer-sivusto raportoi NVIDIAn paljastaneen, ettei Maxwell-sukupolven grafiikkapiirejä tulla näkemään yhtiön Tesla-laskentakorteissa. Asia kävi ilmi tilaisuudessa, jossa yhtiön edustaja kertoi NVIDIAn tulevaisuuden suunnitelmista laskentakorttipuolella, Pascal- ja Volta-arkkitehtuureista sekä tulevista supertietokoneista.

NVIDIAn edustajan kerrotaan sanoneen suoraan, ettei Maxwell-arkkitehtuuria tulla näkemään laskentakorteissa puuttuvien FP64-liukulukuyksiköiden vuoksi. Täysin FP64-yksiköt eivät arkkitehtuurista kuitenkaan puutu, sillä GeForce GTX 970- ja GTX 980 -näytönohjaimien GM204-grafiikkapiirissä kussakin SMM-yksikössä on 128 FP32-yksikön ohella 4 FP64-yksikköä. Maxwellin sijasta tämä vuosi tullaan menemään edeltävän Kepler-arkkitehtuurin laskentakorttien voimalla, kunnes vuonna 2016 NVIDIA julkaisee Pascal-arkkitehtuuriin perustuvia laskentakortteja.

4Gamer, Next generation GPU ”Pascal” and next generation GPU ”Volta” to those very similar… (Google Translate)

Keskustelu

Jotenkin nyt kauhean suurena yllätyksenä tätä pitäisi, kun kuitenkin noiden Tesla-laskentakorttien Kepler-ytimien rakenteet hieman alkaneet elää erillään. Esimerkiksi K80:sen GK210-ytimissä rekistereiden ja välimuistien koko hieman nousi ja olisi melko nopea tahti, jos yksi vuosi mentäisiin vaan Maxwellin uusitulla arkkitehtuurilla ja heti seuraavana vuonna sitten Pascalia päälle.

Pascaliin kuitenkin taitaa olla melko suuret investoinnit, koska isoja tilauksia jo valmiina ja pitäisi IBM:n kanssa saada ensimmäiset koneet mahdollisimman pikaisesti valmiiksi, jos mielivät jenkkien DOE:lle saada valmiiksi Summit ja Sierra myllyt 2017 mennessä (100+ ja 150-300+ petaflops ~325+m dollarin diili).

Ehkä tämä antaa AMD:lle hyvän mahdollisuuden hyökätä takaisin HPC-markkinoille, mistä ne ovat hävinneet aika huolella. Green500 listauksen perusteella uudet nodet ovat ainakin niissä testeissä erittäin energiatehokkaita verrattuna Kepleriin tai muihin arkkitehtuureihin. Intel tosin voi olla toista mieltä ja perinteisillä suorittimilla kuitenkin dominoivat uusia asennuksia täysin ja Knights Landingistä voi odottaa paljonkin, mutta se jää nähtäväksi.

Pascal tai Volta mikä noiden ero nyt loppujen lopuksi edes on? Kuitenkin se seuraava arkkitehtuuri, jossa stacked memory ja NVlinkin avulla jonkinlainen koheesio CPU ja GPGPU-noden välimuistien välillä. Onko sitten Volta "2nd gen" tuosta arkkitehtuurista vai sitten HPC-arkkitehtuuri ja Pascal desktopille tarkoitettu arkkitehtuuri? Joka tapauksessa tuollaisia isoja asennuksia ei kuitenkaan yhdessä yössä viimeistellä ja eiköhän jo 2015-2016 aleta softia DOElla/NVIDIAlla/IBM:llä valmistelee tuota varten ja 2016 ensimmäiset testiasennuksetkin varmaan tarkoitus olla valmiina. Ellei tarkoitus sitten saada konetta valmiiksi paljon myöhemmin.

Paha sanoa vielä noiden eroista, yksi mikä on kuulemma varmistunut on NVLInk gen 2 tuossa Voltassa vrt gen 1 Pascalissa. Kaikki se mitä noista on lukenut on kuitenkin sitä mieltä että molemmat tulee HPC-puolelle, vaikka aikataulu on normaalia tiiviimpi arkkitehtuurin vaihtumisessa.

DiamondTear

Miksi niissä korteissa on ne 4 yksikköä?

Nimellisen FP64 (Double Precision) tuen vuoksi

Nimellinen tuki melko hauska väitös tai sellaisen arvon vuoksi nyt ei varmaan kukaan yhtää mitään tilaa veisi suorittimen piiltä. Ne datojen tarkkuudet ei kuitenkaan ole mitään on/off juttuja, että käytettäisiin vain yhtä valikoitua tarkkuutta kaikissa kerneleissä ja paikoissa missä mahdollista. Pelimoottoreissa ja varsinkin rajatuilla resursseilla olevissa versioissa tyypillisesti käytetään jopa olla 32bit fp meneviä tarkkuuksia ja hauskasti alkaa löytyy jopa 16fp ALUjakin noista mobiililastuista.

64-bit voi olla ihan hyödyllinen jotain geometriaa käsitteleviä vertex/geometry shadereitä varten, jos pelimaailmat ovat todella suuria ja vaaditaan erittäin suurta tarkkuutta. Silti enemmän tuollaisia tarkkuuksia tarvitaan lähinnä tieteellisissä laskennoissa, joissa halutaan suurta tarkkuutta ja ei sekoittaa pyöristyksillä

Niin no, mitään muuta järkevää selitystä niiden olemassaololle ei ole, kun suorituskyky on niin hirvittävää kuraa millä mittarilla tahansa kun yksikköjä on noin vähän. Pelit eivät käytä (ainakaan nykyään) FP64-tarkkuutta

Ei se nyt sitä tarkoita, että FP64-tarkkuuden käyttäminen olisi kokonaan mahdotonta tai pelkästään jonkin PR-kalvojen vuoksi siellä kortilla olisi muutama FP64 ALU. Ei kukaan kuluta transistoreja mitään PR-pisteitä varten. Ja edelleen ne ei ole mitään helvetin on/off juttuja, että yhtä tarkkuutta pitäisi jokaisessa kohdassa käyttää.

Eli vaikka jos jossakin tulevaisuudessa alkaisi tuplatarkkuus yleistymään jostakin syystä peleissä. Niin todennäköisesti suurimmassa osissa tapauksista edelleen se data olisi matalemmalla tarkkuudella.

Muropaketin uusimmat