Uusimmat

Pascal-arkkitehtuuri

17.06.2016 15:25 Sampsa Kurri

1080-dia16

1080-dia13

NVIDIA on viime vuosina kertonut varsin avoimesti tulevaisuuden suunnitelmistaan ja uusista arkkitehtuureistaan. Nyt julkaistu Pascal-arkkitehtuuri on vuoden 2014 syksyllä julkaistun Maxwell-arkkitehtuurin seuraaja ja vuonna 2018 luvassa on seuraavan sukupolven Volta-arkkitehtuuri.

Uusien GeForce-näytönohjaimien avainominaisuuksiksi NVIDIA on listannut arkkitehtuurin, 16 nanometrin FinFet-valmistusprosessin, GDDR5X-muistit, ammattitaidon grafiikkapiirin ja piirilevyn suunnittelussa sekä uuden Simultaneous Multi-Projection -yksikön grafiikkapiirissä.

1080-dia01

GP104-grafiikkapiirissä yhteensä 20 SM-yksikköä, joista jokainen käsittää 128 CUDA-ydintä eli niitä on yhteensä 2560 kappaletta. Jokaisella SM-yksiköllä on oma geometriayksikkönsä eli niitä on 20 kpl, tekstuuriyksiköitä on 8 kpl per SM-yksikkö eli yhteensä 160 kpl ja ROP-yksiköitä 64 kpl. 32-bittisiä muistiohjaimia on kahdeksan kappaletta eli muistiväylä on 256-bittinen.

1080-dia14

Geometriayksikkö eli Polymorph Engine on päivittynyt Pascalissa 4.0-versioon. Uutena ominaisuutena siihen on lisätty Simultaneous Multi-Projection –yksikkö, joka sijaitsee geometrialiukuhihnan lopussa ja kykenee monistamaan yhden geometriadatan 16 eri kuvakulmaan. Tämä mahdollistaa esimerkiksi usean näytön Surround-järjestelmissä oikean perspektiivin myös sivunäyttöjen objekteille, joiden perspektiivi on yleensä vääristynyt pelin rajallisen näkökentän vuoksi, koska pelit käyttävät vain yhtä kuvakulmaa renderöintiin.

Virtuaalitodellisuudessa ominaisuutta käytetään parantamaan suorituskykyä jakamalla kummankin silmän näkymä neljään osaan, joka vähentää tarvetta renderöidä ylimääräisiä osia 3D-maailmasta.

1080-08

TSMC:n 16 nanometrin FinFet-prosessilla valmistettava GP104-grafiikkapiiri rakentuu 7,2 miljardista transistorista ja sen pinta-ala on 314 neliömillimetriä.

Vertailun vuoksi GeForce GTX 980 -näytönohjaimessa käytössä oleva 28 nanometrin viivanleveydellä valmistettava GM204-grafiikkapiiri rakentuu 5,2 miljardista transistorista ja pinta-ala on 398 neliömillimetriä. GeForce GTX 980 Ti:ssä käytössä oleva Maxwell-arkkitehtuurin isoin grafiikkapiiri eli GM200 rakentuu noin kahdeksasta miljardista transistorista ja pinta-ala on 601 neliömillimetriä.

Pienemmän 16 nanometrin valmistustekniikan ansiosta GeForce GTX 1080:n grafiikkapiiri on pinta-alaltaan 21 % pienempi kuin GeForce GTX 980:n GM204, vaikka transistoreita on 38 % enemmän. GeForce GTX 1080:n 180 watin TDP-arvo on 15 wattia korkeampi kuin GeForce GTX 980:llä.

1080-dia03

GP104-grafiikkapiiri käyttää uutta GDDR5X-standardia, joka mahdollistaa tiedonsiirron 10 Gbps (gigabittiä sekunnissa) nopeudella. Micronin kehittämä GDDR5X-standardi perustuu vahvasti GDDR5-muisteihin, mutta 32:sta 64 tavuun tuplatun prefetchin ansiosta muistit tulevat tarjoamaan huomattavasti aiempaa korkeampaa muistikaistaa. NVIDIAn insinöörit ovat puolestaan työstäneet grafiikkapiirin muistiohjaimen uusiksi ja suunnitellut piirilevyn signaalivedot uusiksi mahdollistamaan entistä korkeammat taajuudet.

1080-dia04

1080-dia05

Pascalin muistiarkkitehtuuria on päivitetty parannetuilla pakkausalgoritmeilla, kuten neljännen sukupolven Delta Color -pakkauksella. Uudistusten myötä Pascalilla tarvitaan pelistä riippuen karkeasti 20 % vähemmän muistikaistaa saman suorituskyvyn saavuttamiseksi kuin Maxwellilla. Kun tähän yhdistetään GDDR5X-muistien korkeampi kellotaajuus, ilmoittaa NVIDIA muistiväylän kaistanleveyden parantuneen 1,7-kertaiseksi.

vs_dia

Maxwell-GM104-grafiikkapiiriin verrattuna Pascal-GP104-grafiikkapiirissä Streaming Multiprocessor -yksiköiden kasvanut neljällä ja CUDA-ytimiä on 512 kpl eli 25 % enemmän. Grafiikkapiirin kellotaajuutta on saatu nostettua jopa noin 500 MHz. Tekstuuriyksiköitä on 32 kpl enemmän ja tekstuurien fill-rate on parantunut 78 %. GDDR5X-muistien ansiosta muistien tehollinen kellotaajuus on jopa 10000 MHz ja muistiväylän kaistanleveys on kasvanut 42 %. ROP-yksiköiden lukumäärä ja L2-välimuistin koko on säilynyt samana.

Sisältö

  1. Alkusanat
  2. Pascal-arkkitehtuuri
  3. NVIDIA GeForce GTX 1080 Founders Edition -näytönohjaimen esittely
  4. MSI GeForce GTX 1070 Gaming X 8G -näytönohjaimen esittely
  5. Testikokoonpano, lämpötilan vaikutus suorituskykyyn ja suorituskyvyn skaalautuminen eri resoluutioilla
  6. Suorituskykymittaukset 2560x1440-resoluutiolla
  7. Suorituskykymittaukset 3840x2160-resoluutiolla
  8. Tehonkulutus-, lämpötila- ja melumittaukset
  9. Ylikellotustestit
  10. Loppuyhteenveto