Uusimmat

NVIDIA GeForce GTX 980 & 970 (GM204)

09.10.2014 15:42 Muropaketin toimitus

NVIDIA julkaisi 19. syyskuuta Maxwell-arkkitehtuuriin ja uuteen GM204-grafiikkapiiriin perustuvat GeForce GTX 980- ja 970-näytönohjaimet. Ensimmäinen Maxwell-grafiikkapiiri nähtiin jo helmikuussa, kun markkinoille julkaistiin GM107-grafiikkapiiriin perustuvat GeForce GTX 750- ja 750 Ti -näytönohjaimet. Tuolloin fokus oli edullisessa hinnassa ja alhaisessa virrankulutuksessa, mutta GM204 on suunniteltu tarjoamaan parempaa suorituskykyä. NVIDIAn ja AMD:n grafiikkapiirien valmistuksesta vastaava taiwanilainen TSMC ei ole saanut hiottua 20 nanometrin prosessiaan vielä tarpeeksi valmiiksi, jotta suurikokoisten grafiikkapiirien massatuotanto onnistuisi. Tästä syystä NVIDIA on joutunut optimoimaan Maxwell-arkkitehtuurissa nykyisestä 28 nm:n prosessista irti kaiken mahdollisen.

GeForce GTX 980 korvaa markkinoilla GeForce GTX 780- ja 780 Ti -näytönohjaimet ja GeForce GTX 970 puolestaan GeForce GTX 770:n. NVIDIA keskittyi omissa esityksissään lehdistölle vertailemaan uutta GM204-grafiikkapiiriään ensisijaisesti Kepler-sukupolven GK104-grafiikkapiiriin, joka oli käytössä muun muassa GeForce GTX 680- ja GeForce GTX 770 -näytönohjaimissa. Suoraa vertailua GeForce GTX 780- ja 780 Ti -näytönohjaimien massiiviseen 7,2 miljardin transistorin GK110-grafiikkapiiriin ei käytännössä tehty lainkaan, johtuen todennäköisesti siitä, että GK110 oli alun perin suunniteltu Quadro-näytönohjaimiin ammattilaiskäyttöön ja julkaistiin vasta myöhemmin pelaajille GeForce-näytönohjaimissa.

NVIDIA hyppäsi työpöytänäytönohjaimiensa mallinimissä jälleen yhden sataluvun yli ja siirtyi GeForce GTX 700 -sarjasta suoraan 900-sarjaan. Edellisen kerran näin tapahtui vuonna 2010, kun 200-sarjasta siirryttiin 400-sarjaan. Tällä kertaa perusteluna oli, että markkinoilla on jo GeForce GTX 800M -sarjan mobiilinäytönohjaimet kannettaviin tietokoneisiin. Uuden sukupolven myötä työpöytä- ja mobiilinäytönohjaimet haluttiin yhdistää samaan mallisarjaan sekaannusten välttämiseksi.

Maxwell-arkkitehtuurissa Streaming Multiprocessor -yksiköiden rakennetta on muutettu. Yhdessä Maxwellin SMM-yksikössä on Kepler-arkkitehtuurin 192 CUDA-ytimen sijaan 128 CUDA-ydintä. Lisäksi ne on jaettu neljään 32 ytimen ryppääseen omalla ohjauslogiikalla, kun aiemmin kaikki olivat samassa ryppäässä.

GM204-grafiikkapiirissä on 16 SMM-yksikköä, joista jokainen käsittää 128 CUDA-ydintä eli niitä on yhteensä 2048 kappaletta. Jokaisella SMM-yksiköllä on oma geometriayksikkönsä eli niitä on 16 kpl, tekstuuriyksiköitä on 8 kpl per SMM-yksikkö eli yhteensä 128 kpl ja ROP-yksiköitä 64 kpl. 64-bittisiä muistiohjaimia on neljä kappaletta eli muistiväylä on 256-bittinen.

GK104-grafiikkapiiriin verrattuna Streaming Multiprocessor -yksiköiden määrä on kaksinkertaistunut ja CUDA-ytimien uudelleenjärjestelyllä niitä on 512 kpl eli 33 % enemmän. Tekstuuriyksiköiden määrä on pysynyt samana, mutta grafiikkapiirin korkeamman kellotaajuuden myötä tekstuurien fill-rate on parantunut 12 %. ROP-yksiköiden lukumäärä on tuplattu 64:ään korkeampia resoluutioita ja reunojenpehmennystä ajatellen ja pikseleiden fill-rate on korkeamman kellotaajuuden myötä yli kaksinkertainen (72 vs 32,2 Gpixels/s).

L2-välimuistin koko on kasvatettu kahteen megatavuun, kun Kepler-arkkitehtuurin GK104-grafiikkapiirissä sitä oli 512 kilotavua ja GK110-grafiikkapiirissä 1,5 megatavua. Suuremman L2-välimuistin ansiosta näyttömuistiin tehtävien pyyntöjen määrä vähenee, tehonkulutus laskee ja suorituskyky paranee.

Suuremman L2-välimuistin lisäksi Maxwellin muistiarkkitehtuuria on päivitetty parannetuilla pakkausalgoritmeilla, kuten kolmannen sukupolven Delta Color -pakkauksella. Uudistusten myötä Maxwellilla tarvitaan pelistä riippuen karkeasti 25 % vähemmän muistikaistaa saman suorituskyvyn saavuttamiseksi kuin Keplerillä.

Vertailun vuoksi GeForce GTX 780 Ti:n 384-bittisellä muistiväylällä ja 1750 MHz:n kellotaajuudella toimivilla GDDR5-muisteilla muistiväylän kaistanleveys on 112 gigatavua sekunnissa (+50 %) korkeampi kuin GeForce GTX 980:llä (336 vs 224 Gt/s). Maxwellin muistiarkkitehtuurin uudistusten myötä ero kaventuu NVIDIAn omien laskelmien mukaan teoriassa 12 %:iin.

”Thanks to the improvements in caching and compression in Maxwell, the GPU is able to significantly reduce the number of bytes that have to be fetched from memory per frame. In tests with a variety of games, Maxwell uses roughly 25% fewer bytes per frame compared to Kepler. This means that from the perspective of the GPU core, a Kepler-style memory system running at 9.3Gbps would provide effective bandwidth similar to the bandwidth that Maxwell’s enhanced memory system provides.”

Maxwellista löytyy samat rajapinnat ja toiminnalliset yksiköt kuin Kepleristä, mutta niiden sisäiset rakenteet on työstetty uusiksi.

”Internally, all the units and crossbar structures have been redesigned, data flows optimized, power management significantly improved.”

”The SM scheduler architecture and algorithms have been rewritten to be more intelligent and avoid unnecessary stalls, while further reducing the energy per instruction required for scheduling.”

Muutosten myötä NVIDIA lupaa Maxwell-arkkitehtuurin tarjoavan karkeasti 40 % paremman suorituskyvyn ja kaksinkertaisen suorituskyky/wattia-suhteen verrattuna Keplerin CUDA-ytimeen:

”As a result of these changes, each Maxwell CUDA core is able to deliver roughly 1.4x more performance per core compared to a Kepler CUDA core.”

”With a combination of advances originally developed for Tegra K1, new architectural approaches seen first in the GeForce GTX 750 Ti, and further refinement for GM204, Maxwell now delivers 2x the performance per watt compared to Kepler products.”

Ominaisuuspuolella uudistuksia ovat muun muassa täysi DirectX 11.2 -tuki, Voxel accelerated Global Illumination (VXGI), Multi-Projection Acceleration (MPA) ja MFAA-reunojenpehmennys (Multi-Frame Sampled Anti Aliasing).

TSMC:n 28 nanometrin prosessilla valmistettava GM204-grafiikkapiiri rakentuu 5,2 miljardista transistorista ja sen pinta-ala on 398 neliömillimetriä.

Vertailun vuoksi GeForce GTX 780- ja 780 Ti -näytönohjaimissa käytössä oleva GK110-grafiikkapiiri rakentuu 7,1 miljardista transistorista ja pinta-ala on 533 neliömillimetriä. GK110 käsittää 2880 CUDA-ydintä, joka on 832 kappaletta eli 40 % enemmän kuin GM204:ssä ja piisirun pinta-ala on 34 % suurempi. GeForce GTX 680- ja 770-näytönohjaimissa käytössä oleva GK104-grafiikkapiiri rakentuu 3,54 miljardista transistorista, sen pinta-ala on 294 neliömillimetriä ja CUDA-ytimiä on 1536 kappaletta eli se on pinta-alaltaan 26 % pienempi ja CUDA-ytimiä on 25 % vähemmän.

GeForce GTX 980:ssä on käytössä täysi GM204-grafiikkapiiri eli 2048 CUDA-ydintä ja grafiikkapiirin peruskellotaajuus on 1126 MHz ja 3D-rasituksessa Boost-taajuus nousee 1216 MHz:iin. Neljä gigatavua GDDR5-muistia toimii 1750 MHz:n kellotaajuudella ja 256-bittisellä muistiväylällä kaistanleveys on 224 Gt/s. Näytönohjaimen TDP-arvo on 165 wattia ja se on varustettu kahdella kuusipinnisellä PCI Express -lisävirtaliittimellä.

GeForce GTX 970:ssä grafiikkapiiristä on kytketty pois käytöstä kolme SMM-yksikköä eli 384 CUDA-ydintä ja aktiivisia CUDA-ytimiä on käytössä 1664 kappaletta, 104 tekstuuriyksikköä ja 64 ROP-yksikköä. Peruskellotaajuus on 1050 MHz ja 3D-rasituksessa Boost-taajuus nousee 1178 MHz:iin. Neljä gigatavua GDDR5-muistia toimii 1750 MHz:n kellotaajuudella ja muistiväylän kaistanleveys on 224 Gt/s. Näytönohjaimen TDP-arvo on 145 wattia.

Tutustumme tässä artikkelissa Maxwell-arkkitehtuuriin ja GM204-grafiikkapiiriin sekä esittelemme GeForce GTX 980-referenssinäytönohjaimen ja Asuksen Strix GTX 970-näytönohjaimen. Suorituskykymittaukset ajettiin 2560×1440- ja 1920×1080-resoluutioilla ja vertailukohtina mukana testeissä olivat GeForce GTX 780 Ti-, GeForce GTX 770- ja Radeon R9 290X -näytönohjaimet. Lisäksi mukana on tehonkulutus-, lämpötila- ja melumittaukset sekä ylikellotustestit.

Sisältö

  1. NVIDIA GeForce GTX 980 & 970 (GM204)
  2. GeForce GTX 980 -referenssinäytönohjaimen esittely
  3. Asus Strix GTX 970 -näytönohjaimen esittely
  4. Testikokoonpano ja suorituskykymittaukset 2560x1440-resoluutiolla
  5. Suorituskykymittaukset 1920x1080-resoluutiolla
  6. Tehonkulutus-, lämpötila- ja melumittaukset
  7. Ylikellotustestit
  8. Loppuyhteenveto