NVIDIA GeForce GTX Titan X (GM200)
NVIDIAn esitteli maaliskuun alussa järjestetyssä Game Developers Conference –tapahtumassa uuden GeForce GTX Titan X –näytönohjaimen, jossa on käytössä Maxwell-arkkitehtuuriin perustuva GM200-grafiikkapiiri. Kyseessä on Maxwell-sukupolven suorituskykyisin ja suurikokoisin grafiikkapiiri, joka valmistetaan edelleen taiwanilaisen TSMC:n 28 nanometrin prosessilla. Aiemmista Titan-malleista poiketen Titan X keskittyy laskennan sijaan enemmän grafiikkaan ja FP64-suorituskykyä liukulukujen kaksoistarkkuudella on karsittu merkittävästi.
GeForce GTX Titan X julkaistiin virallisesti GTC 2015 –tapahtumassa 17. maaliskuuta ja se saapui samaan aikaan pienissä erissä myös myyntiin. 999 dollarin suositushinnalla se painii yhden grafiikkapiirin näytönohjainten markkinoilla täysin omassa sarjassaan. Ainoastaan AMD:n ja NVIDIAn kahden grafiikkapiirin ratkaisut ovat hinnaltaan samalla suunnalla.
Titan X on varustettu markkinoiden suorituskykyisimmällä grafiikkapiirillä ja sen avainominaisuudet ovat 3072 CUDA-ydintä, 7 teraflopsin laskentakyky liukulukujen perustarkkuudella ja 12 gigatavun näyttömuisti. Massiivista näyttömuistia markkinoidaan erityisesti pelaamiseen 4K-resoluutiolla sekä virtuaalitodellisuuteen liittyviin sovelluksiin.
GM200-grafiikkapiiri rakentuu noin kahdeksasta miljardista transistorista ja sen pinta-ala on 601 neliömillimetriä. TSMC:n ongelmat 20 nanometrin prosessin kanssa ovat olleet niin perusteellisia, että NVIDIAn seuraavan sukupolven eli Pascal-arkkitehtuuriin perustuvat grafiikkapiirit valmistetaan suoraan 16 nanometrin viivanleveydellä.
Vertailun vuoksi GeForce GTX 980:ssä käytettävä GM204-grafiikkapiiri rakentuu 5,2 miljardista transistorista, sen pinta-ala on 398 neliömillimetriä ja CUDA-ytimiä on 2048 kappaletta. GeForce GTX 780 Ti:n GK110-grafiikkapiiri oli GM200:aa vastaava Kepler-sukupolven jättiläispiiri, joka rakentuu 7,1 miljardista transistorista, sen pinta-ala on 533 neliömillimetriä ja CUDA-ytimiä on 2880 kappaletta.
GM200:ssa on 50 % enemmän CUDA-ytimiä, n. 54 % enemmän transistoreita ja 51 % suurempi piisiru kuin GM204:ssä ja n. 7 % enemmän CUDA-ytimiä sekä n. 13 % enemmän transistoreita ja suurempi piisiru kuin GK110:ssä.
Titan X:ssä on käytössä täysi GM200-grafiikkapiiri eli 24 SMM-yksikköä, joista jokainen käsittää 128 CUDA-ydintä eli niitä on yhteensä 3072 kappaletta. Jokaisella SMM-yksiköllä on oma geometriayksikkönsä eli niitä on 24 kpl, tekstuuriyksiköitä on 8 kpl per SMM-yksikkö eli yhteensä 192 kpl ja ROP-yksiköitä 96 kpl. 64-bittisiä muistiohjaimia on kuusi kappaletta eli muistiväylä on yhteensä 384-bittinen.
Maxwell-arkkitehtuurissa Streaming Multiprocessor- eli SMM-yksikössä on Kepler-arkkitehtuurin 192 CUDA-ytimen sijaan 128 CUDA-ydintä. Lisäksi ne on jaettu neljään 32 ytimen ryppääseen omalla ohjauslogiikalla, kun aiemmin kaikki olivat samassa ryppäässä.
Jokaisessa GM200-grafiikkapiirin 16 SMM-moduulissa on vain neljä kappaletta CUDA-ytimiä (yhteensä 64 kpl), jotka kykenevät suorittamaan liukulukulaskuja kaksoistarkkuudella (Double Precision). Kepler-sukupolven isossa piirissä eli GK110:ssä vastaavia CUDA-ytimiä on yhteensä 896. Titan X:llä liukulukujen kaksoistarkkuuden suorituskyky on sama kuin GTX 980:llä eli 1/32 perustarkkuuden (Single Precision) suorituskyvystä, kun Kepler-sukupolven Titanilla suhde on 1/3.
L2-välimuistin koko on kasvatettu kolmeen megatavuun, kun GM204-grafiikkapiirissä sitä on kaksi megatavua ja Kepler-sukupolven GK110:ssä 1,5 megatavua. Suuremman L2-välimuistin ansiosta näyttömuistiin tehtävien pyyntöjen määrä vähenee, tehonkulutus laskee ja suorituskyky paranee.
GM200:ssa on mukana samat Maxwell-arkkitehtuurin uudistukset kuin jo aiemmin julkaistuissa Maxwell-sukupolven grafiikkapiireissä. Muistiarkkitehtuuria on päivitetty parannetuilla pakkausalgoritmeilla, kuten kolmannen sukupolven Delta Color -pakkauksella. Uudistusten myötä Maxwellilla tarvitaan pelistä riippuen karkeasti 25 % vähemmän muistikaistaa saman suorituskyvyn saavuttamiseksi kuin Keplerillä.
Titan X:n video-ominaisuudet ovat samat kuin GeForce GTX 980:ssä eli suurin tuettu resoluutio on 5120×3200 @ 60Hz ja samanaikaisesti on mahdollista käyttää neljää näyttöä. Grafiikkapiiriin integroidussa NVENC-enkooderissa on tuki H.265-pakkaukselle ja H.264-pakkauksen suoritusteho on parantunut 2,5-kertaiseksi Kepleriin verrattuna mahdollistaen 4K-videon pakkauksen 60 FPS:n nopeudella.
Ominaisuuspuolelta löytyy muun muassa DirectX 12 -tuki (Feature Level 12.1), Voxel accelerated Global Illumination (VXGI), Multi-Projection Acceleration (MPA) ja MFAA-reunojenpehmennys (Multi-Frame Sampled Anti Aliasing).
Tutustumme tässä artikkelissa GM200-grafiikkapiiriin ja esittelemme GeForce GTX Titan X -referenssinäytönohjaimen. Suorituskykymittaukset ajettiin 2560×1440-resoluutioilla ja vertailukohtina mukana testeissä olivat GeForce GTX 980-, GeForce GTX 780 Ti-, Radeon R9 295X2- ja Radeon R9 290X -näytönohjaimet. Lisäksi mukana on tehonkulutus-, lämpötila- ja melumittaukset sekä ylikellotustestit.