Uusimmat

NVIDIA GeForce GTX 460 (192-bit & 768 Mt)

22.07.2010 11:17 Muropaketin toimitus

NVIDIA julkaisi 12. heinäkuuta uuden Fermi-arkkitehtuuriin perustuvan kuluttajaluokan GeForce GTX 460 -näytönohjaimen, joka perustuu GF104-grafiikkapiiriin. Näytönohjaimesta julkaistiin kaksi eri versiota, jotka eroavat toisistaan muistiväylän ja muistimäärän osalta. NVIDIA lanseerasi markkinoille 192-bittisellä muistiväylällä ja 768 megatavun GDDR5-muistimäärällä sekä 256-bittisellä muistiväylällä ja gigatavun muistimäärällä varustetut versiot. NVIDIA on asettanut ensimmäisenä mainitun mallin suositushinnan 199 ja jälkimmäisen 229 dollariin.

Tässä artikkelissa tutustutaan GF104-grafiikkapiirin ominaisuuksiin, NVIDIAn GeForce GTX 460 -referenssinäytönohjaimeen ja saimme Asukselta testattavaksi tehtaalla valmiiksi ylikellotetun ENGTX460 TOP -mallin, joka on varustettu 192-bittisellä muistiväylällä ja 768 megatavun GDDR5-muistimäärällä. Suorituskykymittauksissa ajetaan testit läpi NVIDIAn referenssitaajuuksilla ja vertailukohtina testeissä ovat mukana NVIDIAn rajuimmin karsittuun GF100-grafiikkapiiriin perustuva GeForce GTX 465 ja AMD:n puolelta ATI Radeon HD 5830. Mukana on myös tuttuun tapaan lämpötila- ja tehonkulutusmittaukset sekä ylikellotustestit. Suorituskykyisempi 256-bittisellä muistiväylällä ja gigatavun muistimäärällä varustettu GeForce GTX 460 -malli tulee suurissa erissä saataville hieman myöhemmin ja testaamme sen yhdessä ATI Radeon HD 5850:n kanssa heti, kun saamme testikappaleen käsiimme.

Suurempi versio kuvaa klikkaamalla

GF104-grafiikkapiirin lohkokaaviokuvasta nähdään, että se ei ole vain karsittu GF100-grafiikkapiiri, vaan suunniteltu selvästi pienemmäksi. GF104 rakentuu 1,95 miljardista transistorista ja valmistetaan TSMC:n 40 nanometrin prosessilla. Maaliskuussa julkaistuun GF100-grafiikkapiiriin verrattuna transistoreita on käytetty hieman yli miljardi vähemmän. GF104 koostuu kahdesta GPC:stä (Graphics Processing Cluster), joita NVIDIA itse kutsuu minigrafiikkapiireiksi. Kummassakin GPC:ssä on neljä SM-moduulia (Streaming Multiprocessor) eli yhteensä niitä on kahdeksan kappaletta.

Lohkokaavioon merkitty Host Interface lukee prosessorilta tulevat käskyt ja GigaThread Engine noutaa määrätyn datan keskusmuistista ja kopioi sen ruutupuskuriin (framebuffer). GF104-grafiikkapiirin neljä 64-bittistä GDDR5-muistiohjainta (yhteensä 256-bittinen) huolehtivat kaistanleveydestä ruutupuskurille. GeForce GTX 460:n 192-bittisessä versiossa on yksi 64-bittinen muistiohjain kytketty pois käytöstä. Seuraavaksi GigaThread Engine luo ja lähettää säieblokit SM-moduuleille, jotka puolestaan jakavat 48 säikeen ryhmät (Warp) CUDA-ytimille ja muille suoritusyksiköille.

GF104:n ROP-yksiköt (lohkokaaviossa L2-välimuistin ylä- ja alapuolella), jotka kykenevät suorittamaan 32 rasterioperaatiota kellojaksossa, hoitavat pikseleiden sekoittamisen, reunojenpehmennyksen ja atomiset muistioperaatiot. Ne on järjestetty neljään kahdeksan ROP-yksikön ryhmään, joista jokaista tarjoilee yksi 64-bittisistä muistiohjaimista. Muistiohjain, L2-välimuisti ja ROP-ryhmä ovat tiiviisti nipussa keskenään ja skaalautuvat yhdessä. GeForce GTX 460:n 192-bittisessä versiossa on käytössä 24 ROP-yksikköä ja loput kahdeksan on kytketty pois päältä.

GF104-grafiikkapiirissä on CUDA-ytimiä yhteensä 384 kappaletta. NVIDIA on kuitenkin päätynyt karsimaan GeForce GTX 460 -näytönohjaimissa käytettävissä GF104-grafiikkapiireistä yhden SM-moduulin pois käytöstä eli käyttöön jää 336 CUDA-ydintä.

Jokaisessa kahdeksassa SM-moduulissa on 48 CUDA-ydintä. Yhdessä CUDA-ytimessä on täysin liukuhihnoitettu aritmeettis-looginen- (ALU) ja liukulukuyksikkö (FPU). GF104 tukee IEEE 754-2008 -liukulukustandardia, joka tarjoaa FMA-käskyn (fused multiply-add) single ja double precision -liukulukuformaateille. CUDA-ytimien rinnalla on 16 kappaletta Load/Store-yksiköitä, jotka mahdollistavat lähde- ja kohdeosoitteiden laskennan 16 säikeelle kellojaksossa sekä kahdeksan Special Function -yksikköä (SFU), jotka kykenevät suorittamaan transkendenttisia käskyjä, kuten sini, käänteisluku ja neliöjuuri.

SM-mooduuli on varustettu lisäksi kahdeksalla tekstuuriyksiköllä. Niistä jokainen kykenee laskemaan tekstuuriosoitteen ja hakemaan neljä tekstuurinäytettä kellojaksossa. Tulokset voidaan palauttaa bilineaari-, trilineaari- tai anisotrooppisella suodatuksella sekä ei-suodatettuna. Fermi-arkkitehtuurissa on yritetty parantaa teksturoinnin suorituskykyä hyötysuhteen kautta. Tämä on saavutettu siirtämällä tekstuuriyksiköt SM-moduuliin, parantamalla tekstuurivälimuistin hyötysuhdetta ja korottamalla kellotaajuutta.

Jokaisessa SM-moduulissa on oma geometriayksikkö eli PolyMorph Engine, joita GF104-grafiikkapiirissä on yhteensä kahdeksan kappaletta. GeForce GTX 460 -näytönohjaimissa niitä on käytössä yhden pois päältä kytketyn SM-moduulin seurauksena seitsemän kappaletta. PolyMorph Engine koostuu viidestä vaiheesta, jotka ovat Vertex Fetch, Tessellator, Viewport Transform, Attribute Setup ja Stream Output. Jokaisessa yksikössä lasketut tulokset siirretään SM-moduulille, joka suorittaa pelin shaderin ja palauttaa tuloksen PolyMorph Enginen seuraavalle vaiheelle. Kun kaikki vaiheet on suoritettu, tulokset siirretään eteenpäin Raster Engineille. GF104-grafiikkapiirissä Raster Engineitä on kaksi kappaletta eli molemmissa GPC:ssä yksi. Raster Engine rakentuu kolmesta vaiheesta, jotka ovat Edge Setup, Rasterizer ja Z-Cull. Edge Setupissa verteksien sijainnit haetaan ja kolmion reunojen yhtälöt lasketaan. Kolmiot, jotka eivät ole kohti ruutua, poistetaan. Rasterizer laskee pikseleiden peiton ja sen tuottamat pikselit lähetetään Z-Cull-yksikölle, joka poistaa ruutupuskurissa olevien pikseleiden takana piilossa olevat pikselit tarpeettomina eikä niiden käsittelyä jatketa.

Yhteenvetona 675 MHz:n kellotaajuudella toimivaan GF104-grafiikkapiiriin perustuvassa GeForce GTX 460 -näytönohjaimessa on käytössä 336 CUDA-ydintä, jotka toimivat 1350 MHz:n kellotaajuudella. Näytönohjaimesta julkaistiin kaksi versiota, jotka eroavat toisistaan muistiväylän ja muistimäärän osalta. Lisäksi suorituskykyisemmässä 256-bittisellä muistiväylällä ja gigatavun muistimäärällä varustetussa mallissa GF104-grafiikkapiiri kykenee suorittamaan 32 rasterioperaatiota kellojaksossa ja L2-välimuistin koko on 512 kilotavua, kun 192-bittinen malli kykenee 24 rasterioperaatioon kellojaksossa ja L2-välimuistia on 384 kilotavua. Näytönohjaimien TDP-arvot ovat 150 ja 160 wattia ja NVIDIAn mukaan GF104-grafiikkapiirin maksimi toimintalämpötila on 104 astetta.

 

NVIDIAn GeForce GTX 460 -referenssinäytönohjain

NVIDIAn referenssisuunnittelu GeForce GTX 460 -näytönohjaimesta on kaksi korttipaikkaa korkea ja etupuoli on muovisen ilmanohjaimen ja keskellä sijaitsevan tuulettimen peitossa. Tuuletin imee ilmaa kotelon sisältä lämpöputkilla varustettuun jäähdytysrivastoon ja työntää lämmenneen ilman rivaston läpi ulos kotelosta. Näytönohjaimen oikeassa ylänurkassa on kaksi 6-pinnistä PCI Express -lisävirtaliitintä.

Molemmat 192-bittisellä muistiväylällä ja 768 megatavun GDDR5-muistimäärällä sekä 256-bittisellä muistiväylällä ja gigatavun muistimäärällä varustetut mallit voivat käyttää samaa piirilevyä. 768 megatavun version piirilevyltä jätetään tuotannossa kaksi GDDR5-muistipiiriä pois ja GF104-grafiikkapiiristä kytketään pois päältä yksi 64-bittinen muistiohjain. Kaikki muistipiirit sijaitsevat piirilevyn etupuolella ja kuvassa oikeassa ylänurkassa näkyy SLI-liitin.

Liitinrivistö on varustettu vakiona kahdella kaksilinkkisellä DVI-liitännällä ja mini-HDMI-liittimellä. GF104 tukee myös VGA-, DisplayPort- ja HDMI-näyttöliitäntöjä, mutta niiden implementointi on jätetty tarvittaessa näytönohjainvalmistajien harteille.

Kun GeForce GTX 460:n karsittua GF104-grafiikkapiiriä verrataan maaliskuussa GeForce GTX 480:ssä julkaistuun karsittuun GF100-grafiikkapiiriin, CUDA-ytimiä on 144 kappaletta vähemmän, Polymorph Engineitä kahdeksan kappaletta vähemmän, tekstuuriyksiköitä neljä vähemmän, piirilevyn pituus on 2,25 tuumaa eli noin 5,7 cm lyhyempi, 8- ja 6-pinnisen PCI Express -lisävirtaliittimen sijaan pärjätään kahdella 6-pinnisellä lisävirtaliittimellä, tehonkulutus on 90 wattia alhaisempi ja suositushinta jopa 270 – 300 dollaria edullisempi.

Sisältö

  1. NVIDIA GeForce GTX 460 (192-bit & 768 Mt)
  2. Asus ENGTX460 TOP -näytönohjaimen esittely
  3. Testikokoonpano, suorituskyky-, tehonkulutus- ja lämpötilamittaukset
  4. Ylikellotustestit ja loppuyhteenveto