NVIDIA GeForce GTS 450 (GF106)

21.09.2010 19:58 |

NVIDIAn viime talvi kului Fermi-arkkitehtuurin suorituskykyisimmän GF100-grafiikkapiirin ongelmien korjaamisessa ja vasta piirin kolmas A3-versio kelpasi myyntiin asti maaliskuussa julkaistuissa GeForce GTX 480- ja 470-näytönohjaimissa. Ongelmista johtuen NVIDIA myöhästyi reilusti Fermi-arkkitehtuuriin perustuvien kuluttaja- ja budjettiluokan näytönohjaimien lanseerauksessa. Heinäkuussa julkaistuun GF104-grafiikkapiiriin perustunut kuluttajaluokan GeForce GTX 460 -näytönohjain ja sen kaksi versiota olivat kuitenkin erittäin onnistunut tuotejulkaisu noin 165-250 euron hintaluokkaan. Onnistuneen hinnoittelun lisäksi GeForce GTX 460 -näytönohjaimien hyvä suorituskyky, maltillinen tehonkulutus ja alhainen lämmöntuotto olivat positiivinen yllätys GF100-grafiikkapiirin vaikeuksien jälkeen.

Uusin lanseeraus DirectX 11 -rajapintaa tukevien Fermi-näytönohjaimien joukkoon on alemman kuluttajaluokan GF106-grafiikkapiiriin perustuva GeForce GTS 450, jonka NVIDIA on suunnannut kilpailemaan näytönohjainmarkkinoista ensisijaisesti AMD:n ATI Radeon HD 5750 -näytönohjaimen kanssa ja kuluttajille, jotka käyttävät 1680×1050-resoluutiota.

Tässä artikkelissa tutustumme GF106-grafiikkapiirin ja GeForce GTS 450 -näytönohjaimen ominaisuuksiin ja saimme Asukselta testattavaksi tehtaalla grafiikkapiirin osalta 925 MHz:n kellotaajuudelle valmiiksi ylikellotetun ENGTS450 TOP -mallin. Suorituskykymittauksissa ajetaan testit läpi GeForce GTS 450:llä NVIDIAn referenssitaajuuksilla ja Asuksen tehtaalla ylikellotetuilla kellotaajuuksilla. Vertailukohtina testeissä ovat mukana NVIDIAn GeForce GTX 460 (192-bit & 768 Mt) sekä edellisen sukupolven GeForce GTX 260- ja GeForce GTS 250 -näytönohjaimet. AMD:n puolelta testeihin otettiin mukaan ATI Radeon HD 5750- ja 5770-näytönohjaimet. Mukana on myös tuttuun tapaan lämpötila- ja tehonkulutusmittaukset sekä ylikellotustestit.

TSMC:n 40 nanometrin prosessilla valmistettava ja 1,17 miljardista transistorista rakentuva GF106-grafiikkapiiri muistuttaa suunnittelultaan puolikasta GF104-grafiikkapiiriä. GF104 koostuu yhdestä GPC:stä (Graphics Processing Cluster), joka käsittää neljä SM-moduulia (Streaming Multiprocessor), jotka rakentuvat 48 CUDA-ytimestä.

Lohkokaavioon merkitty Host Interface lukee prosessorilta tulevat käskyt ja GigaThread Engine noutaa määrätyn datan keskusmuistista ja kopioi sen ruutupuskuriin (framebuffer). GeForce GTS 450:n GF106-grafiikkapiirissä on kolme 64-bittistä GDDR5-muistiohjainta, mutta yksi on kytketty pois käytöstä. GigaThread Engine luo ja lähettää säieblokit SM-moduuleille, jotka puolestaan jakavat 48 säikeen ryhmät (Warp) CUDA-ytimille ja muille suoritusyksiköille.

GeForce GTS 450:n GF106:n ROP-yksiköistä on käytössä 16 kappaletta (lohkokaaviossa L2-välimuistin yläpuolella) ja ne kykenevät suorittamaan 16 rasterioperaatiota kellojaksossa (pikseleiden sekoittaminen, reunojenpehmennyk ja atomiset muistioperaatiot). ROP-yksiköt on järjestetty kahteen kahdeksan ROP-yksikön ryhmään ja kolmas ryhmä on kytketty pois käytöstä.

Jokaisessa neljässä SM-moduulissa on 48 CUDA-ydintä eli niitä on käytössä yhteensä 192 kappaletta. Yhdessä CUDA-ytimessä on täysin liukuhihnoitettu aritmeettis-looginen- (ALU) ja liukulukuyksikkö (FPU). CUDA-ytimien rinnalla on 16 kappaletta Load/Store-yksiköitä, jotka mahdollistavat lähde- ja kohdeosoitteiden laskennan 16 säikeelle kellojaksossa sekä kahdeksan Special Function -yksikköä (SFU), jotka kykenevät suorittamaan transkendenttisia käskyjä, kuten sini, käänteisluku ja neliöjuuri.

SM-mooduuli on varustettu lisäksi kahdeksalla tekstuuriyksiköllä. Niistä jokainen kykenee laskemaan tekstuuriosoitteen ja hakemaan neljä tekstuurinäytettä kellojaksossa. Tulokset voidaan palauttaa bilineaari-, trilineaari- tai anisotrooppisella suodatuksella sekä ei-suodatettuna. Fermi-arkkitehtuurissa on yritetty parantaa teksturoinnin suorituskykyä hyötysuhteen kautta. Tämä on saavutettu siirtämällä tekstuuriyksiköt SM-moduuliin, parantamalla tekstuurivälimuistin hyötysuhdetta ja korottamalla kellotaajuutta.

Jokaisessa SM-moduulissa on oma geometriayksikkö eli PolyMorph Engine, joita GF106-grafiikkapiirissä on yhteensä neljä kappaletta. PolyMorph Engine koostuu viidestä vaiheesta, jotka ovat Vertex Fetch, Tessellator, Viewport Transform, Attribute Setup ja Stream Output. Jokaisessa yksikössä lasketut tulokset siirretään SM-moduulille, joka suorittaa pelin shaderin ja palauttaa tuloksen PolyMorph Enginen seuraavalle vaiheelle. Kun kaikki vaiheet on suoritettu, tulokset siirretään eteenpäin Raster Engineille. GF106-grafiikkapiirissä Raster Engineitä on vain yksi kappale. Raster Engine rakentuu kolmesta vaiheesta, jotka ovat Edge Setup, Rasterizer ja Z-Cull. Edge Setupissa verteksien sijainnit haetaan ja kolmion reunojen yhtälöt lasketaan. Kolmiot, jotka eivät ole kohti ruutua, poistetaan. Rasterizer laskee pikseleiden peiton ja sen tuottamat pikselit lähetetään Z-Cull-yksikölle, joka poistaa ruutupuskurissa olevien pikseleiden takana piilossa olevat pikselit tarpeettomina eikä niiden käsittelyä jatketa.

NVIDIAn GeForce GTS 450 -referenssisuunnittelussa GF106-grafiikkapiiri toimii 783 MHz:n kellotaajuudella ja on käytössä 192 CUDA-ydintä, jotka toimivat 1566 MHz:n kellotaajuudella. Tekstuuriyksiköitä on yhteensä 32 ja ROP-yksiköitä 16 kappaletta. 128-bittisen muistiohjaimen jatkona on gigatavu 902 MHz:n kellotaajuudella toimivaa GDDR5-muistia. Näytönohjaimien TDP-arvo on 106 wattia, piirilevyllä on yksi 6-pinninen PCI Express -lisävirtaliitin ja NVIDIAn mukaan GF104-grafiikkapiirin maksimi toimintalämpötila on 95 astetta.

Sisältö

  1. NVIDIA GeForce GTS 450 (GF106)
  2. Asus ENGTS450 TOP
  3. Testikokoonpano, suorituskyky-, tehonkulutus- ja lämpötilamittaukset
  4. Ylikellotustestit ja loppuyhteenveto