Uusimmat

Cayman-grafiikkapiirin ja Radeon HD 6900 -sarjan uudistukset

15.12.2010 07:01 Muropaketin toimitus

Toisin kuin AMD Radeon HD 6800 -sarjan Barts-grafiikkapiiri, joka perustui lähes täysin Cypress-grafiikkapiireissä käytettyyn TeraScale 2 -arkkitehtuuriin, Cayman-grafiikkapiirissä on tehty suurempia arkkitehtuuritason muutoksia ja uudistuksia, joilla on keskitytty hyötysuhteen ja geometriasuorituskyvyn parantamiseen sekä kuvanlaatuominaisuuksiin ja tehonhallintaan.

Kertauksen vuoksi alla listattuna Muropaketin tekniikkakatsaukset AMD:n viimeisimpiin grafiikkapiirijulkaisuihin ja arkkitehtuuriuudistuksiin:

 

Suurempi versio kuvaa klikkaamalla

Caymanissa TeraScale 2 -arkkitehtuuriin on lisätty toinen grafiikkamoottori, käytössä on VLIW4-arkkitehtuuri, 24 SIMD-moottoria, 96 tekstuuriyksikköä, päivitetyt renderöinnin taustaosat ja uusia ominaisuuksia GPU-laskentaan. Bartsin tavoin grafiikkapiiriin on lisätty toinen Ultra-Threaded Dispatch Processor ja tesselointiyksikkö on päivitetty kahdeksanteen sukupolveen. Molemmilla säikeet ryhmiksi kokoavilla ja stream-prosessoreille käsiteltäviksi lähettävillä Ultra-Threaded Dispatch Processoreilla on omat käsky- ja vakiovälimuistit.

Suurempi versio kuvaa klikkaamalla

AMD:n aikaisempiin grafiikkapiireihin verrattuna Cayman-grafiikkapiirissä stream-prosessorit on jaoteltu SIMD-moottoreiden ja säieprosessoreiden sisällä neljän identtisen yksikön ryppäiksi (4D). Stream-prosessorien rinnalla on haarasuoritusyksikkö vuonohjaukseen sekä yleiskäyttörekisterit varastoimaan syöttö-, ulostulo- ja väliaikaistietoa.

Cypress- ja Barts-grafiikkapiireissä neljän stream-prosessorin rinnalla on VLIW5-suunnittelussa lisäksi yksi erikoisyksikkö, joka kykenee suorittamaan ainoastaan transsendenttisia funktioita, kuten sin, cos, log ja exp, mutta Caymanissa samanaikaisesti kolme stream-prosessoria neljästä pystyvät käsittelemään myös näitä funktioita. Caymanin VLIW4-suunnittelulla saavutetaan parempi käyttöaste kuin VLIW5-suunnittelulla ja samalla 10 % parannus suorituskyvyssä piisirun neliömillimetriä kohti.

Cypress-grafiikkapiirissä on yhteensä 1600 stream-prosessoria ja 20 SIMD-moottoria. SIMD-moottorissa on 16 kappaletta säieprosessoreita, jotka ovat viiden stream-prosessorin ryppäitä. Jos Cypressin 1600 stream-prosessorista erotetaan ainoastaan transsendenttisia funktioita suorittavat erikoisyksiköt, jäljelle jää 1280 stream-ydintä ja 320 erikoisyksikköä. Teoriatasolla Caymanissa on 1536 kappaletta hieman Cypressin tavallisia stream-prosessoreita kehittyneempiä stream-prosessoreita, joka vastaa 20 % laajennusta, jos erikoisyksiköt jätetään laskematta.

Renderöinnin taustaosat (Render Back-End) on päivitetty ja Caymanissa kirjoitusoperaatiot on yhdistetty, 16-bittiset kokonaislukuoperaatiot ovat kaksi kertaa nopeammat ja 32-bittiset liukulukuoperaatiot 2-4 kertaa nopeammat Cypressiin verrattuna.

Caymanin kahden grafiikkamoottorin myötä myös tesselaatioyksiköitä on kaksin kappalein ja samalla yhdessä kellojaksossa voidaan prosessoida kaksi primitiiviä. Kahdeksannen sukupolven tesselointiyksiköt tukevat grafiikkapiirin ulkopuolista puskurointia ja yhdessä niiden luvataan tarjoavan parhaimmillaan jopa kolme kertaa ATI Radeon HD 5870:n kuudennen sukupolven tesselointiyksikköä paremman tesselointisuorituskyvyn.

Uusi Enhanced Quality Anti-Aliasing -ominaisuus tarjoaa Radeon HD 6900 -näytönohjaimille paremman reunojenpehmennyksen kuvanlaadun maksimissaan 16 kattavuusnäytteellä pikselin sisältä (8x EQAA). NVIDIAn vastaava tekniikka on nimeltään Coverage Sampling Antialiasing (CSAA), joka on ollut käytössä GeForce 8 -sarjan näytönohjaimista lähtien.

Enhanced Quality Anti-Aliasing asetetaan käyttöön Catalyst Control Centeristä reunojenpehmennysasetuksen valinnan yhteydestä. AMD:n mukaan EQAA-asetuksen vaikutus suorituskykyyn on minimaalinen.

Cayman tukee jo AMD Radeon HD 6800 -sarjan yhteydessä esiteltyä Morphological Anti-Aliasing -reunojenpehmennystekniikkaa, joka hyödyntää Microsoftin GPU-laskentaan tarkoitettua DirectCompute-rajapintaa. MLAA on yhteensopiva DirectX 9-, 10- ja 11-rajapintojen kanssa ja se on AMD:n mukaan suorituskykyisempi kuin super-sampling-tekniikka.

 

PowerTune-teknologia

AMD on joutunut NVIDIAn tavoin huomioimaan muutamien rasitusohjelmien, kuten Furmarkin ja OCCT:n, aiheuttaman näytönohjaimen merkittävästi tavallista pelirasitusta korkeamman tehonkulutuksen ja grafiikkapiirin lämmöntuoton. Radeon HD 6950- ja 6970-näytönohjaimet tuovat mukanaan PowerTune-teknologian, joka rajoittaa näytönohjaimen tehonkulutuksen ennalta määrätylle tasolle.

Cayman-grafiikkapiiriin transistoritasolla integroitu PowerTune-ominaisuus tarkkailee grafiikkapiirin tehonkulutusta ja rasitusta jokaisella kellojaksolla ja säätää grafiikkapiirin eri osien kellotaajuutta jopa alle millisekunnin välein, ettei TDP-arvo ylitä ennalta määrättyä asetusta.

NVIDIAn GeForce GTX 580- ja 570-näytönohjaimissa käyttämä Advanced Power Management -ominaisuus laskee grafiikkapiirin kellotaajuuden tiettyyn kellotaajuuteen, jolloin suorituskyky laskee samassa suhteessa. PowerTune puolestaan optimoi kellotaajuutta maksimi TDP-arvon suhteen, joten suorituskyky säilyy parempana kuin pelkästään kellotaajuus tiettyyn arvoon laskemalla.

AMD tarjoaa käyttäjille mahdollisuuden kontrolloida PowerTune-teknologiaa Catalyst Control Centerin Overdrive-välilehdeltä. Säätö mahdollistaa rajan nostamisen tai laskemisen 20 prosentilla eli esimerkiksi 250 watista 300 tai 200 wattiin. Ainakaan toistaiseksi käyttäjät eivät voi kytkeä pois päältä PowerTune-teknologia.

Testasimme AMD Radeon HD 6970 -näytönohjaimella Furmark 1.8.2 -rasitusohjelmaa, jolla kokoonpanon tehonkulutus nousi 335 wattiin ja Cayman-grafiikkapiirin lämpötila 88 asteeseen. Tämän jälkeen grafiikkapiirin kellotaajuus alkoi vaihdella noin 550-880 MHz:n välimaastossa, kuten yllä oleva GPU-Z:n Sensors-välilehti osoittaa.

Kun Overdrive-välilehdeltä asetettiin PowerTune-asetus +20 prosenttiin, nousi kokoonpanon tehonkulutus 341 wattiin ja grafiikkapiirin lämpötila pysytteli tuulettimen korkeamman kierrosnopeuden ansiosta 87 asteessa ja grafiikkapiirin kellotaajuus pysyi 880 MHz:ssä.

Näillä lukemilla eli kokoonpanon vaivaisella kuusi wattia korkeammalla tehonkulutuksella PowerTune-teknologian käyttäminen Radeon HD 6950- ja 6970-näytönohjaimissa tuntuu ylireagoinnilta rasitusohjelmien suhteen, mutta kenties teknologia on kehitetty esimerkiksi tulevia mobiiligrafiikkapiirejä silmällä pitäen.

AMD:n omat esimerkit esittelevät PowerTune-teknologiaa teoriassa ja käytännössä. Kun näytönohjaimen tehonkulutus ylittää PowerTunen TDP-arvon, kontrolloidaan grafiikkapiirin kellotaajuutta jatkuvasti siten, että tehonkulutus säilyy TDP-arvon alapuolella. Grafiikkapiirin kellotaajuuden laskemisesta on luonnollisesti seurauksena hieman alhaisempi suorituskyky.

Sisältö

  1. AMD Radeon HD 6950 & 6970 (Cayman)
  2. Cayman-grafiikkapiirin ja Radeon HD 6900 -sarjan uudistukset
  3. AMD Radeon HD 6970 (Cayman XT)
  4. AMD Radeon HD 6950 (Cayman Pro)
  5. Testikokoonpano ja suorituskykymittaukset
  6. Tehonkulutus-, lämpötila- ja melumittaukset
  7. Ylikellotustestit
  8. Loppuyhteenveto

Muropaketin uusimmat