Uusimmat

Ampere-arkkitehtuuri

13.10.2020 12:15 Aleksi Pakkala

Ampere-arkkitehtuuri

Nvidian uusi Ampere-arkkitehtuuri tuo näytönohjainmarkkinoille uudistuksia, joista hyötyvät niin pelaajat kuin sisällöntuottajatkin.

Edelliseen Pascal-arkkitehtuurin verrattuna muutoksia ovat muun muassa mainittu tuki HDMI 2.1 -stardardille, 8 nanometrin viivanleveyden prosessorin valmistusprosessi, toisen sukupolven säteenseurantayksiköt, kolmannen sukupolven tensor-laskentayksiköt ja GDDR6X-grafiikkamuisti.

HDMI 2.1 -standardin lisäksi uudet Ampere-arkkitehtuurin näytönohjaimet tukevat DSC 1.2a (Digital Stream Compression) -ominaisuutta, jonka avulla 8K-sisältöä voidaan toistaa 60 hertsin kuvataajuudella, tai 4K-sisältöä jopa 240 hertsin kuvataajuudella. Toistaiseksi tarjolla ei ole 240 hertsin kuvataajuuteen yltäviä 4K-paneeleita, mutta teoreettinen tuki tuolle on jo olemassa.

On mainitsemisen arvoista, että DSC 1.2 -ominaisuudesta hyötyy myös DisplayPort 1.4a -standardia käyttävät näytöt, ja samat resoluutiot samoilla ruudunpäivitysnopeuksilla ovat saavutettavissa DisplayPort 1.4a -liitäntöjä käyttäen.

Varsinkin palvelinpuolella yksi näytönohjainten tärkeimmistä mitattavista ominaisuuksista on suorituskyky virrankulutukseen suhteutettuna. Myös tämän sukupolven vaihdoksen myötä näytönohjainten energiatehokkuus on parantunut huomattavasti. Sen kerrotaan olevan noin 1,9-kertainen RTX 2000 -sarjan Turing-arkkitehtuuriin verrattuna.

Parantunut energiatehokkuus on luonnollisesti monien asioiden summa, mutta siirtymisellä 8 nanometrin viivanleveyden prosessoreihin on tähän valtava vaikutus. Valmistusprosessin viivanleveyden pienentyessä Turing-arkkitehtuurin 12 nanometristä Ampere-arkkitehtuurin 8 nanometriin, vain hieman edellisen sukupolven TU104-grafiikkaydintä fyysisiltä mitoiltaan suuremmalle GA102-grafiikkaytimelle on saatu mahtumaan yli kaksinkertainen määrä transistoreita. Määrä kasvanut lukemaan 28,3 miljardia edellisen sukupolven 13,6 miljardiin verrattuna.

Säteenseurantaydinten määrä on kasvanut GeForce RTX 2080 -näytönohjaimen 46 kappaleesta GeForce RTX 3080 -mallin 68 kappaleeseen. Verrattain vähäisestä kasvusta huolimatta, on näytönohjaimen säteenseurannan suorituskyky kaksinkertaistunut toisen sukupolven säteenseurannan ytimien ansiosta.

Suurimmat suorituskykyparannukset toisen sukupolven säteenseurannan laskentayksiköissä on saavutettu mahdollistamalla säteenseurantaydinten ja tensor-ydinten käyttö samanaikaisesti renderöintiputkessa.

Turing-arkkitehtuurin näytönohjaimilla säteenseurantaa käytettäessä säteenseurantaytimien täytyi suorittaa laskenta valmiiksi, ennen kuin tensor-ytimiä voitiin käyttää senhetkisen ruudun renderöinnissä. Kun säteenseurantaytimiä ja tensor-ytimiä voidaan hyödyntää renderöinnissä samanaikaisesti, saadaan renderöintiaika jopa puolitettua, jolloin ruudunpäivitysnopeus kaksinkertaistuu.

Ampere-arkkitehtuurin grafiikkaytimissä on pienempi määrä tensor-ytimiä Turing-arkkitehtuurin grafiikkaytimiin verrattuna, mutta tensor-ytimien laskentatehoa on parannettu huomattavasti. Tensor-ytimillä suoritetaan syväoppimiselle olennaisia laskentoja, kuten matriisien kertolaskuja. Kolmannen sukupolven tensor-ydinten parannusten lopputulos on kuitenkin se, että GeForce RTX 3080 suoriutuu Nvidian mukaan 2,7 kertaa tehokkaammin tensor-ytimiä käyttävistä laskutehtävistä kuin edellisen sukupolven GeForce RTX 2080 Super.

Pelaamiseen liittyviä käytännön esimerkkejä tensor-ydinten käytöstä ovat säteenseurannan laskenta, DLSS-ominaisuuden vaatima laskenta ja GeForce RTX Voice -ohjelman tarjoamat toiminnallisuudet, kuten taustakohinan reaaliaikainen poistaminen mikrofonin äänestä.

GDDR6X on uusin ja nopein grafiikkamuistin standardi, ja GeForce RTX 3080 näytönohjaimelle tätä uutta muistia on sijoitettu kymmenen gigatavun verran. Tiedonsiirto GDDR6X-muistimoduulien ja grafiikkaytimen välillä tapahtuu 320-bittisen muistiväylän kautta 19 Gbps väylän kautta, jonka ansiosta muistin kaistanleveys on hurjat 760 gigatavua sekunnissa. Tuo on noin 1,5 kertainen parannus GeForce RTX 2080 mallin 448 Gt/s kaistanleveyteen nähden, ja korkeammasta grafiikkamuistin kaistanleveydestä on apua varsinkin korkeilla resoluutioilla pelatessa.

Ampere-arkkitehtuurin näytönohjaimet tukevat myös PCIe 4.0 -standardia, mutta tuosta ei tässä vaiheessa ole näytönohjainten suorituskyvylle merkittävää hyötyä. PCIe 4.0 -tuen hyödyt saattavat realisoitua vasta myöhemmin, mikäli RTX IO -tyyliset teknologiaratkaisut, joissa dataa luetaan suoraan nopealta PCIe 4.0 NVMe -muistilta näytönohjaimen grafiikkamuistiin, yleistyvät. Tällä hetkellä kuitenkin esimerkiksi RTX IO on todella varhaisessa kehitysvaiheessa, eikä teknologiaa käyttäviä valmiita pelejä tai palveluita ole saatavilla.

Mikäli uudesta Ampere-arkkitehtuurista haluaa oppia lisää, kannattaa tutustua Nvidian jakamaan 44-sivuiseen dokumentaatioon Ampere-arkkitehtuurista ja sen tuomista muutoksista.

Sisältö

  1. Johdanto
  2. Tuotteen esittely
  3. Ampere-arkkitehtuuri
  4. Suorituskykymittaukset
  5. Yhteenveto

Aleksi Pakkala

”Liityin Muropaketin kirjoittajien riveihin syksyllä 2017 ja otin kontolleni tietokonekomponenttien puolen - näytönohjaimet, prosessorit, emolevyt ja muistit. Olen kirjoitellut muustakin tietotekniikasta, ja hairahtanut jopa peliarvostelujen puolelle - mutta sydämeni sykkii lopulta benchmarkkaamiselle ja suorituskykylukujen pyörittelylle. Niin elokuvien kuin pelien kanssa huomaan ajautuvani toistuvasti scifin pariin ja nauttivani siitä. Vielä en ole kokenut pelien saralla mitään yhtä vakuuttavaa kuin alkuperäisen Mass Effect -trilogian, ja tulevista elokuvista eniten odotan jatkoa vuoden 2021 Dyynille.”

Muropaketin uusimmat