Uusimmat

Larrabee-arkkitehtuuri

30.09.2008 00:19 Muropaketin toimitus

Yksi IDF Fall 2008 -tapahtuman odotetuimmista aiheista oli Larrabee-arkkitehtuuri. Valitettavasti hyvin nopeasti kävi selväksi, että monilla oli odotukset turhan korkealla ja tapahtumassa ei esitelty asioita kuin teoriassa. Näytillä ei ollut mitään Larrabee-arkkitehtuuriin liittyvää fyysistä tuotetta tai kehitysalustaa eikä puhujat osanneet kertoa kovin tarkasti myöskään valmiiden tuotteiden ominaisuuksista.

Saimme luennon päätyttyä erikseen selvitettyä, että ensimmäinen Larrabee-tuote tulee olemaan PCI Express -väylään asennettava lisäkortti, jota voidaan käyttää esimerkiksi näytönohjaimen rinnalla.

Koska fyysisiä tuotteita ei ollut nähtävillä, joudumme tyytymään VCTS0001-seminaarissa esitettyihin dioihin:

Grafiikkapiirien historia ja kehitys on monille varmasti melko tuttu tarina. Ensimmäisissä grafiikkapiireissä liukuhihnat olivat kiinteät, mutta viime vuosina osa toiminnoista on ollut ohjelmoitavia.

Larrabeen perusajatuksena on yhdistää prosessorin ja grafiikkapiirin parhaat puolet yhdeksi kokonaisuudeksi, joka Intelin mukaan ratkaisee useita grafiikkapiirien nykyisiä rajoituksia. Intel on listannut nykyisen moniytimisen prosessorin puolelta eduksi ohjelmoitavuuden ja grafiikkapiirin puolelta on listattu rinnakkaisuus. Larrabee on Intelin mukaan tehokas ja skaalautuva ohjelmistopohjainen renderöijä, joka tarjoaa joustavuutta ja ohjelmoitavuutta useille eri sovelluksille.

Larrabee rakentuu useista kymmenistä tai jopa sadoista Pentium-arkkitehtuurista vaikutteita ottaneista ytimistä. Intel ei ole vain tyytynyt yhdistämään Pentium-ytimiä yhdeksi isoksi kimpuksi, vaan on työstänyt muun muassa liukuluku- ja kokonaislukuyksiköt kokonaan uusiksi, lisännyt wide vector processing -yksikön (VPU), monisäikeisyyden, 64-bittiset laajennukset sekä kehittyneen esihaun (pre-fetch).

Piirikaaviosta nähdään, että ytimet kommunikoivat keskenään ring-bus-väylän välityksellä, joka tarjoaa nopean pääsyn muistiin ja kiinteisiin toimintoihin. L2-välimuisti on osioitu ytimien kesken, joka tarjoaa korkean yhdistetyn kaistanleveyden sekä tiedon monistamisen ja jakamisen.

Kun käsittelyyn otetaan yksi prosessoriydin, joita Larrabeessa saattaa olla tulevaisuudessa jopa satoja, voidaan siitä eritellä omiksi yksiköiksi käskyjen dekoodaus, skalaari- ja vektoriyksiköt sekä rekisterit ja L2- sekä L1-välimuistit.

Larrabeen tekstuurilogiikka on kiinteä ja se kommunikoi ytimien kanssa L2-välimuistin kautta.

Larrabeen suurimmat erot grafiikkapiiriin verrattuna ovat Intelin mukaan muun muassa: jokainen ydin on oma Intelin Pentium-pohjainen prosessori, joka kykenee suorittamaan kontekstin vaihdon, esi-tyhjentävää moniajoa, heittovaihdon ja ttimet osaavat käyttää virtuaalimuistia. Ytimet kommunikoivat keskenään tehokkaasti ja kiinteät toiminnot eivät haittaa menoa.

Intel on analysoinut Larrabeen suorituskykyä on vasta simulaatiotasolla ja kokeissa on selvitetty 3D-pelien ja sovelluksien työkuorman jakautumista. F.E.A.R.-, Gears of War- ja Half-Life 2 -pelien kohdalla esimerkiksi Pixel Shaden ja rasteroinnin osuus vaihtelee merkittävästi.

Kyseisissä peleissä nähdään kuitenkin Intelin mukaan lähes lineaarinen skaalautuminen Larrabee-ytimien lukumäärää kasvattamalla.

Monisäikeisissä sovelluksissa skaalautuvuutta on simuloitu tällä hetkellä 64 ytimellä ja optimaalisessa tapauksessa suorituskyky on yhteen ytimeen täysin lineaarinen.

Larrabee mahdollistaa myös muutamien ongelmallisten renderöintitapausten ratkaisemisen. Yllä olevissa esimerkeissä käsitellään objektien järjestelyä, sumua ja varjoissa käytettävää Irregular Z-buffer -algoritmia.

Ohjelmatasolla Larrabee-arkkitehtuuriin perustuvat tuotteet kommunikoivat perinteisen ajurin välityksellä DirectX-, OpenGL- tai Larrabeen natiivin C/C++-rajapinnan kanssa.

IDF-tapahtuman Technology Showcase -alueella esiteltiin Ray Tracing -efekteillä piristettyä Quake Wars -peliä, joka renderöitiin kokonaan prosessorilla. Tarkemmin ottaen esittelykokoonpano koostui neljästä 6-ytimisestä Dunnington-koodinimellisestä Xeon 7400 -sarjan prosessorista, joten käytettävissä oli yhteensä 24 prosessoriydintä.

Quake Wars rullasi demokoneessa noin 15 – 20 FPS:n ruudunpäivitysnopeudella 1024×768-resoluutiolla. Intelin edustajan mukaan suorituskyky skaalautuu lähes lineaarisesti käytössä olevien prosessoriytimien ja kellotaajuuden mukaan. Heijastukset ja valonsäteiden taittumiset näyttivät hienoilta rakennuksien ikkunoissa, teleporteissa ja muissa kohteissa, mutta sulava pelikokemus kotikoneilla on tuskin mahdollinen pelkästään prosessorilla renderöitynä vielä pariin vuoteen. Intelin edustajan mukaan he odottavat Larrabeen julkaisua kuin kuuta nousevaa, sillä se soveltuu erinomaisesti juuri Ray Tracing -efektien renderöintiin.

Sisältö

  1. IDF Fall 2008, osa 2 (Lynnfield, Ibex Peak, Larrabee, Calpella)
  2. Lynnfield-prosessori & Ibex Peak -alusta
  3. Larrabee-arkkitehtuuri
  4. Calpella-mobiilialusta Nehalemille
  5. Atom, SSD-kiintolevyt & Core 2 Extreme Mobile QX9300
  6. Lucid Hydra 100: Multi-GPU-ratkaisu ilman piirisarjarajoituksia