Uusimmat

Intel Core 2

18.07.2006 14:51 Muropaketin toimitus

Intelin Conroe-koodinimellä tunnettava prosessori on yksi tämän vuoden suurimpia tuotejulkaisuja ja se on yhdessä Allendalen kanssa samalla ensimmäinen työpöytäkäyttöön tarkoitettu prosessori, joka perustuu prosessorijätin uuteen Core-arkkitehtuuriin. Coresta on vastuussa aiemmin Pentium M -kehitystyön takana nikkaroinut israelilainen työryhmä ja uusi arkkitehtuuri tuo odotetun korvaajan tiensä päähän ajautuneelle vuoden 2000 lopulla julkaistulle NetBurstille. Kuudetta vuotta Intelin edustuksessa olleen NetBurstin lopun ajan merkkejä oli havaittavissa viimeistään viimeisinä julkaistuilla Pentium 4- ja Pentium D -prosessoreilla, joilla tehonkulutus ja sen myötä lämmöntuotto nousivat pilviin.

Core pyrkii tuomaan juuri tehonkulutukseen ja lämmöntuottoon ratkaisuja, joihin tämän artikkelin alussa perehdytään. Mukana on kaksi Conroe-koodinimellistä prosessoria, joista Core 2 Extreme X6800 edustaa Intelin tämän hetken suorituskykyisintä kärkeä, kun taas Core 2 Duo E6700 sijoittuu kuluttajahintaisten prosessoreiden kärkeen. Vertailuna mukana on Intelin osalta Pentium 4 670- ja Pentium Extreme Edition 955 -prosessorit ja AMD:ltä AM2-kantaiset Athlon 64 FX-62- ja Athlon 64 X2 5000+ -prosessorit. Mittauskohteina ovat tehonkulutus, lämmöntuotto ja luonnollisesti suorituskyky. Artikkeli niitataan pakettiin ilma- ja vesijäähdytyksillä toteutetuilla ylikellotustesteillä.

 

Intel Core -arkkitehtuuri

Viime vuoden lopussa Intel teki virallisesti selväksi, että luvassa on rajuja muutoksia ja, että mm. aiempi entistä korkeampiin kellotaajuuksiin tähtäävä ajatusmalli on taakse jäänyttä Inteliä. Yritys mainostaa Corea ”performance-per-watt”-käsitteellä eli suomeksi sanottuna entistä enemmän suorituskykyä, muttei enää tehonkulutuksen kustannuksella. Arkkitehtuuri ei sinänsä sisällä kovinkaan paljon suuria uusia innovaatioita, ja pääasiallisesti siinä on yhdistelty mobiilikäyttöön tarkoitettujen Pentium M -prosessoreiden varsinkin tehonkulutukseen liittyviä hyviksi todettuja ominaisuuksia muutamiin uusiin innovaatioihin ja on mukana myös paljon ominaisuuksia NetBurst-arkkitehtuurista.

Suorituskyky tietokonemaailmassa tarkoittaa usein aikaa, joka kulutetaan tietyn ohjelman tai tehtävän suorittamiseen, tai kykyä ajaa useita ohjelmia tai tehtäviä annetussa ajassa. Päinvastoin kuin usein ymmärretään, suorituskyky ei ole sama asia kuin pelkästään kellotaajuus tai IPC (Instructions per Clock Cycle) eli suoritettujen käskyjen määrä kellojaksossa. Intelin mukaan todellinen suorituskyky määräytyy näiden molempien tulona. Näin ollen suorituskykyä voidaan parantaa nostamalla kellotaajuutta, IPC:tä tai mahdollisesti jopa molempia. Näiden kahden menetelmän lisäksi suorituskykyä voidaan parantaa vähentämällä tiettyyn operaatioon kulutettavien käskyjen määrää, ja tähän tehtävään käytetään SIMD-käskyjä (Single Instruction Multiple Data). Intel implentoi 64-bittiset kokonaisluku-SIMD-käskyt vuonna 1996 Pentium-prosessoreihin MMX-tekniikan myötä, Pentium III:n myötä siirryttiin SSE-käskykantaan (Streaming SIMD Extensions) ja SSE2 sekä SSE3 on julkaistu tämän jälkeen myöhemmissä prosessoreissa.

Tehonkulutuksen vastaavasti määrää prosessorin kellotaajuus kerrottuna käyttöjännitteen neliöllä ja dynaamisella kapasitanssilla, joka on arkkitehtuuririippuvainen ja riippuu ytimen transistorimäärästä ja niiden aktiivisuudesta.

Kuten jo aiemmin mainittiin, Core-arkkitehtuuri yhdistää pääasiallisesti Intelin jo aiemmin kehittämien tekniikoiden parhaimmat puolet yhteen, mutta mukana on myös uusia innovaatioita. Intel mainostamat viisi innovaatiota ovat Wide Dynamic Execution, Advanced Digital Media Boost, Advanced Smart Cache, Intelligent Power Capability ja Smart Memory Access.

Dynamic Execution on yhdistelmä tekniikoita, jotka Intel implentoi ensimmäisenä P6-arkkitehtuuriin perustuviin prosessoreihin (Pentium Pro, Pentium II ja Pentium III). Näihin lukeutuvat Data Flow Analysis, Speculative Execution, Out of Order Execution ja Super Scalar. NetBurst-arkkitehtuurin myötä Intel julkaisi Advanced Dynamic Execution -moottorin, joka suunniteltiin pitämään prosessorin suoritusyksiköt koko ajan toiminnassa. ADE käsitti myös kehittyneen haaraennakointialgoritmin vähentämään väärinarvioitujen haarojen määrää.

Core-arkkitehtuurilla Intel kehittää tätä kykyä Wide Dynamic Executionilla, joka mahdollistaa toimitettavan enemmän käskyjä kellojaksoa kohden ja näin ollen parantaa suoritusaikaa ja energiatehokkuutta. Jokainen suoritusydin on entistä leveämpi, mahdollistaen jokaisen ytimen noutaa, lähettää, suorittaa ja palauttaa enimmillään neljä täyttä käskyä kerrallaan. Aiempiin Mobile- ja NetBurst-arkkitehtuureihin perustuvat prosessorit kykenevät käsittelemään ainoastaan kolme käskyä kerrallaan.

Yksi ominaisuus suoritusajan vähentämiseen on makrofuusio. Aiempien sukupolvien prosessoreissa jokainen sisään tuleva käsky tulkittiin ja suoritettiin yksitellen, mutta makrofuusion myötä yhteiset käskyparit voidaan yhdistää tulkintavaiheessa yhdeksi sisäiseksi käskyksi. Tämän jälkeen kaksi ohjelmakäskyä voidaan suorittaa yhdellä mikro-operaatiolla, mikä vähentää prosessorin keskimääräistä työtaakkaa. Menetelmä lisää ajettavien käskyjen määrää tietyssä ajassa ja vähentää aikaa, joka kuluu käskyrykelmän ajamiseen. Core-arkkitehtuuri sisältää myös kehitetyn Arithmetic Logic Unitin (ALU) auttamaan makrofuusion toimintaa, sekä lisää mikro-operaatiofuusion, joka on tuttu energiansäästötekniikka jo ensimmäisistä Pentium M -prosessoreista. Nykyisissä prosessoreissa x86-ohjelmakäskyt (makro-operaatiot) pilkotaan pieniksi palasiksi, joita kutsutaan mikro-operaatioiksi, ennen kuin ne lähetetään prosessoriliukuhihnalle prosessoitavaksi. Mikro-operaatiofuusio ”sulattaa” mikro-operaatiot, jotka lähetetään samasta makro-operaatiosta, mikä vähentää suoritettavien mikro-operaatioiden määrää.

Advanced Digital Media Boost on ominaisuus, joka lisää huomattavasti suorituskykyä suoritettaessa SSE-käskyjä. 128-bittiset aritmeettiset kokonaisluku- ja tuplatarkkuudelliset liukulukuoperaatiot vähentävät tietyn ohjelman suorittamiseen vaadittavaa keskimääräistä käskymäärää, ja lopputulos voi vaikuttaa suorituskyvyn nousuun. Nämä kiihdyttävät mm. video-, puhe ja kuva-, kuvankäsittely-, kryptografia-, talous-, insinööri- ja tiedeohjelmistoja. SSE-käskyt monipuolistavat arkkitehtuuria mahdollistamalla ohjelmoijien kehittämään algoritmeja, joka voivat sekoittaa pakattua, yksinkertaistarkkuudellista, liukulukuja ja kokonaislukuja käyttämällä sekä SSE- että MMX-käskyjä.

Useissa aiempien sukupolvien prosessoreissa 128-bittiset SSE-, SSE2- ja SSE3-käskyt suoritettiin tavalla, jossa yksi käsky suoritettiin kahdessa kellojaksossa, eli esimerkiksi ensimmäiset 64 bittiä ensimmäisessä kellojaksossa ja jälkimmäiset 64 bittiä toisessa. Advanced Digital Media Boostin myötä nämä 128-bittiset käskyt on mahdollista suorittaa yhdessä kellojaksossa. Tekniikasta on hyötyä varsinkin, kun käynnissä on useita multimediaoperaatioita, jotka käyttävät SSE-, SSE2- ja SSE3-käskyjä.

Advanced Smart Cache on moniytimisiä prosessoreita varten optimoitu välimuistitekniikka, joka parantaa suorituskykyä ja tehokkuutta kasvattamalla mahdollisuutta, että kaksiydinprosessorin kummallakin ytimellä on pääsy dataan entistä suorituskykyisemmästä ja tehokkaammasta välimuistijärjestelmästä. Toisin sanoen tekniikka mahdollistaa L2-välimuistin jakamisen molempien ytimien kesken, kun aiemmissa kaksiydinprosessoreissa molemmilla ytimillä on ollut käytössä oma L2-välimuisti.

Lisäksi tekniikka osaa jaotella välimuistin ytimien kesken niiden käyttötarpeiden perusteella, jolloin jompi kumpi ytimistä voi napata haltuunsa esimerkiksi koko välimuistin, jos toinen ydin on lepotilassa. Molempien ytimien ollessa aktiivisina, välimuisti jaetaan näiden kesken riippuen ytimien työmäärästä. Jos ytimet käsittelevät samanaikaisesti samaa dataa, se säilötään ainoastaan yhteen kertaan L2-välimuistiin. Merkittävä etu jaetusta välimuisti on myös, että se vähentää huomattavasti prosessoriväylän ja laitteiston muistin työmäärää. Prosessoreissa, joissa ytimillä on oma L2-välimuisti, sama data voi olla molemmissa välimuisteissa samaan aikaan ja tämän takia on jatkuvasti pidettävä huoli, että molemmissa välimuisteissa on käytössä uusin data. Kun välimuistissa oleva data lopulta lähetetään käsiteltäväksi, kumpikin ydin tarkistaa, ettei data ole muuttunut toisen ytimen toimesta. Jos näin on päässyt käymään, data päivitetään välittömästi ja esimerkiksi NetBurst-arkkitehtuuriin perustuvissa prosessoreissa tämä tapahtuu laiteväylän ja laitteiston muistin kautta.

Smart Memory Access parantaa laitteiston suorituskykyä optimoimalla saatavilla olevan kaistanleveyden käyttöä muisteihin. Tavoitteena on varmistaa, että data voidaan käsitellä niin nopeasti kuin vain mahdollista ja, että data on sijoitettu mahdollisimman lähelle paikkaa, missä sitä tarvitaan.

Yleensä prosessoreilla load-operaatiota ei voida suorittaa ennen store-operaatioita, mutta useissa tapauksissa load-operaatiot eivät ole riippuvaisia edellisestä store-operaatiosta ja voitaisiin yhtä hyvin ladata aikaisemmin. Ongelmana on tunnistaa, mitkä load-operaatiot voidaan ladata etukäteen ja mitkä eivät. Tässä kohtaa kuvioihin tulee mukaan Smart Memory Accessin uusi algoritmi, memory disambliguation, joka arvioi, voidaanko jokin tietty load-operaatio suorittaa ennen store-operaatiota. Jos ohittaminen onnistuu, prosessori käyttää vähemmän aikaa odottamiseen ja enemmän prosessointiin, mikä vastaavasti näkyy suoraan suorituskyvyssä. Jos arvioinnissa kuitenkin tapahtuu virhe, memory disambiguation huomaa tämän, uudelleenlataa oikean datan ja suorittaa käskyn.

Varmistaakseen, että data on siellä, missä molemmat ytimet sitä tarvitsevat, L1-välimuistissa on kaksi ennakoivaa noutoyksikköä, jotka tunnistavat tulevia käskyjä ja hakevat tarvittavan datan jo etukäteen välimuistiin. L2-välimuistissa on niin ikään kaksi vastaavaa yksikköä, jotka analysoivat hakuja ytimiltä ja varmistavat, että L2-välimuistissa on dataa, jota ytimet saattavat tarvita.

Intelligent Power Capability on viidestä Intelin innovaatiosta viimeinen ja nimensä mukaisesti se koostuu ryppäästä erilaisia tekniikoita, joiden tarkoituksena on alentaa tehonkulutusta. Se sisältää mm. tekniikan, joka kytkee pois käytöstä prosessorin ominaisuuksia, joille ei ole juuri sillä hetkellä käyttöä. Kumpikin/jokainen ydin on paloiteltu pieniin osiin ja sisäisiin väyliin, joita ohjataan erikseen.

Sisältö

  1. Intel Core 2
  2. Intel Core 2 -prosessorit
  3. Testikokoonpano, Tehonkulutus & Lämpötila
  4. Pakkaus- ja renderöintitestit, Synteettiset testit, Pelitestit & Moniajotestit
  5. Ylikellotus
  6. Loppuyhteenveto