Intelin Nehalem-arkkitehtuuri & Core i7-920 (2,66 GHz)
7.11.2008
Nehalem-arkkitehtuuri

Nehalem-arkkitehtuuri on suunniteltu skaalautuvaksi 1 - 8 ytimelle, jotka voivat suorittaa samanaikaisesti kahta säiettä Pentium 4:n Netburst-arkkitehtuurista tutun, mutta uudistetun Hyper-Threading-ominaisuuden avulla. Kaksiytiminen piisiru on tarkoitettu kannettaviin tietokoneisiin, neliytiminen työpöytäkokoonpanoihin ja kahdeksan ydintä palvelimiin ja työasemiin.

Nehalem on Intelin Tick-Tock-kehitysmallin jälkimmäinen Tock-vaihe, jossa uusi mikroarkkitehtuuri suunniteltiin viime vuonna Tick-vaiheessa käyttöönotettua 45 nm:n valmistusprosessia hyödyntäen. Seuraavaksi vuorossa on jälleen Tick-vaihe, jossa Nehalem-arkkitehtuuri siirretään 32 nm:n valmistusprosessiin Westmere-koodinimellisten prosessoreiden myötä.

Ensimmäiset Nehalemiin perustuvat Core i7 -työpöytäprosessorit ovat neliytimisiä ja rakentuvat 731 miljoonasta transistorista. Piisirun pinta-ala on 263 neliömillimetriä.

Intel on tehnyt Nehalem-arkkitehtuurin myötä radikaaleja uudistuksia suunnittelupöydällä. Nykyisiin Core 2 -prosessoreihin verrattuna suurimmat muutokset ovat natiivi neliytiminen piisiru, muistiohjain on siirretty northbridgestä prosessoriin, Front Side Bus -väylä on haudattu ja tilalle on kehitetty pakettipohjainen ja sarjamuotoinen QuickPath Interconnect -väylä (QPI) ja käyttöön on otettu L3-välimuisti.
Kun Nehalemin uusia ominaisuuksia tarkastellaan lähemmin, on pakko todeta, että monet niistä ovat olleet käytössä Intelin pahimmalla kilpailijalla eli AMD:llä jo vuosia K8- ja K10-arkkitehtuureissa: prosessoriin integroitu muistiohjain, HyperTransport-väylä, natiivi neliytiminen piisiru ja jaettu L3-välimuisti.

Modulaarisen suunnittelun myötä prosessori voidaan jakaa kahteen osaan: Coreen ja Uncoreen. Coressa sijaitsevat prosessorin perustoiminnot eli muun muassa suoritusyksiköt, muistinjärjestely ja L1- ja L2-välimuistit. Uncoresta löytyy suuri L3-välimuisti, integroitu muistiohjain, QPI-linkit ja muun muassa TDP-arvon tarkkailusta sekä Base Clock -referenssitaajuudesta huolehtiva Power Control Unit.

Neliytimisen Bloomfield-piisirun kaaviokuvaan on eroteltu neljä ydintä, integroitu muistiohjain, kaksi QuickPath Interconnect -linkkiä, jaettu L3-välimuisti sekä sekalaisia I/O-toimintoja.

Kun tarkasteluun otetaan yksi yllä olevan kuvan Coreista eli ytimistä, saadaan se jaoteltua muun muassa suoritusyksikköihin, L1- ja L2-välimuisteihin, käskyjen dekoodaukseen ja mikrokoodiin. Uusia ominaisuuksia verrattuna nykyisiin Penryn-koodinimellisiin toisen sukupolven Core-arkkitehtuuriin perustuviin ytimiin ovat muun muassa seitsemän lisäkäskyn SSE4.2-laajennus, nopeampi virtualisointi, SMT eli uudistettu Hyper-Threading-ominaisuus, syvemmät puskurit ja parannettu haarautumisen ennustaminen.

L1-välimuistiin ei ole tehty muutoksia, mutta L2-välimuisti on uudistunut radikaalisti. Nehalem-arkkitehtuurissa jokaisella ytimellä on käytössään 256 kilotavua kohtalaisen nopeaa L2-välimuistia. Nykyisissä Yorkfield-koodinimellisissä neliytimisissä Core 2 -prosessoreissa L2-välimuistia on yhteensä 12 megatavua. Nehalemin myötä Intel ottaa kuitenkin käyttöön ytimien kesken jaetun L3-välimuistin, jota on Core i7 -prosessoreissa kahdeksan megatavua.

Pentium 4 -prosessoreiden Netburst-arkkitehtuurista tuttu Hyper-Threading-ominaisuus on otettu Nehalemissa uudelleen käyttöön. Uudistettu Simultaneous Multi-Threading- eli SMT-ominaisuus mahdollistaa jokaisen ytimen suorittavan kahta säiettä kerrallaan. Intelin mukaan Hyper-Threading on kustannustehokkain menetelmä useamman säikeen suorittamiseen. Core i7 -prosessorit kykenevät suorittamaan neljällä ytimellä yhtäaikaisesti yhteensä kahdeksaa säiettä.

Nehalem tarjoaa suorituskyvyn kannalta mielenkiintoisen Turbo Mode -ominaisuuden, joka on vastakohta jo pitkään Intelin prosessoreissa käytetylle EIST-virransäästöominaisuudelle (Enhanced Intel Speed Step). Turbo Mode hyödyntää nykyisissä prosessoreissa olevaa ylikellotusvaraa eli prosessorit kykenevät helposti toimimaan jonkin verran korkeammalla kellotaajuudella kuin ne on vakiona tehtaalla asetettu toimimaan. Nehalemissa erillinen logiikka tarkkailee jatkuvasti ytimien TDP-arvoa (Thermal Design Power) sekä työkuormaa ja kykenee korottamaan ytimien kellotaajuutta prosessorin kerrointa nostamalla.
Käytännössä Turbo Mode -ominaisuus kontrolloi prosessorin kerrointa ja yhden pykälän (Intelin termin mukaan speed bin) korottaminen tarkoittaa kokonaiskellotaajuuden kasvamista 133 MHz:n verran. Intelin spesifikaatioiden mukaan 3,2 GHz:n Core i7-965 Extreme Edition -prosessori kykenee korottamaan kellotaajuutta maksimissaan kaksi pykälää eli 266 MHz, joten sen avulla maksimikellotaajuus on 3466 MHz. 2,67 GHz:n kellotaajuudella toimiva Core i7-920- ja 2,93 GHz:n Core i7-940-prosessorit kykenevät korottamaan kokonaiskellotaajuutta Turbo Modella vain yhden pykälän eli 133 MHz (Core i7-920 2,8 GHz & Core i7-940 3,06 GHz).

Turbo Modea kontrolloi piisirulle integroitu Power Control Unit, joka toimii näkymättömästi rautatasolla. PCU sijaitsee prosessorin Uncoressa ja se on vastuussa muun muassa virran ja tehonkulutuksen sekä ytimien lämpötilojen tarkkailusta. PCU käyttää optimoituja algoritmeja nostaakseen prosessorin kerrointa rasituksessa, kun Turbo Mode -ominaisuus on käytössä.




