Uusimmat

AMD julkaisi tarkat yksityiskohdat Bulldozer-arkkitehtuurista

10.04.2011 13:08 Sampsa Kurri

AMD on julkaissut ohjelmistokehittäjille tarkoitetun optimointioppaan, joka käsittelee uutta suorituskykyisille työpöytä- ja palvelinprosessoreille suunniteltua Bulldozer-koodinimellistä arkkitehtuuria. AMD:n Bulldozer-arkkitehtuuriin perustuvat prosessorit kuuluvat virallisesti 15h-nimiseen tuoteperheeseen (AMD Family 15h).

358-sivuisessa PDF-dokumentissa esitellään Bulldozer-arkkitehtuuri, sen uudistukset, suorituskykyparannukset ja toiminnallisuus sekä käydään läpi, miten sovelluksia voidaan optimoida kooditasolla suorituskykyisemmiksi ja yhteensopivammiksi käyttäen hyväksi Bulldozerin tarjoamia toiminnallisuuksia ja ominaisuuksia.

Optimointiopas ei tarjoa tavalliselle kuluttajalle juurikaan oleellista tietoa, mutta dokumentin toinen kappale sisältää mielenkiintoisen katsauksen Bulldozerin avainominaisuuksiin, suunnitteluratkaisuihin ja suorituskykyparannuksiin:

Bulldozer-arkkitehtuurin avainominaisuudet:

  • Integrated DDR3 memory controller with memory prefetcher
  • 64-Kbyte L1 instruction cache and 16-Kbyte L1 data cache
  • Shared L2 cache between cores of compute unit
  • Shared L3 cache compute units on chip (for supported platforms)
  • 32-byte instruction fetch
  • Instruction predecode and branch prediction during cache-line fills
  • Decoupled prediction and instruction fetch pipelines
  • Four-wayAMD64 instruction decoding (This is a theoretical limit. See section 2.3 on page 31.)
  • Dynamic scheduling and speculative execution
  • Two-way integer execution
  • Two-way address generation
  • Two-way 128-bit wide floating-point execution
  • Legacy single-instruction multiple-data (SIMD) instruction extensions, as well as support for
  • XOP, FMA4, VPERMILx, and Advanced Vector Extensions (AVX).
  • Superforwarding
  • Prefetch into L2 or L1 data cache
  • Deep out-of-order integer and floating-point execution
  • HyperTransport™ technology

Bulldozerin merkittävimmät suorituskykyparannukset:

  • Improved performance of shuffle instructions
  • Improved data transfer between floating-point registers and general purpose registers
  • Improved floating-point register to floating-point register moves
  • Optimization of repeated move instructions
  • More efficient PUSH/POP stack operations
  • 1-Gbyte paging

Optimointiopas keskittyy täysin Bulldozer-arkkitehtuuriin ja sen ominaisuuksiin, eikä dokumentissa mainita sanallakaan esimerkiksi markkinoille tulevista prosessorimalleista, kellotaajuuksista tai välimuistien ko’oista.

Suorituskykyiset AMD FX-työpöytäprosessorit julkaistaan kesäkuussa?

Tämän hetkisten ennakkotietojen perusteella AMD:n odotetaan julkaisevan Bulldozer-arkkitehtuuriin perustuvat Zambezi-koodinimelliset työpöytäprosessorit markkinoille 7. kesäkuuta. Markkinoille on tulossa neljä- (FX-4000), kuusi- (FX-6000) ja kahdeksanytimisiä (FX-8000) prosessoreita, joiden tarkempia mallinumeroita ei vielä ole tiedossa.

Globalfoundriesin 32 nanometrin SOI-prosessilla valmistettava Orochi-piisiru rakentuu neljästä Bulldozer-moduulista, joissa jokaisessa on kaksi prosessoriydintä ja oma L2-välimuisti. Yksi Bulldozer-moduuli rakentuu 213 miljoonasta transistorista ja sen pinta-ala on noin 30,9 neliömillimetriä.

Yhdessä Bulldozer-moduulissa on kaksi itsenäistä kokonaislukuyksikköä omalla L1-välimuistilla varustettuna. Yksittäinen liukulukuyksikkö jakaa kokonaislukuyksiköiden L1-välimuistit. Jokaisessa kokonaislukuyksikössä on neljä liukuhihnaa, joista oletettavasti kaksi on pyhitetty aritmeettisloogisille ja kaksi muistioperaatioille. Kahden megatavun L2-välimuisti on jaettu yhden moduulin kokonaislukuyksiköiden ja liukulukuyksikön kesken ja kahdeksan megatavun L3-välimuisti puolestaan kaikkien prosessorissa olevien Bulldozer-ytimien kesken.

Zambezi-prosessorit käyttävät uutta AM3+-prosessorikantaa, mutta ovat taaksepäin yhteensopivia joidenkin nykyisten AM3-emolevyjen kanssa BIOS-päivityksen avulla.

Tarkempia tietoja AMD Bulldozer-arkkitehtuurista voit lukea Muropaketin viime vuonna julkaisemalsta tekniikkakatsauksesta.