Plaza

Muropaketti.com

AMD kertoi lisää yksityiskohtia Bulldozer- ja Bobcat-ytimistään

24.8.2010

AMD on julkaissut parhaillaan järjestettävän HotChips22-tapahtuman kynnyksellä runsaasti lisää materiaalia, tietoa ja yksityiskohtia kehitteillä olevista Bulldozer- ja Bobcat-koodinimellisistä x86-ytimistään, joita käytetään yrityksen seuraavan sukupolven mobiili-, työpöytä- ja palvelinprosessoreissa. Yrityis luennoi vielä myöhemmin tänään kokonaan uudelleen suunniteltujen ytimien rakenteesta ja toiminnallisuudesta tapahtuman yleisölle.

Suurempi versio kuvaa klikkaamalla

Bulldozer on suunnattu suorituskykyisiin ja skaalautuviin työpöytä- ja palvelinprosessoreihin. Bulldozer-moduulissa on kaksi itsenäistä kokonaislukuyksikköä (core) omalla L1-välimuistilla varustettuna. Yksittäinen liukulukuyksikkö jakaa kokonaislukuyksiköiden L1-välimuistit. L2-välimuisti on jaettu kokonaislukuyksiköiden ja liukulukuyksikön kesken ja L3-välimuisti puolestaan kaikkien prosessorissa olevien Bulldozer-ytimien kesken. Jaettujen komponenttien avulla pystytään alentamaan tehonkulutusta ja pienentämään piisirun pinta-alaa. Itsenäisten komponenttien avulla saavutetaan parempi suorituskyky ja skaalautuvuus. AMD:n ensimmäinen 8-ytiminen Zambezi-koodinimellinen Bulldozeriin perustuva työpöytäprosessori julkaistaan ensi vuonna ja se valmistetaan Globalfoundriesin 32 nm:n SOI-tekniikalla. Zambezi käyttää uutta AM3+-kantaa, johon sopivat myös nykyiset AM2+- ja AM3-kantaiset Phenom II -prosessorit, mutta AM3+-kantaiset Bulldozer-prosessorit eivät ole taaksepäin yhteensopivia nykyisten AM2+- ja AM3-kantaisten emolevyjen kanssa.

Bobcat on suunnattu vähävirtaisiin laitteisiin ja yhden ytimen tehonkulutus voidaan puristaa alle wattiin. Bobcat-ydintä käytetään AMD:n ensimmäisessä Fusion APU -piirissä, jossa yhdistyvät prosessori ja grafiikkapiiri samaan piisiruun. Ensimmäinen Bobcat-prosessoriydintä käyttävä APU on kannettaviin tietokoneisiin suunnattu Ontario-koodinimellinen piiri, joka on edellä aikatauluaan ja sen toimitukset OEM-valmistajille aloitetaan jo tämän vuoden viimeisellä neljänneksellä. Ontariolla varustettuja kannettavia tietokoneita voidaan odottaa myyntiin ensi vuoden alussa. AMD:n mukaan Bobcatin avulla voidaan saavuttaa arviolta 90 % nykypäivän kuluttajaluokan kannettavan tietokoneen prosessorin suorituskyvystä puolet pienemällä piisirulla.

AMD, Hot Chips Press Kit

Sampsa Kurri

1.

Jahans, Atomille tulossa vihdoin todellinen haastaja. Tästä varmaankin Muropakettiin tulee testiä jopa ennen Joulua?=)

2.

Molemmat kuullostavat paperilla hyvältä. Toivottavasti ovat sitä myös käytänössä.

3.

Ai hyvältä kuulostaa? Ennen ainakin omasta mielestäni yksi bulldozer core oli yksi core, eikä kaksi, niinkuin ylläolevassa kuvassa. Eihän se enää ole niin kivaa, kun käytännössä AMD on vain kehittänyt U ja V -putkia ja alkanut kutsua niitä ytimiksi..

4.

AM3+ kanta tulossa siis. Saa vielä nähdä onko esim. tuo 8 ytimellinen prosessori oikeasti sellainen että sisältää 8 erillistä ydintä (ja voi suorittaa 16 erillistä käskyä noin periaatteessa) vai ei.

Periaatteessa noiden hehkutusten jälkeen (miten vähän kuluttavat piitä jne) voisi toivoa että hinnatkin pysyvät maltillisina mutta saa nyt nähdä.

5.

Mielenkiinnolla odotetaan kun vihdoin on saannut Crosshair IV blokit yms hommattua, saa olla melko overkilli, että jaksaa alkaa vaihtamaan. Muisteista ei puhuttu mitään? pitäis olla 4 kanavainen muistiohjain ja DDR4, että olis ”tuntuvia” parannuksia Thubaniin. Ainakin tota muistiohjainta vissiin turha odottaa…

6.

@4

Valitettavasti ainakin tämän mukaan AMD:n mainostamassa 8-ytimisessä olisi vain se 4 moduulia, mutta katsotaan nyt miten tehokkaita ne moduulit (ja ytimet) sitten ovat :)
http://blogs.amd.com/work/2010/08/23/%E2%80%9Dbulldozer%E2%80%9D-20-questions-round-one/

7.

Ensimmäisten bulldozerien IO ulospäin on sama kuin nykyisten Phenom IIsten.

Saat muistit, samat emolevyt(biospäivityksen jälkeen).

Myöhemmin(2012-2013?) sitten tulee DDR4-tuelliset mallit ja emolevyt vaihtoon.


”8-ytiminen” bulldozer = yksi piiri, jossa on 4 bulldozer-moduulia, jokainen pystyy suorittamaan täysin yhtä aikaa käskyjä kahdesta eri säikeestä. Molemmilla säikeillä oma L1-kakku ja kokonaislukuyksiköt.

Käskyjen dekoodaus on jaettu moduulin kahden ytimen kesken, yhteensä yhdessä moduulissa pystytään dekoodaamaan ”vain” 4 käskyä näistä kahdesta säikeestä kellojaksossa (kuulostaa vähältä, mutta ei liene oikeasti pullonkaula). Jokainen ydin pystyy sitten suorittamaan 4ää käskyä yhtä aikaa.

”8-ytiminen bulldozer” pystyy siis joka kellojakso dekoodaamaan yhteensä 16 käskyä, jotka voivat olla peräisin 4-8 eri säikeestä (alle 4llä säikeellä ei saada kaikkia dekoodereita työllistettyä) ja hetkellisesti suorittamaan 32 kokonaislukukäskyä 8 säikeestä(mutta dekoodaus rajoittaa sen teoreettisen keskimääräisen maksimisuoituskyvyn tuohon 16 käskyä/kellojaksoon, käytännössä koodin rinnakkaisuden puute rajoittaa vielä enemmän)

”16-ytiminen” bulldozer lienee sitten kaksi erillistä piiriä MCM-pakkauksesa, molemmislla piireillä 4 moduulia, 8 ”ydintä”.

8.

Saa nähdä mitä tulee, sinänsä vaikuttaa ihan hyvältä. Varsinkin siinä mielessä, että lisää suorituskykyä etsitään muillakin tavoilla kuin vain välimuisteja kasvattamalla.

Välimuisteja toki voi kasvatella ”mielinmäärin”, mutta kun transistoreita palaa niin pirusti. Lopputuloksena hintalapussa on jotain samanlaista kuin Intelin extreme edition diida kivissä.


Toivottavasti pistää kunnolla kampoihin intelille, niin saataisiin taas hintakilpailua kivikauppaan.

9.

@5:

Kait nyt heti tarvii aina ruveta uusimpaan vaihtamaan jos vanha on hyväksi todettu?

10.

@5 Kuten on jo kommentoitu DDR4 ei olis hyper uutuus kuten ikinä ei se muistin nopeus juuri saata tuoda nopeutta merkittävästi.

11.

Zambesi vaikuttaa ihan hyvältä, julkaisun ja testien jälkeen vahvasti harkittavissa oleva vaihtoehto jo säästöön laitetuilla rahoilla ostettavaksi uudeksi järjestelmäksi ensi vuoden puolella… Uudet 6**** näyttikset tai muutama 5***-radeon CF:ässä kaveriksi…

12.

@10
DDR4:sta en tiedä mutta muistikanavien määrä nosto 2->3->4 nopeuttaisi kyllä merkittävästi

13.

@10:

Mihin perustat väitteesi?

Muistikanavien nosto ei auttaisi viiveisiin yhtään, ainoastaan kaistanleveyteen.

DDR4een siirtyminen auttaa yhtä lailla siihen kaistanleveyteen kuin muistikaistan leventäminen.

Ja kolmeen kanavaan siirtyminen itseasiassa hidastaisi viiveitä, koska muistiohjaimeen pitäisi liittää jakolaskin.

Ja kaksikanavaisen DDR3n kaista ei ole mikään pullonkaula suoritituskyvylle nykyään, niin useampi kanava ei toisi merkittävää suorituskykyhyötyä.

14.

hups, @12 olisi pitänyt laittaa.

15.

Toivottavasti tasaväkistä vääntöä sandy bridgen kanssa.

16.

@13
Noh, tiedä sitten mikä nopeuteen vaikuttaa eniten…
http://img405.imageshack.us/img405/5845/x2010042620575415592.png

17.

Meinasin juuri mainita, että ihmekkös i7 on niin fail kun on kolmekanavainen :D Kaikkee sitä kuuleekin. Itte olisin odottanut juurikin 4 kanavaista ja kampa per kanava, jollon olis oikeesti saatu aikaan noille vasteajoille kun muistinkehittäjät nostaa vaan Hz piittammatta latencyistä = naurettavaa paikallaan polkemista…

@7 ”mutta AM3+-kantaiset Bulldozer-prosessorit eivät ole taaksepäin yhteensopivia nykyisten AM2+- ja AM3-kantaisten emolevyjen kanssa.”
Ilmeisesti mulla on lukemisen ymmärtämisessä vikaa?

18.

@17:

Se neljäs kanava ei olisi auttanut vasteaikoihin mitään.

Se olisi vaan tehnyt emolevyistä paljon kalliimpia, prossuista jonkin verran kalliimpia, ja keskimääräinen suorituskykyhyöty olisi jäänyt korkeintaan viiteen prosenttiin.

Muistin kellotaajuuksien nostolla sen sijaan vasteaikaa voidaan saada alas, mutta vain, jos myös muistin sisäinen kellotaajuus nousee eikä muistin liukuhihnat pitene. Käytännössä uuteen muistitekniikaan siirtyminen hidastaa näitä, mutta saman muistitekniikan sisällä korkeammat kellot nopeuttaa.

19.

@16:

Herätys, pasteat tänne täysin synteettisen MUISTIKAISTATESTIN tuloksia.

Tietysti täysin synteettinen muistikaistatesti näyttää muistikaistan puolitoistakertaistuneen kun muistikaista puolitoistakertaistetaan.

Mutta mikään OIKEA, TOSIMAAILMAN OHJELMA ei hyödy kuin korkeintaan pari prosenttia tuosta.

20.

@19
Olkoon niin, pakko kai se on uskoa kun joku asiaan paremmin perehtynyt näin väittää ;)

21.

hienoa amd,mutta mitä pirua tolla tekee??

samaa kauraa uudessa säkissä.

:X

22.

@21:

Ei tuossa ole mitään samaa kauraa, vaan päinvastoin; vihdoin, 10 vuoden jälkeen tulossa oikeasti täysin uudet ytimet.

23.

Jep, Eli esim intelin huippuprossuilla ei tee käytännössä mitään ja ne on vaan synteettisesti parempia :D Juurikin näin…
@20 komppaan ;)

24.

Eksytään kyllä pahasti aiheesta, mutta:

Core i7 on phenom IIsta nopeampi ihan muista syistä kuin kolmen muistikaistan takia, esim:

1) Paljon parempi muistioperaatioiden uudelleenjärjestely
2) HypeThreading
3) Parempi haarautumisenennustus
4) Nopeampi L2-kakku

yms yms.

25.

Kun siis puhutaan ”tosimaailman suorituskyvystä”.

Noiden sandra-lukujen katseleminen on peruskäyttäjälle TÄYSIN TURHAA.

26.

Missä perus-muroylikellottaja kuuluu ryhmään ”peruskäyttäjät”.

27.

@23: Ne Intelin huippuprossut on parempia jostain muusta syystä kun vaan sen isomman muistikaistan takia. Tuohan selviää jo sillä että vertaa i7 920:sen tuloksia kahdella ja kolmella kammalla – kovin vähän siitä eroa löytyy.

Tämä keskustelu muistiväylistä mielestäni peittää paljon mielenkiintoisempia paljastuksia – erityisesti cache-arkkitehtuurissa. AMD tipautti L1d:n *neljännekseen* per säie (eli samaan mitä intel käyttää), kun taas L2:sen koko on kasvatettu vähintään megaan. Mitä ihmettä AMD toivoo saavansa L1-cachen pudottamisesta noin pieneksi? Kellotaajuutta?

L2:kin menee eri suuntaan kun Intelillä – minkähän näköisiä suorituskykytuloksia tuosta tulee? Lisäksi, onkohan cachet vielä eksklusiivisia? 128+512= 640 on vielä jotain järkeä, mutta jos L1 on noin pieni L2:seen verrattuna, voiko eksklusiiviyden ylläpito mitenkään olla sen arvoista?

Ja mikä on L1i:n koko? Jos sekin pienenee, säilytetäänkö sieltä nykyään löytyvä data (erityisesti predecode ja branch prediction) myös L2:sessa?

28.

”johon sopivat myös nykyiset AM2+- ja AM3-kantaiset Phenom II -prosessorit, mutta AM3+-kantaiset Bulldozer-prosessorit eivät ole taaksepäin yhteensopivia nykyisten AM2+- ja AM3-kantaisten emolevyjen kanssa.”

Onkohan tohon sattunu pieni typo? Siis DDR2-muistiohjaimen omaavat AM2+-prossut menis? Eli AM3-kantaan ei ole mahollista saada BD:tä?

29.

Luulisin (ja toivon) että se poissulkeva(suomennetaanpa termi ”exclusive”) L2- kakku olisi vihdoin historiaa. Siitä oli hyötyä K7-aikakausilla kun L1n ja L2n suhteellinen kokoero oli pieni, mutta siitä oli myös selkeä haitta; L2sta ei voitu tehdä kovin nopeaa.

Jo K8lla 512-1024 kB L2n kanssa L2-välimuistin poissulkevudesta oli todennäköisesti enemmän haittaa kuin hyötyä; K8n L2-välimuisti oli verrattaen hidasta verrattuna intelin saman ajan prossujen L2-välimuistien nopeuteen, ja syynä oli hyvin todennäköisesti tuo poissulkevuus, eikä parinkymmenen prosentin efektiivinen kokohyöty tarjoa kovin suurta eroa osumatarkkuuteen.

L1n koon pienentäminen auttaa kellotaajuuden nostamisessa, ilman että L1n viivettä tarvii alkaa kasvattamaan (mistä taas seuraisi selkeämpi suorituskykyhaitta).

Ja jos L2-välimuisti on nopeaa, ei L1-välimuistin koon pienentäminen juurikaan haittaa, itseasiassa itse veikkaan, että keskimääräisti kaikille L1+L2een osuville muistihauille keskimääräinen viive bulldozerilla on jopa PIENEMPI kuin K10llä koska odotan L2n viiveen pienenevän niin merkittävästi.


Käsky-L1-välimuistin koko bulldozerissa on 64 kB/module, eli sama kuin K7/K8/K10llä ydintä kohden. Jos modulen ytimet ajaa samaa koodia melko samassa kohtaa, tarkoittaa se sitä että osumatarkkuus jopa paranee (koska ensikertahutit jää pois), jos taas modulen ytimet ajaa eri koodia, tai ovat koodissa liian eri kohdissa, jää yhdelle ytimelle se n. 32kB/ydin.

30.

Jännä nähdä sitten joskus, miten tuollainen väännös toimii sitten käytännössä.

Voi olla hyvinkin mielenkiintoisia heittoja suuntaan ja toiseen. Siis suorituskyvyssä VS intel, kun ajetaan erityyppisiä sovellutuksia..

Harmi sinänsä, ettei käynyt vanhoihin emoihin. Tai AMD ei ainankaan uskalla luvata käypäisyyttä.

31.

30. Taitaa mennä niin kuin aikaisemminkin. tukea ei luvata suoraan ja emovalmistajat lyö uudet biosit kehiin.

32.

Voi pettymys peräsuoli!

Meitsi on tätä omaa AMD-settiä rakentanut siinä toivossa, että saisi tähän joskus kiinni BD:n.

Mökötän puoli tuntia ainakin. Prkl.

33.

BTW..
Muistiluvuthan tehdään käsittääkseni purskeina. Tästäjohtuen cacheen saadaan haluttu määrä sitä nopeammin tietoa, mitä isompi muistikaista (sen mahd pienen latenssin lisäksi).

Ja kun corejen määrä kasvaa, niin myös muistihakujen määrä kasvaa. Eli mitä enemmän coreja, sitä enemmän myös suuremmasta kaistasta on hyötyä.

Eli 2:n muistikanavan ratkaisu käy syömään AMD:n suorituskykä sitä pahemmin, mitä enemmän coreja on siellä prossussa.

34.

hkultala, kannattaisi mennä töihin AMD lafkaan kun näytät tietävän noista bulldozereista enemmän kuin itse ne jotka niitä valmistaa, lol;)

35.

Mikä suoritin nykyään pitäisi lyödä nVidian kaveriksi? Olisikohan Bulldozerista hinta/laatu voittajaksi Intelistä?

36.

@35

Hmm.. ensinnäkin olisi hyvä tietää, että minkä nvidian näytönohjaimen kaveriksi ja mikä olisi setin käyttötarkoitus, budjetti jne. :)
Ja toisekseen on melkein mahdotonta sanoa millainen Bulldozer tulee olemaan hinta/laatusuhteeltaan, koska suorituskykyä ja hintaa voi vain veikkailla. Nämä rakenteen analysoinnitkin kun loppujen lopuksi antavat vain suuntaa, olettaen että ne ovat ylipäänsä oikeassa. Ja kaikkea ei suorittimista tiedetä edes paperilla.

37.

@35 eikös tuo ole ihan sama minkä prossun lyöt kuhan kellotat +3.8GHz niin ei ole mitään väliä mikä Nvidian näyttis on kiinni niin näyttis on se pullonkaula… Varmaan siis helpoimmat on 965/1090T…

38.

Mukava lukea jonkun hieman asiantuntevammankin kommentteja myös täällä. Eikä aina jotaki tyyliin että pyöriikö crysis tms.

Sais mielestäni ruveta tulemaanki oikeasti jo jotakin uutta. Ei näissä nykyysissä suorittimissa nyt niin järisyttäviä eroja oo vanhempiin malleihin. Esim. Intelin Core arkkitehtuuri? Ei viivanleveyttä pienentämällä, kelloja + muistiMÄÄRÄÄ nostamalla, ytimiä lisäämällä enää kovin pitkälle pötkitä tai siis jossakin vaiheessa luulisi seinän tulevan vastaan. Toisaalta näissä nykyisissä suorittimissa riittää kyllä vauhtia ihan mukavasti peruskäyttöä ajatellen. Mutta kaikki kehittyy koko ajan..

39.

Hahah, nyypät trollailee Kultalaa :)

Toivottavasti on tuloillaan loistava prossu, tätä onkin jo odoteltu.

40.

@25, 26:

Eli siis intelin prossut on teoriassa hyviä, mutta käytännössä AMD:llä ja Intelillä ei ole mitään eroa, paitsi hinta? Pakko uskoa kun joku paremmin perehtynyt sanoo niin. Ei peruskäyttäjä intelin desktop benchmark tuloksista paljoa kostu.

41.

@40:

Ymmärsitkö tarkoituksella väärin?

Missään en väittänyt, että intelin prossut eivät olisi merkittävästi AMDn prossuja nopeampia, vaan kerroin vaan sen, että noista sandra-tuloksista sitä ei nähdä.

Jos niitä prossuja haluaa vertailla KÄYTÄNNÖSSÄ niin käytetään niitä OIKEIDEN OHJELMIEN nopeustestejä tai sellaisia synteettisiä testejä, jotka perustuvat OIKEISSA OHJELMISSA käytettäviin algoritmeihin.

Nämä oikeat ohjelmat ja oikeat benchamrkit pyörivät core i7lla paremmin kuin phenom2lla.

42.

Jeps, prossujen nopeus ei ole absoluuttinen totuus jos haluaa saada softan x pyörimään nopeammin. Uusia prossuja on muutenkin kovin hankala verrata keskenään, sillä joku uusi käsky saattaa nopeuttaa vasta sitten kun sille on jotain koodia. Jokainen käsky kun ei käsittääkseni edelleenkään x86-arkkitehtuurissa ole yhtä nopea, ja sitten riippuu ihan ohjelmasta mitä käskyjä käytetään kuinkakin paljon. Jos haluaa rahoillensa parhaan vastineen niin kyllähän jollakin testillä on suuntaa antava vaikutus, mutta parempi katsoa jotain softien nopeus-eroa, ja valkata softat mitä itse eniten tulee hyödyntämään.

Erityisesti bobcat kiinnostaisi, sillä atomin ja normaaleiden prossujen välille jää jonkin verran rakoa. Läppäriprossuja et oikein työpöytäkoneeseen saa kohtuuhinnalla, ja seuraava etappi kuitenkin vaatii jo aktiivista jäähdytystä, niin hieman huonosti on vaihtoehtoja erittäin hiljaisessa luokassa. Tietysti rahalla saa esim viaa tai jotain läppäriemojakin on pöytäkoneeseen olemassa, mutta ne sitten maksaa jo vähintään normaalin pöytäkoneen verran. Tai läppäriemot on itse asiassa suhteellisen tyyriitä. Niin ja toivottavasti bobcattiin tulee mini-itx-emo.

Kirjaudu sisään

Kommentointi tässä osiossa on sallittu vain rekisteröityneille käyttäjille. Jos sinulla ei vielä ole tunnusta, rekisteröidy käyttäjäksi.

Takaisin ylös