Xbox 360 vs Playstation 3 z pohledu hardwaru – kdo bude rychlejší?

Základem úspěchu next-gen konzolí budou samozřejmě hry, nicméně i holý strojový výkon na něm bude mít svůj podíl. Jaké budou hry pro Xbox 360 a Playstation 3 se zatím můžeme jen dohadovat. Jaký budou mít výkon však již přibližně víme. Pojďte se s námi podívat na srovnání předběžných technických specifikací obou platforem.

Při pohledu na hardwarové specifikace obou očekávaných konzolí se zdá být jakákoliv předpověď výkonnostního vítěze nemožná. Nabízí se oblíbená fráze „hrušky s jabkama“ - a skutečně je to tak. Výkon je dán trojicí procesor, grafická karta a paměťový subsystém a ve všech třech ohledech se svým přístupem Microsoft a Sony diametrálně liší.

Výkon nových konzolí ve srovnání s PC, jak jej prezentuje Sony. Zdroj: wikipedia.org

Co se týče procesoru, Microsoft riskoval určitě méně; Sony zase v tomto ohledu může získat hodně navrch. V Xboxu 360 je použit procesor se třemi symetrickými jádry osvědčené řady RISCových procesorů IBM Power, které sdílejí velkou vyrovnávací paměť. Všechna jádra zvládnou dva thready současně, celkem tedy šest threadů. V PS3 má být použit revoluční „Cell“ procesor, o němž prognózy tvrdí, že i kdyby se na běžném procesoru x86 kompatibilním, kterými jsou vybavena dnešní PC, osadilo třeba i deset jader, s výkonem Cell procesoru se stále ještě nemůže srovnávat.

Cell procesory

Architekturu Cell vyvinula IBM ve spolupráci s Toshibou a Sony. Měla by přinést revoluční zrychlení do mnoha oblastí - od 3D her, přes multimédia až po distribuované počítání projektů jako SETI.

Cell má mít jedno běžné jádro podobné dosavadním procesorům IBM Power (buď PowerPC 970 známé z Apple G5 nebo následující řady Power5) a osm tzv. APU (Attached Processor Units). To jsou vektorové procesory (jedna instrukce nad množinou dat, SIMD) svou prací připomínající třeba vertex shadery z grafických čipů. Jejich výpočetní síla je sama o sobě úžasná, ale mohou pracovat nejen nezávisle, ale také společně a data lze mezi ně libovolně distribuovat. Každý z nich má vlastní malou paměť a jsou spojeny i s jádrem rychlou vnitřní sběrnicí. Nepleťte si APU s koprocesory (FPU) dnešních procesorů, tyto jednotky jsou samostatnými procesory se vším všudy (kromě vysokorychlostní SRAM zastupující cache obsahují 128 128b registrů a čtyři jednotky pro celočíselné a další čtyři pro desetinné operace). Vektorové APU tak zvládne provést čtyři 32b operace v jediném taktu (a osm operace násobení-sčítání).

Právě nahrazení vyrovnávací paměti (cache) v APU běžnou lokální pamětí je kupodivu jednou z příčin rychlosti a realizovatelnosti návrhu. Cache zvyšuje složitost čipů a pro vektorové jednotky tohoto typu není tak vhodná jako postup, který používá APU: operace provádí výhradně nad registry, které si čte nebo zapisuje do zmíněné lokální paměti. Ta je dostupná pouze pro dané APU a opravdu v ní nehledá posledně používané položky. Další silnou stránkou Cell procesoru je možnost zapojení jednotlivých APU do proudového zpracování, kdy každý krok ze série potřebných operací dělá jedno nebo více APU.

Cell procesory budou rychlé pro všechny aplikace, které mohou být tzv. vektorizovány – tedy aby mohly být operace prováděny s celou množinou hodnot (typicky po sobě jdoucí data ve smyčce). Ale do množiny aplikací patří téměř všechny dnes výkonnostně kritické oblasti a na ty zbývající musí posloužit samotné jádro Power.

Výkon cell procesorů je natolik slibný, že by mohl vážně ohrozit x86 procesory v PC. Ty sice už přežily několik lepších konkurenčních technologií (RISC procesory, 64b procesory DEC Alpha, procesory z řad IBM Power, ...) a mnohé z nich okopírovaly, ale Cell by měly být výkonem natolik vpředu a architekturou natolik odlišné, že by to mohlo donutit Intel i AMD k vážnému přehodnocení výstavby svých x86 řešení.

Propustnost operační paměti je asi nejporovnatelnější a oba systémy by v tomto mohly být podobné. Propustnosti přes 20 GB/s, kterou dnes nabízí jen nejdražší grafické karty, dosáhne jak Xbox 360, tak PS3. Microsoft volil opět konvenčněji. Osvědčené DDR3 paměti a celkovou kapacitu 512 MB bude sdílet celý systém včetně grafiky. Naopak Sony chce využít Samsungem nedávno uvedené paměti XDR, pro které by neměl být problém tikat na frekvenci procesoru – 3,2 GHz. Tento typ paměti bude samozřejmě velmi drahý, a tak se počítá jen s 256 MB připojených 64b sběrnicí. Oněch 256 MB je však exkluzivně pro systém, grafika má vlastní paměť. Protože DDR3 paměti v Xbox 360 budou připojeny 128b sběrnicí, propustnost by měla být u Sony jen mírně vyšší.

Možná tím úplně nejdůležitějším prvkem bude grafika. V tomto případě to pro změnu vypadá na větší riskování Microsoftu. Sony pro Playstation počítá s RSX od nVidie, což by podle všeho měl být sice čip příští generace, ale s konvenčním návrhem. Naopak ATI pod kódovým označením R500 pro Xbox 360 vyvíjí velmi odvážnou architekturu. Kromě toho, že grafika bude sdílet 512 MB systémové paměti, je přímo na čipu integrováno 10 MB eDRAM. Embedded RAM je velmi rychlá (a drahá) paměť, která s ostatními částmi čipu má komunikovat rychlostí až 256 GB/s a čip ji má používat pro mnoho základních paměťových operací (Z buffer, stencil buffer apod.). S podobnými pokusy už přišla společnost Bitboys před lety, ale její návrhy zůstaly na papíře nebo ve vzorcích čipů. Integrováním DRAM do čipu také notně přibude tranzistorů a tak složitý čip není snadné vyrobit.

Procesor z PS2 je opravdu zajímavým kusem hardwaru. Kombinuje RISCový procesor s běžným koprocesorem a dvěma vektorovými jednotkami. Stejně jako zajímavý grafický čip stejné konzole se superrychlou vnitřní sběrnicí byl velmi nadčasový. Zdroj: wikipedia.org

Díky tomuto kroku by však měl být umožněn třeba i anti-aliasing bez zpomalení (specifikace Xbox 360 deklaruje možnost alespoň 4× AA pro každou hru). ATI vychází vstříc také specifikacím WGF (nebo také DirectX Next), které požadují sjednocení vertex a pixel shaderů. R500 obsahuje 48 prováděcích jednotek pro shadery, které jsou univerzální. Podle papírových výpočtů (rychlost provádění shader kódu, propustnost apod.) by si měly být R500 a RSX takřka rovny, ale eDRAM a unifikované jednotky v R500 by mohly vše změnit. Uvidíme, zda k lepšímu či horšímu.

Grafika Xboxu 360 – ATI „Xenos“

Renomovaný zahraniční server Beyond3D.com věnující se převážně 3D grafickým kartám a souvisejícím technologiím vydal velmi zajímavé pojednání o ATI Xenos. Tak je symbolicky nazýván grafický čip, který má být 3D akcelerátorem Xboxu 360 (Xenonu). Nebyl vytvořen na základě nových oficiálních specifikací, ale vznikl díky různým rozhovorům přímo s ATI, chytrým spekulacím a blízkému kontaktu s vývojáři, kteří mají samozřejmě o hardware v Xboxu 360 přesnější informace. V článku se dozvíte, jak by měl tento čip fungovat, jak bude komunikovat s dceřinným čipem s pamětí eDRAM, jak se bude lišit od dnešních běžných grafik a díky čemu bude mít velice rychlý anti-aliasing.

Xenos

Aktualizováno: Včera se na Beyond3D.com objevil i první fotka Xenosu. "Daughter" čip s eDRAM je jasně rozeznatelný a není o mnoho menší než samotný grafický čip se všemi prováděcími jednotkami

U specifikací Xboxu 360 i PS3 byly už uvedeny spekulace o celkovém výkonu. Ta je uvedena v počtu operací v plovoucí desetinné čárce za sekundu (FLOPS). Podle Sony by měla mít Playstation 3 tento výkon takřka dvakrát vyšší než Xbox 360 – 2 TFLOPS. Zarážející jsou na tom hned dvě věci: onen dvojnásobek oproti Xboxu 360 a samotná předpona tera. Podle posledního žebříčku nejrychlejších superpočítačů Top500.org z října 2004 by se PS 3 umístila zhruba na 87. místě na světě, těsně za superpočítač Cray X1, které používá jihokorejský meteorologický ústav pro předpověď počasí. X1 sice není úplně nejmodernějším výkřikem poslední doby, ale k dosažení tohoto výkonu musí být osazen zhruba 170 pro něj určenými vektorovými procesory.

Cell procesor vyráběný 90nm technologií bude v PS3 tikat na 3,2 GHz, přesto slibuje o několik řádů vyšší výkon než procesory x86. Později se v továrně IBM a Toshiba počítá s přechodem na 60 a 45 nm a v laboratorních podmínkách už tyto procesory dosáhly 5,2 GHz. Zdroj: wikipedia.org

Sony však uvádí, že Cell procesor tvoří 218 GFLOPS z celkového výkonu, tedy asi desetinu. Zbývajících 1,8 TFLOPS má tedy předvést RSX od nVidie, což se zdá být více než odvážné. Bude to tedy asi dvojnásobek oproti R500 v Xboxu 360 (?) a zhruba devětkrát tolik, než dokáže současná generace GPU. Všechny výkony jsou samozřejmě maximální dosažitelné při ideálním využití, do výkonu GPU jsou započítány všechny možné operace.
 
Kdo spekuloval, co by třeba programátoři Gran Turisma 4 byli schopni vytvořit, kdyby nebyli limitováni obstarožním hardwarem v PS2, se konečně dočká. V případě programátorů to znamená nové přístupy k programování – grafické čipy lze programovat v jazyce shaderů vyššího řádu, aplikace by měly používat více vláken (viz 6 threadů současně v procesoru Xboxu 360) nebo být přímo navrženy pro Cell.

Jádro procesoru Cell se zřetelně viditelným PPE (Power Processing Element, tedy jádro IBM Power) a osmi APU. Zdroj: wikipedia.org

Ale to všechno je jako přesedat z trabantu do lamborghini, kdy se navíc ti koumavější již těší na modifikace, která třeba umožní využít levný a vysoký výkon konzolí pro univerzální použití. To, že jedna konzole bude výkonnější než druhá, nemusí mít samozřejmě žádný vliv na oblibu či prodeje. Jedním slovem úspěch bude záležet hlavně na herních titulech a marketingu, ale o tom tento článek není.

Porovnání výkonu next-gen konzolí s předchozí generací i PC:

    Xbox 360 Playstation 3 PC – Intel x86 Xbox Playstation 2
Procesor název IBM Power IBM "Cell" Intel Pentium 4 XE  Intel Pentium III Emotion Engine
takt 3,2 GHz 3,2 GHz 3,73 GHz 733 MHz 299 MHz
architektura 3 jádra Power4 (970), 6 vláken IBM Power core x86, NetBurst, SSE3  x86, SSE MIPS R5900 CPU
  3 vektorové jednotky VMX-128 8 vektorových APU 2 vlákna (HT) Coppermine FPU + 2 vekt. jednotky
cache 1 MB L2 512 + 8× 256 KB paměť 2 MB L2 128 KB
propustnost FSB 21,6 GB/s 25,6 GB/s 8,5 GB/s 1 GB/s
GFLOPS 115 218 19 3 6
Grafika název ATI R500 nVidia RSX ATI Radeon X800 XT PE nVidia NV2x Graphics Synthesizer
takt gpu 500 MHz 550 MHz 520 MHz 250 MHz 147 MHz
takt pamětí 700 (1 400) MHz 700 (1 400) MHz 560 (1 120) MHz 200 (400) MHz 147 MHz
sběrnice 128-bit DDR3 128-bit DDR3 256-bit DDR3 64-bit DDR 2560-bit
pipelines 48 shader ALU ??? 56 shader ALU 6 vs + 16 ps (38–96 ALUs) 4 16
AA sample rate 16 Gsamples/s ??? 20 Gsamples/s 16,64 Gsamples/s 4 Gsamples/s
geometry rate 500 Mtriangles/s ??? 800 Mtriangles/s 780 Mtriangles/s 125 Mtriangles/s 75 Mtriangles/s
shader perf. 48–96 billions shader ops/s 100 billions shader ops/s max. 40 billions shader ops/s
velikost paměti 512 MB sdílená a 10 MB eDRAM 256 MB 256 MB 64 MB sdílená
propustnost 22,4 VRAM + 256 GB/s eDRAM 22,4 GB/s 35,84 GB/s 3,2 GB/s 48 GB/s
odh. počet tranzistorů 350 milionů 300 milionů 160 milionů
TFLOPS (?) 0,9 1,8 0,2
Paměť takt 700 MHz 3,2 GHz 667 MHz 200 (400) MHz 100 (400) MHz
sběrnice 128-bit DDR3 64-bit XDR  128-bit DDR2 64-bit DDR 64-bit QDR (RDRAM)
velikost 512 MB (sdílená s grafikou) 256 MB 1 GB 64 MB 32 MB
propustnost 22,4 GB/s 25,6 GB/s 10,7 GB/s 3,2 GB/s 3,2 GB/s
Celkem TFLOPS 1 2 0,22

Zdroje: en.wikipedia.org/wiki/Xbox_360; en.wikipedia.org/wiki/Playstation_3; www.xbox.com/en-US/xbox360/factsheet.htm; www.ps3portal.com/?page=ps3_tech_specs; www.blachford.info/computer/Cells/Cell0.html; www.extremetech.com/article2/0,1558,1820466,00.asp

Diskuze (167) Další článek: ECHO - ozvěny tajemných jeskyní

Témata článku: , , , , , , , , , , , ,