IBMs Power5-processor värt en andra titt

Om allt var lika och IBM gjorde sina system lika tillgängliga som Dell och Hewlett-Packard gjorde sitt, skulle IBM Power5-processorn kunna begrava Intels Itanium 2. Först introducerades förra sommaren, Power5 är en en-två slag, en triumf för teknik från ett företag som inte bara utmärker sig inom processordesign utan också inom submikronvetenskapen för chiptillverkning och förpackning.

Power5 går naturligtvis mycket snabbt. Men det kan också ses som IBMs första seriösa försök att tillgodose kundernas behov utöver snabbhet. Power5 erbjuder förbättrad energieffektivitet och fantastisk skalbarhet, stöder operativsystem som inte är IBM (inklusive Linux och Windows) och levererar partitionering och virtualisering oöverträffad av nuvarande Intel-teknik.

Power5 förskådar också en ny generation av 64-bitars, PowerPC-baserade arbetsstationer och servrar från IBMs långvariga partner i Power, Apple Computer. Och IBM drog nyligen ett oväntat drag för ett företag byggt på patent genom att publicera Power-arkitekturen och verktygen under en öppen licens.

Det finns så många sätt som Power5s inflytande sträcker sig längre än IBMs primära bas för välkända kunder. Även om IBM också säljer Itanium 2-, Opteron- och Xeon-servrar verkar företaget helt klart avsikt att lägga Power5-systemen i händerna på Linux- och Windows-administratörer. Oavsett om det är vettigt kommer det att vara upp till kunderna, men Power5s rena tekniska muskler och Itanium-arkitekturens skakande förmögenhet kräver att IBM: s flaggskeppsprocessor tar en resa under vårt mikroskop.

Krafthemligheter

IBM har konsekvent lockat de ljusaste hjärnorna, den typ av ingenjörer som förtjänar monikern "datavetare". På 1980-talet tillagade dessa forskare en processorarkitektur som byggdes för prestanda: IBM 801, den ursprungliga RISC-processorn. 801-talets arv lever vidare i IBM Power-serien av processorklass i företagsklass.

Den största skillnaden mellan en RISC-processor och en CISC-processor, som Intels x86, kan ses som ett dragkamp mellan programmerare och chipdesigners. CISC-processorer är utformade för att göra applikationsutvecklarnas liv enklare genom att minska vanliga operationer till enstaka, långkörande infödda instruktioner, vilket ger CISC ett rykte som en långsam men vänlig design. Jämfört med det ljuset är RISC snabb och ovänlig. Var och en av dess enkla instruktioner tjänar ett mycket smalt syfte, körs snabbt och parallelliseras exceptionellt bra. RISC kräver tålmodiga, begåvade programmerare och noggrant optimerade kompilatorer; RISC: s framgång vittnar om ett överflöd av båda.

Det mest kända Power5-attributet är dess integration av två diskreta RISC-kärnor på ett enda chip. Meddelanden från AMD, Intel och Sun Microsystems angående kommande multicore-processorer fokuserade på denna aspekt av Power5, men multicore var också en funktion av dess föregångare, Power4 och Power4 +. Enligt IBM är Power5 fullt kompatibelt med Power4-körbara filer. Underet med multicore är att det ger rördrömmen om mer hastighet på mindre utrymme utan en markant ökning av värmen. Men som du ser är multicore inte bara SMP på ett chip.

För det första delar Power5s kärnor en mycket snabb nivå 2-cache. Cache-hastigheten och kvantiteten är en faktor i prestanda för alla mikroprocessorer. (Utvecklingen av x86 visar att Intel är helt cache-besatt.) Med enkla instruktioner som flyger så snabbt genom en RISC-processor blir cachens effektivitet för att minska antalet resor till RAM nyckeln till hela designen.

Power5s nivå 2-cache uppgår till bara mindre än 2 MB. Med en delad cache är data som hämtas av en kärna omedelbart tillgänglig för den andra, vilket ökar sannolikheten för att hämta nästa programinstruktion eller datablock inte kräver en resa till prestandadödande RAM. Men den delade cachen gör det också mer troligt att kärnorna försöker komma åt cachen samtidigt, vilket de inte kan göra.

IBM implementerade ett stoppgrop för cachekonflikt och delade upp nivå 2-cache i tre segment. Denna design tillåter kvasi-samtidig åtkomst till cache så länge båda kärnorna träffar olika cachesegment. IBM har en annan kreativ lösning på nivå 2-cache-konfliktfrågan: en tung 36MB extern nivå 3-cache. Varje kärna äger exklusivt sitt nivå 3-cache, så det finns ingen möjlighet för konflikt mellan kärnor. Även om nivå 3-cache inte är nästan lika snabb som nivå 2, är nivå 3 mycket snabbare än huvudminnet och Power5s design gör anslutningen mellan dess kärna och dess tillhörande nivå 3-cache till en direktlänk. Vi anser att IBMs omarbetning av nivå 3-cachedesignen är en av de bästa designvinsterna i Power5.

En annan väsentlig Power5-förstärkning är dess styrenheter på minnet. Varje Power5-kärna har sin egen styrenhet och kan hantera ett dedikerat huvudminneblock. Detta har en enorm inverkan på den totala prestandan, som vi har sett i att jämföra till exempel minne genomströmning av Opteron och Xeon. Och i Power5s fall passar designen med IBMs strategi för parallellisering i flera nivåer.

Två räcker inte

Power5 är inte bara dual-core; den implementerar Power4s SMT-anläggning (Simultaneous Multi-Threading), som ger varje kärna möjlighet att utföra instruktioner från två trådar samtidigt, under vissa förhållanden. SMT liknar Intels HTT (Hyper-Threading Technology) men med tydliga fördelar som gör "vissa villkor" bredare och som dynamiskt optimerar parallellisering genom att analysera och prioritera trådar för att göra parallell körning mer effektiv - tycker vi. Även om det är svårt att isolera vid testning, bör Power5s implementering överträffa den maximala 30-procentiga boost som Intel projicerar för HTT.

Power5 lägger till två grundläggande, men välbehövliga, trådprioriteringsscheman. Dynamisk resursbalansering försöker hålla instruktionsströmmar som flyter smidigt genom att analysera trådarnas beteende och genom att stänga av kod som kan sakta ner en SMT-ström. Till exempel kan instruktioner som måste köras i följd för att få ett exakt resultat låsa den tråden i processorn en stund. Power5 försöker förutse detta och köra enklare instruktioner tills det finns utrymme att utföra sekvensen utan att täppa till SMT.

I en annan fantastisk designförstärkning ger Power5s justerbara trådprioritet operativsystem, drivrutiner och applikationer möjligheten att tilldela en godtycklig prioritetsnivå till varje tråd. Denna applikationsdefinierade trådprioritet tas med i Dynamic Resource Balancing-beräkningar och används bredare för att bestämma hur länge en tråd förblir aktiv i CPU: n. Det ger också operativsystem ett enkelt sätt att kontrollera energibesparing.

Om du har många trådar med hög prioritet igång kommer rutan att bli varm. Men när operativsystemet slår ned trådprioriteringar kommer CPU: n att köra fler tomgångscykler och därför köras svalare. Om du slår ner alla trådprioriteringar till sin lägsta nivå går CPU: n i ett sömnlikt lågeffektläge. Det är det enklaste tillvägagångssättet för energihantering som vi kan föreställa oss.

Slutligen använder Power5 vad den vet om de faciliteter som behövs av varje RISC-instruktion för att i huvudsak stänga av delar av chipet som inte behövs just nu. Detta sätter potentiellt en ny snurr på Powers ökända kraft- och värmeproblem. Det verkar verkligen enklare än OS-drivna energihanteringssystem som de som används av x86-processorer.

Du kanske aldrig märker det

Bara på teknik är Power5 positionerad att styra. Men otroligt som det kan tyckas för de många Itanium 2-skeptikerna som delar sina åsikter medhar majoriteten av observatörer redan kallat Itanium 2 / Power5-tävlingen till Intels fördel.

Det är en konstig bedömning eftersom IBM i det här fallet drar en Intel på Intel. RISC äger Unix-marknaden, Unix äger mellanregionen till avancerad marknad och Intel gör inte RISC. Det är ute i kylan på dessa inköpsorder för flera miljoner dollar. Intel är effektivt utestängda om det inte kan övertyga köpare att Itanium 2 föråldrar RISC. Kommer Intel att kunna bryta sig in? Vi tror att det kommer att ta år för Itanium att skjuta RISC åt sidan, och medan det bryter in kommer Power och Sparc att fortsätta att utvecklas.

Vad som gör det svårt att ringa är att IBM vill ha Intels marknad lika mycket som Intel vill ha IBMs. IBM säljer Power5-servrar för $ 5000 med Linux förinstallerat. Gå tillbaka och skanna specifikationerna för att förstå varför en Power5-server på 5 000 dollar kan vara trevlig att ha runt.

Analytiker som etsar gravstenar för Power noterar att IBM: s chipverksamhet inte tjänar pengar. Men dess systemverksamhet är, och nu är de två enheterna en. Det är ett smart drag: Gör marker för system du säljer; bygg system runt de marker du gör. Att släppa designen och verktygen till allmänheten är också smart. Varje öppen licensinnehavare är en potentiell tillverkningskund, och obegränsad immateriell egendom kommer att strömma in från genier som inte finns på IBMs löner.

Det här är bra strategier för att trivas på inträdesmarknaden. Om bara IBM inte behövde ta itu med kunderna. Big Blue har aldrig kunnat ge den nedre delen av sin katalog varumärkespolish och kundtillit som Dell och HP åtnjuter i spader. Det stora arbete som IBMs ingenjörer har gjort styrs av företagets dåliga marknadsföring. Om du inte kör IBM-utrustning nu kommer du troligen inte att titta på en Power5-server oavsett pris.

IBM har medvetet hitched Power5s framgång till Linux på nybörjarnivå. Men det är svårt att extrahera mervärde från programvara som allmänheten tror att den kan ladda ner gratis, och Linux är ett operativsystem som köpare inte brukar köpa ny hårdvara för att köra. Med andra ord kommer Linux inte att sälja Power5-ingångsservrar. På $ 5000 till $ 6000 är IBM: s billigaste Power5-server inte tillräckligt billig jämfört med en smutsig billig Opteron- eller Xeon EM64T-server (Extended Memory 64 Technology) som kör Linux.

Å andra sidan säljer stort Unix-järn sig själv och kunderna kommer alltid att köpa mer av det de redan använder. De kommer att köpa vad deras lösningskonsulter rekommenderar. IBM överträffar alla andra i sin förmåga att gå igenom större konton. Du kan inte bända en kund lös från IBM-hårdvara i mellanområdet och uppåt. Så det övergripande budskapet på Power5 kommer att förvrängas till pressen och allmänheten i stort, men kostymerna i fältet kringgår IBMs marknadsföring. I IBM-till-kundrelationer kan du inte slå IBM.

Power5 har nästan allt: hastighet, enkelhet, innovation, sömlös bakåtkompatibilitet, en mogen utvecklingsverktygssats och stöd från en teknisk jätte. Det är en oöverträffad teknisk prestation, skapad av vad som kan vara världens smartaste ingenjörer. Om IBM: s marknadsföring någonsin matchar intelligensen från dess teknik, se upp, Intel.