Procesor IBM Power5 warty uwagi

Gdyby wszystko było równe, a IBM uczyniłby swoje systemy tak przystępnymi, jak robią to Dell i Hewlett-Packard, procesor IBM Power5 mógłby pogrzebać procesor Intel Itanium 2. Po raz pierwszy wprowadzony latem ubiegłego roku, Power5 to jeden-dwa uderzenie, triumf inżynierii od firma, która wyróżnia się nie tylko projektowaniem procesorów, ale także submikronową nauką produkcji i pakowania chipów.

Power5 jest oczywiście bardzo szybki. Ale można to również postrzegać jako pierwszą poważną próbę zaspokojenia potrzeb klientów ponad szybkość. Power5 oferuje zwiększoną wydajność energetyczną i niesamowitą skalowalność, obsługuje systemy operacyjne innych firm (w tym Linux i Windows) oraz zapewnia partycjonowanie i wirtualizację niezrównane przez obecną technologię Intel.

Power5 zapowiada również nową generację 64-bitowych stacji roboczych i serwerów opartych na PowerPC od długoletniego partnera IBM w Power, Apple Computer. Niedawno IBM wykonał nieoczekiwany ruch dla firmy zbudowanej na patentach, publikując architekturę Power i narzędzia na otwartej licencji.

Wpływ Power5 wykracza poza podstawową bazę zamożnych klientów IBM na wiele sposobów. Chociaż IBM sprzedaje również serwery Itanium 2, Opteron i Xeon, wydaje się, że firma wyraźnie zamierza oddać systemy Power5 w ręce administratorów systemów Linux i Windows. Czy to będzie miało sens, będzie zależało od klientów, ale czysta siła techniczna Power5 i chwiejne losy architektury Itanium wymagają, aby flagowy procesor IBM wyruszył w podróż pod naszym mikroskopem.

Sekrety mocy

IBM konsekwentnie przyciąga najbystrzejsze umysły, inżynierów, którzy zasługują na przydomek „informatyk”. W latach 80-tych naukowcy ci opracowali architekturę procesora, która została zbudowana z myślą o wydajności: IBM 801, oryginalny procesor RISC. Dziedzictwo 801 jest nadal obecne w serii procesorów klasy korporacyjnej IBM Power.

Główną różnicę między procesorem RISC a procesorem CISC, takim jak Intel x86, można postrzegać jako przeciąganie liny między programistami i projektantami układów. Procesory CISC zostały zaprojektowane w celu ułatwienia życia programistom aplikacji, ograniczając typowe operacje do pojedynczych, długo wykonywanych natywnych instrukcji, dzięki czemu CISC ma reputację powolnego, ale przyjaznego projektu. W tym świetle RISC jest szybki i nieprzyjazny. Każda z jego prostych instrukcji służy bardzo wąskiemu celowi, jest wykonywana szybko i wyjątkowo dobrze działa równolegle. RISC wymaga cierpliwych, utalentowanych programistów i skrupulatnie zoptymalizowanych kompilatorów; Sukces RISC świadczy o obfitości obu.

Najbardziej znanym atrybutem Power5 jest integracja dwóch dyskretnych rdzeni RISC w jednym chipie. Zapowiedzi AMD, Intela i Sun Microsystems dotyczące nadchodzących procesorów wielordzeniowych skupiały się na tym aspekcie Power5, ale wielordzeniowy był również cechą jego poprzedników, Power4 i Power4 +. Według IBM Power5 jest w pełni kompatybilny z plikami wykonywalnymi Power4. Cud wielordzeniowy polega na tym, że zapewnia on marzenie o większej prędkości na mniejszej przestrzeni bez wyraźnego wzrostu ciepła. Ale jak zobaczysz, wielordzeniowy procesor to nie tylko SMP na chipie.

Po pierwsze, rdzenie Power5 współużytkują bardzo szybką pamięć podręczną poziomu 2. Szybkość i ilość pamięci podręcznej ma wpływ na wydajność wszystkich mikroprocesorów. (Ewolucja x86 pokazuje, że Intel ma obsesję na punkcie pamięci podręcznej). Dzięki prostym instrukcjom przepływającym przez procesor RISC tak szybko, efektywność pamięci podręcznej w zmniejszaniu liczby podróży do pamięci RAM staje się kluczem do całego projektu.

Pamięć podręczna poziomu 2 w Power5 wynosi tylko mniej niż 2 MB. Dzięki współużytkowanej pamięci podręcznej dane pobierane przez jeden rdzeń są natychmiast dostępne dla drugiego, co zwiększa prawdopodobieństwo, że pobranie następnej instrukcji programu lub bloku danych nie będzie wymagało przejścia do pamięci RAM zabijającej wydajność. Ale współdzielona pamięć podręczna zwiększa również prawdopodobieństwo, że rdzenie będą próbowały uzyskać dostęp do pamięci podręcznej w tym samym czasie, czego nie mogą zrobić.

IBM zaimplementował ogranicznik rywalizacji o pamięć podręczną, dzieląc pamięć podręczną poziomu 2 na trzy segmenty. Ten projekt umożliwia quasi-jednoczesny dostęp do pamięci podręcznej, o ile oba rdzenie trafiają do różnych segmentów pamięci podręcznej. IBM ma inne kreatywne rozwiązanie problemu rywalizacji o pamięć podręczną poziomu 2: potężną 36 MB zewnętrzną pamięć podręczną poziomu 3. Każdy rdzeń posiada wyłącznie pamięć podręczną poziomu 3, więc nie ma możliwości konfliktu między rdzeniami. Chociaż pamięć podręczna poziomu 3 nie jest tak szybka jak pamięć podręczna poziomu 2, poziom 3 jest znacznie szybszy niż pamięć główna, a konstrukcja Power5 sprawia, że ​​połączenie między rdzeniem a powiązaną pamięcią podręczną poziomu 3 jest bezpośrednim połączeniem. Uważamy, że przeprojektowanie przez IBM projektu pamięci podręcznej poziomu 3 jest jednym z najlepszych projektów w Power5.

Kolejnym znaczącym zyskiem w Power5 są wbudowane kontrolery pamięci. Każdy rdzeń Power5 ma własny kontroler i może zarządzać dedykowanym blokiem pamięci głównej. Ma to ogromny wpływ na ogólną wydajność, jak widzieliśmy na przykład porównując przepustowość pamięci Opteron i Xeon. W przypadku Power5 projekt pasuje do strategii wielopoziomowej równoległości IBM.

Dwa to za mało

Power5 to nie tylko dwurdzeniowy; implementuje funkcję SMT (Simultaneous Multi-Threading) Power4, która daje każdemu rdzeniu możliwość wykonywania instrukcji z dwóch wątków jednocześnie, w określonych warunkach. SMT jest podobny do technologii HTT (Hyper-Threading) Intela, ale ma wyraźne zalety, które sprawiają, że „pewne warunki” są szersze i które dynamicznie optymalizują równoległość poprzez analizę i priorytetyzację wątków w celu zwiększenia wydajności wykonywania równoległego - o wiele bardziej wydajnego, naszym zdaniem. Chociaż trudno jest wyodrębnić w testach, implementacja Power5 powinna przewyższyć maksymalne 30-procentowe przyspieszenie, które Intel projektuje dla HTT.

Power5 dodaje dwa podstawowe, ale bardzo potrzebne schematy ustalania priorytetów wątków. Dynamiczne równoważenie zasobów próbuje zapewnić płynny przepływ strumieni instrukcji, analizując zachowanie wątków i oddzielając kod, który może spowolnić strumień SMT. Na przykład instrukcje, które muszą być wykonywane po kolei, aby uzyskać dokładny wynik, mogą zablokować ten wątek w procesorze na czas. Power5 próbuje to przewidzieć i uruchamia prostsze instrukcje, aż będzie miejsce na wykonanie sekwencji bez zatykania SMT.

Kolejnym niesamowitym zyskiem projektowym, regulowany priorytet wątków Power5, daje systemom operacyjnym, sterownikom i aplikacjom możliwość przypisania dowolnego poziomu priorytetu do każdego wątku. Ten zdefiniowany przez aplikację priorytet wątku jest uwzględniany w obliczeniach dynamicznego równoważenia zasobów i jest szerzej używany do określania czasu, przez jaki wątek pozostaje aktywny w procesorze. Zapewnia również systemom operacyjnym łatwy sposób kontrolowania oszczędzania energii.

Jeśli masz uruchomionych wiele wątków o wysokim priorytecie, pudełko będzie działać. Ale gdy system operacyjny obniża priorytety wątków, procesor będzie działał więcej bezczynnych cykli, a zatem będzie działał chłodniej. Jeśli obniżysz wszystkie priorytety wątków do najniższego poziomu, procesor przejdzie w senny tryb niskiego poboru mocy. To najprostsze podejście do zarządzania energią, jakie możemy sobie wyobrazić.

Wreszcie, Power5 wykorzystuje wszystko, co wie o udogodnieniach wymaganych przez każdą instrukcję RISC, aby zasadniczo wyłączyć części chipa, które nie są w danym momencie potrzebne. To potencjalnie nadaje nowy wymiar niesławnym problemom z zasilaniem i ciepłem Power. Z pewnością wydaje się prostszy niż schematy zarządzania energią oparte na systemie operacyjnym, takie jak te stosowane przez procesory x86.

Możesz nigdy tego nie zauważyć

W samej technologii Power5 ma władzę. Ale niewiarygodne, jak mogłoby się wydawać wielu sceptykom Itanium 2, z którymi dzielą się swoimi opiniamiwiększość obserwatorów nazwała już konkurs Itanium 2 / Power5 na korzyść Intela.

To dziwna ocena, ponieważ w tym przypadku IBM ściąga Intel na Intel. RISC jest właścicielem rynku Unix, Unix jest właścicielem rynku średniej i wyższej klasy, a Intel nie robi RISC. Jest zimno w związku z tymi wielomilionowymi zamówieniami żelaznymi. Intel jest skutecznie zablokowany, chyba że uda mu się przekonać kupujących, że Itanium 2 przestaje istnieć RISC. Czy Intel będzie w stanie się włamać? Uważamy, że Itanium minie lata, zanim odepchnie RISC na bok, a gdy się włamie, Power i Sparc będą nadal ewoluować.

To, co sprawia, że ​​trudno to nazwać, to fakt, że IBM chce rynku Intela tak samo, jak Intel chce IBM. IBM sprzedaje serwery Power5 za 5000 USD z preinstalowanym systemem Linux. Wróć i przejrzyj specyfikacje, aby zrozumieć, dlaczego warto mieć serwer Power5 o wartości 5000 USD.

Analitycy wytrawiający nagrobki dla Power zauważają, że biznes chipów IBM nie zarabia pieniędzy. Ale jego działalność w zakresie systemów jest taka, a teraz te dwie jednostki są jednym. To mądre posunięcie: przygotuj chipy do sprzedawanych systemów; buduj systemy wokół żetonów, które tworzysz. Udostępnianie projektu i narzędzi opinii publicznej jest również sprytne. Każdy otwarty licencjobiorca jest potencjalnym klientem produkcyjnym, a nieobciążona własność intelektualna będzie napływać od geniuszy spoza listy płac IBM.

To są dobre strategie dostosowania się do wejścia na rynek. Gdyby tylko IBM nie miał do czynienia z klientami. Firma Big Blue nigdy nie była w stanie przynieść najniższego poziomu swojego katalogu, tak polerowanej marki, jak i zaufania klientów, którymi cieszą się Dell i HP. Wielka praca inżynierów IBM jest ograniczona przez kiepski marketing firmy. Najprawdopodobniej, jeśli nie korzystasz teraz ze sprzętu IBM, nigdy nie spojrzysz na serwer Power5, niezależnie od ceny.

IBM celowo połączył sukces Power5 z Linuksem na poziomie podstawowym. Ale trudno jest wydobyć wartość dodaną z oprogramowania, które zdaniem opinii publicznej można pobrać za darmo, a Linux to system operacyjny, którego kupujący nie kupują nowego sprzętu do uruchomienia. Innymi słowy, Linux nie będzie sprzedawał podstawowych serwerów Power5. Kosztujący od 5000 do 6000 USD najtańszy serwer IBM Power5 nie jest wystarczająco tani w porównaniu z tanim serwerem Opteron lub Xeon EM64T (Extended Memory 64 Technology) z systemem Linux.

Z drugiej strony, duże oprogramowanie Unix sprzedaje się samo, a klienci zawsze kupują więcej tego, czego już używają. Kupią to, co doradzają ich konsultanci ds. Rozwiązań. IBM przewyższa wszystkie inne, jeśli chodzi o jego zdolność do pochlebstw wobec głównych klientów. Nie można odciągnąć klienta od sprzętu IBM ze średniej i wyższej półki. Tak więc ogólna wiadomość na temat Power5 będzie zniekształcona dla prasy i opinii publicznej, ale garnitury w tej dziedzinie omijają marketing IBM. W relacjach między IBM a klientami nie można pokonać IBM.

Power5 ma prawie wszystko: szybkość, prostotę, innowacje, bezproblemową wsteczną kompatybilność, dojrzały zestaw narzędzi programistycznych i wsparcie technologicznego giganta. To niezrównane osiągnięcie inżynieryjne, stworzone przez prawdopodobnie najmądrzejszych inżynierów na świecie. Jeśli marketing IBM kiedykolwiek dorównuje inteligencji jego inżynierii, uważaj, Intel.