Komponenter

Indenfor Tsubame - Nvidia GPU Supercomputer

手技TEWAZA「甲州印伝」koshu lacquered deerhide/伝統工芸 青山スクエア Japan traditional crafts Aoyama Square

手技TEWAZA「甲州印伝」koshu lacquered deerhide/伝統工芸 青山スクエア Japan traditional crafts Aoyama Square
Anonim

Når du går ind i computerrummet på anden sal i Tokyo Institute of Technology's computerbygning, bliver du ikke straks ramt af Japans næst hurtigeste supercomputer. Du kan ikke se Tsubame-computeren til de industrielle klimaanlæg, der står i vejen, men det siger i sig selv. Med mere end 30.000 proceskerner, der summere væk, bruger maskinen en megawatt strøm og skal holdes kølig.

Tsubame blev rangeret som den 29. hurtigeste supercomputer i verden i den seneste Top 500 ranking med en hastighed på 77,48T Flops flytende punktoperationer pr. sekund) på Linpack-benchmark-industristandarden.

Selv om positionen er forholdsvis god, gør det ikke det, der gør det så specielt. Det interessante ved Tsubame er, at det ikke er afhængigt af den ubehandlede processorkraft af CPU'er (centralprocessorenheder) alene for at få arbejdet udført. Tsubame indeholder hundredvis af grafikprocessorer af samme type, der anvendes i forbruger-pc'er, og arbejder sammen med CPU'er i et blandet miljø, som nogle siger, er en model for fremtidige supercomputere, der betjener discipliner som materialekemi.

[Yderligere læsning: Bedste NAS-kasser til streaming af medier og backup]

Grafiske processorer (GPU'er) er meget gode til hurtigt at udføre samme beregning på store mængder data, så de kan gøre kort arbejde med nogle problemer inden for områder som molekylær dynamik, fysik simuleringer og billedbehandling. > "Jeg tror i langt de fleste interessante problemer i fremtiden, at de problemer, der påvirker menneskeheden, hvor virkningen kommer fra naturen … kræver evnen til at manipulere og beregne på et meget stort datasæt", siger Jen-Hsun Huang, adm. Direktør af Nvidia, der talte på universitetet i denne uge. Tsubame bruger 680 af Nvidias Tesla grafikkort.

Hvor stor forskel gør GPU'erne? Takayuki Aoki, professor i materialekemi ved universitetet, sagde, at simuleringer, der tidligere tog tre måneder, tager 10 timer på Tsubame.

Tsubame selv - når du bevæger sig forbi klimaanlæggene - er delt på flere værelser i to gulv i bygningen og består i vid udstrækning af rackmonterede Sun x4600 systemer. Der er 655 af disse i alt, som hver har 16 AMD Opteron CPU-kerner inde i det, og Clearspeed CSX600 acceleratorplader.

Grafikkortene findes i 170 Nvidia Tesla S1070 rackmonterede enheder, der er slået ind mellem Solsystemer. Hver af 1U Nvidia-systemer har fire GPU'er inde i hver af dem, der har 240 behandlingskerner til i alt 960 kerner pr. System.

Tesla-systemerne blev tilføjet til Tsubame i løbet af cirka en uge, mens computeren fungerede.

"Folk troede, at vi var vanvittige," sagde Satoshi Matsuoka, direktør for det globale videnskabelige informations- og databehandlingscenter på universitetet. "Dette er en supercomputer på 1 mia. Dollar, der bruger en megawatt af magt, men vi viste det teknisk, at det var muligt."

Resultatet er, hvad universitetspersonale kalder version 1.2 af Tsubams supercomputer.

Jeg tror, ​​at vi burde have opnået 85 [T Flops], men vi løb tør for tid, så det var 77 [T Flops], "sagde Matsuoka af benchmarks udført på systemet. På 85T Flops ville det have steget et par steder i Top 500 og været placeret hurtigst i Japan.

Der er altid næste gang: En ny Top 500-liste udløber i juni 2009, og Tokyo Institute of Technology ser også ud længere fremme.

"Dette er ikke slutningen af ​​Tsubame, det er bare begyndelsen på GPU-accelerationen at blive mainstream," sagde Matsuoka. "Vi tror på, at der i verden vil være supercomputere, der registrerer flere petafløb i de kommende år, og vi vil gerne følge med på jakkesæt."

Tsubame 2.0, som han kaldte den næste opgradering, skulle være her inden for de næste to år og vil prale af en vedvarende ydeevne af mindst en petaflop (en petaflop er 1.000 teraflops), sagde han. Det grundlæggende design for maskinen er stadig ikke færdiggjort, men det vil fortsætte den heterogene beregningsgrundlag for blanding af CPU'er og GPU'er, sagde han.