Hjemmesider

Nvidia lancerer Next-Gen Fermi Architecture

► INTRO NEW SCANIA L-S DIVA CONCEPT BY SUSPEKT (I AM BACK)

► INTRO NEW SCANIA L-S DIVA CONCEPT BY SUSPEKT (I AM BACK)
Anonim

Nvidia kan have omdøbt sin NVISION-reklame konference til "GPU Technology Conference", men det er stadig et Nvidia show igennem og igennem. CEO Jen-Hsun Huang tog noget tid under sin keynote for at afsløre selskabets næste store GPU-arkitektur, kodet "Fermi". Dette er chipgrafik fansne har ringet til GT300, den generatoriske efterfølger til GT200-chipen, der driver kort som GeForce GTX 285.

Chippegiganten var meget omhyggelig med at placere chippen som ikke en ny grafikchip, men en ny " beregne og grafik" chip, i den rækkefølge (kursiv mine). Faktisk viste næsten alt om, at den nye chip vedrører dens beregningsfunktioner, snarere end traditionelt grafikorienterede ting som tekstur-enheder og render-back-ender. Det, vi ved, er, at chippen er enorm til en anslået 3,0 milliarder transistorer, og den vil blive produceret på en 40nm proces ved TSMC. Dette er omkring 40 procent flere transistorer end RV870-chip i de nye Radeon 5800 series DirectX 11-kort, som netop er blevet udgivet af rivaliserende AMD. Chippen har 512 behandlingsenheder (Nvidia kalder dem CUDA kerner), der er organiseret i 16 "streaming multiprocessors" på 32 kerner hver. Dette er mere end dobbelt 240 kernerne i GT200, og kernerne har betydelige forbedringer udover. Chippen vil bruge en 384-bit GDDR5-hukommelsesgrænseflade.

Her er nogle af de vigtigste punktpunkter:

Tredje generations streamingsmultiprocessor (SM)

  • 32 CUDA kerner pr. SM, 4x over GT200
  • 8x topdimensionen med dobbelt præcision i punktet GT200
  • Dual Warp Scheduler, der skemaer og sender to warps på 32 tråde
  • pr. klok
  • 64 KB RAM med en konfigurerbar partitionering af delt hukommelse og L1 cache

Andet Generation Parallel Trådudførelse ISA

  • Unified Address Space med fuld C ++ Support
  • Optimeret til OpenCL og DirectCompute
  • Fuld IEEE 754-2008 32-bit og 64-bit præcision
  • Fuld 32-biters helhedsbane med 64 -bit-udvidelser
  • Hukommelsesadgangsinstruktioner til understøttelse af overgang til 64-bit adressering
  • Forbedret ydeevne gennem prædikering

Forbedret hukommelsessystem

  • NVIDIA Parallel DataCache-hierarki med konfigurerbare L1 og Unified L2
  • Caches
  • Første GPU med ECC-hukommelsesstøtte
  • Meget forbedret atomhukommelsesoperation ydeevne

NVIDIA GigaThread Engine

  • 10x hurtigere applikationskonfiguration
  • Udførelse af samtidig kerneudførelse
  • Udførelse af ordreudførelse uden blokering
  • Dual overlappede hukommelsesoverførselsmotorer

Der er mange ekstra funktioner, der bør forbedres udførelsen af ​​denne chip i stream computing opgaver, som meget hurtigere præcision flydende punkt beregningshastighed. Nuværende Nvidia GPU'er beregner dobbelt præcision ved en brøkdel af hastigheden af ​​enkeltpræcisionsoperationer. Dobbelt-præcision flydende punkt operationer bør nu være på halvdelen af ​​præstation af enkelt præcision, hvilket er en enorm forbedring. Store forbedringer i caching og planlægning er også synlige. Du kan læse mere om arkitekturen på Nvidias nye Fermi-side, som indeholder en PDF-hvidbog.

Så hvornår kan du købe et grafikkort, der bruger denne chip? Nvidia siger ikke. Virksomhedsrepræsentanter har sagt, at de i øjeblikket "bringer op", hvilket betyder at arbejdsprover først er kommet tilbage fra fabrikationsfabrikken. At lave et uddannet gæt fra tidligere historie, vi ville sige December er en optimistisk udgivelsesdato, og Q1 2010 for bred tilgængelighed er mere sandsynligt. Forvente brædder at være dyre. Nvidia vil ikke videregive chipstørrelsen, men dømme ved transistor tæller vi ville gætte mellem 450 og 500 mm 2 . Sammen med de ekstra omkostninger til et 384-bit hukommelsesinterface og udfordringerne med at få gode udbytte ud af en så stor chip på den relativt nye 40nm fremstillingsproces, og du kigger på kort, der sandsynligvis vil være både mere kraftfulde og dyrere end AMDs netop udgivne Radeon 5800 series kort.

Følg Jason Cross på twitter eller besøg hans blog.