► INTRO NEW SCANIA L-S DIVA CONCEPT BY SUSPEKT (I AM BACK)
Chippegiganten var meget omhyggelig med at placere chippen som ikke en ny grafikchip, men en ny " beregne og grafik" chip, i den rækkefølge (kursiv mine). Faktisk viste næsten alt om, at den nye chip vedrører dens beregningsfunktioner, snarere end traditionelt grafikorienterede ting som tekstur-enheder og render-back-ender. Det, vi ved, er, at chippen er enorm til en anslået 3,0 milliarder transistorer, og den vil blive produceret på en 40nm proces ved TSMC. Dette er omkring 40 procent flere transistorer end RV870-chip i de nye Radeon 5800 series DirectX 11-kort, som netop er blevet udgivet af rivaliserende AMD. Chippen har 512 behandlingsenheder (Nvidia kalder dem CUDA kerner), der er organiseret i 16 "streaming multiprocessors" på 32 kerner hver. Dette er mere end dobbelt 240 kernerne i GT200, og kernerne har betydelige forbedringer udover. Chippen vil bruge en 384-bit GDDR5-hukommelsesgrænseflade.
Her er nogle af de vigtigste punktpunkter:
Tredje generations streamingsmultiprocessor (SM)
- 32 CUDA kerner pr. SM, 4x over GT200
- 8x topdimensionen med dobbelt præcision i punktet GT200
- Dual Warp Scheduler, der skemaer og sender to warps på 32 tråde
- pr. klok
- 64 KB RAM med en konfigurerbar partitionering af delt hukommelse og L1 cache
Andet Generation Parallel Trådudførelse ISA
- Unified Address Space med fuld C ++ Support
- Optimeret til OpenCL og DirectCompute
- Fuld IEEE 754-2008 32-bit og 64-bit præcision
- Fuld 32-biters helhedsbane med 64 -bit-udvidelser
- Hukommelsesadgangsinstruktioner til understøttelse af overgang til 64-bit adressering
- Forbedret ydeevne gennem prædikering
Forbedret hukommelsessystem
- NVIDIA Parallel DataCache-hierarki med konfigurerbare L1 og Unified L2
- Caches
- Første GPU med ECC-hukommelsesstøtte
- Meget forbedret atomhukommelsesoperation ydeevne
NVIDIA GigaThread Engine
- 10x hurtigere applikationskonfiguration
- Udførelse af samtidig kerneudførelse
- Udførelse af ordreudførelse uden blokering
- Dual overlappede hukommelsesoverførselsmotorer
Der er mange ekstra funktioner, der bør forbedres udførelsen af denne chip i stream computing opgaver, som meget hurtigere præcision flydende punkt beregningshastighed. Nuværende Nvidia GPU'er beregner dobbelt præcision ved en brøkdel af hastigheden af enkeltpræcisionsoperationer. Dobbelt-præcision flydende punkt operationer bør nu være på halvdelen af præstation af enkelt præcision, hvilket er en enorm forbedring. Store forbedringer i caching og planlægning er også synlige. Du kan læse mere om arkitekturen på Nvidias nye Fermi-side, som indeholder en PDF-hvidbog.
Så hvornår kan du købe et grafikkort, der bruger denne chip? Nvidia siger ikke. Virksomhedsrepræsentanter har sagt, at de i øjeblikket "bringer op", hvilket betyder at arbejdsprover først er kommet tilbage fra fabrikationsfabrikken. At lave et uddannet gæt fra tidligere historie, vi ville sige December er en optimistisk udgivelsesdato, og Q1 2010 for bred tilgængelighed er mere sandsynligt. Forvente brædder at være dyre. Nvidia vil ikke videregive chipstørrelsen, men dømme ved transistor tæller vi ville gætte mellem 450 og 500 mm 2 . Sammen med de ekstra omkostninger til et 384-bit hukommelsesinterface og udfordringerne med at få gode udbytte ud af en så stor chip på den relativt nye 40nm fremstillingsproces, og du kigger på kort, der sandsynligvis vil være både mere kraftfulde og dyrere end AMDs netop udgivne Radeon 5800 series kort.Følg Jason Cross på twitter eller besøg hans blog.
Nvidia lancerer sin hurtigste bærbare GPU
Nvidia lancerede GeForce GTX 280M grafikchip, den hurtigste bærbare grafikbehandlingsenhed til dato.
Nvidia siger, at den nye Fermi-CPU vil køre supercomputere
Nvidia viste et grafikkort baseret på sin nye Fermi-arkitektur, hvilket vil fremskynde ydeevnen af dens fremtidige GPU'er.
Nvidia Teases Fermi GF100 Viser ved CES 2010
Nvidia ringer i det nye år med tidspunkter af Fermi GF100 prøver i næste uges CES 2010 i Vegas.