► INTRO NEW SCANIA L-S DIVA CONCEPT BY SUSPEKT (I AM BACK)
Chippegiganten var meget omhyggelig med at placere chippen som ikke en ny grafikchip, men en ny " beregne og grafik" chip, i den rækkefølge (kursiv mine). Faktisk viste næsten alt om, at den nye chip vedrører dens beregningsfunktioner, snarere end traditionelt grafikorienterede ting som tekstur-enheder og render-back-ender. Det, vi ved, er, at chippen er enorm til en anslået 3,0 milliarder transistorer, og den vil blive produceret på en 40nm proces ved TSMC. Dette er omkring 40 procent flere transistorer end RV870-chip i de nye Radeon 5800 series DirectX 11-kort, som netop er blevet udgivet af rivaliserende AMD. Chippen har 512 behandlingsenheder (Nvidia kalder dem CUDA kerner), der er organiseret i 16 "streaming multiprocessors" på 32 kerner hver. Dette er mere end dobbelt 240 kernerne i GT200, og kernerne har betydelige forbedringer udover. Chippen vil bruge en 384-bit GDDR5-hukommelsesgrænseflade.
Her er nogle af de vigtigste punktpunkter:
Tredje generations streamingsmultiprocessor (SM)
- 32 CUDA kerner pr. SM, 4x over GT200
- 8x topdimensionen med dobbelt præcision i punktet GT200
- Dual Warp Scheduler, der skemaer og sender to warps på 32 tråde
- pr. klok
- 64 KB RAM med en konfigurerbar partitionering af delt hukommelse og L1 cache
Andet Generation Parallel Trådudførelse ISA
- Unified Address Space med fuld C ++ Support
- Optimeret til OpenCL og DirectCompute
- Fuld IEEE 754-2008 32-bit og 64-bit præcision
- Fuld 32-biters helhedsbane med 64 -bit-udvidelser
- Hukommelsesadgangsinstruktioner til understøttelse af overgang til 64-bit adressering
- Forbedret ydeevne gennem prædikering
Forbedret hukommelsessystem
- NVIDIA Parallel DataCache-hierarki med konfigurerbare L1 og Unified L2
- Caches
- Første GPU med ECC-hukommelsesstøtte
- Meget forbedret atomhukommelsesoperation ydeevne
NVIDIA GigaThread Engine
- 10x hurtigere applikationskonfiguration
- Udførelse af samtidig kerneudførelse
- Udførelse af ordreudførelse uden blokering
- Dual overlappede hukommelsesoverførselsmotorer
Der er mange ekstra funktioner, der bør forbedres udførelsen af denne chip i stream computing opgaver, som meget hurtigere præcision flydende punkt beregningshastighed. Nuværende Nvidia GPU'er beregner dobbelt præcision ved en brøkdel af hastigheden af enkeltpræcisionsoperationer. Dobbelt-præcision flydende punkt operationer bør nu være på halvdelen af præstation af enkelt præcision, hvilket er en enorm forbedring. Store forbedringer i caching og planlægning er også synlige. Du kan læse mere om arkitekturen på Nvidias nye Fermi-side, som indeholder en PDF-hvidbog.
Følg Jason Cross på twitter eller besøg hans blog.
Nvidia lancerer sin hurtigste bærbare GPU

Nvidia lancerede GeForce GTX 280M grafikchip, den hurtigste bærbare grafikbehandlingsenhed til dato.
Nvidia siger, at den nye Fermi-CPU vil køre supercomputere

Nvidia viste et grafikkort baseret på sin nye Fermi-arkitektur, hvilket vil fremskynde ydeevnen af dens fremtidige GPU'er.
Nvidia Teases Fermi GF100 Viser ved CES 2010

Nvidia ringer i det nye år med tidspunkter af Fermi GF100 prøver i næste uges CES 2010 i Vegas.