Nvidia presenterar nästa generations arkitektur

Next Gen CUDA GPU Architecture, Code-Named Fermi - Fermi Interview

Nvidia kan ha bytt namn till sin NVISION-reklam konferens till "GPU Technology Conference", men det är fortfarande ett Nvidia show genom och igenom. VD Jen-Hsun Huang tog en stund under sin nyckel för att avslöja företagets nästa stora GPU-arkitektur, kodnamnet "Fermi". Det här är chipgrafikfläktarna som har ringt GT300, generationsuppföljaren till GT200-chipet som driver kort som GeForce GTX 285.

Chippegiganten var mycket försiktig med att placera chipet som inte ett nytt grafikkort utan en ny " beräkna och grafik" chip, i den ordningen (kursivgruva). Faktum är att nästan allt avslöjade om det nya chipet hänför sig till dess beräkningsegenskaper, i stället för traditionellt grafikorienterade saker som konsistensenheter och render-back-ändar. Vad vi vet är att chipet är enormt på cirka 3,0 miljarder transistorer, och kommer att produceras på en 40nm-process vid TSMC. Det här är cirka 40 procent fler transistorer än RV870-chipet i de nya Radeon 5800-serien DirectX 11-kort som just släppts av rival AMD. Chipet har 512 behandlingsenheter (Nvidia kallar dem CUDA-kärnor) organiserade i 16 "streaming multiprocessors" med 32 kärnor vardera. Detta är mer än dubbelt 240 kärnor i GT200, och kärnorna har också betydande förbättringar. Chipet kommer att använda ett 384-bitars GDDR5-minnesgränssnitt.

Här är några av de viktigaste punkterna:

Tredje generationsströmmande multiprocessor (SM)

32 CUDA-kärnor per SM, 4x över GT200
8x Dual Warp Scheduler-toppdimensionen med dubbla precisioner över GT200
Dual Warp Scheduler som schemalägger och skickar två varv med 32 trådar
per klocka
64 KB RAM med en konfigurerbar partitionering av delat minne och L1-cache

Andra Generering av parallellgänga ISA

Unified Address Space med Full C ++ Support
Optimerat för OpenCL och DirectCompute
Full IEEE 754-2008 32-bitars och 64-bitars precision
Full 32-bitars helhetsbana med 64 -bit-utvidgningar
Minnesåtkomstinstruktioner för att stödja övergång till 64-bitars adressering
Förbättrad prestanda genom förberedelse

Förbättrad minnesundersystem

NVIDIA Parallell DataCache-hierarki med konfigurerbar L1 och Unified L2
Caches
Första GPU med ECC-minnesstöd
Mycket förbättrad atomminneoperation prestanda

NVIDIA GigaThread Engine

10x snabbare applikationskonfiguration
Körning av samtidiga kärnor
Exekvering av trådlängdsutförande
Dubbla överlappade minnesöverföringsmotorer

Det finns många ytterligare funktioner som bör förbättras prestanda för detta chip i stream databehandling uppgifter, som mycket snabbare dubbla precision flytande punkt beräkningshastighet. Nuvarande Nvidia GPU: er beräknar dubbel precision vid bråkdel av hastigheten för enkel-precisionsoperationer. Dubbel-precision flytpunktsoperationer bör nu ligga på hälften av enkel precision, vilket är en stor förbättring. Stora förbättringar av caching och schemaläggning är också uppenbara. Du kan läsa mer om arkitekturen på Nvidias nya Fermi-sida, som innehåller en PDF-vitbok.

Så när kan du köpa ett grafikkort som använder den här chipen? Nvidia säger inte. Företrädare för företagen har sagt att de för närvarande "tar upp chipet", vilket innebär att arbetsprover bara har kommit tillbaka från tillverkningsverket. Att göra ett utbildat gissning från tidigare historia, vi skulle säga att december är ett optimistiskt utgivningsdatum, och Q1 2010 för bred tillgänglighet är mer sannolikt. Förvänta sig brädor att vara dyra. Nvidia kommer inte att avslöja chipstorleken, men bedömer med transistorantalet vi skulle gissa mellan 450 och 500 mm ² . I kombination med de extra kostnaden för ett 384-bitars minnesgränssnitt och utmaningarna med att få bra avkastning ut ur ett så stort chip på den relativt nya 40nm tillverkningsprocessen, och du tittar på kort som sannolikt kommer att vara både kraftfullare och dyrare än AMDs nyssläppta Radeon 5800-seriekort.

Följ Jason Cross på Twitter eller besök hans blogg.

Epicor presenterar nästa generations ERP

Epicor kommer att släppa sin efterlängtade Epicor 9 ERP-produkt i slutet av året.

Microsofts nästa generations sökmotor Kumo förväntas nästa vecka

Allmänheten får sin första glimt på Microsofts kommande sökmotor, kallad Kumo, nästa vecka.

Nästa version av Firefox kommer att innehålla nästa generations funktioner. Mozilla hoppas kommer att hjälpa webbläsaren att stå bortsett från konkurrenter.

Firefox 3.5, vilket beror på slutlig release i slutet av månaden kommer att tillåta människor att redigera digitala bilder från webbläsaren utan att behöva ha ett program från tredje part tack vare en ny Javascript-motor som Mozilla har byggt för webbläsaren, säger Mike Beltzner, chef för Firefox i Mozilla, under en intervju i New York.

Nvidia presenterar nästa generations arkitektur

Next Gen CUDA GPU Architecture, Code-Named Fermi - Fermi Interview

Epicor presenterar nästa generations ERP

Microsofts nästa generations sökmotor Kumo förväntas nästa vecka

Nästa version av Firefox kommer att innehålla nästa generations funktioner. Mozilla hoppas kommer att hjälpa webbläsaren att stå bortsett från konkurrenter.

Intressanta artiklar

Bästa programmeringsverktygen för att undervisa barn

3 bästa GUI-aktiverade USB Image Writer-verktyg på Linux

10 bästa användbara Gutenberg blockerar plugins för WordPress

3 fler VoIP- alternativ till Skype

Academix GNU/Linux

Verktyg för att komma åt Linux-filsystemet från Windows

Bästa programmeringsverktygen för att undervisa barn

3 bästa GUI-aktiverade USB Image Writer-verktyg på Linux

10 bästa användbara Gutenberg blockerar plugins för WordPress

Bästa programmeringsverktygen för att undervisa barn

3 bästa GUI-aktiverade USB Image Writer-verktyg på Linux

10 bästa användbara Gutenberg blockerar plugins för WordPress

Nvidia presenterar nästa generations arkitektur

Next Gen CUDA GPU Architecture, Code-Named Fermi - Fermi Interview

Rekommenderad

Intressanta artiklar