Webbplatser

Nvidia presenterar nästa generations arkitektur

Next Gen CUDA GPU Architecture, Code-Named Fermi - Fermi Interview

Next Gen CUDA GPU Architecture, Code-Named Fermi - Fermi Interview
Anonim

Nvidia kan ha bytt namn till sin NVISION-reklam konferens till "GPU Technology Conference", men det är fortfarande ett Nvidia show genom och igenom. VD Jen-Hsun Huang tog en stund under sin nyckel för att avslöja företagets nästa stora GPU-arkitektur, kodnamnet "Fermi". Det här är chipgrafikfläktarna som har ringt GT300, generationsuppföljaren till GT200-chipet som driver kort som GeForce GTX 285.

Chippegiganten var mycket försiktig med att placera chipet som inte ett nytt grafikkort utan en ny " beräkna och grafik" chip, i den ordningen (kursivgruva). Faktum är att nästan allt avslöjade om det nya chipet hänför sig till dess beräkningsegenskaper, i stället för traditionellt grafikorienterade saker som konsistensenheter och render-back-ändar. Vad vi vet är att chipet är enormt på cirka 3,0 miljarder transistorer, och kommer att produceras på en 40nm-process vid TSMC. Det här är cirka 40 procent fler transistorer än RV870-chipet i de nya Radeon 5800-serien DirectX 11-kort som just släppts av rival AMD. Chipet har 512 behandlingsenheter (Nvidia kallar dem CUDA-kärnor) organiserade i 16 "streaming multiprocessors" med 32 kärnor vardera. Detta är mer än dubbelt 240 kärnor i GT200, och kärnorna har också betydande förbättringar. Chipet kommer att använda ett 384-bitars GDDR5-minnesgränssnitt.

Här är några av de viktigaste punkterna:

Tredje generationsströmmande multiprocessor (SM)

  • 32 CUDA-kärnor per SM, 4x över GT200
  • 8x Dual Warp Scheduler-toppdimensionen med dubbla precisioner över GT200
  • Dual Warp Scheduler som schemalägger och skickar två varv med 32 trådar
  • per klocka
  • 64 KB RAM med en konfigurerbar partitionering av delat minne och L1-cache

Andra Generering av parallellgänga ISA

  • Unified Address Space med Full C ++ Support
  • Optimerat för OpenCL och DirectCompute
  • Full IEEE 754-2008 32-bitars och 64-bitars precision
  • Full 32-bitars helhetsbana med 64 -bit-utvidgningar
  • Minnesåtkomstinstruktioner för att stödja övergång till 64-bitars adressering
  • Förbättrad prestanda genom förberedelse

Förbättrad minnesundersystem

  • NVIDIA Parallell DataCache-hierarki med konfigurerbar L1 och Unified L2
  • Caches
  • Första GPU med ECC-minnesstöd
  • Mycket förbättrad atomminneoperation prestanda

NVIDIA GigaThread Engine

  • 10x snabbare applikationskonfiguration
  • Körning av samtidiga kärnor
  • Exekvering av trådlängdsutförande
  • Dubbla överlappade minnesöverföringsmotorer

Det finns många ytterligare funktioner som bör förbättras prestanda för detta chip i stream databehandling uppgifter, som mycket snabbare dubbla precision flytande punkt beräkningshastighet. Nuvarande Nvidia GPU: er beräknar dubbel precision vid bråkdel av hastigheten för enkel-precisionsoperationer. Dubbel-precision flytpunktsoperationer bör nu ligga på hälften av enkel precision, vilket är en stor förbättring. Stora förbättringar av caching och schemaläggning är också uppenbara. Du kan läsa mer om arkitekturen på Nvidias nya Fermi-sida, som innehåller en PDF-vitbok.

Så när kan du köpa ett grafikkort som använder den här chipen? Nvidia säger inte. Företrädare för företagen har sagt att de för närvarande "tar upp chipet", vilket innebär att arbetsprover bara har kommit tillbaka från tillverkningsverket. Att göra ett utbildat gissning från tidigare historia, vi skulle säga att december är ett optimistiskt utgivningsdatum, och Q1 2010 för bred tillgänglighet är mer sannolikt. Förvänta sig brädor att vara dyra. Nvidia kommer inte att avslöja chipstorleken, men bedömer med transistorantalet vi skulle gissa mellan 450 och 500 mm 2 . I kombination med de extra kostnaden för ett 384-bitars minnesgränssnitt och utmaningarna med att få bra avkastning ut ur ett så stort chip på den relativt nya 40nm tillverkningsprocessen, och du tittar på kort som sannolikt kommer att vara både kraftfullare och dyrare än AMDs nyssläppta Radeon 5800-seriekort.

Följ Jason Cross på Twitter eller besök hans blogg.