Pagine

GK106

Numerose sono state le speculazioni riguardanti l'architettura e l'organizzazione degli shader adottate da Nvidia sul nuovo chip GK106. In realtà questa GPU deriva direttamente dal GK104, con opportune semplificazioni sul numero di unità d'elaborazione. Stando alle dichiarazioni ufficiali di Nvidia, la versione full presenta tutti i 960 CUDA Core abilitati, organizzati in 5 SMX (192 x 5) ciascuno con 16 TMUs (80 totali). Essendo il numero di SMX dispari, uno dei 5 blocchi base dispone di un singolo blocco logico GPC dedicato.

Questo significa che lo shader frontend del GK106 è 3/5 di quello di un full-GK104.

GeForce GTX 660 Block Diagram FINAL

 Processing Units (GK106)

GK106
Graphics Processing Clusters 3
SMXs 5
CUDA Cores 960
Texture Units 80
ROP Units 24

 

Il backend prevede 3 gruppi di ROPs da 8 unità collegati ad una cache L2 da 384KB e tre memory controller. Su questi ultimi sono collegati i chip di memoria GDDR5. Con un bus ampio 192-bit, il quantitativo di memoria video tipico sarebbe di 768 MB o 1536MB (a seconda della densità), ma siccome Nvidia ha voluto innalzare la soglia VRAM a 2GB (cifra tonda) è stata costretta ad implementare lo stesso design asimmetrico già visto sulla GTX 660 Ti.

In pratica, per poter inserire 8 chip VRAM al posto dei classici 6, il primo MC è stato connesso ad un numero doppio di chip (design asimmetrico). Tale soluzioni implica sempre un framebaffer di 1536MB a piena banda (192-bit) ma la scheda è comunque in grado di allocare fino a 2GB di memoria con una limitazione di banda a 64-bit per l'ultima porzione di 512MB.

GK106 MC

 Memory (GTX 660)

 
Total Video Memory 2048MB GDDR5
Memory Interface 192-bit
Total Memory Bandwidth 144.2 GB/s
Texture Filtering Rate 78.4 GigaTexels/sec

 

Passiamo alle frequenze di clock. Il base clock del chip GK106 è di 980MHz, mentre il boost clock è di 1033MHz. Le memorie operano invece a 6008MHz. 

GK107

Il chip GK107 già lo conosciamo bene. Con i suoi 118 millimetri quadrati di superficie e 1.3 miliardi di transistor è la GPU desktop Kepler a 28nm più compatta realizzata finora da Nvidia. Integra 384 CUDA Core organizzati su due SMX in una singola GPC. Le ROPs sono 16, con 256KB di cache L2 ed il memory controller ha un'ampiezza di 128-bit.

GeForce GTX 650 Block Diagram FINAL

 Processing Units (GK107)

 
Graphics Processing Clusters 1
SMXs 2
CUDA Cores 384
Texture Units 32
ROP Units 16

 

new imc 650

 Memory (GTX 650)

 
Total Video Memory 1024MB / 2048MB GDDR5
Memory Interface 128-bit
Total Memory Bandwidth 80 GB/s
Texture Filtering Rate 33.9 GigaTexels/sec

 

Su questo chip la funzione GPU boost non è stata implementata, la GPU GK107 viaggia sempre a 1058MHz ed è abbinata ad 1 o 2GB di memoria video GDDR5 funzionanti a 5GHz (effettivi).