GK106
Numerose sono state le speculazioni riguardanti l'architettura e l'organizzazione degli shader adottate da Nvidia sul nuovo chip GK106. In realtà questa GPU deriva direttamente dal GK104, con opportune semplificazioni sul numero di unità d'elaborazione. Stando alle dichiarazioni ufficiali di Nvidia, la versione full presenta tutti i 960 CUDA Core abilitati, organizzati in 5 SMX (192 x 5) ciascuno con 16 TMUs (80 totali). Essendo il numero di SMX dispari, uno dei 5 blocchi base dispone di un singolo blocco logico GPC dedicato.
Questo significa che lo shader frontend del GK106 è 3/5 di quello di un full-GK104.
Processing Units (GK106) |
GK106 |
Graphics Processing Clusters | 3 |
SMXs | 5 |
CUDA Cores | 960 |
Texture Units | 80 |
ROP Units | 24 |
Il backend prevede 3 gruppi di ROPs da 8 unità collegati ad una cache L2 da 384KB e tre memory controller. Su questi ultimi sono collegati i chip di memoria GDDR5. Con un bus ampio 192-bit, il quantitativo di memoria video tipico sarebbe di 768 MB o 1536MB (a seconda della densità), ma siccome Nvidia ha voluto innalzare la soglia VRAM a 2GB (cifra tonda) è stata costretta ad implementare lo stesso design asimmetrico già visto sulla GTX 660 Ti.
In pratica, per poter inserire 8 chip VRAM al posto dei classici 6, il primo MC è stato connesso ad un numero doppio di chip (design asimmetrico). Tale soluzioni implica sempre un framebaffer di 1536MB a piena banda (192-bit) ma la scheda è comunque in grado di allocare fino a 2GB di memoria con una limitazione di banda a 64-bit per l'ultima porzione di 512MB.
Memory (GTX 660) |
|
Total Video Memory | 2048MB GDDR5 |
Memory Interface | 192-bit |
Total Memory Bandwidth | 144.2 GB/s |
Texture Filtering Rate | 78.4 GigaTexels/sec |
Passiamo alle frequenze di clock. Il base clock del chip GK106 è di 980MHz, mentre il boost clock è di 1033MHz. Le memorie operano invece a 6008MHz.
GK107
Il chip GK107 già lo conosciamo bene. Con i suoi 118 millimetri quadrati di superficie e 1.3 miliardi di transistor è la GPU desktop Kepler a 28nm più compatta realizzata finora da Nvidia. Integra 384 CUDA Core organizzati su due SMX in una singola GPC. Le ROPs sono 16, con 256KB di cache L2 ed il memory controller ha un'ampiezza di 128-bit.
Processing Units (GK107) |
|
Graphics Processing Clusters | 1 |
SMXs | 2 |
CUDA Cores | 384 |
Texture Units | 32 |
ROP Units | 16 |
Memory (GTX 650) |
|
Total Video Memory | 1024MB / 2048MB GDDR5 |
Memory Interface | 128-bit |
Total Memory Bandwidth | 80 GB/s |
Texture Filtering Rate | 33.9 GigaTexels/sec |
Su questo chip la funzione GPU boost non è stata implementata, la GPU GK107 viaggia sempre a 1058MHz ed è abbinata ad 1 o 2GB di memoria video GDDR5 funzionanti a 5GHz (effettivi).