Skylake-X, il “Phantom Throttling” e il caso delle SIMD AVX512 - Bits and Chips Skin ADV
Text Size

Mentre overcloker ed utenti enthusiast si stanno ancora confrontando sui problemi relativi ai consumi e alla sezione di alimentazione delle schede madri X299, gli utenti che in Skylake-X vedono una CPU da lavoro (Prosumer) stanno analizzando nel dettaglio il funzionamento della stessa con carichi da lavoro “seri”, soprattutto facendo uso delle SIMD AVX2 e AVX512.

Ha catturato la nostra attenzione, in particolare, questo thread sul forum ufficiale di Prime 95, in cui l’utente Mysticial ha constatato come la CPU, quando va in Throttling non abbassi le frequenze di funzionamento, ma invece diminuisca l’IPC: “When I was testing with AVX512, I noticed that the throttling doesn't lower the clock speed. Instead, it seems to cut the IPC in half. So it's architectural throttling of some sort. The most natural hypothesis is that the dedicated FMA on port 5 gets shutdown. But I currently have no evidence to support this theory nor have I run any targeted benchmarks to test it”.

Qui di seguito la suddivisione delle porte, nell’uArch Skylake-X:

  • Port 0: ALU/Vec ALU, Vec Shft/Vec Add, Vec Mul/FMA, DIV, Branch2
  • Port 1: ALU/Vec ALU/Fast LEA, Vec Shift/Vec Add, Vec Mul/FMA, Slow Int, Slow LEA
  • Port 2: Load/Store Address
  • Port 3: Load/Store Address
  • Port 4: Store Data
  • Port 5: ALU/Vec ALU/Fast LEA, Vec Shuffle, FMA
  • Port 6: ALU/Shift, Branch1
  • Port 7: Store Address


Questa soluzione potrebbe essere stata presa per più motivi, ed ognuno non esclude l’altro:

  • mantenendo elevata la frequenza operativa, una volta conclusa l’operazione AVX2 o AVX512, le altre operazioni possono essere effettuate senza dover aspettare che il clock torni a salire;
  • da un punto di vista del marketing la CPU lavora sempre a frequenza elevata, anche con le SIMD AVX2 e AVX512, considerate da sempre molto avide di potenza (Sempre Mysticial  afferma: “This sort of "phantom throttling" is new to me and I believe new only to Skylake X. And it lets people "think" they're running at 5.0 GHz on air when in reality, everything is getting throttled down to less than half speed and you won't notice until you actually measure the performance and/or power draw. The average overclocker who only cares about showing off their CPUz will not notice and will be very happy”);
  • non vi sono latenze aggiuntive per la fluttuazione di clock, a seconda dei carichi di lavoro.

Sempre Mysticial, convinto dalle argomentazioni di Der8auer, ha provato a modificare i parametri della propria scheda madre Gigabyte, al fine di evitare questo Throttling, impostando il VCCIN manualmente. Questo ha portato effettivamente ad evitare il fenomeno del Phantom Throttling, ma ha causato lo shutdown del sistema per l'eccessivo carico con la CPU @4GHz: "Once the vdroop has been solved, it won't work yet. The moment you try to pull 4 GHz of AVX512, it will hard shutdown the system instead of phantom throttle. This is caused by the VCore current protection. Maxing out the VCore current limit finally let me run AVX512 on all cores @ 4.0 GHz without shutting down or throttling. However, the temperatures did reach 95C. So it's not something I recommend anyone doing unless they've delided the processor and are running custom water. But at the very least, the throttling problem on Gigabyte motherboards has been solved. The exact nature of the phantom throttling is still unknown. And it is receiving enough attention that people are probably gonna start looking at it".

Altro fattore da considerare, quando si parla di Skylake-X e SIMD AVX2/AVX512, è il rinnovato design della Cache L2 ed L3 (Quattro volte la Cache L2 di Broadwell-E, ma la metà Cache L3). L’ormai immancabile Der8auer analizza quindi la gestione della Cache attraverso Prime95, in relazione alle dimensione dei carichi di lavoro.

 

 

Quando si esegue il test FFT 96K (768KB) si ha un consumo pari a 492W per l’intero sistema, mentre quando si esegue il test FFT 128K (1024KB) si ha un consumo di “soli” 406W. Questo fa supporre che quando si utilizzano stringhe di dati più lunghe (1024KB), si debba utilizzare la Cache L3 (Questo provoca elevate latenze, quindi la CPU ha momenti in cui è “a riposo”), mentre con stringhe più brevi (768KB) i dati possano essere gestiti quasi in toto dalla Cache L2 (La CPU lavora sempre al 100%). Tutto questo significa che con grosse moli di dati le CPU Skylake-X perdono in performance (Quando invece dovrebbe mantenere le medesime prestazioni, in teoria!).

A questo punto va constatato come la Cache L3 (Decisamente sottotono) abbia una Bandwidth poco superiore alla Memoria DDR4 @3600 MHz, quindi non è difficile supporre che con delle DDR4 @4000 MHz potremmo avere delle RAM più performanti della Cache L3 (Latenze a parte)!

Si tratta sicuramente di un grosso defict per le CPU Skylake-X, in quanto chi lavora con le SIMD AVX2 e AVX512 solitamente cerca la massima efficacia, e quindi utilizza stringhe di dati piuttosto corpose. Aspettiamo comunque aggiornamenti di BIOS e update di WIndows, in quanto la situazione potrebbe essere risolta (Almeno in parte), attraverso il Software.


Pubblicato in: News, Hardware
Tags: avx512 , gigabyte , intel , overclock , prime95 , skylake-x , socket2066 , vrm

OkNotizie
Gian Maria Forni
Autore: Gian Maria Forni
Esperto in:
Esperto di mercati e CPU
Sebbene sia laureato in Lettere e Filosofia, indirizzo Storia Contemporanea, e scriva per quotidiani e riviste di tale settore, ha sempre avuto la passione per l'informatica ed ha collaborato quale moderatore in importanti forum del settore
Notizie postate da Gian Maria ForniArticoli postati da Gian Maria Forni
2534
news
153
articoli
     Questo indirizzo email è protetto dagli spambots. È necessario abilitare JavaScript per vederlo.

carLtoon

Press Release

BitsAndChips Official Channel

Quotazioni

Loading
Chart
o Intel Corp. 34.63 ▲0.07 (0.20%)
o Advanced Micro Devices 13.77 ▲0.22 (1.62%)
o Microsoft Corp. 73.92 ▲0.06 (0.08%)
o NVIDIA Corp. 166.71 ▲1.61 (0.97%)
o Texas Instruments 82.13 ▼0.03 (-0.04%)
o Apple Inc. 150.92 ▼0.10 (-0.07%)
o Oracle Corp. 50.98 ▼0.02 (-0.04%)
NASDAQ:INTC

Intel Corp.

Company ID [NASDAQ:INTC] Last trade:34.63 Trade time:12:35PM EDT Value change:▲0.07 (0.20%)
NYSE:AMD

Advanced Micro Devices

Company ID [NYSE:AMD] Last trade:13.77 Trade time:12:36PM EDT Value change:▲0.22 (1.62%)
NASDAQ:MSFT

Microsoft Corp.

Company ID [NASDAQ:MSFT] Last trade:73.92 Trade time:12:36PM EDT Value change:▲0.06 (0.08%)
NASDAQ:NVDA

NVIDIA Corp.

Company ID [NASDAQ:NVDA] Last trade:166.71 Trade time:12:36PM EDT Value change:▲1.61 (0.97%)
NASDAQ:TXN

Texas Instruments

Company ID [NASDAQ:TXN] Last trade:82.13 Trade time:12:35PM EDT Value change:▼0.03 (-0.04%)
NASDAQ:AAPL

Apple Inc.

Company ID [NASDAQ:AAPL] Last trade:150.92 Trade time:12:36PM EDT Value change:▼0.10 (-0.07%)
NYSE:ORCL

Oracle Corp.

Company ID [NYSE:ORCL] Last trade:50.98 Trade time:12:35PM EDT Value change:▼0.02 (-0.04%)

Il meglio dal forum

[Official Topic] AMD APU Kabini, Temash, Kaveri e... Carrizo. Discutiamo le ultime novità sulle APU AMD basate su microarchitettura Bulldozer e Jaguar
[Waiting for] AMD GPU Polaris & Vega (ex-Arctic Islands). Discutiamo le ultime novità sulle GPU Polaris di AMD, senza dimenticarci di Vega!
[Official Topic] Nvidia Pascal GPU. Discutiamo le ultime novità sulle GPU Pascal di NVIDIA e su quanto ci aspetta in futuro!
[Official Topic] AMD "Zen". Discutiamo le ultime novità sulla microarchitettura x86 Zen di AMD e le CPU/APU in arrivo.
Buongiorno e buonasera. Il thread dedicato alle discussioni più futili e divertenti! Ogni forum che si rispetti ne ha uno, no?
Creative Sound Blaster e Windows 10/8.1/8/7/Vista. Dedicato a tutti i possessori delle schede audio di Creative Labs!
B&C e la questone "degli articoli prezzolati". Perché B&C è un portale diverso?