Il passaggio di Intel all'architettura
QuickPath Interconnect, per la famiglia Nehalem dei suoi processori Xeon, è stato di grande interesse per
ScaleMP. Quest'azienda, specializzata in virtualizzazioni
high-end, sta rilasciando un programma chiamato
vSMP Foundation per aggregare rack di server in un
multiprocessore virtuale simmetrico, per carichi di lavoro tipici dei supercomputer.
Chi necessita di un grande spazio di memoria per i propri applicativi, ma non può permettersi l'acquisto di un
SMP box con svariati TB di memoria, può comprare un rack di server a più basso costo. Il
software vSMP Foundation, insieme a una struttura InfiniBand, collega i vari nodi per formare uno spazio di memoria coerente, dove far girare sistema operativo e applicativi.
Secondo
Shai Fultheim — fondatore e CEO di
ScaleMP — l'acquisto del software aggiunge un 25% al costo di un cluster x64-InfiniBand. Confrontando però carichi di lavoro tipici (simulazioni, data warehousing,
EDA) con macchine concorrenti, che usano RISC/UNIX con elettronica reale, le prestazioni risultano essere da tre a quattro volte superiori.
La
coerenza della memoria è assicurata da una speciale macchina virtuale, installata su uno stick USB, che viene inserito in ciascun server. In pratica, essa agisce come un BIOS virtuale, facendo credere al sistema operativo e alle applicazioni di essere in esecuzione su un hardware SMP reale. Si possono usare fino a 16 computer fisici, possibilmente identici, perché le configurazioni eterogenee non sono gradite.
Con il lancio di Nehalem EP Xeon 5500 a marzo, Intel ha integrato i controllori di memoria nei core ed è passata da un'architettura
FSB a una
QPI. Sebbene molti programmi debbano ancora essere modificati per sfruttare a fondo questi cambiamenti, i risultati non si sono fatti attendere, come ci ricorda
Benjamin Baer, vicepresidente marketing della
ScaleMP.
Più nel dettaglio, la larghezza di banda della memoria aggregata è passata da 142 GB/sec a 445 GB/sec. Un sistema di 16 nodi, ciascuno dei quali con uno Xeon X5570 a 2.93 GHz (per un totale di 128 core), ha raggiunto il settimo posto nella graduatoria
STREAM Memory Bandwidth, nonostante nell'elenco comparissero macchine con 1024 core, come l'
Altix 4700 Linux, di Silicon Graphics.