Man mano che le densità di potenza nei data center continuano ad aumentare, la necessità di raffreddamento continuo diventa più importante. Il rischio di una perdita di raffreddamento durante uno switch verso un gruppo di continuità ed il relativo impatto possono essere catastrofici per un’organizzazione. Le apparecchiature IT potrebbero infatti non funzionare o essere danneggiate.
A seconda del raffreddamento o della tecnologia UPS implementata in un Data Center, i requisiti per il raffreddamento continuo possono differire notevolmente.
Il raffreddamento continuo è definito come la capacità di fornire un ambiente termico stabile per le apparecchiature IT critiche senza alcuna interruzione.
Il raffreddamento continuo richiede una temperatura di ingresso delle apparecchiature IT costante per il tempo necessario al riavvio dei sistemi meccanici di raffreddamento dopo un’interruzione dell’alimentazione ai sistemi di raffreddamento (compreso il tempo necessario per il trasferimento ai gruppi elettrogeni quando presenti). Richiede inoltre un adeguato mantenimento della temperatura del corridoio freddo.
Il mantenimento di un ambiente termico stabile aiuta a mitigare le possibilità di aumenti improvvisi del carico di uscita dell’UPS. Potrebbero verificarsi aumenti di carico dovuti all’aumento del consumo di energia delle ventole degli apparati IT per compensare una temporanea perdita di raffreddamento. Se il carico non è ben gestito, l’aumento potrebbe sovraccaricare l’UPS, compromettendo il funzionamento dell’intera struttura.
L’American Society of Heating, Refrigerating, and Air-Conditioning Engineers (ASHRAE), di concerto con i principali produttori di apparecchiature IT, ha stabilito le Thermal Guidelines for Data Processing Environments che includono le temperature dell’aria di ingresso consigliate delle apparecchiature informatiche necessarie per consentire il funzionamento affidabile di server, apparecchiature di archiviazione e dispositivi di rete. A partire dal 2015, la linea guida ASHRAE raccomanda di mantenere l’ingresso del dispositivo tra temperature a bulbo secco di 18-27° C (66-81° F), con temperature del punto di rugiada da 9° C a 15° C (15-59° F) e umidità relativa inferiore al 60% per soddisfare i criteri stabiliti dai produttori.
Va notato che i requisiti del raffreddamento continuo sono indipendenti dalle linee guida ASHRAE per la temperatura effettiva dell’ingresso degli apparati IT. La conformità alle linee guida ASHRAE per la temperatura di ingresso del server è una decisione basata sulle esigenze individuali di un’organizzazione.
Le linee guida ASHRAE stabiliscono la variazione massima consentita nella temperatura di ingresso per le apparecchiature IT. Per un data center con archiviazione su nastro la variazione di temperatura massima consentita per le apparecchiature IT tipiche è limitata a 5 ° C in un’ora. Tutte le altre apparecchiature IT sono limitate alle temperature massime consentite fino a 20 ° C in un’ora. Per un data center con qualsiasi tipo di dispositivo, ASHRAE limita questa velocità di modifica a 5 ° C entro un periodo di 15 minuti. È importante notare che questo non è un tasso di variazione, ma piuttosto una limitazione discreta di aumento o diminuzione della temperatura.
Si consideri un data center con contenimento del corridoio freddo in cui le unità di trattamento dell’aria della sala computer con acqua refrigerata (Computer Room Air Handling, CRAH) operano con metodologie di controllo della temperatura dell’aria di mandata e con un set point normale di 20° C. Se la control deadband è impostata a 1° C, significa che durante le normali operazioni l’unità fornirebbe una temperatura di ingresso delle apparecchiature IT di 19-21° C, supponendo che non si mescoli aria tra l’unità CRAH e le apparecchiature IT.
Se si verifica un guasto o una perdita di energia di rete mentre l’unità fornisce aria a 19° C all’ambiente critico e il guasto provoca il raggiungimento da parte dell’unità CRAH della temperatura di 24° C al massimo, allora la temperatura di ingresso non può, entro un periodo di 15 minuti, deviare tra 19-24° C. Ciò significa che, se l’unità si ripristina entro un periodo di 15 minuti, l’unità non può raffreddarsi eccessivamente al punto in cui la temperatura dell’aria di mandata scende al di sotto di 19° C.
Il mantenimento di questo intervallo di temperatura richiede una grande attenzione da parte degli algoritmi di controllo utilizzati per gestire il raffreddamento delle unità CRAH. Ricorrendo allo stesso esempio, se un guasto dovesse invece causare una temperatura dell’aria di mandata di picco di 22° C prima del recupero, il recupero potrebbe raffreddarsi a 17° C per rimanere all’interno della banda morta di 5° C in un periodo di 15 minuti.
Occorre inoltre considerare il tempo necessario per ripristinare il raffreddamento meccanico. Mentre ASHRAE utilizza periodi di 15 minuti per definire le variazioni di temperatura massime consentite, lo standard Tier richiede che una soluzione di raffreddamento continuo sia in grado di fornire un ambiente termico stabile per tutto il tempo necessario per il riavvio del sistema di raffreddamento meccanico in seguito a qualsiasi interruzione del raffreddamento o alla perdita di energia elettrica.
ll tempo di riavvio del sistema meccanico viene misurato dal momento della perdita di utilità fino a quando i generatori del motore (o altri sistemi di produzione di energia in loco) si avviano e si chiudono sul carico critico, quando il sistema meccanico è ripristinato, è in funzione e fornisce raffreddamento nominale in condizioni operative stazionarie. Ad esempio, un refrigeratore non è ufficialmente operativo fino a quando non viene riavviato e funziona con le normali condizioni di alimentazione, di ritorno dell’acqua e delle portate.
Sebbene i produttori stiano riducendo i tempi di riavvio delle apparecchiature, l’intervallo tra la perdita di potenza e una ripresa della capacità del sistema di produrre un raffreddamento stabile deve essere posto come punto di attenzione nella progettazione di Data Center. Se, ad esempio, sono necessari 10 minuti per ripristinare un raffreddamento meccanico stabile dopo una perdita di potenza, l’accumulo di energia termica (Thermal Energy Storage, TES) deve essere in grado di fornire 10 minuti di accumulo di acqua refrigerata.
Sebbene il livello Tier IV sia l’unico livello che richiede il raffreddamento continuo, i data center con densità di carico IT superiori alla media dovrebbero prendere in considerazione il raffreddamento continuo per mitigare i grandi aumenti di temperatura a causa della perdita di energia elettrica o guasti ai componenti.
L’Uptime Institute ha dimostrato come, in un data center con impegno di 6 kW / rack, le temperature dell’aria aspirata nella sala IT hanno superato il valore massimo entro 60 secondi dopo una perdita di raffreddamento o anche solo una perdita di movimento dell’aria. La perdita di raffreddamento di 1 minuto ha poi richiesto ben 20 minuti per il recupero.
Se consideriamo lo scenario di un guasto della rete elettrica di pubblica utilità durante il quale l’UPS continua ad alimentare i dispositivi IT, ma il funzionamento dell’impianto meccanico viene interrotto, a seconda della tecnologia di raffreddamento impiegata, questa interruzione può continuare per diversi minuti. Durante questo periodo, qualsiasi aumento delle temperature nella sala IT può danneggiare le apparecchiature. Il raffreddamento continuo fornisce il ponte per consentire all’ambiente termico di rimanere stabile fino al ripristino del sistema di raffreddamento meccanico o di altro tipo. Una soluzione di raffreddamento continuo progettata correttamente impedirà qualsiasi aumento della temperatura media dell’aria in ingresso al server.
Il livello Tier IV è l’unico livello che richiede il raffreddamento continuo. Di seguito sono riportati approcci per ottenere il raffreddamento continuo. Gli standard di livello non sono prescrittivi, ma forniscono standard basati sui risultati e sulle prestazioni, pertanto potrebbero esistere altri metodi per raggiungere l’obiettivo del raffreddamento continuo oltre a quelli descritti di seguito.
Il raffreddamento continuo per un sistema di acqua refrigerata viene generalmente realizzato con capacità TES ossia con accumulo di acqua refrigerata. Le pompe secondarie e i CRAH devono essere presenti anche su fonti di alimentazione UPS con tolleranza di guasto. La fonte di alimentazione può essere l’UPS IT o un sistema UPS separato dedicato ai sistemi meccanici, contemporaneamente manutenibile e tollerante ai guasti.
Se il sistema di raffreddamento è in una configurazione primaria diretta, le pompe primarie devono essere su un UPS. È inoltre necessario considerare i serbatoi di accumulo termico ed il modo in cui sono collegati alla distribuzione dell’acqua refrigerata. A seconda della connessione dei serbatoi al sistema di distribuzione dell’acqua refrigerata, l’acqua refrigerata di alimentazione e di ritorno (quindi più calda) potrebbe essere miscelata, riducendo potenzialmente il tempo in cui un serbatoio di accumulo di acqua refrigerata può supportare un ambiente termico stabile per le apparecchiature IT.
Il raffreddamento continuo per i sistemi ad espansione diretta (Direct Expansion, DX) richiede che sia i condizionatori d’aria della sala computer (CRAC) sia i condensatori esterni siano collegati ad un sistema UPS con manutenzione simultanea e tollerante ai guasti.
Inoltre, i sistemi DX potrebbero richiedere ulteriori analisi ingegneristiche per soddisfare i requisiti di raffreddamento continuo. Il ciclo del compressore durante il normale funzionamento dei CRAC può causare l’interruzione del funzionamento dei compressori per diversi minuti per la protezione del compressore. In ambienti con densità superiore alla media, questi vuoti possono causare sbalzi di temperatura sia durante le normali operazioni che durante i guasti e la perdita di energia elettrica, rendendo più difficile il raggiungimento di un ambiente termico stabile.
Il raffreddamento continuo per sistemi di evaporazione, come evaporatori diretti o scambiatori di calore ad evaporazione indiretta, richiede che le pompe dell’acqua (secondarie o di sistema circolanti) e le ventole di distribuzione siano alimentate da fonti di energia UPS Fault Tolerant.
Il raffreddamento continuo per sistemi che ricorrono ad aria esterna al 100%, in grado di fornire raffreddamento durante tutto l’anno, richiede che le ventole o il sistema che fornisce l’aria alla sala computer siano alimentate da fonti di energia UPS Fault Tolerant.
Quando i sistemi UPS rotanti sono installati come UPS IT e i sistemi di raffreddamento si trovano su un bus senza interruzioni, potrebbero non essere necessarie ulteriori misure di raffreddamento continuo poiché il sistema meccanico non subirebbe un’interruzione durante un trasferimento dall’utilità al generatore.
Se esiste un sistema di acqua refrigerata installato in tandem con un UPS rotante senza batterie, il sito deve dimostrare che la temperatura media di ingresso del server non aumenterà oltre i limiti indicati in precedenza se non è installato TES. Ogni caso specifico deve essere progettato per garantire che venga soddisfatto il requisito di un ambiente termico stabile durante una perdita di potenza.
Fornendo stabilità termica all’ambiente IT durante qualsiasi interruzione nel sistema di raffreddamento, come il passaggio dall’interruzione di servizio all’energia del gruppo elettrogeno, il raffreddamento continuo garantisce che un disservizio non comporti costosi danni da calore all’hardware IT o alle apparecchiature critiche, né che il carico di uscita dell’UPS aumenti fino al sovraccarico.
Il raffreddamento continuo è un requisito solo per la certificazione di livello Tier IV, ma è una tutela giustificabile per qualsiasi struttura con densità media superiore a 4 kW / rack alla luce del potenziale danno a strutture e risorse IT.