Problème de dissipation thermique des serveurs haute puissance
Le centre de données est comme une « super-usine » d’informations, traitant des quantités massives de données jour et nuit. En entrant dans le centre de données, des rangées de hautes armoires apparaissent. Les serveurs à l’intérieur tournent à grande vitesse comme des « bourreaux de travail » infatigables. Mais le saviez-vous ? Bien que ces serveurs fournissent une puissance de calcul puissante, ils sont également confrontés à de graves problèmes de dissipation de chaleur.
Avec le développement rapide de la technologie, les performances des serveurs continuent d'augmenter et la consommation d'énergie augmente également de manière spectaculaire. La méthode traditionnelle de refroidissement par air est comme l'utilisation d'un petit ventilateur pour refroidir un grand poêle, qui devient de plus en plus incapable de le faire. Prenons l'exemple d'un centre de données ordinaire, la densité de puissance d'une armoire par mètre carré peut atteindre plusieurs kilowatts. Dans certains scénarios de calcul haute performance, la puissance d'une seule armoire peut même dépasser des dizaines de kilowatts. Sous des charges aussi élevées, les systèmes de refroidissement par air traditionnels doivent être équipés d'unités de climatisation haute puissance et d'un grand nombre de ventilateurs de refroidissement afin d'évacuer la chaleur. Non seulement cela consomme une quantité d'énergie stupéfiante, représentant environ 40 % de la consommation électrique du centre de données, juste derrière l'équipement informatique lui-même, mais l'effet de dissipation de chaleur est également insatisfaisant.
Il est bien connu que le processeur, le processeur graphique et d'autres puces à l'intérieur du serveur génèrent beaucoup de chaleur. Cependant, en tant que composant clé pour le stockage, la lecture et l'écriture des données, le problème de dissipation thermique de la mémoire ne peut pas non plus être ignoré. La mémoire de serveur hautes performances d'aujourd'hui, en particulier les modules de mémoire DDR5 et de spécifications supérieures, a considérablement augmenté sa consommation d'énergie par rapport aux générations précédentes. La consommation d'énergie standard est généralement aussi élevée que 15 W, et les DIMM haute puissance sont encore plus courants. Lorsque la mémoire fonctionne dans un environnement à haute température pendant une longue période, le taux d'erreur de lecture et d'écriture des données augmente considérablement, tout comme un scribe fatigué qui fait des erreurs fréquentes dans une pièce étouffante. Cela entraînera non seulement une baisse des performances du système, mais dans les cas graves, cela peut également entraîner des conséquences catastrophiques telles que des pannes et des pertes de données, jetant une ombre sur le fonctionnement stable du centre de données.
Pourquoi la technologie de refroidissement liquide se démarque
Face aux difficultés du refroidissement par air traditionnel, la technologie du refroidissement liquide a fait des débuts brillants comme un « magicien de la dissipation de chaleur ». Le refroidissement liquide, comme son nom l'indique, utilise le liquide comme moyen de transfert de chaleur pour évacuer rapidement la chaleur générée par le serveur. Son principe de fonctionnement peut être comparé au système de circulation sanguine du corps humain. Entraîné par la pompe, le liquide de refroidissement circule le long des tuyaux soigneusement conçus et s'écoule à travers les composants générateurs de chaleur du serveur, tels que le processeur, le processeur graphique, la mémoire, etc., comme un « caloporteur », transportant en continu la chaleur vers le dispositif de refroidissement externe et la dissipant finalement dans l'air.
Par rapport au refroidissement par air, les avantages du refroidissement par liquide sont évidents. Tout d’abord, la conductivité thermique du liquide est environ 25 fois supérieure à celle de l’air, ce qui signifie que la chaleur est transférée plus rapidement et plus efficacement dans le liquide, et peut être évacuée aussi rapidement que l’éclair, gardant l’intérieur du serveur « frais » à tout moment. Tout comme lors d’une chaude journée d’été, se laver les mains à l’eau froide peut rapidement évacuer la chaleur de vos mains, tandis que l’effet rafraîchissant d’une brise est beaucoup moins efficace.
Deuxièmement, le système de refroidissement liquide présente une excellente stabilité. Étant donné que la capacité thermique spécifique du liquide est importante, après avoir absorbé une grande quantité de chaleur, l'augmentation de sa propre température est relativement faible, ce qui peut fournir un environnement thermique relativement stable pour le serveur et éviter efficacement les pannes matérielles causées par des fluctuations de température excessives. C'est comme mettre une couche de « vêtement de protection » à température constante sur le serveur, de sorte que le serveur puisse fonctionner de manière stable, quelle que soit l'évolution de l'environnement extérieur.
De plus, la technologie de refroidissement liquide excelle en matière d'économie d'énergie et de réduction du bruit. D'une part, le système de refroidissement liquide n'a pas besoin d'être équipé d'un grand nombre de ventilateurs de refroidissement à haute puissance comme le refroidissement par air, ce qui réduit la consommation d'énergie du ventilateur et réduit également le bruit généré par le fonctionnement du ventilateur. Selon les statistiques, les centres de données refroidis par liquide peuvent réduire la consommation d'énergie d'environ 30 % par rapport aux centres de données refroidis par air traditionnels, ce qui peut réduire considérablement les factures d'électricité des centres de données et réaliser des économies d'énergie verte. D'autre part, sans le bruit vrombissant des ventilateurs, le centre de données devient plus silencieux, créant un environnement de travail relativement confortable pour le personnel d'exploitation et de maintenance et réduisant l'impact du bruit sur l'environnement environnant.
Enfin, la technologie de refroidissement liquide permet un déploiement à haute densité de serveurs. Étant donné que le système de refroidissement liquide présente une efficacité de dissipation thermique élevée et peut gérer efficacement la grande quantité de chaleur générée par les serveurs à haute densité de puissance, davantage de serveurs peuvent être placés dans le même espace, améliorant ainsi la puissance de calcul et la densité de stockage du centre de données et exploitant pleinement les précieuses ressources de l'espace informatique, tout comme la construction de gratte-ciels plus hauts sur un terrain limité, augmentant considérablement la « capacité de production » du centre de données.
Solutions de refroidissement liquide de la mémoire des serveurs haute puissance
Solutions de refroidissement liquide de la mémoire des serveurs haute puissance
- Limites des solutions existantes
Actuellement, les solutions de refroidissement liquide de mémoire existantes dans l'industrie utilisent principalement des tuyaux en acier ou en cuivre pour connecter les plaques froides afin de dissiper la chaleur. Le TIM (matériau d'interface thermique) est fixé à la surface du tube et le refroidissement est obtenu par contact entre le TIM et le DIMM. Bien que cette conception puisse réduire la température du DIMM et améliorer les performances dans une certaine mesure, elle présente de nombreux inconvénients.
D'une part, la compatibilité est médiocre. En raison de la diversité des configurations des systèmes de serveurs, cette conception avec un espacement DIMM fixe ne peut pas être appliquée à différentes plates-formes en tant que composant standard. C'est comme des vêtements sur mesure de la même taille pour des personnes de différentes morphologies. Ils sont soit trop serrés, soit trop amples et difficiles à ajuster parfaitement. Cela augmentera non seulement considérablement le coût global, mais peut également affecter la stabilité du système. Selon les données pertinentes, dans certains scénarios où les accessoires du serveur doivent être remplacés fréquemment, les dépenses supplémentaires causées par les problèmes de compatibilité du refroidissement liquide de la mémoire peuvent représenter plus de 30 % du coût total du système de refroidissement.
En revanche, il est difficile à entretenir. Le système de refroidissement liquide DIMM nécessite une maintenance facile lors du branchement et du débranchement des DIMM. Cependant, la conception actuelle présente le risque d'endommager le TIM sur la surface du tube lors du branchement et du débranchement des DIMM. Il est également possible que la force de contact soit difficile à contrôler, ce qui entraîne un mauvais contact entre le DIMM et le tube, ce qui à son tour conduit à une répartition inégale de la température du DIMM. Tout comme lors du démontage et de l'installation d'un composant clé d'un instrument de précision, on peut accidentellement endommager les composants sensibles à l'intérieur, affectant le fonctionnement normal de l'ensemble de l'instrument. Dans les registres d'exploitation et de maintenance de certains grands centres de données, des pannes de dissipation de chaleur causées par le branchement et le débranchement de la mémoire se produisent souvent, causant de gros problèmes au personnel d'exploitation et de maintenance et augmentant le risque d'indisponibilité du système.
- Points forts de la solution innovante
Pour surmonter ces défis, un système de refroidissement liquide de mémoire haute puissance basé sur des plaques froides thermiques et mécaniques modulaires a été développé. Le système utilise un dissipateur thermique spécial directement connecté au DIMM pour transférer efficacement la chaleur générée par la mémoire vers une plaque froide distante. Il réalise un échange de chaleur par le biais d'un liquide en circulation pour optimiser la température du DIMM et la maintenir dans la plage de fonctionnement appropriée.
La conception modulaire du dissipateur thermique et de la plaque froide sont les points forts de cette solution innovante. En assemblant séparément le module DIMM et le dissipateur thermique et en utilisant la pression pour maintenir une force de contact uniforme, un contact stable entre le module DIMM et le dissipateur thermique est assuré, ce qui permet un transfert efficace de la chaleur, évitant ainsi la surchauffe locale causée par un mauvais contact. Cela rend également la distribution de température du module DIMM plus uniforme, offrant une garantie solide pour un fonctionnement stable de la mémoire.
En termes de compatibilité, cette conception adopte une conception de pas standard et peut être largement utilisée sur plusieurs plates-formes DIMM. La conception de référence du pas DIMM est de 0.297 pouces, ce qui peut être utilisé universellement dans diverses conceptions de plates-formes de pas DIMM de 0.297 à 0.35 pouces. C'est comme une clé principale qui peut être adaptée à une variété de « verrous » de différentes spécifications, réduisant considérablement les coûts supplémentaires. Qu'il s'agisse d'un serveur de données pour une petite entreprise ou d'un cluster de calcul hautes performances dans un grand centre de données, il peut être facilement géré sans se soucier des problèmes de compatibilité.
L'adaptabilité est également un avantage majeur de cette solution. Elle permet d'ajuster de manière flexible le matériau ou la conception du dissipateur thermique en fonction des besoins pour répondre aux différentes exigences de consommation d'énergie des modules DIMM. Par exemple, pour les modules DIMM DDR5 haute puissance à consommation d'énergie plus élevée, un dissipateur thermique en cuivre avec une conductivité thermique plus élevée peut être sélectionné et sa structure d'ailettes de dissipateur thermique peut être optimisée. Pour les modules DIMM ordinaires à consommation d'énergie relativement faible, un dissipateur thermique en aluminium à faible coût peut être utilisé pour assurer l'effet de dissipation thermique tout en obtenant un contrôle précis des coûts. Cela permet aux fabricants de serveurs et aux opérateurs de centres de données d'adapter la solution de refroidissement de mémoire la plus adaptée aux besoins réels de l'entreprise, évitant ainsi le gaspillage de ressources.
Pour vérifier l'excellence de cette solution innovante, les chercheurs ont effectué des simulations thermiques à l'aide de l'outil Flotherm 2210. Les résultats montrent que la nouvelle conception surpasse les solutions de refroidissement conventionnelles en termes de résistance thermique, avec des améliorations allant de 8 % à 19 %. Dans le même temps, dans le test DDR5 TTV, les résultats du test réel différaient de la simulation dans les 5 %, prouvant ainsi l'efficacité de la nouvelle solution. Cela signifie qu'après l'adoption de la nouvelle solution de refroidissement liquide, les modules de mémoire peuvent dissiper la chaleur plus rapidement, tout comme le remplacement d'une voiture sous-alimentée par un moteur hautes performances, lui permettant de maintenir une bonne dissipation de la chaleur lors de la conduite à grande vitesse, garantissant un fonctionnement stable et efficace du système serveur.
Performances réelles du refroidissement liquide de la mémoire
Dans le centre de données d'une grande entreprise Internet, les serveurs qui utilisaient à l'origine un refroidissement par air traditionnel subissaient une forte augmentation de la température de la mémoire pendant les périodes de pointe, et le système signalait fréquemment des erreurs, laissant le personnel d'exploitation et de maintenance souvent débordé. Pour résoudre complètement ce problème, ils ont introduit une solution de refroidissement liquide de la mémoire basée sur des plaques froides thermiques et mécaniques modulaires.
L'effet après la mise en œuvre est significatif. La température de la mémoire du serveur est contrôlée avec précision. Même en cas de fonctionnement à forte charge, la fluctuation de température est extrêmement faible et reste toujours dans la plage de fonctionnement idéale. La stabilité du système a été considérablement améliorée. Les problèmes tels que les pannes système et les erreurs de données causées par la surchauffe de la mémoire ont presque disparu et la continuité des activités a été efficacement garantie. Dans le même temps, la consommation d'énergie du centre de données a également été considérablement réduite et les économies d'électricité sont considérables, ce qui apporte de réels avantages économiques à l'entreprise.
Il existe également une start-up spécialisée dans l'informatique d'intelligence artificielle. Avec l'expansion rapide de son activité, les exigences en matière de performances des serveurs sont de plus en plus élevées. Lorsque leurs serveurs haute puissance exécutent des modèles d'IA complexes, le refroidissement de la mémoire devient un goulot d'étranglement. Après avoir remplacé le nouveau système de refroidissement liquide de la mémoire, le serveur semble avoir reçu une injection de booster, les performances ont été pleinement libérées, le temps de formation du modèle a été considérablement raccourci et un soutien solide a été fourni pour l'itération rapide du produit, aidant l'entreprise à se démarquer dans la concurrence féroce du marché.
Ces cas de réussite montrent que la technologie de refroidissement liquide de la mémoire a démontré sa puissance dans le combat réel, garantissant le fonctionnement stable et efficace des centres de données de nombreuses entreprises. À l'avenir, avec les progrès continus de la science des matériaux et des processus de fabrication, la technologie de refroidissement liquide de la mémoire continuera d'évoluer. La conductivité thermique du liquide de refroidissement sera encore améliorée, la conception des tuyaux de dissipation thermique et des dissipateurs thermiques sera plus sophistiquée et efficace, la compatibilité et la maintenabilité atteignant de nouveaux sommets, ce qui ouvre la voie à une dissipation thermique solide pour le développement de serveurs haute puissance, aidant le monde numérique à prospérer.
Entrez dans l'ère du refroidissement liquide
L'émergence de la technologie de refroidissement liquide de la mémoire des serveurs haute puissance a apporté des solutions innovantes aux problèmes de dissipation thermique dans les centres de données. Elle répond non seulement aux exigences élevées de dissipation thermique que le refroidissement par air traditionnel ne peut pas satisfaire, mais surmonte également les problèmes de compatibilité et de maintenance des solutions de refroidissement liquide de mémoire existantes. Avec ses excellentes performances de dissipation thermique, sa stabilité exceptionnelle, ses effets d'économie d'énergie significatifs et sa bonne adaptabilité, elle assure le fonctionnement efficace et stable du serveur.
À l'ère de la transformation numérique accélérée, les centres de données, pierre angulaire de la société de l'information, sont confrontés à des défis et des opportunités sans précédent. L'essor de la technologie de refroidissement liquide est sans aucun doute la clé pour ouvrir un nouveau chapitre dans les futurs centres de données. Si les entreprises veulent se démarquer dans la concurrence féroce du marché, elles doivent suivre la tendance du développement technologique et prêter attention et appliquer activement des technologies avancées telles que le refroidissement liquide de la mémoire. Je pense que dans un avenir proche, avec la vulgarisation et l'amélioration continues de la technologie de refroidissement liquide, les centres de données inaugureront une nouvelle transformation, insufflant une impulsion continue au développement vigoureux de l'économie numérique mondiale. Attendons de voir et accueillons cette ère du refroidissement liquide pleine de possibilités infinies !