Problema de disipación de calor en servidores de alta potencia
El centro de datos es como una “superfábrica” de información que procesa cantidades masivas de datos día y noche. Al ingresar al centro de datos, aparecen filas de gabinetes altos. Los servidores en el interior funcionan a alta velocidad como incansables “adictos al trabajo”. Pero, ¿sabía? Si bien estos servidores brindan una gran capacidad de procesamiento, también enfrentan graves desafíos de disipación de calor.
Con el rápido desarrollo de la tecnología, el rendimiento de los servidores sigue aumentando y el consumo de energía también aumenta drásticamente. El método tradicional de refrigeración por aire es como usar un pequeño ventilador para enfriar una estufa grande, que cada vez es más incapaz de hacerlo. Si tomamos como ejemplo un centro de datos ordinario, la densidad de potencia del gabinete por metro cuadrado puede ser de varios kilovatios. En algunos escenarios de computación de alto rendimiento, la potencia de un solo gabinete puede incluso superar las decenas de kilovatios. Con cargas tan altas, los sistemas de refrigeración por aire tradicionales deben estar equipados con unidades de aire acondicionado de alta potencia y una gran cantidad de ventiladores de refrigeración para eliminar el calor. Esto no solo consume una cantidad asombrosa de energía, que representa aproximadamente el 40% del consumo de electricidad del centro de datos, solo superado por el propio equipo de TI, sino que el efecto de disipación de calor también es insatisfactorio.
Es bien sabido que la CPU, la GPU y otros chips dentro del servidor generan mucho calor. Sin embargo, como componente clave para el almacenamiento y la lectura y escritura de datos, tampoco se puede ignorar el problema de la disipación de calor de la memoria. La memoria de servidor de alto rendimiento actual, especialmente los módulos de memoria DDR5 y de especificación superior, ha aumentado significativamente el consumo de energía en comparación con las generaciones anteriores. El consumo de energía estándar suele ser de hasta 15 W, y las DIMM de alta potencia son aún más comunes. Cuando la memoria funciona en un entorno de alta temperatura durante mucho tiempo, la tasa de errores de lectura y escritura de datos aumentará significativamente, al igual que un escriba cansado que comete errores frecuentes en una habitación sofocante. Esto no solo conducirá a una disminución del rendimiento del sistema, sino que en casos graves también puede causar consecuencias catastróficas como fallas y pérdida de datos, lo que ensombrece el funcionamiento estable del centro de datos.
Por qué se destaca la tecnología de refrigeración líquida
Frente a las dificultades de la refrigeración por aire tradicional, la tecnología de refrigeración líquida ha hecho un debut brillante como un "mago de la disipación de calor". La refrigeración líquida, como su nombre indica, utiliza líquido como medio de transferencia de calor para eliminar rápidamente el calor generado por el servidor. Su principio de funcionamiento se puede comparar con el sistema de circulación sanguínea del cuerpo humano. Impulsado por la bomba, el refrigerante circula a lo largo de las tuberías cuidadosamente diseñadas y fluye a través de los componentes generadores de calor en el servidor, como la CPU, la GPU, la memoria, etc., como un "transportador de calor", transportando continuamente el calor al dispositivo de refrigeración externo y finalmente disipándolo en el aire.
En comparación con la refrigeración por aire, las ventajas de la refrigeración líquida son obvias. En primer lugar, la conductividad térmica del líquido es aproximadamente 25 veces mayor que la del aire, lo que significa que el calor se transfiere más rápido y de manera más eficiente en el líquido, y se puede descargar tan rápido como un rayo, manteniendo el interior del servidor "fresco" en todo momento. Al igual que en un día caluroso de verano, lavarse las manos con agua fría puede quitarles rápidamente el calor de las manos, mientras que el efecto refrescante de una brisa es mucho menos efectivo.
En segundo lugar, el sistema de refrigeración líquida tiene una excelente estabilidad. Dado que la capacidad calorífica específica del líquido es grande, después de absorber una gran cantidad de calor, el aumento de su propia temperatura es relativamente pequeño, lo que puede proporcionar un entorno térmico relativamente estable para el servidor y evitar de manera efectiva fallas de hardware causadas por fluctuaciones excesivas de temperatura. Esto es como poner una capa de "ropa protectora" de temperatura constante en el servidor, de modo que el servidor pueda funcionar de manera estable sin importar cómo cambie el entorno externo.
Además, la tecnología de refrigeración líquida destaca por su ahorro de energía y reducción de ruido. Por un lado, el sistema de refrigeración líquida no necesita estar equipado con una gran cantidad de ventiladores de refrigeración de alta potencia como el sistema de refrigeración por aire, lo que reduce el consumo de energía del ventilador y también reduce el ruido generado por el funcionamiento del ventilador. Según las estadísticas, los centros de datos refrigerados por líquido pueden reducir el consumo de energía en aproximadamente un 30 % en comparación con los centros de datos refrigerados por aire tradicionales, lo que puede reducir significativamente las facturas de electricidad de los centros de datos y lograr un ahorro de energía ecológica. Por otro lado, sin el zumbido de los ventiladores, el centro de datos se vuelve más silencioso, lo que crea un entorno de trabajo relativamente cómodo para el personal de operación y mantenimiento y reduce el impacto del ruido en el entorno circundante.
Por último, la tecnología de refrigeración líquida permite la implementación de servidores de alta densidad. Dado que el sistema de refrigeración líquida tiene una alta eficiencia de disipación de calor y puede hacer frente de manera eficaz a la gran cantidad de calor generado por servidores de alta densidad de potencia, se pueden colocar más servidores en el mismo espacio, lo que mejora la potencia informática y la densidad de almacenamiento del centro de datos y hace un uso completo de los valiosos recursos de espacio de la sala de ordenadores, al igual que se construyen rascacielos más altos en un terreno limitado, lo que aumenta en gran medida la "capacidad de producción" del centro de datos.
Soluciones de refrigeración líquida de memoria para servidores de alta potencia
Soluciones de refrigeración líquida de memoria para servidores de alta potencia
- Limitaciones de las soluciones existentes
En la actualidad, las soluciones de refrigeración líquida de memoria existentes en la industria utilizan principalmente tubos de acero o tubos de cobre para conectar placas frías y disipar el calor. El TIM (material de interfaz térmica) se adhiere a la superficie del tubo y el enfriamiento se logra mediante el contacto entre el TIM y el DIMM. Aunque este diseño puede reducir la temperatura del DIMM y mejorar el rendimiento hasta cierto punto, tiene muchas desventajas.
Por un lado, la compatibilidad es deficiente. Debido a la diversidad de diseños de sistemas de servidores, este diseño con espaciado fijo de DIMM no se puede aplicar a diferentes plataformas como una pieza estándar. Esto es como ropa hecha a medida del mismo tamaño para personas con diferentes formas corporales. Son demasiado ajustadas o demasiado sueltas y difíciles de ajustar perfectamente. Esto no solo aumentará significativamente el costo general, sino que también puede afectar la estabilidad del sistema. Según datos relevantes, en algunos escenarios en los que los accesorios del servidor deben reemplazarse con frecuencia, el gasto adicional en costos causado por problemas de compatibilidad de refrigeración líquida de memoria puede representar más del 30% del costo total del sistema de refrigeración.
Por otro lado, es difícil de mantener. El sistema de refrigeración líquida DIMM requiere un mantenimiento sencillo al conectar y desconectar los DIMM. Sin embargo, el diseño actual tiene el riesgo de dañar el TIM en la superficie del tubo al conectar y desconectar los DIMM. También es posible que la fuerza de contacto sea difícil de controlar, lo que da como resultado un mal contacto entre el DIMM y el tubo, lo que a su vez conduce a una distribución desigual de la temperatura del DIMM. Al igual que cuando se desmonta e instala un componente clave de un instrumento de precisión, uno puede dañar accidentalmente los componentes sensibles del interior, lo que afecta el funcionamiento normal de todo el instrumento. En los registros de operación y mantenimiento de algunos grandes centros de datos, a menudo ocurren fallas de disipación de calor causadas por la conexión y desconexión de la memoria, lo que causa grandes problemas al personal de operación y mantenimiento y aumenta el riesgo de tiempo de inactividad del sistema.
- Aspectos destacados de la solución innovadora
Para superar estos desafíos, se desarrolló un sistema de refrigeración líquida de memoria de alta potencia basado en placas de refrigeración mecánicas y térmicas modulares. El sistema utiliza un disipador de calor especial conectado directamente a la DIMM para transferir de manera eficiente el calor generado por la memoria a una placa de refrigeración remota. Logra el intercambio de calor a través del líquido que fluye para optimizar la temperatura de la DIMM y mantenerla dentro del rango de funcionamiento adecuado.
El diseño modular del disipador de calor y la placa de enfriamiento son los puntos fuertes de esta solución innovadora. Al ensamblar el DIMM y el disipador de calor por separado y usar presión para mantener una fuerza de contacto uniforme, se garantiza un contacto estable entre el DIMM y el disipador de calor, lo que permite que el calor se transfiera de manera eficiente, evitando el sobrecalentamiento local causado por un mal contacto. Esto también hace que la distribución de temperatura del DIMM sea más uniforme, lo que proporciona una sólida garantía de funcionamiento estable de la memoria.
En términos de compatibilidad, este diseño adopta un diseño de paso estándar y se puede utilizar ampliamente en múltiples plataformas DIMM. El diseño de referencia del paso DIMM es de 0.297 pulgadas, que se puede utilizar universalmente en varios diseños de plataforma de paso DIMM de 0.297 a 0.35 pulgadas. Es como una llave maestra que se puede adaptar a una variedad de "cerraduras" de diferentes especificaciones, lo que reduce en gran medida los costos adicionales. Ya sea un servidor de datos para una pequeña empresa o un clúster de computación de alto rendimiento en un gran centro de datos, se puede administrar fácilmente sin preocuparse por problemas de compatibilidad.
La adaptabilidad también es una ventaja importante de esta solución. Puede ajustar de forma flexible el material o el diseño del disipador de calor según las necesidades para satisfacer los diferentes requisitos de consumo de energía de los DIMM. Por ejemplo, para los DIMM de alta potencia DDR5 con mayor consumo de energía, se puede seleccionar un disipador de calor de cobre con mayor conductividad térmica y se puede optimizar su estructura de aletas del disipador de calor. Para los DIMM comunes con un consumo de energía relativamente bajo, se puede utilizar un disipador de calor de aluminio de bajo costo para garantizar el efecto de disipación de calor y, al mismo tiempo, lograr un control de costos preciso. Esto permite a los fabricantes de servidores y operadores de centros de datos adaptar la solución de enfriamiento de memoria más adecuada según las necesidades comerciales reales, evitando el desperdicio de recursos.
Para comprobar la excelencia de esta innovadora solución, los investigadores realizaron simulaciones térmicas con la herramienta Flotherm 2210. Los resultados muestran que el nuevo diseño supera a las soluciones de refrigeración convencionales en términos de resistencia térmica, con mejoras que van del 8% al 19%. Al mismo tiempo, en la prueba DDR5 TTV, los resultados reales de la prueba difirieron de la simulación en un 5%, lo que demuestra aún más la eficacia de la nueva solución. Esto significa que después de adoptar la nueva solución de refrigeración líquida, los módulos de memoria pueden disipar el calor más rápido, al igual que reemplazar un automóvil de baja potencia por un motor de alto rendimiento, lo que le permite mantener una buena disipación del calor cuando se conduce a altas velocidades, lo que garantiza un funcionamiento estable y eficiente del sistema del servidor.
Rendimiento real de la refrigeración líquida de la memoria
En el centro de datos de una gran empresa de Internet, los servidores que originalmente utilizaban refrigeración por aire tradicional experimentaban un aumento brusco de la temperatura de la memoria durante los períodos pico de actividad y el sistema informaba errores con frecuencia, lo que a menudo dejaba al personal de operaciones y mantenimiento abrumado. Para resolver por completo este problema, introdujeron una solución de refrigeración líquida de la memoria basada en placas de refrigeración térmicas y mecánicas modulares.
El efecto después de la implementación es significativo. La temperatura de la memoria del servidor se controla con precisión. Incluso bajo una operación de alta carga, la fluctuación de temperatura es extremadamente pequeña y siempre se mantiene en el rango de trabajo ideal. La estabilidad del sistema ha mejorado enormemente. Los problemas como fallas del sistema y errores de datos causados por el sobrecalentamiento de la memoria casi han desaparecido, y la continuidad del negocio se ha garantizado de manera efectiva. Al mismo tiempo, el consumo de energía del centro de datos también se ha reducido significativamente y los ahorros en costos de electricidad son considerables, lo que brinda beneficios económicos reales a la empresa.
También hay una empresa emergente que se centra en la computación de inteligencia artificial. Con la rápida expansión de su negocio, los requisitos de rendimiento del servidor son cada vez mayores. Cuando sus servidores de alta potencia ejecutan modelos de IA complejos, el enfriamiento de la memoria se convierte en un cuello de botella. Después de reemplazar el nuevo sistema de enfriamiento líquido de la memoria, el servidor pareció recibir un refuerzo, el rendimiento se liberó por completo, el tiempo de entrenamiento del modelo se acortó en gran medida y se brindó un fuerte apoyo para la iteración rápida del producto, lo que ayudó a la empresa a destacarse en la feroz competencia del mercado.
Estos casos de éxito demuestran que la tecnología de refrigeración líquida de memoria ha demostrado su gran potencia en combate real, garantizando el funcionamiento estable y eficiente de los centros de datos de muchas empresas. De cara al futuro, con el avance continuo de la ciencia de los materiales y los procesos de fabricación, la tecnología de refrigeración líquida de memoria seguirá evolucionando. La conductividad térmica del refrigerante se mejorará aún más, el diseño de los conductos de disipación de calor y los disipadores de calor será más sofisticado y eficiente, y la compatibilidad y la capacidad de mantenimiento alcanzarán nuevas cotas, lo que allana un camino sólido de disipación de calor para el desarrollo de servidores de alta potencia, ayudando al mundo digital a florecer.
Adopte la era de la refrigeración líquida
La aparición de la tecnología de refrigeración líquida de memoria de servidor de alta potencia ha aportado soluciones innovadoras a los problemas de disipación de calor en los centros de datos. No solo cumple con los altos requisitos de disipación de calor que la refrigeración por aire tradicional no puede satisfacer, sino que también supera los problemas de compatibilidad y mantenimiento de las soluciones de refrigeración líquida de memoria existentes. Con su excelente rendimiento de disipación de calor, estabilidad sobresaliente, efectos de ahorro de energía significativos y buena adaptabilidad, garantiza el funcionamiento eficiente y estable del servidor.
En esta era de transformación digital acelerada, los centros de datos, como piedra angular de la sociedad de la información, se enfrentan a desafíos y oportunidades sin precedentes. El auge de la tecnología de refrigeración líquida es, sin duda, la clave para abrir un nuevo capítulo en los centros de datos del futuro. Si las empresas quieren destacarse en la feroz competencia del mercado, deben mantenerse al día con la tendencia del desarrollo tecnológico y prestar atención y aplicar activamente tecnologías avanzadas como la refrigeración líquida de la memoria. Creo que en el futuro cercano, con la continua popularización y mejora de la tecnología de refrigeración líquida, los centros de datos marcarán el comienzo de una nueva transformación, inyectando un impulso continuo al vigoroso desarrollo de la economía digital global. ¡Esperemos y veamos y demos la bienvenida a esta era de refrigeración líquida llena de infinitas posibilidades!