Schneider Electric, leader de la transformation numérique de la gestion de l'énergie et des automatismes, a publié le livre blanc 133 intitulé « Navigating Liquid Cooling Architectures for Data Centers with AI Workloads ». Ce document propose un examen approfondi des technologies de refroidissement liquide et de leurs applications dans les centres de données modernes, en particulier ceux qui gèrent des charges de travail d'IA à haute densité.
La demande en matière d'IA croît à un rythme exponentiel. Par conséquent, les centres de données nécessaires à la mise en œuvre de la technologie d'IA génèrent une chaleur considérable, en particulier ceux qui contiennent des serveurs d'IA avec des accélérateurs utilisés pour l'apprentissage de grands modèles de langage et des charges de travail d'inférence. Cette production de chaleur accroît la nécessité d'utiliser le refroidissement liquide pour maintenir des performances, une durabilité et une fiabilité optimales.
Le dernier livre blanc de Schneider Electric guide les opérateurs de centres de données et les responsables informatiques à travers les complexités du refroidissement liquide, en offrant des réponses claires aux questions critiques sur la conception, la mise en œuvre et l'exploitation du système.
Compréhension des architectures de refroidissement liquide
Les auteurs Paul Lin, Robert Bunger et Victor Avelar identifient deux catégories principales de refroidissement liquide pour les serveurs IA : le refroidissement direct sur la puce et le refroidissement par immersion. Ils décrivent les composants et les fonctions d'une unité de distribution du liquide de refroidissement (CDU), qui sont essentiels pour gérer la température, le débit, la pression et l'échange de chaleur au sein du système de refroidissement.
« Les charges de travail d'IA présentent des défis de refroidissement uniques que le refroidissement de l'air seul ne peut pas résoudre », a déclaré Robert Bunger, Innovation Product Owner, CTO Office, Data Center Segment, Schneider Electric. « Notre livre blanc vise à démystifier les architectures de refroidissement liquide, en fournissant aux opérateurs de centres de données les connaissances nécessaires pour prendre des décisions éclairées lors de la planification des déploiements de refroidissement liquide. Notre objectif est de fournir aux professionnels des centres de données des informations pratiques pour optimiser leurs systèmes de refroidissement. En comprenant les compromis et les avantages de chaque architecture, les opérateurs peuvent améliorer les performances et l'efficacité de leurs centres de données. »
Le livre blanc présente trois éléments clés des architectures de refroidissement liquide :
- Capture de la chaleur à l'intérieur du serveur : Utilisation d'un milieu liquide (par exemple, huile diélectrique, eau) pour absorber la chaleur des composants informatiques.
- Type de CDU : Sélection du CDU approprié en fonction des méthodes d'échange de chaleur (liquide-air, liquide-liquide) et des facteurs de forme (montage en rack, montage au sol).
- Méthode de rejet de la chaleur : Déterminer comment transférer efficacement la chaleur vers l'extérieur, soit par les systèmes existants de l'installation, soit par des installations dédiées.
Choisir la bonne architecture
Le document détaille six architectures courantes de refroidissement liquide, combinant différents types de CDU et méthodes de rejet de la chaleur, et fournit des conseils pour choisir la meilleure option en fonction de facteurs tels que l'infrastructure existante, la taille du déploiement, la vitesse et l'efficacité énergétique.
Avec la demande croissante de puissance de traitement de l'IA et l'augmentation correspondante des charges thermiques, le refroidissement liquide devient un élément essentiel dans le design des centres de données. Le livre blanc aborde également les évolutions de l'industrie telles que le besoin d'une plus grande efficacité énergétique, la conformité aux réglementations environnementales et le passage à des opérations durables.
« Alors que l'IA continue de stimuler le besoin de solutions de refroidissement avancées, notre livre blanc constitue une ressource précieuse pour nous adapter à ces changements », a ajouté Bunger. « Nous nous engageons à aider nos clients à atteindre leurs objectifs de haute performance tout en améliorant la durabilité et la fiabilité. »
Les designs de référence pour les centres de données d'IA
Ce livre blanc est particulièrement opportun et pertinent à la lumière de la récente collaboration de Schneider Electric avec NVIDIA pour optimiser l'infrastructure des centres de données pour les applications d'IA.
Ce partenariat a permis d'introduire le premier design de référence de centre de données d'IA accessible au public, en s'appuyant sur les technologies d'IA avancées de NVIDIA et l'expertise de Schneider Electric en matière d'infrastructure de centre de données.
Ces designs de référence définissent de nouvelles normes pour le déploiement et l'exploitation de l'IA, en fournissant aux opérateurs de centres de données des solutions innovantes pour gérer efficacement les charges de travail d'IA à haute densité.
Pour plus d'informations et pour télécharger le livre blanc, visitez le site web de Schneider Electric.