L’attrait et le potentiel de l’IA pour les entreprises et les hyperscalers ont captivé l’imagination des entreprises du monde entier, mais que doivent-elles prendre en compte pour la mettre en œuvre dans leurs centres de données ? Plus précisément, ils ont besoin d’une infrastructure qui réponde aux exigences de calcul, de mise en réseau et de stockage de leurs implémentations et charges de travail d’IA.
À cette fin, un examen des dépenses en infrastructures montre l’impact actuel de l’IA sur les entreprises. Poussés en grande partie par les ventes de serveurs accélérés alimentés par l’IA, les achats mondiaux de centres de données ont bondi de 38 % d’une année sur l’autre au premier semestre 2024, selon un rapport couvrant tous les aspects des dépenses en équipements de centres de données du Groupe Dell’Oroune société d’études et d’analyses de marché.
Les serveurs d’IA et les dépenses en infrastructure alimentent la croissance future
Pour l’ensemble de l’année 2024, les dépenses d’investissement des centres de données devraient augmenter de 35 % pour atteindre plus de 400 milliards de dollars, les dépenses consacrées aux serveurs et à l’infrastructure d’IA étant en tête, selon le rapport. Les fournisseurs de services cloud hyperscale s’efforcent d’élargir leurs offres d’IA, créant ainsi une forte demande pour ces systèmes spécialisés.
« L’adoption de l’infrastructure d’IA en est encore à ses débuts pour les entreprises, selon Baron Fung, directeur principal de la recherche chez Dell’Oro. « Les organisations déterminent combien investir, car le retour sur investissement (ROI) dépend de l’échelle des modèles d’IA qu’elles envisagent de prendre en charge sur site et de la manière dont elles peuvent utiliser ces modèles. “
À court terme, a-t-il poursuivi, l’utilisation des services de cloud public pourrait s’avérer plus logique, le temps que les entreprises affinent leurs modèles d’utilisation. « L’une des questions les plus courantes que nous rencontrons est de savoir comment les entreprises peuvent monétiser leurs investissements en IA et obtenir les rendements souhaités. »
Les infrastructures progressent malgré les défis
Malgré ces défis, les déploiements d’infrastructures d’IA gagnent du terrain, en particulier en dehors des hyperscalers. Les équipementiers de serveurs tels que Dell, Supermicro et HPE, qui s’adressent aux marchés non hyperscalers, ont considérablement augmenté leurs ventes de systèmes d’IA.
Au-delà des coûts élevés, les entreprises doivent remédier aux limitations en matière d’énergie et de capacité des centres de données, car l’infrastructure d’IA a souvent une puissance et une puissance différentes. refroidissement besoins par rapport aux systèmes informatiques traditionnels, a expliqué Fung.
Les organisations qui investissent dans l’IA pour les centres de données privés comprennent des fournisseurs de cloud de niveau 2 et des entreprises de secteurs tels que la finance et la fabrication de haute technologie.
“Bien que certains puissent déployer de grands clusters d’IA, la plupart mettent en œuvre des systèmes à plus petite échelle (par exemple, quelques racks) pour des tâches telles que le réglage fin des modèles ou l’inférence ; d’autres construisent des cloud d’IA privés pour garantir que les données sensibles restent isolées de l’Internet au sens large. ” a expliqué Fung.
Tendances des dépenses en matière d’infrastructure d’IA pour les centres de données
Bien que le rapport couvre les progrès réalisés dans de nombreux types de dépenses en équipements de centres de données, les dépenses d’investissement en IA/services accélérés sont plus importantes que le reste car elles croissent plus rapidement, suivies par l’infrastructure physique. Les clients potentiels doivent comprendre que tous les éléments du centre de données doivent être déployés de manière synchronisée.
Cette augmentation rapide est principalement due à la montée en puissance des serveurs accélérés, essentiels aux applications d’IA générative. Il s’agit du quatrième trimestre consécutif de croissance à trois chiffres du chiffre d’affaires d’une année sur l’autre dans les livraisons accélérées de serveurs.
Piloter l’informatique accélérée
L’IA a des exigences de performances différentes de celles du HPC traditionnel. En tant que tels, les accélérateurs matériels et les coprocesseurs pour l’IA sont conçus pour compléter un processeur ou un autre processeur hautes performances dans le but d’accélérer une fonction ou une charge de travail spécifique.
À ce stade, le calcul accéléré utilise du matériel spécialisé comme les GPU, les ASIC, DPUTPU et FPGA pour exécuter les calculs plus efficacement que les CPU, améliorant ainsi la vitesse et les performances. Il est particulièrement avantageux pour les tâches qui peuvent être parallélisées, telles que le calcul haute performance, l’apprentissage profond, le ML et l’IA.
Les mises à niveau des serveurs, en particulier vers les plates-formes CPU de 4e et 5e générations, se font attendre depuis longtemps et, malgré les incertitudes économiques mondiales persistantes, la demande pour ces systèmes devrait augmenter, indique le rapport.
Nouvelle infrastructure physique du centre de données (DCPI)
Le marché des infrastructures physiques des centres de données (DCPI) a surperformé les attentes au premier semestre de cette année. Selon le rapport, la croissance a été attribuée à la construction de nouveaux centres de données avec des modifications de conception liées à l’IA pour prendre en charge l’augmentation des densités de puissance des racks. L’Amérique du Nord est en tête avec le taux de croissance le plus rapide, tandis que les revenus de la région Asie-Pacifique, hors Chine, ont également connu une croissance à deux chiffres.
Les revenus des composants de serveurs et de systèmes de stockage ont atteint des niveaux records au cours des deux premiers trimestres de l’année. La croissance rapide des accélérateurs, qui incluent les GPU et accélérateurs personnalisésainsi que les disques de mémoire et de stockage, ont été un facteur clé de cette augmentation des revenus. « Les applications d’IA générative ont été les principaux moteurs de l’accélération de la demande de serveurs, mais la hausse des prix des matières premières, en particulier pour les disques de mémoire et de stockage, a également contribué à l’augmentation des revenus, a expliqué Fung.
En ce qui concerne les revenus des composants, le rapport prévoit qu’ils doubleront en 2024, alimentés par le déploiement accru de processeurs spécialisés tels que les accélérateurs et Cartes réseau intelligentes. Les prix des composants de base, tels que la mémoire et les disques de stockage, devraient augmenter tout au long de l’année.
Un autre élément de l’infrastructure du centre de données qui doit être mis à jour pour l’IA est Commutateurs Ethernet. Il faudra peut-être encore plusieurs trimestres pour que ce segment se développe en raison de problèmes de stocks. « Nous prévoyons que la reprise du marché des commutateurs Ethernet sera menée par les SP cloud hyperscale sur les deux réseaux pour l’informatique à usage général et les clusters d’IA », a déclaré Fung.
La voie à suivre en matière d’infrastructure pour les centres de données d’IA
L’IA a un impact bien plus que les opérations des centres de données des utilisateurs et des fournisseurs de services, en particulier dans le domaine de gestion de réseau. Et comme il s’agit d’un domaine en évolution rapide, en apprendre davantage sur l’IA est un conseil judicieux. Est-ce que votre infrastructure prête?