Réseautez les débutants, les aficionados et les professionnels ! Prête-moi ton oreille. Il y a des choses en cours qui auront un impact profond sur votre terrain de jeu, le réseau. L’IA générative et les applications conçues pour en tirer parti font l’objet d’une grande attention. Les études abondent sur l’apparence de ces applications, les frameworks qu’elles utilisent et les services à utiliser. J’ai moi-même certaines de ces données.
Mais ce dont on ne parle pas (assez), c’est de l’impact que ces applications vont avoir sur l’épine dorsale de l’entreprise. Vous savez, le réseau. Il n’est pas surprenant d’apprendre que seulement 50 % des répondants à une enquête orientée réseau a déclaré que la planification du réseau était une activité dans laquelle leur entreprise s’engageait.
C’est problématique car il y a des choses en cours dans les affaires qui indiquent que les réseaux de centres de données (ceux que vous exploitez et supervisez quotidiennement) sont sur le point d’être inondés de nouvelles charges de travail qui auront de grandes implications sur votre entreprise. réseaux de centres de données.
Les charges de travail d’IA reviennent à la maison
Oui, c’est ce que signifie réellement tout ce qui parle de rapatriement. Si des charges de travail reviennent à la maison, ils ont besoin d’un endroit où séjourner et de couloirs pour se déplacer au milieu de la nuit. Nos propres recherches indique une augmentation significative (de 13 % en 2021 à 50 % en 2024) des organisations qui ont ou prévoient de rapatrier des charges de travail.
Et voici le problème : si Enquête de Barclay auprès des DSI à partir du premier semestre 2024 est exact, les charges de travail qui reviennent à la maison concernent uniquement les données. Les charges de travail de stockage et de base de données étaient les principales charges de travail transférées du cloud public vers un centre de données près de chez vous. En raison de la dépendance de l’IA à l’égard de ces données, le retour des charges de travail liées aux données vers le centre de données est révélateur des futures charges de travail de l’IA dans le centre de données.
Compte tenu des principaux modèles actuels d’applications d’IA, des changements importants dans le réseau en termes de débit et de modèles de trafic sont nécessaires. Cela est dû à l’ajout de nouveaux « niveaux » dans l’architecture des applications qui s’étendent pour intégrer à la fois les sources de données et les services d’inférence, ainsi qu’à un afflux de nouveau trafic.
Vue de haut niveau de l’architecture prenant en charge l’IA
Quelle technologie de mise en réseau est la meilleure pour les charges de travail d’IA ?
Le fait est que certains protocoles, comme Infinibandsont depuis longtemps du ressort des professionnels du stockage. Mais Infiniband est l’un des protocoles chéris de Usines d’IA parce que la plupart du trafic de l’IA est constitué de gros morceaux de données et, honnêtement, submerge facilement Ethernet.
Nous disposons donc d’un réseau qui intègre désormais des protocoles supplémentaires avec de nouveaux chemins qui pénètrent plus profondément dans le centre de données. Il y a plus de trafic et un plus grand besoin de le contrôler pour diverses raisons (comme la conformité, la confidentialité, etc.).
Tout cet exercice de planification de réseau ? Absolument nécessaire maintenant. Et l’une des tâches associées à cet exercice devrait être l’identification des points de contrôle stratégiques dans ce réseau.
Les points de contrôle stratégiques sont les emplacements de l’architecture réseau où des services peuvent être insérés pour contrôler le trafic à des fins d’évolutivité et de sécurité. Et tout aussi important que identifier ces points de contrôle c’est reconnaître que les flux de trafic seront bidirectionnels. De nombreuses applications d’IA s’appuient sur des services d’inférence capables d’appeler dehors à un service ; services qui peuvent résider à l’intérieur du centre de données mais peuvent également se trouver à l’extérieur du centre de données.
Il s’agit d’un changement marqué dans l’architecture qui suppose traditionnellement entrant (entrée) le contrôle de la circulation est la norme. Certains de ces points de contrôle nécessiteront un service capable de gérer et de sécuriser sortant trafic. Et pas le type de fonctionnalités de « filtrage d’URL/contenu Web ». Cela va plutôt dans le sens de Sécurité des API retourné à l’envers.
Un dernier mot sur les charges de travail de mise en réseau et d’IA
L’IA est disruptive dans tous les sens du terme. Cela change les industries, les emplois, les attentes et le réseau. Lorsque nous parlons de transformation numérique et de la nécessité de moderniser l’architecture d’entreprise, nous soulignons l’importance de son élément le plus fondamental : l’infrastructure. Cela signifie le réseau.
Il est temps de se lancer dans quelques exercices de planification du réseau avant qu’il ne soit submergé par des charges de travail et de nouvelles exigences de trafic que l’infrastructure réseau existante ne peut pas gérer.