Avec les résultats récemment annoncés, Nvidia a été occupé avec plusieurs mises à jour de l’IA. La société a récemment clarifié Blackwell, introduit les plans d’agent NIM et publié les résultats des tests de performances MLPerf. Ces innovations de NVIDIA ont aidé les entreprises à développer, déployer et faire évoluer des solutions d’IA.
Pour comprendre l’importance de ces annonces, j’ai assisté à une réunion d’information avec Dave Salvator, directeur des produits de calcul accéléré chez NVIDIA, et Justin Boitano, vice-président de l’IA d’entreprise.
Pas seulement un GPU : Blackwell est une plateforme
Pour commencer le briefing, Salvator a souligné un point en partageant une diapositive illustrant les puces utilisées par Blackwell. « Blackwell est une plateforme », a-t-il déclaré. « Il est très important de comprendre cela. Le GPU n’est qu’un début. Comme vous le voyez sur la rangée du haut, ce sont des photos de toutes les puces qui entrent dans un système Blackwell pour lui faire faire ce qu’il fait, ce qui nous amène dans la prochaine ère de l’IA générative.
NVIDIA a déclaré avoir conçu Blackwell pour répondre aux exigences rigoureuses des applications d’IA modernes. Le dernier MLPerf Les benchmarks Inference v4.1 montrent que Blackwell offre des performances jusqu’à quatre fois supérieures à celles de la génération précédente GPU. La société a déclaré que cette amélioration des performances provenait de plusieurs innovations clés, notamment le Transformer Engine de deuxième génération et les cœurs Tensor FP4.
“MLPerf est une référence en matière d’IA standard qui examine les performances de formation et d’inférence pour les centres de données et même les petits appareils”, a déclaré Salvator. « Nous croyons fermement aux normes de référence de l’industrie, car c’est là que différentes entreprises peuvent se réunir, exécuter la même charge de travail et obtenir des résultats directement comparables. De plus, ces résultats sont bien entendu vérifiés par tous les soumissionnaires.
Réunir plusieurs technologies
Selon la société, Blackwell intègre plusieurs technologies NVIDIA, notamment NVLink et NVSwitch, pour une communication à large bande passante entre les GPU. Cette approche est essentielle pour les tâches d’inférence d’IA en temps réel à grande échelle. NVLink et NVSwitch permettent au système Blackwell de répondre aux demandes croissantes des LLM, tels que Llama 2 70B, qui nécessitent une génération de jetons à faible latence et à haut débit pour des performances en temps réel.
Dans les benchmarks MLPerf, Salvator a déclaré que Blackwell gérait bien les tâches d’inférence complexes sur diverses charges de travail d’IA. Un exemple : sa capacité à exécuter efficacement des LLM avec des milliards de paramètres met en évidence son potentiel dans des secteurs comme la finance, où l’analyse des données et la prise de décision en temps réel sont essentielles.
Les performances supérieures de Blackwell garantissent que les entreprises peuvent répondre à des exigences strictes en matière de latence tout en servant simultanément de nombreux utilisateurs.
Comprendre Blackwell en tant que système
Salvator a souligné que Blackwell consiste à intégrer plusieurs composants dans un système cohérent et performant. Il comprend une suite de puces NVIDIA, telles que le GPU Blackwell, le CPU Grace, l’unité de traitement de données BlueField et le commutateur NVLink, qui fonctionnent ensemble pour établir la norme en matière d’IA et de calcul accéléré.
Cette approche au niveau du système permet à Blackwell d’obtenir des résultats impressionnants dans les tâches d’inférence d’IA. En optimisant l’interaction entre ces composants, NVIDIA a créé une plate-forme qui excelle non seulement en termes de performances, mais également d’efficacité et d’évolutivité, ce qui change la donne pour les entreprises cherchant à déployer l’IA à grande échelle. Les entreprises devraient pouvoir déployer un système Blackwell pour gagner à la fois en performances et en rentabilité.
NIM Agent Blueprints : accélérer l’adoption de l’IA en entreprise
Justin Boitano a suivi Salvator pour discuter Plans NVIDIA NIM. Pour lancer cette discussion, il a adopté une vision large. « Cette transition vers l’IA générative a réellement le potentiel d’inaugurer une vague de productivité sans précédent dans le monde », a-t-il déclaré. « Aujourd’hui, la première vague d’IA générative était en réalité l’infusion de l’IA dans des services à l’échelle Internet pilotés par les créateurs de modèles fondamentaux. Et nous pensons traditionnellement à cela comme quelque chose comme ChatGPTet il a été créé pour améliorer la productivité des utilisateurs individuels en écrivant un langage et en écrivant du code. Mais cela s’étend à la façon dont nous effectuons des recherches sur Internet, rédigeons des e-mails, transcrivons et enregistrons des réunions.
Il a dit que la prochaine vague commençait maintenant.
« Cela représente une transformation plus importante des processus métiers qui affectera la manière dont les équipes travaillent dans l’entreprise », a-t-il déclaré. « Cela va se produire dans les entreprises pour les aider à activer ce que nous considérons traditionnellement comme des connaissances institutionnelles qu’elles seules possèdent sur la façon dont elles gèrent leur entreprise et la manière dont elles engagent leurs clients, les aidant ainsi à créer une nouvelle forme d’intelligence pour stimuler l’innovation plus rapidement que jamais. avant.”
C’est là que les NIM Blueprints entrent en jeu en tant que base pour les entreprises qui cherchent à se lancer dans l’IA générative. Il s’agit essentiellement de flux de travail de référence complets adaptés à des cas d’utilisation spécifiques de l’IA, tels que le service client, la découverte de médicaments et l’extraction de données à partir de PDF. Chaque plan est livré avec des exemples d’applications, du code de référence, des guides de personnalisation et des graphiques Helm de déploiement, offrant aux développeurs une longueur d’avance dans la création de solutions basées sur l’IA.
Quelques études de cas
NVIDIA a déclaré que ce qui distingue les NIM Blueprints est leur capacité à favoriser un cycle d’amélioration continue grâce à un « volant » d’IA basé sur les données. À mesure que les entreprises utilisent des applications et génèrent de nouvelles données, celles-ci sont réinjectées dans le système pour affiner et améliorer les modèles d’IA, les rendant ainsi plus intelligents et efficaces au fil du temps.
Dans le secteur de la santé, NVIDIA a déclaré que les NIM Blueprints peuvent accélérer la découverte de médicaments en tirant parti des flux de travail de criblage virtuel génératif. En conséquence, les chercheurs peuvent identifier plus efficacement les molécules prometteuses, réduisant ainsi le temps et les coûts tout en augmentant les chances de succès.
Dans le domaine du service client, les entreprises peuvent utiliser les NIM Blueprints pour créer des avatars humains numériques qui interagissent avec les clients de manière plus engageante et personnalisée, améliorant ainsi l’expérience et la satisfaction des utilisateurs.
De plus, l’adaptabilité des NIM Blueprints signifie que les entreprises de divers secteurs, du commerce de détail à la finance, peuvent adapter ces flux de travail pour répondre à leurs besoins. La conception modulaire permet aux entreprises d’intégrer les NIM Blueprints à leurs systèmes existants, prenant ainsi en charge un déploiement plus transparent et plus efficace des solutions d’IA. Cette flexibilité est cruciale pour les entreprises qui souhaitent rester compétitives sur un marché de plus en plus axé sur l’IA.
Quelques dernières réflexions
La plus grande idée fausse à propos de NVIDIA est qu’il s’agit d’un fabricant de puces. Bien qu’il fabrique les meilleurs GPU de sa catégorie, il est impossible de maintenir à tout moment le leadership du marché au niveau des puces. NVIDIA a utilisé ses prouesses en matière de logiciels et de systèmes pour créer un fossé autour d’elle. En fait, Salvatore m’a dit que la société comptait presque deux fois plus d’ingénieurs logiciels que de matériel, ce qui montre le niveau d’engagement de NVIDIA dans la fourniture de solutions sous forme de systèmes.
Zeus Kerravala est le fondateur et analyste principal de ZK Research.
Lisez ses autres articles sur l’informatique en réseau ici.