Dans un avenir pas si lointain, les routines quotidiennes de millions de personnes évolueront, toujours familières, mais transformées sous la surface. Tout cela dépendra d’une révolution du cloud computing.
Imaginez une nouvelle génération de produits informatiques spatiaux qui ne sont pas intrusifs (pensez à Apple Vision Pro réduit au format de lunettes ordinaires) et qui vous aident à naviguer dans le monde physique d’une manière qui vous connecte à votre environnement plutôt que de provoquer un isolement. Imaginez de nouveaux agents d’IA qui travaillent réellement pour vous, s’occupant des tâches banales afin que vous puissiez vous concentrer sur la créativité et les connexions avec le monde réel. Et imaginez votre voiture interagir avec une infrastructure urbaine intelligente pour rationaliser votre trajet et le rendre plus sûr. L’avenir ne vient pas seulement : nous nous précipitons vers lui.
Pour adopter ces technologies à une échelle proche de celle du smartphone ou de l’ordinateur portable, il doit y avoir un changement radical dans le monde. infrastructure de cloud computing sous-jacente.
L’évolution du cloud computing se poursuit
Aux débuts d’Internet, des serveurs centralisés géraient tout le trafic. Faire évoluer un site Web signifiait acheter des serveurs plus nombreux et plus gros. Cette première époque Internet s’est terminée avec l’abandon de ce modèle monolithique vers un modèle utilisant des serveurs et des logiciels distribués moins coûteux pour optimiser le trafic Web. Au lieu d’évoluer verticalement à partir d’un seul point central, nous pourrions désormais évoluer horizontalement de manière beaucoup plus rentable. Le Web se serait effondré sous son propre poids sans cet abandon des serveurs centralisés. La décentralisation et la distribution de contenu ont fait fonctionner le Web.
Nous sommes à un point de bascule similaire, approchant rapidement d’un monde où les ressources informatiques centralisées ne peuvent plus répondre aux exigences de notre technologie. Bon nombre de ces changements sont en bonne voie. D’ici 2025, les appareils de pointe créeront plus de 90 zettaoctets (90 billion gigaoctets) de données. Notre infrastructure Internet actuelle peut prendre en charge le plus que 17 milliards d’appareils connectés actuellement utilisé, mais prendra-t-il en charge près de deux fois plus d’appareils connectés en 2030 ?
De plus, même si l’essor de l’IA a été stupéfiant, nous n’en avons qu’effleuré la surface. Les données montrent que IA générative l’adoption a augmenté plus que deux fois plus vite que les smartphones et les tablettes. Le marché est en passe d’atteindre un un chiffre stupéfiant de 140 milliards de dollars d’ici 2030– cela fait beaucoup de LLM. Les géants de la technologie comme Alphabet, Amazon, Meta et Microsoft se sont engagés à dépenser collectivement près de 200 milliards de dollars cette année, principalement sur les centres de données, les puces et autres équipements permettant de créer, former et déployer des modèles d’IA génératifs. Mais cette infrastructure essentiellement centralisée pourra-t-elle évoluer avec son adoption ?
Les nouvelles applications nécessitent une mise à niveau du cloud computing
Nous ne pouvons pas nous attendre à ce qu’un modèle de centre de données centralisé – destiné aux services Web et cloud originaux des années 2000 – puisse résister à la pression insondable à venir qui viendra avec la seule IA, sans parler des appareils informatiques spatiaux, des véhicules intelligents et même une croissance normale des données. Ces centres de données peuvent se trouver à des centaines ou des milliers de kilomètres de l’utilisateur final ou de l’appareil. Cette distance, ainsi que des charges de travail plus lourdes, se traduisent par une latence plus importante.
Attendre une seconde ou deux pour qu’un site Web se charge lorsque vous effectuez des achats en ligne est une recette pour la frustration des clients et l’abandon de panier, mais la latence est encore plus dommageable dans les interactions en temps réel décrites ci-dessus. De l’informatique spatiale aux interactions automatisées par l’IA en passant par la gestion du trafic urbain, la clé du succès réside dans les interactions en temps réel à faible latence entre les appareils et les personnes, le tout à grande échelle.
Quelle sera cette nouveauté infrastructure informatique ressembler? Nous avons quelques options, même si je crois qu’il y a un gagnant évident.
Premièrement, les consommateurs pourraient s’adapter à des appareils volumineux et gourmands en informatique, dotés de suffisamment de puissance pour subvenir à leurs besoins au lieu de se connecter au cloud ou à la périphérie.
Une autre option serait de rester assis et d’attendre que la puissance de calcul devienne suffisamment petite pour s’adapter à des appareils plus rationalisés.
La troisième option, et que je considère comme la plus réaliste, consiste à adopter un cloud distribué et décentralisé.
Au lieu de la vingtaine de centres de données cloud régionaux utilisés aujourd’hui par la plupart des fournisseurs de cloud, des centaines (et à terme des milliers) de points de calcul puissants seront répartis dans le monde entier, à proximité des utilisateurs et de leurs appareils. La puissance de traitement répondra de manière dynamique aux besoins d’applications spécifiques, avec infrastructure de calcul—CPU et GPU—étroitement adaptés aux exigences de la charge de travail. Les charges de travail peuvent communiquer avec les points de calcul et revenir aux appareils en quelques millisecondes, permettant ainsi des applications en temps réel qui nécessitent des niveaux élevés d’intelligence informatique avec une latence ultra faible.
La nouvelle norme du cloud computing
Cette révolution de l’informatique distribuée ne consiste pas à « construisez-le, et ils viendront ». De fortes forces du marché le stimulent.
Pensez aux domaines dans lesquels les entreprises technologiques mondiales investissent. Microsoft, lors de sa récente conférence Build, s’est concentré sur de nouvelles expériences utilisateur sophistiquées qui bénéficieront de l’informatique de pointe. Google Cloud distribué (GDC) fait la promotion de sa capacité « IA partout », en complément de ses modèles Gemini AI. Infrastructure itinérante d’Oracle étend les services cloud à la périphérie du réseau. Apple Intelligence exploitera l’IA à une telle échelle – sur l’appareil pour certaines tâches et dans un cloud privé pour des calculs plus complexes – qu’elle nécessitera d’énormes quantités de réseau pour fonctionner correctement. Et AWS vante services de pointe pour déployer des API et des outils au-delà de ses centres de données.
Ce sont des signes que nous allons dans la bonne direction. Cependant, la véritable révolution amènera une informatique puissante et spécialement conçue à bien plus de points de présence que ce qui est actuellement envisagé par les entreprises technologiques qui sont encore investies dans un modèle de distribution limité.
Un dernier mot
À terme, l’informatique hautement distribuée sera si omniprésente qu’elle sera transparente pour les utilisateurs. Mais sans déménager vers infrastructure informatique distribuéeles contraintes de l’architecture actuelle deviendront bientôt apparentes : elles perturberont nos vies numériques et limiteront les possibilités des technologies émergentes.
Les pierres angulaires d’une nouvelle ère Internet sont déjà en place et pourraient conduire à des avancées techniques passionnantes, intégrant l’informatique spatiale, les agents d’IA et les infrastructures urbaines intelligentes dans notre vie quotidienne. Il est désormais temps d’implanter une informatique puissante près de chez vous.