La startup chinoise, Deepseek, pourrait remanier la façon dont les opérateurs prévoient d’utiliser l’IA dans leurs réseaux.
Deepseek a fait la une des journaux plus tôt cette année lorsqu’il a publié un modèle d’IA à grande langue open source qu’il a affirmé est plus efficace et plus facile à former que les plates-formes américaines d’Openai et d’autres. En mars, la société a déployé Deepseek-V3, promettant une amélioration de l’exécutabilité du code et un Boost des performances de référence sur un modèle V3 précédent qui est sorti en décembre. Le nouveau modèle nécessite moins de 6 millions de dollars de puissance de calcul des puces NVIDIA H800, Reuters a rapporté.
Deepseek pourrait réduire le matériel et les coûts de formationmais qu’est-ce que cela signifie pour les opérateurs de réseau?
Un mouvement vers le bord
Un changement est que les organisations pourraient utiliser Deepseek pour Fortifiez leurs capacités informatiques de bord. L’Edge, avec le LAN, est l’endroit où les modèles d’IA apprennent, selon Ed Fox, CTO chez Mettel, un fournisseur mondial de produits de communication numérique intégrés pour les entreprises et les agences gouvernementales.
Usman Javaid, directeur des produits et marketing chez Orange Business, voit également des modèles Deepseek-R1 fonctionner sur un nœud Edge. Les modèles sont efficaces et peuvent fonctionner où les utilisateurs le souhaitent, et il a dit qu’il prévoyait un jour où les téléphones portables qui incorporent des chipsets efficaces pourraient exécuter de petits modèles d’IA.
“Deepseek a contribué à faire ce concept d’IA immersif réel, ce qui signifie que vous pouvez prendre l’IA et le mettre aussi près que possible de votre charge de travail ou de vos données”, a déclaré Javaid.
Modèles plus efficaces mathématiquement
Deepseek peut également permettre aux organisations de créer des modèles d’IA plus efficaces mathématiquement qui nécessitent moins de calculs, a déclaré Javaid.
“Au lieu d’avoir une approche brute-force pour calculer, vous pouvez adopter une approche d’efficacité du modèle”, a déclaré Javaid. “Ensuite, finalement, avec moins de calcul, vous pouvez obtenir des résultats similaires ou meilleurs.”
Cependant, cela est livré avec une mise en garde: les modèles avec plus de raisonnement nécessitent moins de calcul pour les former, mais le calcul sera toujours nécessaire pour l’inférence.
“Vous avez besoin de beaucoup de calcul pour déduire des modèles, car beaucoup de traitement se produit au niveau de l’inférence, au niveau du raisonnement”, a-t-il déclaré. “Alors, comment vous regardez votre coût total de possession, pas seulement dans le coût de la formation, mais en fait, votre cours d’inférence est bien plus élevé.”
Deepseek pour la recherche
Aujourd’hui, Deepseek est principalement utilisé à des fins de recherche. Les entreprises expérimentent en utilisant l’apprentissage automatique et l’IA pour se connecter à plusieurs moteurs d’IA et acquérir une meilleure compréhension des différents modèles d’apprentissage, selon Jim Coyle, CTO du secteur public américain à la lookout, un point final mobile et une société de sécurité cloud.
“Surtout en ce qui concerne les États-Unis – à cause des relations américaines – je ne vois pas [DeepSeek] Être utilisé dans un aspect du monde des affaires au-delà de la recherche “, a déclaré Coyle.
En effet, le Congrès américain a présenté un projet de loi bipartite pour interdire Deepseek. Certaines agences américaines, telles que le ministère de la Défense, la NASA et le ministère du Commerce, ont déjà institué une interdiction. Entre-temps, états qui ne permettent pas de profondeur Incluez l’Alabama, l’Iowa, New York, l’Oklahoma, le Texas et la Virginie.
Andrew Athan, Technical Solutions Architect III chez World Wide Technology, un intégrateur de systèmes informatiques, a fait écho aux affirmations de Coyle.
“Deepseek en soi aura un impact limité, principalement parce que l’entreprise et ses modèles ne sont pas basées aux États-Unis, et ont donc diverses problèmes de sécurité et de sécurité nationale”, a-t-il déclaré.
Au lieu de cela, il a déclaré que Deepseek “limité aux ressources” pourrait être mieux adapté à une utilisation par les universités et d’autres institutions similaires.
“Les approches de Deepseek sont utiles à de nombreux participants à l’écosystème, y compris dans le monde universitaire, qui a des contraintes de ressources similaires, et où les tailles de modèle utilisées pour la recherche sont éclipsées par les développeurs de modèles à l’échelle industrielle”, a déclaré Athan.
Implications de sécurité
Les organisations qui décident de déployer Deepseek doivent Marchez soigneusement pour s’assurer que les informations sont sécurisées. Il est crucial de mettre en œuvre Zero Trust et une politique uniforme dictant comment le matériel est crypté pendant ses transit, a déclaré Javaid.
“Il y a un besoin peut-être une couche de confiance sous-jacente plus courante et plus cohérente, qui comprend la responsabilité de la sécurité – non seulement par modèle, mais une couche sous-jacente qui assure la conformité”, a-t-il déclaré.
Le renard de Mettel a déclaré qu’il est également important que les entreprises identifient avec précision, suivent avec précision le trafic provenant d’une application telle que Deepseek. Coyle a conseillé aux entreprises de faire preuve de prudence lors du blocage des outils d’IA, car cela pourrait entraîner une attaque de déni de service. De plus, des outils comme Deepseek pourraient en outre inciter les organisations à adopter une confiance zéro et le concept de souveraineté des données, dans laquelle les règles et les réglementations régissent les données en fonction de la région opérationnelle.
Un nouveau type de réseau?
En fin de compte, Deepseek et des modèles comme il pouvaient inaugurer un Nouveau type d’infrastructure réseauA déclaré Javaid, celui qui est plus distribué et moins centralisé.
“Vous pouvez même exécuter vos modèles dans votre réseau, vos routeurs et vos commutateurs”, a déclaré Javaid. “Et puis vous pouvez également créer des intelligences à l’invite et au niveau de l’application pour pouvoir avoir votre réseau ayant la même capacité de raisonnement que dans vos modèles d’IA génératifs.”
Une nouvelle génération de modèles distribués efficaces sur l’IA open source entraînera éventuellement les opérateurs de réseau à considérer les nouveaux types d’architecture émergents, a-t-il déclaré.
L’évolution de Deepseek n’est que l’itération la plus récente de la plus grande course sur les armements de l’IA. À mesure que les organisations développent leurs propres outils d’IA, ils pourraient vouloir les plus petites empreintes de pas profondes.
“Les systèmes les plus capables sont constitués de collections de modèles plus petits, chacun à régler pour effectuer de manière optimale pour une tâche finale spécifique”, a déclaré Athan de WWT.
À l’avenir, les plates-formes de l’IA seront propulsées pour distinguer leurs offres de Deepseek et incorporer des fonctionnalités non trouvées dans la plate-forme chinoise, a déclaré Nic Benders, stratège technique en chef de New Relic.
“Au cours des prochains mois, comme nous voyons d’autres sociétés d’IA copier ce que Deepseek a fait, nous devrions voir des modèles plus compétents et des prix d’utilisation inférieurs à tous les niveaux”, a déclaré Benders.