9to5Neural : DeepSeek expliqué, pertes NVIDIA et revendications de confidentialité AI

9to5Neural: DeepSeek explained, deep NVIDIA losses, AI privacy claim debunked

Dans un monde où l’innovation technologique ne cesse de croître, DeepSeek, une entreprise chinoise spécialisée dans l’IA, fait actuellement les gros titres. Cette société, fondée en 2023, représente un défi sérieux pour les géants américains comme NVIDIA et OpenAI. Nous allons explorer son modèle d’affaires, ses méthodes d’entraînement et la réaction des acteurs majeurs de l’IA face à cette nouvelle concurrence.

Qui est DeepSeek ?

DeepSeek a vu le jour à Hangzhou grâce à Liang Wengeng, un innovateur ayant une vision claire pour l’IA. Issu d’un fonds de couverture axé sur l’intelligence artificielle, ce projet s’est constitué avant que le gouvernement américain n’impose des restrictions sur l’accès aux puces AI. En conséquence, l’entreprise a acquis un stock important de GPU NVIDIA, lui permettant d’avancer rapidement dans le développement de son modèle V3.

Ce qui démarque DeepSeek, c’est son approche méthodique. Au lieu de tenter de créer des modèles totalement nouveaux, elle s’est concentrée sur l’optimisation et la distillation d’anciens modèles. Cela lui permet de fonctionner avec des ressources bien moins coûteuses tout en restant compétitive face à des modèles comme le ChatGPT d’OpenAI.

Méthodologie d’entraînement de DeepSeek

La méthode d’entraînement de cette start-up repose sur l’utilisation de l’intelligence artificielle pour former autre intelligence artificielle. Par rapport à l’approche classique qui nécessite des jeux de données labellisés par des humains, cette technique permet une scalabilité bien plus importante. Cependant, cette méthode comporte des risques d’erreurs amplifiées, rendant les vérifications d’alignement plus complexes.

D’un autre côté, la combinaison de l’apprentissage renforcé et du fine-tuning supervisé est cruciale pour garantir l’objectivité des réponses générées par l’IA. Cette dualité de méthode pourrait inciter d’autres entreprises américaines à réévaluer leurs méthodes d’entraînement à l’avenir.

Impact sur le marché et réactions des géants de l’IA

DeepSeek a suscité une réaction immédiate sur les marchés avec une chute spectaculaire de la capitalisation boursière de NVIDIA, qui a perdu près de 600 milliards d’euros. L’angoisse des investisseurs provient du fait que DeepSeek a montré qu’il était possible de développer des modèles AI à moindre coût, menaçant ainsi la domination de NVIDIA dans le secteur. Toutefois, certains pensent que cette réaction est exagérée.

La comparaison de DeepSeek avec OpenAI soulève des questions sur la véritable mesure de l’innovation. Même si DeepSeek a démontré une certaine efficacité, la course à l’IA continue. NVIDIA a d’ailleurs mentionné que, malgré les avancées de DeepSeek, le besoin en GPU de haute performance reste essentiel pour progresser dans ce domaine. La concurrence appelle à l’évolution, et chaque acteur doit s’adapter pour continuer à proposer des solutions de pointe.

La bataille pour le développement de l’intelligence artificielle ne fait donc que commencer. La publication de nouveaux modèles par OpenAI pourrait être influencée par la nécessité de répondre à cette nouvelle dynamique que DeepSeek impose sur le marché. Les prochains mois seront déterminants pour voir comment cette compétition façonnera le futur de l’intelligence artificielle.