DeepSeek, une startup en intelligence artificielle basée à Hangzhou, en Chine, a attiré une attention significative dans l'industrie mondiale de l'IA avec le lancement du grand modèle linguistique DeepSeek-V3 à la fin de décembre 2024. Ce modèle a 671 milliards de paramètres mais n'a pris que environ deux mois pour être formé à un coût de 5,58 millions USD, nettement inférieur aux investissements des autres grandes entreprises technologiques. DeepSeek-V3 atteint les meilleures performances parmi les modèles open source et se compare aux modèles les plus avancés dans le monde. La société a optimisé le processus de formation pour minimiser les coûts, en utilisant environ 2,78 millions d'heures de GPU avec les GPU H800 de Nvidia produits en Chine. Cela démontre que les entreprises d'IA chinoises ont réalisé des progrès significatifs malgré les restrictions des États-Unis dans l'accès aux semiconducteurs avancés nécessaires à la formation en IA. Le succès de DeepSeek a suscité des inquiétudes dans l'industrie technologique américaine, avec une chute des actions de Nvidia et d'autres sociétés technologiques. Les experts estiment que DeepSeek a atteint des performances élevées à un coût beaucoup plus bas que ses homologues américains, grâce à l'utilisation de technologies open source et de méthodes de formation efficaces. De plus, DeepSeek a publié le code source et des explications techniques détaillées du modèle, permettant aux chercheurs et développeurs du monde entier d'accéder et d'améliorer cette technologie. Cette transparence contraste avec l'approche plus secrète des principales entreprises d'IA américaines et pourrait changer la manière dont les grandes entreprises technologiques développent des modèles à l'avenir.
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
#Deepseek Goes Viral#
DeepSeek, une startup en intelligence artificielle basée à Hangzhou, en Chine, a attiré une attention significative dans l'industrie mondiale de l'IA avec le lancement du grand modèle linguistique DeepSeek-V3 à la fin de décembre 2024. Ce modèle a 671 milliards de paramètres mais n'a pris que environ deux mois pour être formé à un coût de 5,58 millions USD, nettement inférieur aux investissements des autres grandes entreprises technologiques.
DeepSeek-V3 atteint les meilleures performances parmi les modèles open source et se compare aux modèles les plus avancés dans le monde. La société a optimisé le processus de formation pour minimiser les coûts, en utilisant environ 2,78 millions d'heures de GPU avec les GPU H800 de Nvidia produits en Chine. Cela démontre que les entreprises d'IA chinoises ont réalisé des progrès significatifs malgré les restrictions des États-Unis dans l'accès aux semiconducteurs avancés nécessaires à la formation en IA.
Le succès de DeepSeek a suscité des inquiétudes dans l'industrie technologique américaine, avec une chute des actions de Nvidia et d'autres sociétés technologiques. Les experts estiment que DeepSeek a atteint des performances élevées à un coût beaucoup plus bas que ses homologues américains, grâce à l'utilisation de technologies open source et de méthodes de formation efficaces.
De plus, DeepSeek a publié le code source et des explications techniques détaillées du modèle, permettant aux chercheurs et développeurs du monde entier d'accéder et d'améliorer cette technologie. Cette transparence contraste avec l'approche plus secrète des principales entreprises d'IA américaines et pourrait changer la manière dont les grandes entreprises technologiques développent des modèles à l'avenir.