DeepSeek marque une nouvelle étape dans la course à l'IA

DeepSeek marque une nouvelle étape dans la course à l'IA

DeepSeek, une startup chinoise, a fait une percée significative dans la compétition de l'intelligence artificielle grâce à son modèle DeepSeek-R1. Ce modèle open source se mesure aux performances des modèles occidentaux, notamment en mathématiques, en programmation et en raisonnement.

Le modèle DeepSeek-R1 utilise une architecture "mixture-of-experts" (MoE) qui ne mobilise que 37 milliards de paramètres sur un total de 671 milliards pour chaque token traité, ce qui réduit les coûts d'inférence tout en préservant une performance élevée. De plus, la startup a amélioré les techniques de distillation, ce qui permet de transférer les capacités de raisonnement des modèles plus grands vers des modèles plus petits.

Cette approche a suscité l'intérêt des universités chinoises, comme l'Université de Shenzhen et l'Université de Zhejiang, qui intègrent dorénavant DeepSeek dans leurs programmes pour enrichir l'enseignement de l'IA.

https://www.beaboss.fr/Thematique/digital-innovation-1074/intelligence-artificielle-2023/Breves/deepseek-marque-nouvelle-etape-course-ia-481613.htm 

https://www.solutions-numeriques.com/avis-dexpert-deepseek-marque-une-nouvelle-etape-dans-la-course-a-lia/ 

Author

IAredac