IA : Xiaomi présente son Intelligence artificielle MiDashengLM-7B

Xiaomi crée la surprise en dévoilant MiDashengLM-7B, un modèle d’intelligence artificielle vocale open source. Ce modèle est conçu pour être intégré dans les véhicules électriques et les appareils domestiques intelligents de Xiaomi, pour transformer l’interaction homme-machine. Ce modèle repousse les limites de la compréhension audio grâce à une architecture innovante, alliant performances techniques et accessibilité.
- Architecture hybride : MiDashengLM-7B combine l'encodeur audio propriétaire Dasheng avec le décodeur Qwen2.5-Omni-7B Thinker d'Alibaba, permettant une compréhension holistique des entrées audio, y compris la parole, les sons environnementaux et la musique.
- Entraînement innovant : Contrairement aux approches traditionnelles basées sur la reconnaissance automatique de la parole (ASR), MiDashengLM-7B utilise des légendes audio générales pour capturer une représentation textuelle complète des scènes audio complexes.
- Performance supérieure : Le modèle offre une réduction du temps jusqu'au premier jeton (TTFT) jusqu'à 4 fois plus rapide et une capacité de traitement par lots jusqu'à 20 fois supérieure par rapport à des modèles comparables.
Pour aller plus loin sur le sujet, voici une sélection d’articles et de sources à consulter :
https://goodtech.info/xiaomi-ia-vocale-open-source-midashenglm7b/
https://ux-tech.fr/xiaomi-ouvre-le-modele-de-comprehension-du-son-midashenglm-7b/