LLM open source : Qwen, Llama, DeepSeek et les challengers

DossierPar la rédaction12 min

Quand on parle d’intelligence artificielle, trois noms reviennent toujours : ChatGPT, Claude, Gemini. Pourtant, une grande partie de l’IA qui tourne aujourd’hui dans les entreprises porte d’autres noms, bien moins connus du grand public : Qwen, Llama, DeepSeek, Mistral. Ces modèles ne sont pas des seconds couteaux. Plusieurs d’entre eux égalent les géants américains sur les classements publics, coûtent souvent plusieurs fois moins cher à l’usage, et présentent une particularité que ChatGPT n’a pas : on peut récupérer le modèle et le faire tourner sur ses propres serveurs.

En une phrase : les LLM open source comme Qwen (Alibaba), Llama (Meta), DeepSeek et Mistral (français) offrent des performances proches des modèles propriétaires pour un coût souvent inférieur via API, avec en prime la possibilité d’héberger l’IA chez soi pour garder le contrôle des données. Pour une TPE-PME, ça reste rarement le premier choix, mais ça devient pertinent dès qu’on a un gros volume, une contrainte de confidentialité ou un besoin de souveraineté.

On ne va pas refaire ici le match des trois grands : il est traité dans notre comparatif ChatGPT, Claude ou Gemini, lequel choisir. On regarde l’autre moitié du marché, celle qui passe sous le radar du public mais que les développeurs et les DSI connaissent bien.

Open source, open weights, paramètres : le vocabulaire en clair

Avant de comparer, trois mots à poser, parce qu’ils sont souvent mal employés, y compris par les éditeurs eux-mêmes.

Les paramètres (ou poids). Un modèle de langage, c’est un immense réseau de nombres réglés pendant l’entraînement. Ces nombres s’appellent les paramètres, ou les poids. On les compte en milliards : un modèle « 27B » a 27 milliards de paramètres. Plus il y en a, plus le modèle est en général capable, mais aussi plus il est lourd et coûteux à faire tourner. Beaucoup de modèles récents utilisent une astuce appelée « mélange d’experts » (MoE) : sur 235 milliards de paramètres au total, seuls 22 milliards travaillent à chaque réponse, ce qui réduit fortement le coût.

Open weights (poids ouverts). L’éditeur publie les poids du modèle en téléchargement libre. N’importe qui peut récupérer le fichier, le faire tourner sur sa propre machine, l’adapter à ses données. C’est la grande différence avec ChatGPT ou Gemini, dont les poids restent secrets et accessibles seulement à travers leur service.

Open source. Le terme est plus exigeant. Au sens strict, un logiciel open source autorise tout usage, y compris commercial, sans condition restrictive (licences comme Apache 2.0 ou MIT). Or beaucoup de modèles dits « open source » ne le sont pas tout à fait : leurs poids sont téléchargeables, mais une licence maison limite certains usages. C’est le cas de Llama et de l’ancienne génération de Gemma. La nuance compte : « poids ouverts » ne veut pas automatiquement dire « libre de droits ». On le précise pour chaque modèle ci-dessous.

Qwen (Alibaba) : le rouleau compresseur open source

Qwen est la famille de modèles développée par Alibaba Cloud. C’est sans doute la série open source la plus active du marché : déclinaisons multiples, mises à jour fréquentes, et une présence massive sur Hugging Face, la plateforme de référence pour télécharger des modèles.

La série décline plusieurs tailles et se met à jour très vite. La génération la plus récente, Qwen3.6, est arrivée en avril 2026 : la variante dense Qwen3.6-27B (27 milliards de paramètres) gère nativement plus de 260 000 tokens de contexte, extensibles au-delà du million, et accepte texte et images. Source : fiche Qwen3.6-27B sur Hugging Face.

Le point fort de Qwen, au-delà des performances : la licence. Tous les modèles à poids ouverts de la série sont publiés sous Apache 2.0, l’une des licences les plus permissives. Concrètement, une entreprise peut les utiliser commercialement, les modifier et les déployer sans demander d’autorisation ni payer de royalties. Source : licence Apache 2.0 sur la fiche Qwen3.6.

Concrètement pour votre entreprise : Qwen est un excellent moteur pour qui veut une IA puissante, gratuite à la licence, et hébergeable où on veut. Le bémol pour un dirigeant prudent : c’est un modèle chinois, ce qui peut poser des questions de gouvernance des données si vous passez par l’API d’Alibaba (en local, le problème disparaît, puisque rien ne sort de vos serveurs).

Llama (Meta) : open weights, mais pas open source

Llama est la famille de Meta (Facebook, Instagram). C’est le modèle qui a popularisé l’idée d’une IA téléchargeable : la première version a déclenché tout l’écosystème open weights. La génération actuelle, Llama 4, est sortie le 5 avril 2025, avec notamment les variantes Scout et Maverick, en architecture mélange d’experts et multimodales (texte et images). Source : fiche Llama, Wikipedia.

Attention au piège de vocabulaire. Llama est souvent présenté comme « open source », mais ce n’est pas exact. Les poids sont téléchargeables, donc open weights, mais la licence est une licence maison : la Llama 4 Community License. Elle autorise l’usage commercial, sauf une clause notable : les entreprises qui dépassaient 700 millions d’utilisateurs actifs mensuels au moment de la sortie doivent demander une licence séparée à Meta. Sources : Llama 4 Community License (texte officiel Meta) et Wikipedia.

Concrètement pour votre entreprise : cette clause des 700 millions ne concerne aucune TPE-PME, elle vise les autres géants de la tech. Pour vous, Llama 4 est donc utilisable commercialement sans souci. Son intérêt : un écosystème énorme (tutoriels, outils, intégrations) et une bonne disponibilité sur toutes les plateformes cloud. La nuance : ce n’est pas une licence libre au sens strict, et Meta garde la main sur les conditions.

DeepSeek : le challenger qui a fait trembler la Silicon Valley

DeepSeek est un laboratoire chinois qui s’est fait connaître début 2025 en publiant un modèle de raisonnement, R1, dont les performances rivalisaient avec les meilleurs modèles américains pour un coût d’entraînement annoncé bien inférieur. L’effet sur le marché a été spectaculaire à l’époque.

Depuis, la série a continué. DeepSeek-V3.2, un modèle de 685 milliards de paramètres, est sorti fin 2025. Source : fiche DeepSeek-V3.2 sur Hugging Face. Et le 24 avril 2026, DeepSeek a publié en open source une préversion de la génération V4, avec deux modèles : V4-Pro (1,6 trillion de paramètres au total, 49 milliards actifs) et V4-Flash (284 milliards au total, 13 milliards actifs), tous deux dotés d’une fenêtre de contexte d’un million de tokens. Source : DeepSeek V4 Preview, documentation officielle.

L’atout de DeepSeek : la licence MIT, encore plus simple qu’Apache 2.0, totalement permissive. Code et poids sont libres d’usage, y compris commercial. Source : licence MIT sur la fiche Hugging Face.

Concrètement pour votre entreprise : DeepSeek brille sur le raisonnement et le code, à un coût d’API parmi les plus bas du marché. Mêmes réserves que pour Qwen : éditeur chinois, donc vigilance sur l’API officielle pour des données sensibles. En local ou via un hébergeur européen qui propose ces modèles, l’objection tombe.

Mistral (français) : la souveraineté européenne

Mistral AI est la pépite française de l’IA, basée à Paris. Son intérêt pour une entreprise hexagonale est évident : éditeur européen, soumis au RGPD, avec une vraie offre de modèles ouverts. C’est aussi un argument de souveraineté, c’est-à-dire ne pas dépendre uniquement d’acteurs américains ou chinois.

La famille Mistral 3, sortie le 2 décembre 2025, comprend Mistral Large 3, un mélange d’experts de 675 milliards de paramètres au total dont 41 milliards actifs, plus une série de petits modèles Ministral 3 (3, 8 et 14 milliards de paramètres) taillés pour tourner sur du matériel modeste. Tous sont publiés sous Apache 2.0. Source : annonce officielle Mistral 3.

Côté tarif API, Mistral Large 3 est annoncé à 0,50 dollar le million de tokens en entrée et 1,50 dollar en sortie, soit un positionnement nettement moins cher que les modèles haut de gamme américains. Source : tarifs publiés par Mistral.

Concrètement pour votre entreprise : si la confidentialité et la souveraineté pèsent dans votre décision, Mistral est le choix le plus naturel pour une PME française. C’est aussi le modèle qui écrit le mieux notre langue parmi les ouverts. On a creusé ce point dans notre comparatif de la meilleure IA en français.

Gemma (Google) et Command A+ (Cohere) : deux outsiders à connaître

Gemma est la gamme de petits modèles ouverts de Google, le cousin léger de Gemini. Gemma 3, sortie en mars 2025, se décline de 1 à 27 milliards de paramètres, gère plus de 140 langues et accepte les images sur les variantes les plus grosses. Particularité : les versions Gemma 1 à 3 ne sont pas sous une licence libre standard mais sous une licence maison, les « Gemma Terms of Use », qui imposent des restrictions d’usage. La toute dernière génération, Gemma 4, est en revanche passée sous Apache 2.0. Sources : présentation de Gemma 3 (Hugging Face) et conditions de licence Gemma (Google). Gemma est intéressant pour faire tourner une IA correcte sur une machine peu puissante.

Command A+ de Cohere est un autre cas à part. Sorti le 20 mai 2026, ce modèle de 218 milliards de paramètres (dont 25 milliards actifs) est publié sous Apache 2.0 et vise explicitement les entreprises soucieuses de souveraineté : il tourne sur deux cartes graphiques seulement et se prête au déploiement privé ou hors ligne. Source : annonce Command A+ (Cohere). Un nom à retenir pour les usages métier sensibles.

Tableau récapitulatif

Modèle	Éditeur	Version récente	Statut / licence	Point fort	Accès
Qwen	Alibaba (Chine)	Qwen3.6 (avr. 2026)	Open weights, Apache 2.0 (libre)	Polyvalent, très actif, contexte long	API, OpenRouter, local (Ollama, Hugging Face)
Llama	Meta (USA)	Llama 4 (avr. 2025)	Open weights, licence maison (pas open source au sens strict)	Écosystème géant, multimodal	API, OpenRouter, cloud, local
DeepSeek	DeepSeek (Chine)	V4 preview (avr. 2026), V3.2 (2025)	Open weights, MIT (libre)	Raisonnement, code, coût très bas	API, OpenRouter, local
Mistral	Mistral AI (France)	Mistral 3 (déc. 2025)	Open weights, Apache 2.0 (libre)	Souveraineté européenne, français	API, cloud EU, OpenRouter, local
Gemma	Google (USA)	Gemma 3 (mars 2025)	Open weights, licence maison (Gemma 4 en Apache 2.0)	Léger, multilingue	API, Hugging Face, local
Command A+	Cohere (Canada)	Mai 2026	Open weights, Apache 2.0 (libre)	Usages entreprise, souveraineté	Hugging Face, plateforme Cohere, local

Trois façons d’accéder à ces modèles

1. L’API de l’éditeur. La voie la plus simple : on appelle le modèle via son service, on paie à l’usage (au nombre de tokens). C’est ce que font la plupart des entreprises au départ. Avantage : zéro infrastructure. Inconvénient : vos données transitent par le serveur de l’éditeur.

2. OpenRouter et autres agrégateurs. Des plateformes comme OpenRouter donnent accès à des dizaines de modèles via une seule connexion, en comparant les prix. Pratique pour tester plusieurs LLM sans multiplier les comptes, et pour basculer de l’un à l’autre selon le besoin.

3. En local, chez vous. C’est la vraie spécificité de l’open source : télécharger le modèle et le faire tourner sur vos serveurs. Rien ne sort de chez vous, donc confidentialité maximale. La contrepartie : il faut du matériel adapté (cartes graphiques) et une compétence technique. Les petits modèles (Ministral 3, Gemma, petits Qwen) tournent sur une machine modeste ; les gros exigent une vraie infrastructure.

Alors, faut-il quitter ChatGPT pour ces modèles ?

Pas forcément, et c’est important de le dire sans hype. Pour un dirigeant qui veut simplement rédiger, résumer, brainstormer au quotidien, un abonnement à ChatGPT, Claude ou Gemini reste le choix le plus simple et le plus complet. L’interface, les applications mobiles, les intégrations clés en main : tout est prêt. Le panorama complet est dans notre guide des modèles d’IA 2026.

Les modèles open source deviennent pertinents dans trois cas précis. D’abord le volume : si vous traitez des milliers de requêtes par jour (classer des emails, analyser des fiches, alimenter un produit), le coût à l’API d’un modèle ouvert peut diviser votre facture. Les fourchettes de prix sont détaillées dans notre dossier sur les vrais prix de l’IA en entreprise. Ensuite la confidentialité : si vos données sont sensibles, l’hébergement local résout la question de la fuite, sujet qu’on creuse dans notre guide RGPD et IA. Enfin la souveraineté : ne pas dépendre d’un seul fournisseur étranger, garder la main sur sa technologie.

Le verdict honnête : ces modèles ne sont pas « meilleurs » dans l’absolu, ils sont meilleurs pour certains usages. Le bon réflexe n’est pas de choisir un camp, mais d’identifier votre besoin réel avant de choisir l’outil. Si vous hésitez sur la marche à suivre, c’est exactement le type d’arbitrage que nous accompagnons au sein de notre agence IA.

FAQ

Un LLM open source, est-ce vraiment gratuit ?

La licence est gratuite pour les modèles libres (Apache 2.0, MIT) : vous ne payez aucun droit pour les utiliser, même commercialement. Mais faire tourner le modèle a un coût : soit le prix de l’API si vous passez par un service, soit le matériel et l’électricité si vous l’hébergez. « Open source » veut dire libre de droits, pas gratuit à l’usage.

Qwen et DeepSeek sont chinois : mes données sont-elles en danger ?

Si vous passez par l’API officielle d’un éditeur chinois, vos données transitent par ses serveurs, ce qui peut poser un problème de gouvernance pour des informations sensibles. La parade propre à l’open source : télécharger le modèle et le faire tourner en local ou chez un hébergeur européen. Dans ce cas, aucune donnée ne quitte votre infrastructure.

Quelle différence entre open source et open weights ?

Open weights signifie que les poids du modèle sont téléchargeables. Open source ajoute une condition : une licence réellement libre (Apache 2.0, MIT) qui autorise tout usage sans restriction. Llama et Gemma 1 à 3 sont open weights mais sous licence maison restrictive ; Qwen, Mistral, DeepSeek et Command A+ sont, eux, sous licence libre.

Quel modèle ouvert pour une PME française ?

Mistral est le point de départ logique : éditeur français, soumis au RGPD, licence Apache 2.0, et c’est le modèle ouvert qui écrit le mieux notre langue. Pour un coût d’usage minimal sur de gros volumes, DeepSeek est imbattable. Pour la polyvalence, Qwen. Le choix dépend de votre priorité : souveraineté, prix ou capacités.

Peut-on faire tourner ces modèles sans compétence technique ?

Via une API ou un agrégateur comme OpenRouter, oui, c’est à la portée d’une PME équipée d’un développeur ou d’un prestataire. L’hébergement local, lui, demande de vraies compétences (infrastructure, cartes graphiques, maintenance). Pour la plupart des TPE, passer par l’API d’un modèle ouvert reste la voie la plus réaliste avant d’envisager le local.

Sources

Vous êtes une entreprise ?

Ordiama, c'est aussi une agence IA à Strasbourg : on crée votre site, on vous rend visible dans l'IA et on automatise vos tâches.

Découvrir l'agence →