Qwen3 8B
Qwen3 8B est un modèle chat de Qwen, publié le 28 avril 2025. Qwen3-8B is a dense 8.2B parameter causal language model from the Qwen3 series, designed for both reasoning-heavy tasks and efficient dialogue. It supports seamless switching between "thinking" mode for math,...
by Qwen · fenêtre de contexte de 41K tokens
Idéal pour
- chat et routage à faible latence
- routage et triage des requêtes
- classification de texte
Comment utiliser Qwen3 8B dans osFoundry
Connectez-vous avec votre propre clé (BYOK)
Ouvrez la fenêtre de clés et collez votre clé API Qwen. osFoundry détecte automatiquement Qwen3 8B — assignez-le à un rôle Maestro (router, direct, orchestrator ou fallback) dans l'onglet Pipeline et il est actif dans chaque conversation. Votre clé, votre compte fournisseur — sans majoration sur les tokens.
Utilisez-le dans une Room App
Les Room Apps déclarent leurs fonctionnalités IA dans leur manifeste, puis les appellent via invokeAI :
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Appelez-le depuis vos propres applications
Une fois un modèle intégré à votre espace de travail, vous pouvez l'héberger en tant qu'API et l'appeler depuis vos propres services, scripts ou CI — en dehors d'osFoundry.
Exécutez Qwen3 8B vous-même
Qwen3 8B est également disponible en open weights — hébergez-le vous-même pour un contrôle total des données et zéro coût au token. Consultez cette page pour les prérequis GPU et une comparaison des coûts avec la tarification API.
Qwen3 8B face aux modèles similaires
| Modèle | Organisation | Paramètres | Contexte | Prix en entrée | Auto-hébergement |
|---|
| Qwen3 8B | Qwen | — | 41K | $ 0.050 /1M | API uniquement |
| Coder Large | Arcee AI | — | 33K | $ 0.500 /1M | API uniquement |
| CodeLLaMa 7B Instruct Solidity | AlfredPros | — | 4K | $ 0.800 /1M | API uniquement |
| Gemma 3n 4B | Google | — | 33K | $ 0.060 /1M | API uniquement |
Licence
Hosted — usage subject to provider terms — Modèle hébergé uniquement — l'utilisation est régie par les conditions d'API du fournisseur. Apportez votre propre clé fournisseur.
Aucun poids distribué ; usage soumis aux conditions du fournisseur.
Questions fréquentes sur Qwen3 8B
Combien coûte Qwen3 8B ?
Qwen3 8B est facturé à $ 0.050 /1M en entrée et $ 0.400 /1M en sortie. Apportez votre propre clé API Qwen — osFoundry répercute la tarification du fournisseur sans majoration.
Puis-je utiliser Qwen3 8B à des fins commerciales ?
L'usage commercial est autorisé sous conditions. Modèle hébergé uniquement — l'utilisation est régie par les conditions d'API du fournisseur. Apportez votre propre clé fournisseur. Aucun poids distribué ; usage soumis aux conditions du fournisseur.
Quelle est la fenêtre de contexte de Qwen3 8B ?
Qwen3 8B prend en charge une fenêtre de contexte de 41K tokens.
Puis-je exécuter Qwen3 8B localement ?
Non — Qwen3 8B est uniquement hébergé et accessible via l'API Qwen. Un équivalent en open-weights est disponible en auto-hébergement — voir le lien croisé ci-dessus.
À quoi Qwen3 8B excelle-t-il ?
Qwen3 8B convient particulièrement bien à chat et routage à faible latence, routage et triage des requêtes, classification de texte.
Comment utiliser Qwen3 8B dans osFoundry ?
Collez votre clé API Qwen dans la fenêtre de clés (ou déployez les open weights pour les modèles auto-hébergeables), assignez Qwen3 8B à un rôle Maestro dans l'onglet Pipeline, puis utilisez-le en chat, dans les Room Apps via invokeAI, ou dans vos propres applications.
Publié par Qwen le 28 avril 2025. Source : https://openrouter.ai/qwen/qwen3-8b