Qwen3 Max Thinking
Veröffentlicht von Qwen im Jahr 2026, ist Qwen3 Max Thinking ein Chat-Modell. Qwen3-Max-Thinking is the flagship reasoning model in the Qwen3 series, designed for high-stakes cognitive tasks that require deep, multi-step reasoning. By significantly scaling model capacity and reinforcement learning compute, it...
by Qwen · Kontextfenster von 262K Token
Am besten geeignet für
- Chat und Routing mit geringer Latenz
- Anfrage-Routing und Triage
- Textklassifikation
Möglichkeiten, Qwen3 Max Thinking in osFoundry zu nutzen
Mit eigenem Schlüssel verbinden (BYOK)
Öffnen Sie den Schlüssel-Dialog und fügen Sie Ihren Qwen-API-Key ein. osFoundry erkennt Qwen3 Max Thinking automatisch — weisen Sie es im Pipeline-Tab einer Maestro-Rolle (Router, Direct, Orchestrator oder Fallback) zu, und es ist in jedem Chat verfügbar. Ihr Key, Ihr Provider-Konto — kein Token-Aufschlag.
In einer Room App verwenden
Room Apps deklarieren KI-Funktionen in ihrem Manifest und rufen sie anschließend mit invokeAI auf:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Aus eigenen Anwendungen aufrufen
Sobald ein Modell in Ihrem Workspace eingerichtet ist, können Sie es als API hosten und aus Ihren eigenen Diensten, Skripten oder CI — außerhalb von osFoundry — erreichen.
Qwen3 Max Thinking im Vergleich zu ähnlichen Modellen
| Modell | Organisation | Parameter | Kontext | Input-Preis | Selbst hosten |
|---|
| Qwen3 Max Thinking | Qwen | — | 262K | $ 0.780 /1M | Nur API |
| GLM 5 | Z.ai | — | 203K | $ 0.600 /1M | Nur API |
| MiniMax M2.5 | MiniMax | — | 197K | $ 0.150 /1M | Nur API |
| Step 3.5 Flash | StepFun | — | 262K | $ 0.100 /1M | Nur API |
Lizenz
Hosted — usage subject to provider terms — Nur gehostetes Modell — die Nutzung unterliegt den API-Bedingungen des Anbieters. Bringen Sie Ihren eigenen Provider-Key mit.
Keine Weights verteilt; Nutzung unterliegt den Anbieterbedingungen.
Häufige Fragen zu Qwen3 Max Thinking
Wie viel kostet Qwen3 Max Thinking?
Qwen3 Max Thinking wird mit $ 0.780 /1M für Input und $ 3.90 /1M für Output abgerechnet. Bringen Sie Ihren eigenen Qwen-API-Key mit — osFoundry reicht die Provider-Preise ohne Aufschlag durch.
Kann ich Qwen3 Max Thinking kommerziell nutzen?
Kommerzielle Nutzung ist unter bestimmten Bedingungen erlaubt. Nur gehostetes Modell — die Nutzung unterliegt den API-Bedingungen des Anbieters. Bringen Sie Ihren eigenen Provider-Key mit. Keine Weights verteilt; Nutzung unterliegt den Anbieterbedingungen.
Wie groß ist das Kontextfenster von Qwen3 Max Thinking?
Qwen3 Max Thinking unterstützt ein Kontextfenster von 262K Token.
Kann ich Qwen3 Max Thinking lokal betreiben?
Nein — Qwen3 Max Thinking ist nur gehostet verfügbar und wird über die Qwen-API genutzt.
Worin ist Qwen3 Max Thinking besonders gut?
Qwen3 Max Thinking eignet sich besonders für Chat und Routing mit geringer Latenz, Anfrage-Routing und Triage, Textklassifikation.
Wie verwende ich Qwen3 Max Thinking in osFoundry?
Fügen Sie Ihren Qwen-API-Key im Schlüssel-Dialog ein (oder stellen Sie bei selbst hostbaren Modellen die Open Weights bereit), weisen Sie Qwen3 Max Thinking im Pipeline-Tab einer Maestro-Rolle zu und nutzen Sie es anschließend im Chat, in Room Apps über invokeAI oder in Ihren eigenen Anwendungen.
Veröffentlicht von Qwen am 9. Februar 2026. Quelle: https://openrouter.ai/qwen/qwen3-max-thinking