GLM 4.7 Flash
Dibangun oleh Z.ai, GLM 4.7 Flash adalah sebuah model chat dengan context window 203K token. As a 30B-class SOTA model, GLM-4.7-Flash offers a new option that balances performance and efficiency. It is further optimized for agentic coding use cases, strengthening coding capabilities, long-horizon task planning,...
by Z.ai · context window 203K token
Paling cocok untuk
- chat dan routing latensi rendah
- routing dan triase permintaan
- klasifikasi teks
Cara menggunakan GLM 4.7 Flash di osFoundry
Hubungkan dengan key Anda sendiri (BYOK)
Buka dialog key dan tempelkan API key Z.ai Anda. osFoundry menemukan GLM 4.7 Flash secara otomatis — tetapkan ke peran Maestro (router, direct, orchestrator, atau fallback) di tab Pipeline dan model ini langsung aktif di setiap chat. Key Anda, akun provider Anda — tanpa markup token.
Gunakan di Room App
Room App mendeklarasikan fitur AI di manifest mereka, lalu memanggilnya dengan invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Panggil dari aplikasi Anda sendiri
Setelah sebuah model terhubung ke workspace Anda, Anda dapat meng-host-nya sebagai API dan mengaksesnya dari layanan, skrip, atau CI Anda sendiri — di luar osFoundry.
Jalankan GLM 4.7 Flash sendiri
GLM 4.7 Flash juga tersedia sebagai open weights — self-host model ini untuk kontrol data penuh dan tanpa biaya per token. Lihat halaman tersebut untuk persyaratan GPU dan perbandingan biaya terhadap harga API.
GLM 4.7 Flash vs model serupa
Lisensi
Hosted — usage subject to provider terms — Model ter-host saja — penggunaan diatur oleh ketentuan API provider. Bawa key provider Anda sendiri.
Tidak ada weights yang didistribusikan; penggunaan tunduk pada ketentuan provider.
Pertanyaan umum tentang GLM 4.7 Flash
Berapa biaya GLM 4.7 Flash?
GLM 4.7 Flash dikenakan biaya $ 0.060 /1M untuk input, dan $ 0.400 /1M untuk output. Bawa API key Z.ai Anda sendiri — osFoundry meneruskan harga provider tanpa markup.
Bisakah saya menggunakan GLM 4.7 Flash secara komersial?
Penggunaan komersial diizinkan dengan syarat. Model ter-host saja — penggunaan diatur oleh ketentuan API provider. Bawa key provider Anda sendiri. Tidak ada weights yang didistribusikan; penggunaan tunduk pada ketentuan provider.
Berapa context window dari GLM 4.7 Flash?
GLM 4.7 Flash mendukung context window 203K token.
Bisakah saya menjalankan GLM 4.7 Flash secara lokal?
Tidak — GLM 4.7 Flash hanya ter-host dan diakses melalui API Z.ai. Padanan open-weights tersedia untuk self-host — lihat tautan silang di atas.
Apa keunggulan utama GLM 4.7 Flash?
GLM 4.7 Flash sangat cocok untuk chat dan routing latensi rendah, routing dan triase permintaan, klasifikasi teks.
Bagaimana cara menggunakan GLM 4.7 Flash di osFoundry?
Tempelkan API key Z.ai Anda di dialog key (atau deploy open weights untuk model yang dapat di-self-host), tetapkan GLM 4.7 Flash ke peran Maestro di tab Pipeline, lalu gunakan di chat, di Room App via invokeAI, atau di aplikasi Anda sendiri.
Diterbitkan oleh Z.ai pada 19 Januari 2026. Sumber: https://openrouter.ai/z-ai/glm-4.7-flash