Name: GLM 4.7 Flash
Author: Z.ai

Question 1

Quanto custa GLM 4.7 Flash?

Accepted Answer

GLM 4.7 Flash é cobrado a $ 0.060 /1M para entrada e $ 0.400 /1M para saída. Use sua própria chave de API da Z.ai — o osFoundry repassa o preço do provedor sem markup.

Question 2

Posso usar GLM 4.7 Flash comercialmente?

Accepted Answer

Uso comercial é permitido com condições. Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor. Sem distribuição de pesos; uso sujeito aos termos do provedor.

Question 3

Qual é a janela de contexto de GLM 4.7 Flash?

Accepted Answer

GLM 4.7 Flash suporta uma janela de contexto de 203K tokens.

Question 4

Posso rodar GLM 4.7 Flash localmente?

Accepted Answer

Não — GLM 4.7 Flash é somente hospedado e acessado via API da Z.ai. Há um equivalente open-weights disponível para auto-hospedagem — veja o link cruzado acima.

Question 5

Em que GLM 4.7 Flash é melhor?

Accepted Answer

GLM 4.7 Flash é bem adequado para chat e roteamento de baixa latência, roteamento e triagem de requisições, classificação de texto.

Question 6

Como uso GLM 4.7 Flash no osFoundry?

Accepted Answer

Cole sua chave de API da Z.ai no diálogo de chaves (ou implante os pesos abertos para modelos auto-hospedáveis), atribua GLM 4.7 Flash a um papel do Maestro na aba Pipeline e use-o em chats, em Room Apps via invokeAI ou nos seus próprios apps.