Name: Llama 3.3 70B
Author: Meta

Question 1

¿Es gratuito el uso de Llama 3.3 70B?

Accepted Answer

Llama 3.3 70B se puede ejecutar gratis localmente en su propio hardware. El acceso alojado a través de osFoundry se mide (entrada Free (local) / $ 0.59 /1M, salida Free (local) / $ 0.79 /1M). Pueden alternar entre local y alojado en cualquier momento.

Question 2

¿Puedo utilizar Llama 3.3 70B comercialmente?

Accepted Answer

El uso comercial está permitido con condiciones. Permite uso comercial hasta 700M de usuarios activos mensuales; los despliegues mayores requieren una licencia aparte. Se requiere la atribución "Built with Llama".

Question 3

¿Cuál es la ventana de contexto de Llama 3.3 70B?

Accepted Answer

Llama 3.3 70B admite una ventana de contexto de 128K tokens.

Question 4

¿Cuánta VRAM necesita Llama 3.3 70B?

Accepted Answer

Aproximadamente 42 GB con cuantización Q4, o 168 GB con precisión FP16 completa. Cabe en una sola A100/H100 80GB.

Question 5

¿Puedo ejecutar Llama 3.3 70B localmente?

Accepted Answer

Sí. Llama 3.3 70B es de pesos abiertos y se ejecuta localmente en una GPU de estación de trabajo. El runtime local de osFoundry gestiona la carga del modelo, la cuantización y el enrutamiento.

Question 6

¿En qué destaca Llama 3.3 70B?

Accepted Answer

Llama 3.3 70B es muy adecuado para chat general y preguntas y respuestas, orquestación de agentes con uso de herramientas, análisis y resumen de documentos extensos.

Question 7

¿Cómo se utiliza Llama 3.3 70B en osFoundry?

Accepted Answer

Peguen su clave de API de Meta en el diálogo de claves (o desplieguen los pesos abiertos para modelos autoalojables), asignen Llama 3.3 70B a un rol de Maestro en la pestaña Pipeline y úsenlo en chat, en Room Apps mediante invokeAI o en sus propias aplicaciones.