← Resources
GUIDE · 2026-01-15
Alternative a ChatGPT self-hosted: classifica di 7 piattaforme BYOK
Le piattaforme chat self-hosted BYOK sono maturate fino a diventare una sostituzione credibile di ChatGPT Team. Questa guida ne classifica sette per copertura provider, supporto ai modelli locali, RBAC e TCO complessivo, così puoi scegliere quella più adatta al tuo team.
Perché i team abbandonano ChatGPT hosted nel 2026
Tre pressioni stanno spingendo i team tecnici fuori da ChatGPT Business nel 2026. Primo, l'esportazione dei dati non è più disponibile all'interno dei Workspace di ChatGPT Business, il che rende audit, eDiscovery e offboarding più difficili di quanto dovrebbero essere. Secondo, il tier Business viene fornito senza SCIM, quindi il provisioning e il de-provisioning degli utenti è manuale anche dopo aver configurato SAML o OIDC SSO. Terzo, il prezzo per posto scala linearmente mentre le API dei modelli di frontiera continuano a diventare più economiche, perciò ogni team che già paga l'accesso alle API di OpenAI, Anthropic o Google sta pagando due volte.
Le piattaforme BYOK self-hosted ribaltano questa matematica. Porti le tue chiavi, controlli il percorso dei dati e decidi se l'inferenza gira nella tua VPC, su un laptop o presso un cloud provider di cui ti fidi già. Il trade-off è il tempo operativo. Scegliere la piattaforma giusta significa far combaciare la sua superficie funzionale con la dimensione del team e il threat model, invece di rincorrere le stelle su GitHub.
Rubrica di valutazione: profondità BYOK, supporto modelli locali, RBAC, audit
Ogni piattaforma in questa guida dichiara il BYOK. Le differenze emergono sotto carico. Abbiamo valutato ciascuna su quattro assi che contano davvero una volta superato il setup del singolo sviluppatore.
- Profondità BYOK: quanti provider sono di prima classe, se gli admin possono limitare quali chiavi gli utenti possono aggiungere e se le chiavi sono cifrate at rest.
- Supporto ai modelli locali: integrazione nativa con llama.cpp o Ollama, offload su GPU e selezione del modello per Workspace.
- RBAC e SSO: ruoli, gruppi, OIDC o SAML e se i non-admin possono essere limitati a modelli o tool specifici.
- Audit e governance: controlli sulla retention delle chat, log esportabili e attribuzione dell'utilizzo per utente per il chargeback.
Una piattaforma che ne centra tre su quattro è utilizzabile. Una che le centra tutte e quattro è rara. Il confronto qui sotto segnala dove ciascuna è carente, così puoi pianificare di conseguenza invece di scoprirlo in produzione.
OpenWebUI, LibreChat, AnythingLLM, Jan, Chatbot UI, OpenAssistantGPT e osFoundry a confronto
Open WebUI è leader sul RBAC. La sua documentazione descrive un modello a tre livelli di ruoli, gruppi e permessi granulari, oltre a connessioni configurabili dall'admin, ed è ciò che più si avvicina a una governance enterprise nel campo open source. LibreChat copre la superficie di provider più ampia, inclusi OpenAI, Anthropic, Google, Mistral, Bedrock, Azure e Ollama, con MCP e supporto agli agent integrati. AnythingLLM è la scelta document-centric: i modelli con scope per Workspace permettono a un Workspace di rimanere completamente locale mentre un altro chiama GPT-4o.
Jan è l'opzione desktop-first, gira completamente offline una volta scaricati i modelli ed espone un server OpenAI-compatibile su localhost. Chatbot UI di McKay Wrigley è un punto di partenza pulito e hackerabile ma è più vicino a un'implementazione di riferimento che a un prodotto gestito. OpenAssistantGPT è più ristretto, focalizzato sull'embedding di chatbot OpenAI Assistant API in siti web. osFoundry si colloca all'estremo ibrido, combinando billing pure-passthrough BYOK con agent integrati, app ed editor di orchestrazione no-code.
TCO nascosto: tempo ops, GPU, rotazione chiavi, compliance
Il prezzo di listino è la parte facile. Il costo reale si annida in quattro punti. Il tempo ops domina: ogni piattaforma self-hosted necessita di upgrade, backup del database, tuning del reverse proxy e una rotazione di on-call quando la chat si blocca a metà riunione. La spesa GPU è la seconda voce. Un singolo H100 per l'inferenza locale di llama.cpp costa al mese più di un anno di posti ChatGPT Business per un piccolo team, perciò gli stack solo-locali tornano economicamente sensati soltanto su larga scala o sotto rigide regole di data-residency.
La rotazione delle chiavi è la voce silenziosa. BYOK significa che le chiavi dei provider vivono da qualche parte, e quel da-qualche-parte richiede un vault, un audit trail e una policy di rotazione. La compliance è l'ultimo capitolo. Il self-hosting può accorciare il percorso verso HIPAA, SOC 2 o GDPR scope, ma solo se la piattaforma espone gli audit log, i controlli di retention e le revisioni di accesso che il tuo auditor chiederà. Valuta tutto questo prima di migrare, non dopo.
Albero decisionale: scegli per dimensione del team e threat model
Abbina la piattaforma al vincolo che ti lega davvero.
- Sviluppatore solo o hobbista: Jan se vuoi un'app desktop local-first, Chatbot UI se vuoi una codebase Next.js hackerabile.
- Piccolo team, provider cloud misti: LibreChat. La superficie di provider e il supporto MCP sono difficili da battere a questa scala.
- Workflow document-heavy: AnythingLLM. I modelli con scope per Workspace e il RAG integrato si sposano direttamente con il caso d'uso.
- Organizzazione mid-size con esigenze di governance admin: Open WebUI. Il modello RBAC e le connessioni configurate dall'admin gestiscono policy multi-tenant reali.
- Team regolamentato o con vincoli di residenza dati che vuole anche agent e app: un orchestratore ibrido che supporta sia llama.cpp locale sia routing BYOK verso il cloud mantiene aperte le opzioni.
- Solo chatbot embedded in sito web: OpenAssistantGPT.
La mossa sbagliata è scegliere in base a stelle o screenshot. Scegli in base all'asse della rubrica su cui non puoi scendere a compromessi, poi verifica che gli altri siano almeno adeguati.
Checklist di migrazione da ChatGPT Team
ChatGPT Business non offre esportazione dati guidata dall'admin, perciò pianifica il passaggio attorno a ciò che gli utenti possono estrarre da soli. Esegui questa checklist nell'ordine per evitare di perdere contesto.
- Inventaria Workspace attivi, GPT personalizzati e qualsiasi Projects in uso; annota i proprietari di ciascuno.
- Fai in modo che ogni utente attivi l'esportazione dei propri dati personali da Settings mentre l'accesso è ancora attivo.
- Allestisci la nuova piattaforma in ambiente di staging, cabla il BYOK per i provider che usi davvero e conferma che streaming e tool call funzionino end-to-end.
- Configura SSO (SAML o OIDC) e decidi in anticipo il tuo modello di provisioning, dato che SCIM è raro lato open source.
- Ricrea assistant condivisi, system prompt e qualsiasi corpus di retrieval; verifica la qualità del retrieval prima del cutover.
- Imposta retention, destinazione degli audit log e attribuzione dell'utilizzo per utente prima della prima chat di produzione.
- Comunica la data di cutover, congela le nuove chat su ChatGPT qualche giorno in anticipo e mantieni l'accesso in sola lettura per una finestra di esportazione.
FAQ: residenza dei dati, SSO, on-prem
La maggior parte delle domande dei buyer sulle alternative self-hosted a ChatGPT ruota attorno a residenza, identità e deployment on-prem. La versione breve: il self-hosting ti dà le leve necessarie per HIPAA, SOC 2 e GDPR scope, ma è la piattaforma che deve esporle. Conferma il supporto al protocollo SSO, la forma degli audit log, la cifratura delle chiavi at rest e se il vendor ha un'architettura di riferimento per operatività completamente air-gapped prima di impegnarti. I dettagli per ogni domanda comune sono nelle FAQ qui sotto.
Frequently asked questions
- Un'alternativa self-hosted a ChatGPT è HIPAA compliant out of the box?
- Nessuna piattaforma è HIPAA compliant di default. Il self-hosting ti dà i controlli di cui hai bisogno, ma la compliance dipende ancora da come la deployi. Servono cifratura at rest e in transit, audit logging, revisioni di accesso, un piano di risposta agli incidenti documentato e Business Associate Agreement con qualsiasi infrastruttura cloud o API di modello che tocchi protected health information. Gli stack solo-locali con llama.cpp od Ollama evitano del tutto la questione BAA per l'inferenza perché nulla lascia la tua rete. Se instradi a OpenAI o Anthropic via BYOK, ti serve comunque il loro tier enterprise e un BAA firmato prima di inviare PHI.
- Quale piattaforma self-hosted ha il miglior SSO e RBAC?
- Open WebUI ha il role-based access control più strutturato nel campo open source, con un modello documentato a tre livelli di ruoli, gruppi e permessi granulari più connessioni provider configurate dall'admin. LibreChat supporta OAuth2 e auth multi-utente ed è ampiamente diffuso nei team. Entrambi supportano i principali identity provider, ma la maturità di SAML e SCIM varia da release a release, perciò verifica contro il tuo IdP specifico prima di impegnarti. Se ti serve attribute-based access control o gating fine-grained sui modelli, aspettati di stratificare un reverse proxy o un identity-aware proxy davanti a una qualsiasi di queste piattaforme.
- Posso far girare un'alternativa self-hosted a ChatGPT completamente offline?
- Sì, se scegli una piattaforma che supporta l'inferenza locale e porti i tuoi pesi del modello. Jan è progettato per questo e gira completamente offline una volta scaricati i modelli. AnythingLLM viene fornito local-by-default con un LLM locale, embedder e database vettoriale. LibreChat e Open WebUI si integrano entrambi con Ollama o qualsiasi server locale OpenAI-compatibile come llama.cpp. L'operatività completamente air-gapped è semplice per chat e retrieval. Aspettati trade-off sulla qualità del modello rispetto alle API di frontiera, e calibra attentamente la memoria GPU se vuoi latenza accettabile su modelli open-weight più grandi.
- Quanto costa fare self-hosting rispetto a ChatGPT Business?
- Il costo software per le piattaforme open source di questa guida è zero. Il costo reale viene da infrastruttura, utilizzo delle API dei modelli sotto BYOK e tempo operatore. Un piccolo team che usa BYOK verso OpenAI o Anthropic tipicamente paga meno per utente attivo del prezzo per posto di ChatGPT Business, perché l'utilizzo passthrough delle API scala con i prompt effettivi anziché con il numero di persone. L'inferenza solo-locale è l'opposto: una singola GPU di fascia alta costa al mese più di diversi anni di posti per un piccolo team, perciò ha senso economico solo su larga scala o dove le regole di data-residency lo impongono. Modellizza sempre entrambe le voci prima di decidere.
Sources