Data: 2026-04-02 Decisão: Chave da plataforma (Opção B) recomendada para início
Resumo
Tokens são a unidade de cobrança das empresas de IA. O ConvertaFlow controla o consumo por plano via ai_tokens_monthly. A margem é de 80-98% — o custo de IA é irrelevante comparado à receita da assinatura.
Limites por Plano
| Plano | ai_tokens_monthly | max_ai_agents | ai_replies_enabled | api_access_enabled | api_requests_per_day |
|---|---|---|---|---|---|
| Essencial | 50.000 | 1 | false | false | 0 |
| Profissional | 200.000 | 2 | true | false | 0 |
| Business | 1.000.000 | 5 | true | true | 1.000 |
| Enterprise | 5.000.000 | 10 | true | true | 10.000 |
Conversão Tokens → Conversas
| Tokens | Conversas IA estimadas | Custo (Haiku 4.5) |
|---|---|---|
| 50.000 | ~50-100 | ~R$0,50-1,00 |
| 200.000 | ~200-400 | ~R$2-4 |
| 1.000.000 | ~1.000-2.000 | ~R$10-20 |
| 5.000.000 | ~5.000-10.000 | ~R$50-100 |
Base: ~500-1.000 tokens por conversa completa de atendimento.
Significado dos Campos
ai_tokens_monthly
Limite mensal de tokens consumidos em todas as interações IA do tenant:
- Respostas automáticas em conversas
- Resumos de conversa
- Classificação de intenção
- RAG (busca semântica + memória)
- Processamento de documentos
max_ai_agents
Assistentes IA com personalidade, regras e base de conhecimento específica.
- 1 agente: "Assistente Geral"
- 5 agentes: "Vendas", "Suporte L1", "Suporte L2", "FAQ", "Onboarding"
ai_replies_enabled
Se a IA pode responder automaticamente. Essencial = desabilitado (só atendimento humano).
api_access_enabled
Se o cliente pode usar API pública (cf_live_xxx): integrações com n8n, Zapier, ERPs.
api_requests_per_day
Limite diário de chamadas à API pública.
Modelo de Negócio
Opção B: Chave da Plataforma (recomendada)
O ConvertaFlow configura UMA chave master Anthropic. Todos os clientes usam essa chave, com limites por plano.
Margem por plano:
| Plano | Receita | Custo IA | Margem |
|---|---|---|---|
| Essencial R$49,90 | R$49,90 | ~R$1 | 98% |
| Profissional R$149,90 | R$149,90 | ~R$3 | 97% |
| Business R$299,90 | R$299,90 | ~R$15 | 95% |
| Enterprise R$499,90 | R$499,90 | ~R$75 | 85% |
BYOK — Bring Your Own Key (implementado)
O cliente pode usar sua própria API Key em IA & Agentes > Configuração IA. Quando configurado:
- Todas as funções de IA (intenção, agente, fluxos, embeddings, suporte) usam a chave do cliente
- Custo zero para a plataforma
- Provedores com tier gratuito (Google Gemini Flash, Groq Llama): cliente pode ter IA sem custo
- Chave criptografada (Fernet) e nunca exposta em logs
- Se a chave falhar, fallback automático para chave da plataforma
O roteamento e feito pelo AI Router centralizado (ai_router.py). Documentação completa em docs/knowledge/20-ai-router-e-configuração-centralizada.md
Economia com Prompt Caching
Anthropic prompt caching (cache_control: ephemeral) já implementado. System prompts cacheados por 5 minutos → até 90% de redução no custo de tokens repetitivos.
Configuração Produção
# Obrigatório para IA funcionar
ANTHROPIC_API_KEY=sk-ant-xxx
# Modelo recomendado (custo-benefício)
AI_DEFAULT_MODEL=claude-haiku-4-5
Obter key em: console.anthropic.com
Monitoramento
- Anthropic dashboard: console.anthropic.com/usage (custo global)
- ConvertaFlow: GET /billing/usage (consumo por tenant)
- Alertas: Configurar alerta quando tenant atingir 80% do limite
Tabela do Banco
Coluna ai_tokens_monthly na tabela public.subscription_plans:
SELECT slug, ai_tokens_monthly, max_ai_agents, ai_replies_enabled, api_access_enabled
FROM public.subscription_plans ORDER BY id;
Arquivos Relacionados
| Arquivo | Função |
|---|---|
backend-python/app/models/billing.py |
Model SubscriptionPlan com campos IA |
backend-python/app/api/ai.py |
Processamento IA com contagem de tokens |
backend-python/app/api/ai_config.py |
BYOK — Bring Your Own Key |
frontend/src/app/(dashboard)/admin/plans/page.tsx |
Edição de limites por plano |