Tokens IA e API

Limites de tokens e modelo de consumo

4 min de leitura ·Atualizado em 28 de abril de 2026

Data: 2026-04-02 Decisão: Chave da plataforma (Opção B) recomendada para início

Resumo

Tokens são a unidade de cobrança das empresas de IA. O ConvertaFlow controla o consumo por plano via ai_tokens_monthly. A margem é de 80-98% — o custo de IA é irrelevante comparado à receita da assinatura.

Limites por Plano

Plano	ai_tokens_monthly	max_ai_agents	ai_replies_enabled	api_access_enabled	api_requests_per_day
Essencial	50.000	1	false	false	0
Profissional	200.000	2	true	false	0
Business	1.000.000	5	true	true	1.000
Enterprise	5.000.000	10	true	true	10.000

Conversão Tokens → Conversas

Tokens	Conversas IA estimadas	Custo (Haiku 4.5)
50.000	~50-100	~R$0,50-1,00
200.000	~200-400	~R$2-4
1.000.000	~1.000-2.000	~R$10-20
5.000.000	~5.000-10.000	~R$50-100

Base: ~500-1.000 tokens por conversa completa de atendimento.

Significado dos Campos

ai_tokens_monthly

Limite mensal de tokens consumidos em todas as interações IA do tenant:

Respostas automáticas em conversas
Resumos de conversa
Classificação de intenção
RAG (busca semântica + memória)
Processamento de documentos

max_ai_agents

Assistentes IA com personalidade, regras e base de conhecimento específica.

1 agente: "Assistente Geral"
5 agentes: "Vendas", "Suporte L1", "Suporte L2", "FAQ", "Onboarding"

ai_replies_enabled

Se a IA pode responder automaticamente. Essencial = desabilitado (só atendimento humano).

api_access_enabled

Se o cliente pode usar API pública (cf_live_xxx): integrações com n8n, Zapier, ERPs.

api_requests_per_day

Limite diário de chamadas à API pública.

Modelo de Negócio

Opção B: Chave da Plataforma (recomendada)

O ConvertaFlow configura UMA chave master Anthropic. Todos os clientes usam essa chave, com limites por plano.

Margem por plano:

Plano	Receita	Custo IA	Margem
Essencial R$49,90	R$49,90	~R$1	98%
Profissional R$149,90	R$149,90	~R$3	97%
Business R$299,90	R$299,90	~R$15	95%
Enterprise R$499,90	R$499,90	~R$75	85%

BYOK — Bring Your Own Key (implementado)

O cliente pode usar sua própria API Key em IA & Agentes > Configuração IA. Quando configurado:

Todas as funções de IA (intenção, agente, fluxos, embeddings, suporte) usam a chave do cliente
Custo zero para a plataforma
Provedores com tier gratuito (Google Gemini Flash, Groq Llama): cliente pode ter IA sem custo
Chave criptografada (Fernet) e nunca exposta em logs
Se a chave falhar, fallback automático para chave da plataforma

O roteamento e feito pelo AI Router centralizado (ai_router.py). Documentação completa em docs/knowledge/20-ai-router-e-configuração-centralizada.md

Economia com Prompt Caching

Anthropic prompt caching (cache_control: ephemeral) já implementado. System prompts cacheados por 5 minutos → até 90% de redução no custo de tokens repetitivos.

Configuração Produção

# Obrigatório para IA funcionar
ANTHROPIC_API_KEY=sk-ant-xxx

# Modelo recomendado (custo-benefício)
AI_DEFAULT_MODEL=claude-haiku-4-5

Obter key em: console.anthropic.com

Monitoramento

Anthropic dashboard: console.anthropic.com/usage (custo global)
ConvertaFlow: GET /billing/usage (consumo por tenant)
Alertas: Configurar alerta quando tenant atingir 80% do limite

Tabela do Banco

Coluna ai_tokens_monthly na tabela public.subscription_plans:

SELECT slug, ai_tokens_monthly, max_ai_agents, ai_replies_enabled, api_access_enabled
FROM public.subscription_plans ORDER BY id;

Arquivos Relacionados

Arquivo	Função
`backend-python/app/models/billing.py`	Model SubscriptionPlan com campos IA
`backend-python/app/api/ai.py`	Processamento IA com contagem de tokens
`backend-python/app/api/ai_config.py`	BYOK — Bring Your Own Key
`frontend/src/app/(dashboard)/admin/plans/page.tsx`	Edição de limites por plano