Tokens IA e API

Limites de tokens e modelo de consumo

Data: 2026-04-02 Decisão: Chave da plataforma (Opção B) recomendada para início


Resumo

Tokens são a unidade de cobrança das empresas de IA. O ConvertaFlow controla o consumo por plano via ai_tokens_monthly. A margem é de 80-98% — o custo de IA é irrelevante comparado à receita da assinatura.


Limites por Plano

Plano ai_tokens_monthly max_ai_agents ai_replies_enabled api_access_enabled api_requests_per_day
Essencial 50.000 1 false false 0
Profissional 200.000 2 true false 0
Business 1.000.000 5 true true 1.000
Enterprise 5.000.000 10 true true 10.000

Conversão Tokens → Conversas

Tokens Conversas IA estimadas Custo (Haiku 4.5)
50.000 ~50-100 ~R$0,50-1,00
200.000 ~200-400 ~R$2-4
1.000.000 ~1.000-2.000 ~R$10-20
5.000.000 ~5.000-10.000 ~R$50-100

Base: ~500-1.000 tokens por conversa completa de atendimento.


Significado dos Campos

ai_tokens_monthly

Limite mensal de tokens consumidos em todas as interações IA do tenant:

  • Respostas automáticas em conversas
  • Resumos de conversa
  • Classificação de intenção
  • RAG (busca semântica + memória)
  • Processamento de documentos

max_ai_agents

Assistentes IA com personalidade, regras e base de conhecimento específica.

  • 1 agente: "Assistente Geral"
  • 5 agentes: "Vendas", "Suporte L1", "Suporte L2", "FAQ", "Onboarding"

ai_replies_enabled

Se a IA pode responder automaticamente. Essencial = desabilitado (só atendimento humano).

api_access_enabled

Se o cliente pode usar API pública (cf_live_xxx): integrações com n8n, Zapier, ERPs.

api_requests_per_day

Limite diário de chamadas à API pública.


Modelo de Negócio

Opção B: Chave da Plataforma (recomendada)

O ConvertaFlow configura UMA chave master Anthropic. Todos os clientes usam essa chave, com limites por plano.

Margem por plano:

Plano Receita Custo IA Margem
Essencial R$49,90 R$49,90 ~R$1 98%
Profissional R$149,90 R$149,90 ~R$3 97%
Business R$299,90 R$299,90 ~R$15 95%
Enterprise R$499,90 R$499,90 ~R$75 85%

BYOK — Bring Your Own Key (implementado)

O cliente pode usar sua própria API Key em IA & Agentes > Configuração IA. Quando configurado:

  • Todas as funções de IA (intenção, agente, fluxos, embeddings, suporte) usam a chave do cliente
  • Custo zero para a plataforma
  • Provedores com tier gratuito (Google Gemini Flash, Groq Llama): cliente pode ter IA sem custo
  • Chave criptografada (Fernet) e nunca exposta em logs
  • Se a chave falhar, fallback automático para chave da plataforma

O roteamento e feito pelo AI Router centralizado (ai_router.py). Documentação completa em docs/knowledge/20-ai-router-e-configuração-centralizada.md


Economia com Prompt Caching

Anthropic prompt caching (cache_control: ephemeral) já implementado. System prompts cacheados por 5 minutos → até 90% de redução no custo de tokens repetitivos.


Configuração Produção

# Obrigatório para IA funcionar
ANTHROPIC_API_KEY=sk-ant-xxx

# Modelo recomendado (custo-benefício)
AI_DEFAULT_MODEL=claude-haiku-4-5

Obter key em: console.anthropic.com


Monitoramento

  • Anthropic dashboard: console.anthropic.com/usage (custo global)
  • ConvertaFlow: GET /billing/usage (consumo por tenant)
  • Alertas: Configurar alerta quando tenant atingir 80% do limite

Tabela do Banco

Coluna ai_tokens_monthly na tabela public.subscription_plans:

SELECT slug, ai_tokens_monthly, max_ai_agents, ai_replies_enabled, api_access_enabled
FROM public.subscription_plans ORDER BY id;

Arquivos Relacionados

Arquivo Função
backend-python/app/models/billing.py Model SubscriptionPlan com campos IA
backend-python/app/api/ai.py Processamento IA com contagem de tokens
backend-python/app/api/ai_config.py BYOK — Bring Your Own Key
frontend/src/app/(dashboard)/admin/plans/page.tsx Edição de limites por plano

Este artigo foi útil?