Opus, Sonnet ou Haiku: qual usar e quanto custa
Quem começa com a API da Anthropic costuma cometer o mesmo erro: usar o modelo mais inteligente para tudo. Funciona — e custa 5x mais do que deveria. Este guia resolve a escolha em uma tabela e três perguntas.
Os três modelos, em junho de 2026
| Modelo | ID | Forte em | Contexto | Custo (US$/1M tokens, entrada/saída) |
|---|---|---|---|---|
| Claude Opus 4.8 | claude-opus-4-8 | Agentes complexos, código, raciocínio longo | 1M | $5 / $25 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 | O equilíbrio — o cavalo de batalha do dia a dia | 1M | $3 / $15 |
| Claude Haiku 4.5 | claude-haiku-4-5 | Volume: classificação, extração, tarefas pontuais | 200K | $1 / $5 |
Repare na coluna de custo: a saída do Opus custa 5x a do Haiku. Num pipeline que roda milhares de vezes por dia, essa diferença é a sua margem.
As três perguntas que decidem
1. É raciocínio longo ou tarefa pontual? Planejar uma migração, revisar um contrato complexo, conduzir um agente por dezenas de passos → Opus. Classificar um ticket, extrair campos de um e-mail, resumir um parágrafo → Haiku.
2. Qual é o volume? Alto volume empurra para baixo na tabela. Mil classificações por dia no Opus é dinheiro queimado; no Haiku, é centavos.
3. Quanto custa errar? Se o erro é caro (decisão jurídica, código que vai para produção), pague pelo modelo mais forte nessa etapa — e só nela.
A regra de ouro: comece pelo modelo mais barato que resolve a tarefa com qualidade. Suba de tier apenas quando a qualidade pedir. O padrão profissional é rotear: Opus planeja, Haiku executa o volume, Sonnet faz o meio de campo.
O que mudou em 2026 (e quebra tutorial antigo)
Se você aprendeu com material de 2024/2025, atenção: nos modelos atuais da família 4.6+ e no Opus 4.8, os parâmetros de amostragem — temperature, top_p, top_k — foram removidos. Enviá-los retorna erro 400.
No lugar, dois controles melhores:
- Adaptive thinking (
thinking: {type: "adaptive"}) — o modelo decide sozinho quando e quanto raciocinar antes de responder. - Effort (
low/medium/high/max) — você calibra o investimento de raciocínio por tarefa, em vez de chutar um número de 0 a 1.
Receita prática para começar
- Prototipe no Sonnet 4.6 — qualidade alta, custo médio, raramente decepciona.
- Quando o fluxo estabilizar, teste a etapa repetitiva no Haiku 4.5. Se a qualidade segurar, você acabou de cortar a conta.
- Reserve o Opus 4.8 para os nós difíceis: o planejamento, o código crítico, o agente que toma decisões encadeadas.
Modelo certo na tarefa certa não é economia mesquinha — é o que separa um experimento caro de uma operação sustentável.
Pare de ler sobre IA. Opere.
Na Genesi.Dev você pratica em máquina Linux real e IA real — e sai de cada curso com material pronto para usar no trabalho.
Começar grátisLeia também
A lista honesta: as tarefas de alta frequência e alta dor em que a IA se paga em dias — e o primeiro passo concreto de cada uma.
A IA não vai roubar seu emprego. Quem opera IA vai.A frase que você ouve como ameaça é, lida com atenção, um mapa: a vaga não desaparece — ela muda de dono. E o novo dono é quem aprendeu a operar.