Ferramentas & Modelos12 de junho de 2026 5 min de leitura

Opus, Sonnet ou Haiku: qual usar e quanto custa

Quem começa com a API da Anthropic costuma cometer o mesmo erro: usar o modelo mais inteligente para tudo. Funciona — e custa 5x mais do que deveria. Este guia resolve a escolha em uma tabela e três perguntas.

Os três modelos, em junho de 2026

Modelo	ID	Forte em	Contexto	Custo (US$/1M tokens, entrada/saída)
Claude Opus 4.8	`claude-opus-4-8`	Agentes complexos, código, raciocínio longo	1M	$5 / $25
Claude Sonnet 4.6	`claude-sonnet-4-6`	O equilíbrio — o cavalo de batalha do dia a dia	1M	$3 / $15
Claude Haiku 4.5	`claude-haiku-4-5`	Volume: classificação, extração, tarefas pontuais	200K	$1 / $5

Repare na coluna de custo: a saída do Opus custa 5x a do Haiku. Num pipeline que roda milhares de vezes por dia, essa diferença é a sua margem.

As três perguntas que decidem

1. É raciocínio longo ou tarefa pontual? Planejar uma migração, revisar um contrato complexo, conduzir um agente por dezenas de passos → Opus. Classificar um ticket, extrair campos de um e-mail, resumir um parágrafo → Haiku.

2. Qual é o volume? Alto volume empurra para baixo na tabela. Mil classificações por dia no Opus é dinheiro queimado; no Haiku, é centavos.

3. Quanto custa errar? Se o erro é caro (decisão jurídica, código que vai para produção), pague pelo modelo mais forte nessa etapa — e só nela.

DICA

A regra de ouro: comece pelo modelo mais barato que resolve a tarefa com qualidade. Suba de tier apenas quando a qualidade pedir. O padrão profissional é rotear: Opus planeja, Haiku executa o volume, Sonnet faz o meio de campo.

O que mudou em 2026 (e quebra tutorial antigo)

Se você aprendeu com material de 2024/2025, atenção: nos modelos atuais da família 4.6+ e no Opus 4.8, os parâmetros de amostragem — temperature, top_p, top_k — foram removidos. Enviá-los retorna erro 400.

No lugar, dois controles melhores:

Adaptive thinking (thinking: {type: "adaptive"}) — o modelo decide sozinho quando e quanto raciocinar antes de responder.
Effort (low / medium / high / max) — você calibra o investimento de raciocínio por tarefa, em vez de chutar um número de 0 a 1.

Receita prática para começar

Prototipe no Sonnet 4.6 — qualidade alta, custo médio, raramente decepciona.
Quando o fluxo estabilizar, teste a etapa repetitiva no Haiku 4.5. Se a qualidade segurar, você acabou de cortar a conta.
Reserve o Opus 4.8 para os nós difíceis: o planejamento, o código crítico, o agente que toma decisões encadeadas.

Modelo certo na tarefa certa não é economia mesquinha — é o que separa um experimento caro de uma operação sustentável.

Pare de ler sobre IA. Opere.

Na Genesi.Dev você pratica em máquina Linux real e IA real — e sai de cada curso com material pronto para usar no trabalho.

Começar grátis