O que conta como tool call?

Uma response do modelo que solicita execução de uma function exposta pelo aplicativo (function calling). É o sinal canônico de que o modelo está agindo, não apenas conversando.

Por que AI Gateway é melhor que chamar provider diretamente?

Três motivos: budgets unificados por team, observabilidade cross-provider em um lugar, e fallback automático quando o provider primário falha. Os 3.5% de fallbacks salvos por mês são receita preservada que não existiria sem essa camada.

IA aplicada2026-05-194 min de leitura

Vercel AI Gateway: tool calls dobraram em 6 meses (e o que isso significa)

Dados do Vercel AI Gateway mostram tool calls subindo de 11.4% (out/2025) para 22.2% (abr/2026) e 3.5% das requests salvas por fallback automático. O que isso revela sobre apps de IA.

#vercel #ai-gateway #agents #fallback #observability

Resposta atômica: Dados públicos de produção do Vercel AI Gateway (7 meses, mais de 200 mil times) mostram que tool calls subiram de 11.4% das requests em outubro de 2025 para 22.2% em abril de 2026 — quase dobraram. Cerca de 3.5% das requests completam graças a fallback automático. A leitura: o mercado está saindo de "chatbot" para "agente que age".

O número que conta uma história

11.4% para 22.2% em seis meses. Isso é a fração de requests no AI Gateway que terminam com o modelo solicitando execução de uma função (tool call) em vez de só conversar.

A interpretação técnica: a maturidade de aplicações de IA em produção mudou. Em 2025, a maioria dos apps usava LLM como gerador de texto. Em 2026, mais de um em cada cinco requests é o modelo agindo — consultando dados, transformando estados, escrevendo em sistemas.

O ponto não-óbvio: quem está construindo SaaS de IA agora e ainda não tem function calling sólido está construindo o produto de 2025 em 2026.

A leitura por trás dos 22.2%

Tool call é diferente de RAG. RAG é "modelo busca contexto antes de responder". Tool call é "modelo executa ação no sistema". Quando a métrica dobra em 6 meses, três forças combinam:

1. Modelos com tool use confiável. Claude Opus 4.x, GPT-5.x e Gemini 2.x convergiram em qualidade de function calling. Falhas de tool call caíram a níveis aceitáveis para produção.

2. Frameworks de agente maduros. AI SDK, LangChain, Mastra, e managed agents da Anthropic estabilizaram interfaces. Construir agente deixou de ser PoC.

3. Pressão de produto. "Faça por mim" vence "me explique" em retenção. Times que entregam agente em vez de chat assistente veem ativação mais alta.

Os 3.5% que ninguém menciona

Esse é o número mais subestimado da release: 3.5% das requests no AI Gateway são salvas por fallback automático. O usuário fez request, o provider primário falhou (rate limit, timeout, erro), e o gateway re-roteou para um provider saudável tempo suficiente para o usuário receber resposta válida.

Em escala, isso é receita preservada. Para SaaS de IA com 1 milhão de requests/mês:

sem AI Gateway: ~35 mil requests teriam falhado para o usuário
com AI Gateway: a maioria delas completou silenciosamente

Em produção brasileira, com providers internacionais que tem variabilidade de latência maior, esse número provavelmente é mais alto.

Por que isso muda arquitetura

1. Provider-agnostic prompts viram requisito. Se o gateway pode reescrever sua request de Claude para GPT em caso de falha, o prompt precisa funcionar nos dois.

2. Modelos como string, não como pacote. O padrão recomendado é referenciar modelo via "provider/modelo" (ex: "anthropic/claude-opus-4-7") em vez de importar SDK específico. Trocar de modelo vira variável de ambiente.

3. Budget unificado por team. Antes era um budget por provider. Agora é um budget total. Pricing de SaaS com IA pode ser modelado por "execuções" sem se preocupar com qual provider serviu cada execução.

Como começar

Setup mínimo:

import { generateText } from "ai";

const result = await generateText({
  model: "anthropic/claude-opus-4-7",
  messages: [{ role: "user", content: prompt }],
  tools: { searchInternal: { /* ... */ } },
});

Para apps em produção que ainda usam SDK direto, a migração para gateway leva geralmente menos de uma sprint e libera fallback + observabilidade no caminho.

Sinais de que vale priorizar agora

Você está em produção com IA e não tem fallback explícito quando provider falha
Tem mais de um provider em uso e budget descentralizado
Está construindo agente com tool calls e quer dashboard único de saúde
Roda no Vercel e ainda integra LLM "na unha"

Em qualquer um desses casos, migrar pro gateway tende a pagar em uma sprint.

A leitura estratégica

A telemetria do AI Gateway é um dos termômetros mais honestos do estado real de IA em produção — não é survey, não é hype, é dado de quem está rodando.

O que ela mostra: apps de IA estão saindo da fase "geração" e entrando na fase "execução". Quem está construindo na primeira fase vai sentir a defasagem dentro de 12 meses.

Próximo passo

Para times que querem auditar a stack de IA atual (quem chama o quê, custo por execução, sinais de saúde) e desenhar arquitetura provider-agnostic com fallback explícito: discovery técnico de duas semanas cobre exatamente esse escopo.

Fontes citadas

AI Gateway production index — Vercel · acessado em 2026-05-19
AI Gateway: Production-ready reliability — Vercel · acessado em 2026-05-19
AI Gateway Capabilities — Vercel Docs · acessado em 2026-05-19