Saiu no Show HN de junho de 2026 um projeto chamado Web Speed que ataca um problema que todo mundo fala e ninguém resolveu direito: agentes de IA que navegam na web gastam tokens demais e quebram o tempo todo. A proposta é simples na superfície e esperta por baixo. A ideia é traduzir HTML humano-orientado em um JSON estruturado que qualquer LLM consegue consumir, sem alucinar seletores, sem pagar o custo de re-analisar a mesma página N vezes. E tudo via MCP, o que torna plug-and-play em Claude, Cursor, Cowork, Hermes, Antigravity e qualquer cliente que fale o protocolo.
Resposta direta
Web Speed é um servidor MCP open source (licença GPL-3.0, repositório no GitHub) que recebe uma URL e devolve um mapa estruturado em JSON com headings, navegação, links de conteúdo, formulários, tabelas, blocos de texto e metadados. O código não usa LLM nenhum. Toda a interpretação é determinística (BeautifulSoup + heurísticas) e roda em milissegundos. O resultado: 70-90% de redução de tokens comparado a jogar o HTML bruto no contexto, 40% menos latência nas chamadas, e um esquema JSON estável que o seu agente aprende uma vez e reaproveita para qualquer site. Em junho de 2026, na versão 2.0.4, o autor Dominic Pi-Sunyer abriu a thread no HN para colher feedback.
O que é e por que importa agora
A web moderna é otimizada para olho humano. HTML sujo, layout complexo, frameworks JS que montam a página no cliente. Para um LLM ler isso direito, três coisas dão errado:
- Custo de token explode. Uma página de e-commerce pesa 150-200 mil caracteres brutos. Multiplique por quantas páginas o seu agente precisa visitar em uma tarefa. A conta da OpenAI ou Anthropic não perdoa.
- Alucinação de seletores. O LLM lê o HTML, "acha" um botão que parece clicável, e na hora de agir o seletor não existe mais (mudou layout, mudou classe, mudou framework). O agente erra, refaz, gasta mais tokens.
- Re-descoberta constante. Cada nova tarefa no mesmo site recomeça do zero. O agente não lembra que
example.com/logintem campo de email, campo de senha, botão submit. Toda vez: ler tudo de novo.
O Web Speed ataca os três. O servidor lê o HTML uma vez com BeautifulSoup, extrai só o que é estruturalmente relevante, e devolve um JSON fixo. Mesma URL, mesmo output, mesmo schema. Seu agente gasta tokens para decidir, não para descobrir. E quando descobre, o resultado é reaproveitável.
A sacada mais comentada no HN é o cache global compartilhado (só no plano pago de US$ 99/mês). Quando um usuário visita um site, o mapa vai para o servidor. Outro agente, em outro continente, pedindo a mesma URL recebe o mapa do cache em vez de reprocessar. Cold start de 42ms na primeira vez, near-instant nas próximas. Para frotas de agentes rodando em produção, isso muda a economia da operação.
Como funciona (sem jargão)
A versão community do Web Speed é um servidor MCP em Python. Você clona o repositório, cria um venv, instala requirements, e registra o server.py no seu cliente MCP. Em 5 minutos você tem 6 ferramentas novas:
interpret_page— recebe URL, devolve o mapa estruturado completosubmit_form— submete GET ou POST, devolve o mapa da página resultantesite_map— crawla um domínio inteiro a partir de uma URL raiz, devolve mapa combinadoinspect_element— drill-down em um nó específico via seletor CSSpage_type— classifica a página (login,listing,article,form,navigation,other) em uma chamada sóinvalidate_cache— limpa o cache de uma URL para forçar refetch
A integração com Claude Desktop ou Cowork é um JSON de configuração apontando para o server.py. Quem usa Cursor, Antigravity ou Hermes faz o mesmo — qualquer cliente que fale MCP pega de primeira.
O output segue um schema fixo. Exemplo real de interpret_page rodando em uma página qualquer:
{
"url": "https://example.com/",
"page_type": "article",
"title": "Exemplo",
"headings": [{"level": 1, "text": "Exemplo"}],
"navigation": [{"label": "Home", "url": "https://example.com/", "location": "header"}],
"content_links": {"total": 12, "truncated": false, "items": []},
"forms": [],
"tables": [],
"text_blocks": [{"tag": "p", "text": "..."}],
"metadata": {}
}
Note o que não está aí: scripts, estilos, SVGs, comentários HTML, atributos de classes que mudam a cada deploy. O Web Speed strip-a o que não é estrutural. Em um benchmark do próprio autor (caso WK-902), 180 mil tokens de HTML viraram 4.200 tokens de mapa — economia de 97%. O custo por chamada caiu de ~US$ 0,30 para ~US$ 0,04 com gpt-4o-mini.
A versão paga adiciona o bridge de autenticação: o agente usa o keychain local do seu navegador para preencher login e senha sem que a senha saia da sua máquina. Isso destrava casos como LinkedIn, portais de cliente, ERPs com sessão — qualquer site que não funciona sem login. O OSS tem um caminho análogo via post-auth, mas a UX é manual.
Comparativo rápido: antes vs agora
| Aspecto | Agente cru (HTML bruto) | Agente + Web Speed |
|---|---|---|
| Tokens por página típica | 50k–200k | 2k–15k (redução 70-90%) |
| Latência de primeira chamada | Alta (parsing + raciocínio) | 42ms (mapa determinístico) |
| Estabilidade entre sessões | Seletores mudam, agente re-adivinha | Schema fixo, mesma URL = mesma resposta |
| Custo por tarefa de 50 páginas | US$ 5–15 (modelo médio) | US$ 0,50–1,50 |
| Funciona atrás de login | Não, ou com gambiarra | Sim (bridge de keychain no plano pago) |
| Setup inicial | Zero (já está no LLM) | 5 min (clone, venv, config MCP) |
| Cache compartilhado | Nenhum | Sim, no plano pago (HIT vs MISS no header X-Cache) |
A economia do cache é o que mais pesa. Em uma frota de agentes onde 20 agentes visitam o mesmo domínio no mesmo dia, 19 deles pegam cache. Sem Web Speed, são 20 calls LLM completas. Com cache, é 1 processamento + 19 leituras baratas.
O que isso muda para o seu negócio
Se você não é dev, pode parecer longe do seu problema. Não é. Toda vez que um agente interno (seu, de um fornecedor, de um SaaS que você contratou) precisa consultar um site externo — comparar preço de concorrente, puxar tabela de frete, ler uma página de FAQ que não está na sua base — esse agente está pagando o custo que o Web Speed corta.
Cenários onde isso vira dinheiro rápido:
- Monitoramento de preço em varejo. Agente que visita 30 sites de concorrente todo dia, coleta preço de 200 SKUs. Sem Web Speed: US$ 30/dia de API. Com: US$ 3/dia, e os seletores não quebram quando o concorrente refatora o front.
- Prospecção B2B. Agente que visita LinkedIn, sites institucionais, portais de governança, junta dados de leads. Com o bridge de auth, vira rotina; sem, é script frágil que quebra toda semana.
- Atendimento híbrido no WhatsApp. Quando o atendente de IA precisa puxar "status do meu pedido" do site do fornecedor, o mapa estruturado entra direto no prompt. Sem alucinação, sem retry.
O projeto ainda é cedo — 8 stars no GitHub em junho de 2026, último push no dia 10 de maio, licença GPL-3.0 (cuidado se você for embarcar em produto comercial fechado, a GPL exige abertura do código derivado). Mas a direção está clara: tradução determinística de web para LLM vai virar commodity até 2027, do mesmo jeito que RAG virou commodity entre 2023 e 2024. Quem entra agora ganha a curva de aprendizado e os cases antes do mercado saturar.
Se você quer ver um agente MCP real rodando no seu negócio — não demo, em produção, integrado com WhatsApp, CRM e seus sistemas internos — a Agendai implementa em ~2 semanas. A primeira semana é de graça, sem fidelidade.
Perguntas frequentes
O que é Web Speed? Um servidor MCP open source (github.com/Dominic-Pi-Sunyer/web-speed-oss) que traduz páginas web em JSON estruturado para agentes de IA consumirem. Lançado no Show HN de junho de 2026 pelo autor Dominic Pi-Sunyer, em sua versão 2.0.4.
Como o Web Speed funciona na prática?
Você registra o server.py no seu cliente MCP (Claude Desktop, Cursor, Cowork, Hermes, etc.) e ganha 6 ferramentas: interpret_page, submit_form, site_map, inspect_element, page_type e invalidate_cache. O servidor faz parsing determinístico com BeautifulSoup, sem chamar nenhum LLM internamente.
Quanto custa implementar Web Speed? A versão community é gratuita (GPL-3.0, código aberto, self-hosted). A versão hospedada com cache global compartilhado custa a partir de US$ 0 (plano free com limite) até US$ 99/mês no plano Max, com rate limiting maior e suporte prioritário. Detalhes em api.getwebspeed.io/pricing.
Quais os riscos de usar Web Speed?
Três principais: (1) a licença GPL-3.0 exige que código derivado seja aberto — não use em produto SaaS fechado sem entender o impacto; (2) o parsing determinístico pode falhar em sites com muito JS client-side pesado (a saída NOT_HTML ou PARSE_FAILED é retornada nesses casos); (3) a bridge de auth depende do keychain local do navegador, então rodar em servidor headless exige Playwright configurado.
Web Speed substitui funcionários? Não. Ele substitui a parte chata, repetitiva e cara de uma tarefa de agente — descobrir e re-descobrir a estrutura de uma página. A decisão continua sendo do LLM, e a revisão final continua sendo humana. O que muda é que cada hora de trabalho do agente custa 80-90% menos, então vale a pena automatizar tarefas que antes eram caras demais para delegar.