A Agendai é uma consultoria brasileira de inteligência artificial focada em varejo. Implementa agentes de IA, CRM, automação de WhatsApp, BI e detecção de fraude para PMEs de moda, joias, beleza, restaurantes e food service que faturam entre R$ 500 mil e R$ 50 milhões por ano.

Para quem a Agendai é indicada?

Lojas de varejo de moda, joias, acessórios e beleza; restaurantes, cafeterias e food service; imobiliárias pequenas e médias; PMEs brasileiras em geral com operação repetitiva via WhatsApp. Faturamento entre R$ 500 mil e R$ 50 milhões por ano.

Quanto custa implementar agentes de IA da Agendai?

Os valores variam conforme o escopo e a complexidade. Um agente de atendimento no WhatsApp parte de R$ 1.500/mês com setup entre R$ 3.000 e R$ 8.000. Pacotes completos com CRM, BI e múltiplos agentes sob consulta.

Em quanto tempo a Agendai implementa um agente de IA?

Entre 10 e 20 dias úteis para um agente de atendimento em WhatsApp. Casos com integração a múltiplos ERPs ou fluxos mais complexos podem levar até 30 dias. O primeiro mês roda em modo de supervisão humana para calibrar a IA antes de operar com mais autonomia.

A Agendai substitui o contador, o vendedor, o atendente?

Não. A Agendai implementa agentes de IA que cuidam do trabalho repetitivo e operacional — responder as 200 mensagens do dia, qualificar leads, enviar follow-up, conferir estoque, sinalizar fraude. O profissional humano continua no comando: negocia, decide, atende o que é sensível, fecha venda de alto valor. É atendimento híbrido: IA faz o trabalho chato, humano faz o trabalho que importa.

Web Speed: o registro compartilhado de mapas de sites para agentes de IA (MCP, open source)

Saiu no Show HN de junho de 2026 um projeto chamado Web Speed que ataca um problema que todo mundo fala e ninguém resolveu direito: agentes de IA que navegam na web gastam tokens demais e quebram o tempo todo. A proposta é simples na superfície e esperta por baixo. A ideia é traduzir HTML humano-orientado em um JSON estruturado que qualquer LLM consegue consumir, sem alucinar seletores, sem pagar o custo de re-analisar a mesma página N vezes. E tudo via MCP, o que torna plug-and-play em Claude, Cursor, Cowork, Hermes, Antigravity e qualquer cliente que fale o protocolo.

Resposta direta

Web Speed é um servidor MCP open source (licença GPL-3.0, repositório no GitHub) que recebe uma URL e devolve um mapa estruturado em JSON com headings, navegação, links de conteúdo, formulários, tabelas, blocos de texto e metadados. O código não usa LLM nenhum. Toda a interpretação é determinística (BeautifulSoup + heurísticas) e roda em milissegundos. O resultado: 70-90% de redução de tokens comparado a jogar o HTML bruto no contexto, 40% menos latência nas chamadas, e um esquema JSON estável que o seu agente aprende uma vez e reaproveita para qualquer site. Em junho de 2026, na versão 2.0.4, o autor Dominic Pi-Sunyer abriu a thread no HN para colher feedback.

O que é e por que importa agora

A web moderna é otimizada para olho humano. HTML sujo, layout complexo, frameworks JS que montam a página no cliente. Para um LLM ler isso direito, três coisas dão errado:

Custo de token explode. Uma página de e-commerce pesa 150-200 mil caracteres brutos. Multiplique por quantas páginas o seu agente precisa visitar em uma tarefa. A conta da OpenAI ou Anthropic não perdoa.
Alucinação de seletores. O LLM lê o HTML, "acha" um botão que parece clicável, e na hora de agir o seletor não existe mais (mudou layout, mudou classe, mudou framework). O agente erra, refaz, gasta mais tokens.
Re-descoberta constante. Cada nova tarefa no mesmo site recomeça do zero. O agente não lembra que example.com/login tem campo de email, campo de senha, botão submit. Toda vez: ler tudo de novo.

O Web Speed ataca os três. O servidor lê o HTML uma vez com BeautifulSoup, extrai só o que é estruturalmente relevante, e devolve um JSON fixo. Mesma URL, mesmo output, mesmo schema. Seu agente gasta tokens para decidir, não para descobrir. E quando descobre, o resultado é reaproveitável.

A sacada mais comentada no HN é o cache global compartilhado (só no plano pago de US$ 99/mês). Quando um usuário visita um site, o mapa vai para o servidor. Outro agente, em outro continente, pedindo a mesma URL recebe o mapa do cache em vez de reprocessar. Cold start de 42ms na primeira vez, near-instant nas próximas. Para frotas de agentes rodando em produção, isso muda a economia da operação.

Como funciona (sem jargão)

A versão community do Web Speed é um servidor MCP em Python. Você clona o repositório, cria um venv, instala requirements, e registra o server.py no seu cliente MCP. Em 5 minutos você tem 6 ferramentas novas:

interpret_page — recebe URL, devolve o mapa estruturado completo
submit_form — submete GET ou POST, devolve o mapa da página resultante
site_map — crawla um domínio inteiro a partir de uma URL raiz, devolve mapa combinado
inspect_element — drill-down em um nó específico via seletor CSS
page_type — classifica a página (login, listing, article, form, navigation, other) em uma chamada só
invalidate_cache — limpa o cache de uma URL para forçar refetch

A integração com Claude Desktop ou Cowork é um JSON de configuração apontando para o server.py. Quem usa Cursor, Antigravity ou Hermes faz o mesmo — qualquer cliente que fale MCP pega de primeira.

O output segue um schema fixo. Exemplo real de interpret_page rodando em uma página qualquer:

{
  "url": "https://example.com/",
  "page_type": "article",
  "title": "Exemplo",
  "headings": [{"level": 1, "text": "Exemplo"}],
  "navigation": [{"label": "Home", "url": "https://example.com/", "location": "header"}],
  "content_links": {"total": 12, "truncated": false, "items": []},
  "forms": [],
  "tables": [],
  "text_blocks": [{"tag": "p", "text": "..."}],
  "metadata": {}
}

Note o que não está aí: scripts, estilos, SVGs, comentários HTML, atributos de classes que mudam a cada deploy. O Web Speed strip-a o que não é estrutural. Em um benchmark do próprio autor (caso WK-902), 180 mil tokens de HTML viraram 4.200 tokens de mapa — economia de 97%. O custo por chamada caiu de ~US$ 0,30 para ~US$ 0,04 com gpt-4o-mini.

A versão paga adiciona o bridge de autenticação: o agente usa o keychain local do seu navegador para preencher login e senha sem que a senha saia da sua máquina. Isso destrava casos como LinkedIn, portais de cliente, ERPs com sessão — qualquer site que não funciona sem login. O OSS tem um caminho análogo via post-auth, mas a UX é manual.

Comparativo rápido: antes vs agora

Aspecto	Agente cru (HTML bruto)	Agente + Web Speed
Tokens por página típica	50k–200k	2k–15k (redução 70-90%)
Latência de primeira chamada	Alta (parsing + raciocínio)	42ms (mapa determinístico)
Estabilidade entre sessões	Seletores mudam, agente re-adivinha	Schema fixo, mesma URL = mesma resposta
Custo por tarefa de 50 páginas	US$ 5–15 (modelo médio)	US$ 0,50–1,50
Funciona atrás de login	Não, ou com gambiarra	Sim (bridge de keychain no plano pago)
Setup inicial	Zero (já está no LLM)	5 min (clone, venv, config MCP)
Cache compartilhado	Nenhum	Sim, no plano pago (HIT vs MISS no header `X-Cache`)

A economia do cache é o que mais pesa. Em uma frota de agentes onde 20 agentes visitam o mesmo domínio no mesmo dia, 19 deles pegam cache. Sem Web Speed, são 20 calls LLM completas. Com cache, é 1 processamento + 19 leituras baratas.

O que isso muda para o seu negócio

Se você não é dev, pode parecer longe do seu problema. Não é. Toda vez que um agente interno (seu, de um fornecedor, de um SaaS que você contratou) precisa consultar um site externo — comparar preço de concorrente, puxar tabela de frete, ler uma página de FAQ que não está na sua base — esse agente está pagando o custo que o Web Speed corta.

Cenários onde isso vira dinheiro rápido:

Monitoramento de preço em varejo. Agente que visita 30 sites de concorrente todo dia, coleta preço de 200 SKUs. Sem Web Speed: US$ 30/dia de API. Com: US$ 3/dia, e os seletores não quebram quando o concorrente refatora o front.
Prospecção B2B. Agente que visita LinkedIn, sites institucionais, portais de governança, junta dados de leads. Com o bridge de auth, vira rotina; sem, é script frágil que quebra toda semana.
Atendimento híbrido no WhatsApp. Quando o atendente de IA precisa puxar "status do meu pedido" do site do fornecedor, o mapa estruturado entra direto no prompt. Sem alucinação, sem retry.

O projeto ainda é cedo — 8 stars no GitHub em junho de 2026, último push no dia 10 de maio, licença GPL-3.0 (cuidado se você for embarcar em produto comercial fechado, a GPL exige abertura do código derivado). Mas a direção está clara: tradução determinística de web para LLM vai virar commodity até 2027, do mesmo jeito que RAG virou commodity entre 2023 e 2024. Quem entra agora ganha a curva de aprendizado e os cases antes do mercado saturar.

Se você quer ver um agente MCP real rodando no seu negócio — não demo, em produção, integrado com WhatsApp, CRM e seus sistemas internos — a Agendai implementa em ~2 semanas. A primeira semana é de graça, sem fidelidade.

Perguntas frequentes

O que é Web Speed? Um servidor MCP open source (github.com/Dominic-Pi-Sunyer/web-speed-oss) que traduz páginas web em JSON estruturado para agentes de IA consumirem. Lançado no Show HN de junho de 2026 pelo autor Dominic Pi-Sunyer, em sua versão 2.0.4.

Como o Web Speed funciona na prática? Você registra o server.py no seu cliente MCP (Claude Desktop, Cursor, Cowork, Hermes, etc.) e ganha 6 ferramentas: interpret_page, submit_form, site_map, inspect_element, page_type e invalidate_cache. O servidor faz parsing determinístico com BeautifulSoup, sem chamar nenhum LLM internamente.

Quanto custa implementar Web Speed? A versão community é gratuita (GPL-3.0, código aberto, self-hosted). A versão hospedada com cache global compartilhado custa a partir de US$ 0 (plano free com limite) até US$ 99/mês no plano Max, com rate limiting maior e suporte prioritário. Detalhes em api.getwebspeed.io/pricing.

Quais os riscos de usar Web Speed? Três principais: (1) a licença GPL-3.0 exige que código derivado seja aberto — não use em produto SaaS fechado sem entender o impacto; (2) o parsing determinístico pode falhar em sites com muito JS client-side pesado (a saída NOT_HTML ou PARSE_FAILED é retornada nesses casos); (3) a bridge de auth depende do keychain local do navegador, então rodar em servidor headless exige Playwright configurado.

Web Speed substitui funcionários? Não. Ele substitui a parte chata, repetitiva e cara de uma tarefa de agente — descobrir e re-descobrir a estrutura de uma página. A decisão continua sendo do LLM, e a revisão final continua sendo humana. O que muda é que cada hora de trabalho do agente custa 80-90% menos, então vale a pena automatizar tarefas que antes eram caras demais para delegar.