Em 15 de junho de 2026 apareceu no Show HN um projeto chamado Memento: um agente self-hosted que conecta na sua caixa de e-mail, lê tudo que entra, extrai entidades e decisões, e mantém uma wiki pesquisável que cresce sozinha. Em 48 horas ele virou referência no LLM Wiki do Karpathy e na lista curada Awesome-Agent-Memory — duas das comunidades mais cuidadosas em memória de agentes. A ideia não é nova, mas a forma como o Memento amarra e-mail → extração → wiki → busca agentic virou o primeiro produto que parece dar certo sem você montar nada. Vale entender o que tem dentro, o que mudou em relação ao RAG tradicional, e onde isso já está rodando em negócio de verdade.
Resposta direta
Memento é um agente self-hosted que lê sua caixa de entrada, extrai entidades, decisões e contexto de cada thread, e mantém um wiki vivo em markdown que qualquer agente (ou você mesmo) pode consultar depois. Em vez de você procurar no histórico toda vez que precisa lembrar "o que esse cliente pediu semana passada", você pergunta ao agente e ele responde citando a página do wiki com o trecho. Roda local, sem enviar seus e-mails pra API de terceiro, e o projeto original do Karpathy descreve a arquitetura completa num gist com 1.953 palavras — incluindo o arquivo AGENTS.md (equivalente ao CLAUDE.md do Claude Code) que ensina o LLM a ser um mantenedor disciplinado de wiki em vez de um chatbot genérico.
O que é e por que importa agora
Três coisas mudaram em 2026 que tornaram possível o Memento existir como produto e não como demo.
Primeiro: agentes de leitura longa ficaram baratos o suficiente pra rodar em background. O Claude Sonnet 4.6 e o Qwen3.7 Max processam uma thread de e-mail de 30 páginas por menos de US$ 0,02 segundo o llm-stats.com — em 2024 custava US$ 0,80. Isso destravou o caso "leio tudo e mantenho um resumo atualizado" porque a conta fecha.
Segundo: o LLM Wiki do Karpathy virou referência de arquitetura. Em vez de RAG tradicional — onde você recupera trechos e responde do zero toda vez — o LLM mantém um arquivo de markdown organizado por tópico, com links internos, e atualiza só as páginas relevantes quando uma informação nova chega. É incremental, persistente e citou de volta. Memento é a primeira implementação que faz isso automaticamente sem você escrever código.
Terceiro: self-hosted ficou usável. O Odysseus — workspace AI local do PewDiePie, MIT license, 67 mil stars em 2 meses segundo EveryDev.ai — mostrou que dá pra rodar chat + agents + tools + model serving + email numa única máquina local. Memento herda esse mesmo pressuposto: seu e-mail não sai do seu hardware.
Por que importa agora: gerentes brasileiros que tocam 30 contas de WhatsApp, 3 caixas de e-mail corporativo e uma loja virtual passam 1-2h por dia procurando informação perdida em thread ("qual era mesmo o prazo que esse fornecedor pediu?"). Memento transforma isso em uma busca de 5 segundos — e ainda deixa um rastro auditável de quem prometeu o quê pra quem.
Como funciona (sem jargão)
Quatro blocos, na ordem em que rodam quando você liga o Memento.
1. Coletor de e-mail (IMAP). Você aponta pra uma caixa — Gmail, Outlook, IMAP corporativo, qualquer uma que aceite conexão padrão. O Memento abre uma thread por vez, baixa corpo + anexos de texto (PDFs viram texto via OCR local), e joga no próximo bloco. Nada sai da sua máquina.
2. Extrator de entidades e decisões. Um agente de leitura lê a thread e devolve um JSON estruturado: quem são as pessoas envolvidas, qual o assunto, quais decisões foram tomadas, quais prazos apareceram, quais documentos foram anexados. O prompt que faz esse trabalho está no AGENTS.md e é o que diferencia um extrator disciplinado de um que alucina campos.
3. Wiki local em markdown. Cada entidade relevante vira uma página. Decisões viram entradas datadas dentro da página do projeto. Prazos viram entradas datadas dentro da página do fornecedor. Páginas se linkam entre si quando o contexto cruza ("fornecedor X" linka pra "projeto Y" que linka pra "cliente Z"). O resultado é um diretório .wiki/ no seu filesystem que você pode abrir no Obsidian, no VS Code ou em qualquer leitor de markdown.
4. Busca agentic. Quando você pergunta "o que o fornecedor X prometeu na semana passada?", um segundo agente consulta o wiki, segue os links, cita a página e o trecho, e responde. Você pode pedir pra ele reescrever uma página inteira ("atualiza a página do projeto Y com essa thread nova"), o que cria um ciclo de manutenção sem sua mão.
O Hermes Agent da Nous Research usa o mesmo princípio de "agent-curated memory with periodic nudges" segundo o próprio README — você percebe que 2026 é o ano em que agente que mantém memória persistente deixou de ser feature e virou commodity.
Comparativo rápido: antes vs agora
| Busca no Gmail (2023) | RAG tradicional (2024) | Memento (2026) | |
|---|---|---|---|
| Onde roda | Servidor do Google | Sua infra + banco vetorial | Sua máquina local |
| O que entende | Palavras-chave | Similaridade semântica | Contexto + entidades + decisões + datas |
| Quem mantém | Index do Google | Você reindexa manual | O agente atualiza incremental |
| Custo mensal | Grátis (seus dados) | US$ 50-500 em embeddings | ~US$ 5 em LLM local ou US$ 30 em API |
| Privacidade | Google lê tudo | Depende do provedor | 100% local |
| Tempo por busca | 5-30s | 3-10s | 1-3s (wiki já está organizado) |
A diferença-chave é que RAG responde do zero toda vez — ele recupera 5 trechos, cola no prompt, e o LLM inventa uma resposta coerente em cima deles. Memento mantém um estado organizado que cresce com o tempo, então a resposta é citável e estável.
O que isso muda para o seu negócio
Três aplicações concretas que já estão rodando em PME brasileira em junho de 2026.
Atendimento ao cliente com contexto histórico. Em vez do atendente abrir 4 abas (CRM, e-mail, WhatsApp, ERP), ele pergunta ao agente "o que já aconteceu com esse cliente?" e recebe um resumo de 200 palavras com link pra cada thread relevante. Lojas de varejo que testaram reportam queda de 40% no tempo médio de atendimento na segunda semana.
Cobrança inteligente. O wiki vira a fonte da verdade sobre "o que esse cliente já deve, o que já prometeu, em qual data". Quando o agente de cobrança vai mandar mensagem, ele consulta o wiki e escreve uma cobrança coerente com a história — sem repetir o que já foi negociado, sem cobrar valor errado. Esse é o padrão que a Agendai implanta em varejistas com carteira de inadimplência acima de 8%.
Gestão de fornecedores e cotações. Em loja que compra de 30-50 fornecedores por mês, cada pedido vira thread. O Memento extrai preço, prazo, condição de pagamento e SKU; o wiki mostra em 10 segundos qual fornecedor tem o melhor histórico de entrega pro mesmo SKU. Comprador passa de "chutar fornecedor" pra "consultar histórico".
Referência natural Agendai
O desenho de "agente mantém um estado organizado que cresce com o tempo" é exatamente o que a Agendai implementa em operação de WhatsApp + CRM pra varejo brasileiro. O wiki do Memento sobre um cliente vira a página do cliente no CRM da loja — alimentada pelo histórico de conversas, pedidos e cobranças. O agente de atendimento lê essa página antes de responder; o agente de cobrança lê antes de mandar mensagem; o agente de pós-venda lê antes de pedir review. Se você quer ver isso rodando no seu negócio, a Agendai implementa em ~2 semanas — a primeira semana é de graça, sem fidelidade.
Perguntas frequentes
O que é o Memento exatamente?
É um agente self-hosted que conecta na sua caixa de e-mail via IMAP, lê cada thread, extrai entidades, decisões e prazos, e mantém um wiki em markdown local com busca agentic. Foi publicado no Show HN em 15 de junho de 2026 e listado no Awesome-Agent-Memory como referência de arquitetura de memória persistente.
Como o Memento se compara com o RAG tradicional?
RAG recupera trechos do zero toda vez e responde em cima deles — útil, mas o resultado não é citável nem estável. Memento mantém um wiki organizado que cresce com o tempo, então a resposta sempre cita a página e o trecho exato. Em PME brasileira, Memento ganhou tração porque wiki persistente combina melhor com operação pequena onde cada thread de e-mail é evento de negócio (pedido, cobrança, fornecedor).
Quanto custa rodar o Memento?
Três caminhos: (1) 100% local com Ollama + modelo 7B quantizado, custo zero em API mas precisa de GPU com pelo menos 12 GB de VRAM; (2) local com API de fronteira (Claude Sonnet 4.6 ou Qwen3.7 Max) via OpenRouter, custo ~US$ 5-15 por mês para uma caixa corporativa média; (3) SaaS gerenciado (ainda em beta em junho de 2026), preço esperado na faixa de US$ 30/mês.
Quais os riscos do Memento?
Os mesmos de qualquer agente que lê dados sensíveis: ele pode extrair entidades erradas se o prompt do AGENTS.md não estiver bem escrito; pode resumir mal uma thread ambígua; pode falhar em manter o wiki atualizado se a caixa de e-mail receber mais de 500 mensagens por dia. O mitigador real é revisar as primeiras 50 páginas que ele gera — você aprende o padrão dele rápido.
Memento substitui meu CRM ou minha ferramenta de helpdesk?
Não, e o criador é explícito sobre isso no README. Memento é a camada de memória/contexto — ele alimenta o CRM e o helpdesk, não os substitui. Se você roda HubSpot ou Kommo, o wiki do Memento vira o "cérebro de leitura" que consulta antes de cada interação; o registro de auditoria continua no CRM. É uma escolha de escopo: Memento cuida do "lembrar", você cuida do "agir".
Recomendamos também: Harness engineering em 2026 e RAG para atendimento: o que é e quando vale a pena.
Quer ver um agente que mantém memória viva da operação rodando no seu varejo? A Agendai implementa o equivalente em WhatsApp + CRM em ~2 semanas — primeira semana de graça. Fale com a gente.