iachat

Author	SHA1	Message	Date
Rodribm10	b561aa8451	revert(hermes): remove camadas 2/3/4 + reabilita memória A causa raiz dos bugs de "info repetida em turns anteriores" era o default_scope ASC do Message conflitando com .order(desc) no debounce (ver commit `f1d3a124d`). Como já corrigi com .reorder, as Camadas 2, 3 e 4 viraram peso morto que adicionava latência/false positive sem ganho. Removido: - Camada 2 (factual sem tool → retrigger force_factual_tool) - Camada 3 (strip de linhas repetidas com pool de outgoings anteriores) - Camada 4 (topic gating: bloqueio quando resposta tem tópico não pedido) - Tracker de tool calls em McpController (suportava Camada 2) - Snapshot baseline em OutgoingJob (suportava Camada 2) - Regra "🚨 NÃO CONFIE NA SUA MEMÓRIA" das 4 SOUL.md Hermes Mantido: - Camada 1: handoff intencional ("Um momento — vou verificar") + loop detection (Jaccard >= 0.50 ou pergunta reformulada com 3+ keywords). Genuíno pra bot externo (Claro/Vivo) e loops óbvios. - Label-guard em OutgoingJob (não dispatch se conv tem triagem_humana). - Auto-react ambient (feature original). - Reorder fix no combined_incoming_content (causa raiz). Memory + user_profile reabilitados nos 4 Hermes (config.yaml) e no template do hermes-provision pra futuros agentes. Sem memória, cliente precisa repetir nome/CPF/contexto a cada turn — UX horrível. Contaminação cross-unit que justificava desligar vinha de outro bug (X-Captain-Assistant-Id apontando pro parent), já corrigido. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-02 18:39:43 -03:00
Rodribm10	f1d3a124d5	fix(hermes): debounce agrupava msgs de turns ANTIGOS (default_scope ASC) Bug raiz que causou todos os problemas de "Hermes repetindo info de turns anteriores" hoje: Message tem default_scope order(created_at: :asc). O combined_incoming_ content fazia .order(created_at: :desc) que GERA SQL com 2 orderings em conflito ("ORDER BY created_at ASC, created_at DESC") — no Postgres o ASC ganha quando a primeira coluna é igual. Resultado: last_real_outgoing virava a MAIS ANTIGA outgoing (a saudação inicial), não a mais recente. Aí o scope incoming agrupava TODAS as msgs do cliente desde o "Oi" da Juliana, juntando wifi+pet num turn só. Caso real conv 6064 (2026-05-02 21:18): T1: cliente "Preciso senha wifi" → Hermes "Prime2025" T2: cliente "Posso levar animais?" → debounce agrupou ["Preciso senha wifi", "Posso levar animais"] como se fossem MSGS DO MESMO TURN, mandou pro Hermes como "Cliente acabou de dizer: Preciso senha wifi.\nPosso levar animais?" → Hermes consultou faq_lookup com query "senha wifi e animais" → Resposta: "Senha Prime2025 e pode levar animais" Fix: usa .reorder(created_at: :desc) que sobrescreve default_scope, gerando SQL limpa com só "ORDER BY created_at DESC". Camadas 3 (strip linhas) e 4 (topic gating) que adicionei antes são paliativos válidos como defesa em profundidade, mas o problema raiz era esse default_scope. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-02 18:30:12 -03:00
Rodribm10	ed99f67525	feat(captain/hermes): camada 2 — gating de saída factual sem tool call Detecta alucinação de memória: se resposta do Hermes contém info factual (preço/senha/horário/regra/política) E o LLM NÃO chamou nenhuma tool MCP entre dispatch e callback, bloqueia entrega + dispara system_message forçando consulta a tool. 1 retry; persistindo, escala. Implementação: - McpController: incrementa Rails.cache hermes_tool_calls:<conv_id> em cada tools/call. - OutgoingJob: snapshot do contador como hermes_tool_calls_baseline ANTES de despachar pro Hermes. - HermesCallbackController.gate_factual_no_tool!: compara baseline vs current; se igual + FACTUAL_PATTERNS bate, intercepta. Patterns cobrem R$, %, "senha", check-in/out + horário, política de cancelamento, "permitido", "pode levar pet/animal". Caso real: cliente pede senha do Wi-Fi → Hermes responde de cabeça "é passada presencialmente" sem chamar faq_lookup → callback intercepta, não entrega pro cliente, manda [SISTEMA: force_factual_tool] pro Hermes com instrução de chamar faq_lookup. Se faq_lookup vier vazio → frase- âncora handoff. Auto-react ambient: removido filtro de "?" que barrava em prod. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-02 17:58:17 -03:00
Rodribm10	c960dc7e1e	feat(captain/hermes): handoff por loop + label-guard em outgoing Substitui o interceptor agressivo de "Um momento — vou verificar" (que bloqueava silenciosamente) por handoff explícito + loop detection: - HANDOFF_PATTERNS: detecta a frase-âncora ("Um momento — vou verificar", "Aguarde um instante") e ENTREGA pro cliente, marcando conv com label triagem_humana. - looped_response?: detecta 2 outgoing similares (Jaccard >= 0.50) OU pergunta reformulada sobre mesmo tópico (>= 3 keywords em comum + ambas inquisitivas via "?" / "me confirma" / "qual prefere" etc). 1ª resposta passa, 2ª escala. Cobre o caso "endereço ou link?" → "apenas link ou link + endereço?". - OutgoingJob: guard que pula dispatch se conv tem label triagem_humana ou hermes_placeholder. Hermes não responde mais → não gasta token + não gera loop. Cobre 2 casos do Rodrigo: 1. Bot da Claro insistindo em menu → 2ª resposta similar escala. 2. Hermes pedindo confirmação 2x sem entregar → escala. Tokenize normaliza acentos (transliterate) pra stopwords baterem "voce/você", "endereco/endereço", etc. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-02 17:30:58 -03:00
Rodribm10	a2bb613e68	feat(captain/hermes): debounce — inbox.typing_delay como buffer + agrupar msgs Antes: inbox.typing_delay funcionava só pro Captain interno (schedule_internal_response). Hermes ignorava o campo e disparava OutgoingJob na hora — campo da UI era cosmético pra inboxes Hermes. Agora: - schedule_hermes_response cancela jobs OutgoingJob pendentes pra mesma conversa e enfileira com wait=inbox.typing_delay (debounce window). - OutgoingJob agrupa todas msgs incoming entre a última resposta real do agente (ignora reactions) e a msg âncora; dispatch envia o texto concatenado pro Hermes via novo content_override no Client#dispatch. Resultado: cliente que digita "Oi" + "quero pernoite Master" em segundos vê o agente esperar até o buffer vencer e responder UMA vez cobrindo ambas as falas, em vez de 2 respostas atropelando o pensamento. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-02 08:46:24 -03:00
Rodribm10	bfa06597f2	feat(captain/hermes): auto-react deterministico antes do LLM Pattern matching no Captain dispara reaction <1s sem esperar Codex processar. Resposta de texto continua vindo do Hermes normalmente — auto-react eh COMPLEMENTAR. Padroes detectados (no incoming message): - "obrigado/valeu/vlw/thanks" -> 🙏 - "ok/fechado/perfeito/blz/combinado" -> 👍 - attachment image (msg sem texto) -> 😍 - attachment audio (msg curta) -> 🙏 Conservative: só dispara em casos CLAROS. Em duvida, deixa pro LLM decidir via react_to_message tool. Plugado em Captain::Hermes::OutgoingJob#perform — chamado antes do dispatch pro Hermes. Falha silenciosa (rescue) — nao bloqueia fluxo. SOUL.md atualizado: regra de frequencia (~30% das msgs) + nota sobre auto-react pra LLM nao duplicar reacao em casos cobertos. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 21:59:28 -03:00
Rodribm10	35de8b7fde	feat(captain): cliente Captain ↔ Hermes (outgoing job + callback endpoint) Implementa o lado Captain da integração Nível 2 (Hermes como cérebro). Ativação por inbox via env var CAPTAIN_HERMES_INBOX_IDS — inboxes não listadas seguem usando o orquestrador interno do Captain (Daniela_Reservas etc) sem mudança alguma. Princípio "só adiciona, não retira". Componentes: - enterprise/app/services/captain/hermes.rb Módulo helper de config (env vars, URLs, secrets per-inbox). - enterprise/app/services/captain/hermes/client.rb Service que monta payload (msg + contexto da conversa/inbox/contato) e faz POST autenticado via HMAC-SHA256 (X-Hub-Signature-256) no webhook do Hermes Agent (porta 8644). DispatchError em falha de rede/HTTP. - enterprise/app/jobs/captain/hermes/outgoing_job.rb Wrapper Sidekiq do Client. Retry 3x em DispatchError. - app/controllers/webhooks/captain/hermes_callback_controller.rb Recebe callback do plugin captain-http-callback do Hermes. Valida HMAC se CAPTAIN_HERMES_CALLBACK_SECRET setado, identifica conversation pela última pending da inbox (janela 5min) e cria mensagem outgoing. - config/routes.rb Rota POST /webhooks/captain/hermes_callback (fora de /api/v1/accounts). - enterprise/app/services/enterprise/message_templates/hook_execution_service.rb Branch novo no schedule_captain_response: se Hermes habilitado pra inbox, dispara HermesOutgoingJob; senão, fluxo Captain interno como antes. Env vars (todas opcionais; sem set = Hermes desabilitado em todas inboxes): - CAPTAIN_HERMES_INBOX_IDS (CSV de inbox.id) - CAPTAIN_HERMES_WEBHOOK_BASE_URL (default http://172.17.0.1:8644) - CAPTAIN_HERMES_CALLBACK_SECRET (HMAC validar callbacks de entrada) - CAPTAIN_HERMES_SUBSCRIPTION_SECRET_INBOX_<id> (HMAC assinar saídas) Limitação: identificação da conversation no callback usa última pending da inbox dentro de 5min. OK pra PoC com 1 conversa de teste por vez. Em produção, melhorar mapeando delivery_id ↔ conversation_id em Redis. Próximo passo manual (admin VPS): criar subscription no Hermes: hermes webhook subscribe captain-inbox-1 \\ --prompt 'Cliente disse: {message}. Responda como Daniela ...' \\ --deliver http_callback \\ --deliver-chat-id 'http://CAPTAIN_HOST/webhooks/captain/hermes_callback?inbox_id=1' Depois set CAPTAIN_HERMES_INBOX_IDS=1 + CAPTAIN_HERMES_SUBSCRIPTION_SECRET_INBOX_1 no stack do Captain e testar pela inbox Angelina. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 13:22:22 -03:00

7 Commits