iachat/enterprise/app/services/captain/contact_memories/extraction_service.rb
Rodribm10 cfffea9c16 feat(captain): semantic memory fixes + roleta + reclamações + analytics
Consolida o trabalho desta branch de abril/2026 em um bloco pronto pra
testar em staging antes do merge pra main.

## Correções de memória semântica
- ExtractionService: Princípio Zero + Regra de Ouro (ação consumada vs intenção).
- Cenário Daniela_Reservas: Passo 0 de classificação (consulta/intenção/fora).

## Roleta da Sorte (end-to-end)
- Schema Supabase + 7 RPCs atômicas (server-side, idempotentes).
- Services: Offer, Redeem, WeeklyReport.
- Jobs: OfferRouletteJob (hook em ConfirmationService após Pix pago),
  NotifyRevealed + Scheduler de fallback.
- Tool manual GenerateRoletaLinkTool + endpoint público /roleta/notify.
- Dashboard /captain/roleta com Resgate + Relatório + anomaly detection.

## Cenário Reclamacoes_Ouvidoria
- Triagem P1-P4, framework LAST, Three-level listening, Self-check.
- Sem compensação material, detecção de cliente frustrado eleva prioridade.

## Analytics
- Funil de conversão /captain/funnel: 5 etapas via regex, zero LLM.
- Detector de churn via ChurnOutreach* (cron dias úteis 10h-17h BRT).

## Trabalho pré-existente incluído
- Captain Executive Reports (ceo_digest, mattermost_delivery).
- get_reserva_preco_tool, Lifecycle ajustes, Reservations UI polimentos.

## Outros
- .gitignore: patterns pra credenciais.
- Migrations de scenarios idempotentes.
- i18n completa pt_BR+en pra roleta/funnel.

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-04-21 15:36:25 -03:00

259 lines
15 KiB
Ruby

# rubocop:disable Metrics/ClassLength
class Captain::ContactMemories::ExtractionService
MAX_FACTS = 5
MIN_CONFIDENCE = 0.5
EXTRACTION_MODEL = 'gpt-4o-mini'.freeze
MAX_CHARS = 40_000 # matches Captain::Llm::ConversationInsightService convention
SCOPE_PATTERN = /\A(global|unit:\d+)\z/
def initialize(conversation:)
@conversation = conversation
end
def call
raw = call_llm
parsed = JSON.parse(raw)
facts = parsed.fetch('facts', [])
facts.filter_map { |f| normalize(f) }.take(MAX_FACTS)
rescue JSON::ParserError => e
Rails.logger.warn("[ContactMemory::ExtractionService] JSON parse: #{e.message}")
[]
rescue StandardError => e
Rails.logger.error("[ContactMemory::ExtractionService] #{e.class}: #{e.message}")
[]
end
private
# TODO(phase-6): add Integrations::LlmInstrumentation wrap for OTEL metrics
# (extraction_count, extraction_cost, facts_per_call, llm_error_rate).
def call_llm
RubyLLM.chat(model: EXTRACTION_MODEL)
.with_temperature(0)
.with_params(response_format: { type: 'json_object' })
.ask(build_prompt)
.content.to_s
end
def build_prompt
<<~PROMPT
Você é um analista conservador que extrai apenas FATOS MEMORÁVEIS de uma conversa de WhatsApp entre um hóspede e um hotel. Sua missão é criar memória útil de longo prazo sobre o cliente não transcrever a conversa.
## PRINCÍPIO ZERO — LITERALIDADE SOBRE INFERÊNCIA
Você extrai o que o cliente DISSE e o que ACONTECEU, não o que você acha que ele quis dizer ou o que provavelmente vai acontecer. Quando em dúvida entre registrar uma interpretação ou não registrar nada: NÃO REGISTRE. Memória errada é muito pior que memória ausente memória errada contamina conversas futuras e faz o atendente mentir pro cliente.
## REGRA DE OURO — AÇÃO CONSUMADA vs INTENÇÃO FUTURA
**NUNCA** registre como fato uma ação que o cliente apenas EXPRESSOU INTENÇÃO de fazer. Isso é o erro mais grave possível contamina o recall e faz o bot afirmar falsidades nas próximas conversas.
### Exemplo REAL de erro a não repetir:
- Cliente: "Maravilha, entro em contato amanhã para reservar"
- Bot: "Fico à disposição pra te ajudar amanhã"
- **ERRADO (alucinação)**: `padrao_comportamental` "Reservou Hidromassagem para pernoite em 21/04/2026"
- **CERTO**: nada. O cliente não reservou disse que vai entrar em contato. Se amanhã ele reservar de fato, a conversa de amanhã vira memória.
### Sinais de AÇÃO CONSUMADA (pode virar `padrao_comportamental` com data):
- Bot gerou Pix / enviou link de reserva **E** cliente confirmou recebimento ou pagou.
- Cliente disse explicitamente "paguei", "confirmado", "pode confirmar", "tá feito", "perfeito, pode marcar".
- Bot respondeu confirmando suíte + data + valor **E** cliente não desdisse.
- Registro de estadia: "fiquei na Alexa em 03/02", "nos hospedamos no fim de semana".
### Sinais de INTENÇÃO FUTURA (NÃO MEMORIZE — retorne nada):
- "Entro em contato amanhã para reservar"
- "Vou querer reservar"
- "Pretendo fazer uma reserva"
- "Tô pensando em reservar"
- "Quero ver opções"
- "Depois eu vejo / me avise depois"
- "Amanhã eu decido"
- Qualquer conversa de orçamento/consulta sem fechamento concreto.
### Teste antes de registrar ação:
Releia o último terço da conversa. A reserva foi EFETIVAMENTE fechada (Pix gerado + cliente aceitou, ou cliente disse "pode confirmar" + bot confirmou)? Se não conseguir apontar a virada de "intenção" pra "feito" com trecho literal, NÃO É AÇÃO CONSUMADA é intenção efêmera e NÃO VIRA memória.
## CONTEXTO DO NEGÓCIO (dados canônicos — NÃO invente fora desta lista)
- **Suítes válidas**: APENAS `Alexa`, `Stilo`, `Hidromassagem`. Se o texto mencionar qualquer outro nome de suíte (ex: "Aluba", "Premium", "Deluxe"), é ERRO de transcrição ou alucinação DESCARTE o fato. Nunca normalize pra um dos 3 nomes automaticamente: se o cliente disse "queria a Aluba", descarte silenciosamente.
- **Permanências válidas**: `2hrs`, `3hrs`, `4hrs`, `pernoite`, `diária`. Qualquer outro termo = descarte.
## DADOS CADASTRAIS NÃO SÃO MEMÓRIA (regra absoluta)
Os seguintes dados são armazenados separadamente no perfil do contato e NUNCA devem virar memória:
- Nome completo / primeiro nome / apelido
- CPF, RG, passaporte, qualquer documento
- Email, telefone, endereço
- Data de nascimento (a não ser que esteja explicitamente vinculada a celebração no hotel vira `data_comemorativa`, não cadastro)
Exemplos de fatos INVÁLIDOS que NÃO devem ser extraídos:
- "Rodrigo tem um CPF que pode ser usado para reservas"
- "Cliente forneceu nome e CPF"
- "Rodrigo Borba Machado é o nome do cliente"
- "O email é x@y.com"
- "Informou telefone para contato"
## TAXONOMIA ESTRITA
Use apenas estes 9 tipos. Cada tipo tem definição precisa + exemplos do que SIM e do que NÃO é.
1. **preferencia** APENAS se o cliente DECLAROU EXPLICITAMENTE uma preferência com palavras como "prefiro", "gosto mais de", "sempre escolho", "adoro", "minha favorita é". Sem declaração explícita = NÃO É PREFERÊNCIA.
SIM: "Prefiro sempre a Stilo com hidro"
SIM: "Gosto de chegar tarde, depois das 22h"
SIM: "Minha suíte favorita é a Hidromassagem"
NÃO: "Quero reservar uma suíte" (é pedido pontual, não preferência recorrente)
NÃO: "Escolheu a Alexa dessa vez" (foi UMA escolha, não preferência declarada use `padrao_comportamental` com data)
NÃO: "Reservou Alexa para pernoite" (é uma transação, use `padrao_comportamental` com data)
REGRA CRÍTICA: nunca extraia "Prefere X" se a única evidência é uma escolha. Preferência precisa de DECLARAÇÃO EXPLÍCITA com as palavras-gatilho acima.
2. **data_comemorativa** data anual recorrente declarada pelo cliente (aniversário dele/esposa/casamento, Dia dos Namorados que ele celebra aqui, etc).
SIM: "É nosso aniversário de casamento dia 14/02"
SIM: "Aniversário da minha esposa em 3/8"
NÃO: "Quero reservar dia 20/04" (é data da reserva, não data comemorativa)
NÃO: "Ontem foi meu aniversário" ( comemora aqui se mencionar que TRADICIONALMENTE vem)
3. **vinculo_social** relacionamento social duradouro com outra pessoa mencionada (esposa, marido, filho, amigo, colega).
SIM: "Sempre venho com minha esposa Mariana"
SIM: "Indicado pelo Márcio, meu amigo"
NÃO: "Obrigado" (não é vínculo)
NÃO: "Expressou gratidão ao hotel" (isso é gentileza, não vínculo social)
4. **padrao_comportamental** evento de escolha EFETIVAMENTE CONSUMADA pelo cliente (ver REGRA DE OURO), OU declaração explícita de hábito.
**TODO fato desse tipo DEVE incluir a data da conversa no content**, no formato:
"Reservou Stilo para pernoite em 23/05/2026"
"Escolheu 4hrs em 14/03/2026"
SIM: "Sempre chego tarde, entre 23h e meia-noite" (declarou hábito)
SIM: "Costumo ficar só o pernoite" (declarou hábito)
SIM: "Reservou Alexa para pernoite em 23/05/2026" APENAS se a reserva foi consumada (Pix gerado + cliente não desistiu, OU cliente disse "pode confirmar" + bot confirmou)
SIM: "Escolheu 4hrs na visita de 14/03/2026" se efetivamente escolheu e fechou
NÃO: "Costuma ficar 2 horas" (SEM DATA e SEM declaração banido)
NÃO: "Prefere permanência de 4 horas" (banido isso seria preferencia, que exige declaração explícita)
NÃO: "Vai chegar às 22h hoje" (intenção da conversa atual, não histórico)
NÃO: "Reservou X" quando o cliente disse "entro em contato amanhã para reservar" ou "quero reservar" (intenção futura violação da REGRA DE OURO).
NÃO: "Reservou X" quando o bot apenas cotou preço e o cliente não fechou explicitamente.
REGRA CRÍTICA: se você vai registrar uma escolha pontual, (a) a ação DEVE ter sido consumada, e (b) SEMPRE inclua a data no content. Memória sem data vira ruído; memória sem consumação vira mentira.
5. **reclamacao** queixa EXPLÍCITA sobre algo que desagradou/frustrou/causou problema, com sentimento negativo claro.
SIM: "O ar-condicionado estava barulhento demais, não dormi direito"
SIM: "Achei péssimo o atendimento da recepcionista X"
NÃO: "Tem estacionamento?" (é PERGUNTA, não reclamação)
NÃO: "Vocês aceitam pet?" (é dúvida)
NÃO: "Poderia ter chegado mais cedo" (é observação, sem queixa)
6. **feedback_positivo** elogio EXPLÍCITO sobre pessoa, serviço ou experiência específica.
SIM: "A Dona Cida do café é maravilhosa, sempre muito atenciosa"
SIM: "Foi a melhor estadia que tive, amei a limpeza"
NÃO: "Obrigado" ou "Agradeceu o atendimento" (cortesia genérica, não elogio memorável)
NÃO: "Foi incentivado a aproveitar o aniversário" (isso é resposta do atendente, não fala do cliente)
7. **restricao** restrição médica, alérgica, dietética ou de mobilidade que afeta hospedagem.
SIM: "Sou alérgico a amendoim"
SIM: "Não posso subir escadas, preciso de quarto térreo"
NÃO: "O hotel não aceita pet" (é regra do hotel, não restrição do cliente)
NÃO: "Hoje vou comer só frutas" (preferência pontual, não restrição médica)
8. **vinculo_comercial** relação comercial/profissional declarada que afeta tratamento (funcionário de empresa parceira, influenciador, agente de viagem, desconto corporativo).
SIM: "Sou funcionário da Caixa, tenho desconto corp"
SIM: "Trabalho com turismo, venho avaliar o hotel"
NÃO: "Fez uma reserva para X" (é reserva, não vínculo comercial)
NÃO: "Já veio 3 vezes" (frequência não é vínculo comercial)
9. **contexto_pessoal** fato pessoal relevante que afeta o atendimento (profissão, local onde mora, situação de vida).
SIM: "Sou caminhoneiro, viajo sempre, preciso hospedagem rápida"
SIM: "Moro em Luziânia, venho no fim de semana"
NÃO: "Me chamo Rodrigo" (nome vai nos dados cadastrais, não é memória)
NÃO: "Informou CPF e email" (dados cadastrais, não memória)
NÃO: "Está interessado em reservar" (intenção da conversa, não perfil)
## REGRAS ABSOLUTAS (violação = FATO DESCARTADO)
1. **Evidência OBRIGATÓRIA**: cada fato precisa de um trecho LITERAL da conversa. Se não tem trecho claro, não extraia.
2. **Perguntas/dúvidas NÃO são reclamação nem memória**: se o cliente fez uma pergunta ("tem X?", "aceita Y?"), isso é informação que ele queria, não fato sobre ele.
3. **Cortesia genérica NÃO é feedback**: "obrigado", "tá bom", "ok" NÃO viram feedback_positivo.
4. **Aplicar a REGRA DE OURO de ação-consumada vs intenção-futura**: "informou CPF" nunca é memória (é cadastro). "Escolheu X" ou "Reservou X em tal data" vira `padrao_comportamental` se a ação foi efetivamente CONSUMADA nesta conversa (Pix confirmado, cliente disse "pode marcar"+ bot confirmou, ou registro de estadia passada). Discussão/intenção sem fechamento = NÃO EXTRAIA.
5. **Ações do atendente NÃO são memória do cliente**: se o bot "incentivou X" ou "ofereceu Y", isso descreve o atendente, não o cliente. Ignore.
6. **Máximo 5 fatos por conversa**. Se dúvida entre extrair ou não, DESCARTE. Qualidade > quantidade.
7. **Se a conversa não tem NADA realmente memorável**, retorne `{"facts": []}`. Isso é o comportamento normal e esperado da maioria das conversas transacionais.
## FORMATO DE SAÍDA
JSON: `{"facts": [{...}, ...]}` onde cada fato tem:
- `memory_type`: um dos 9 tipos acima
- `content`: frase curta em português, 3ª pessoa ("Prefere Stilo com hidro"), max 1000 chars
- `evidence`: trecho LITERAL da conversa que prova o fato (copiar aspas do cliente)
- `confidence`: 0.0 a 1.0 (use 0.9 se for totalmente explícito, 0.7-0.89 se for forte inferência, <0.7 descarte)
- `scope`: `global` na maioria dos casos. Use `unit:<id>` apenas para reclamação/feedback sobre algo específico de UMA unidade.
## CONVERSA A ANALISAR
**Data de referência desta conversa:** #{conversation_reference_date}
(use essa data em toda memória de escolha do tipo `padrao_comportamental`)
#{formatted_messages}
Retorne JSON puro, nada além disso.
PROMPT
end
# Date of the conversation, used as the temporal reference the LLM must embed
# in padrao_comportamental memories. Falls back to now if somehow no message.
def conversation_reference_date
last = @conversation.messages.where(private: false).maximum(:created_at)
(last || Time.current).strftime('%d/%m/%Y')
end
# Feeds the LLM extractor. MUST exclude:
# - private: true (internal agent-to-agent notes — never seen by the guest; privacy leak if extracted)
# - failed status (outbound messages that never reached the guest — extracting from them is dishonest)
def formatted_messages
scope = @conversation.messages
.where(message_type: [:incoming, :outgoing], private: false)
.where.not(status: :failed)
.order(created_at: :asc)
limited_messages(scope).map { |m| "[#{m.message_type}] #{m.content}" }.join("\n")
end
def limited_messages(scope)
all = scope.to_a
return all if all.sum { |m| m.content.to_s.length } <= MAX_CHARS
# keep most recent messages, drop oldest until under cap
kept = []
total = 0
all.reverse_each do |msg|
len = msg.content.to_s.length
break if total + len > MAX_CHARS
kept.unshift(msg)
total += len
end
kept
end
def normalize(raw_fact)
type = raw_fact['memory_type'].to_s
content = raw_fact['content'].to_s.strip
evidence = raw_fact['evidence'].to_s.strip
confidence = raw_fact['confidence'].to_f
raw_scope = raw_fact['scope'].to_s.presence || 'global'
scope = valid_scope?(raw_scope) ? raw_scope : 'global'
return nil unless Captain::ContactMemory::MEMORY_TYPES.include?(type)
return nil if content.blank? || evidence.blank?
return nil if confidence < MIN_CONFIDENCE
{
memory_type: type,
content: content.truncate(1000),
evidence: evidence,
confidence: confidence,
scope: scope
}
end
def valid_scope?(value)
SCOPE_PATTERN.match?(value)
end
end
# rubocop:enable Metrics/ClassLength