# Plano de Evolução do Capitão (Jasmine): De Assistente a Ecossistema **Data:** 06/01/2026 **Arquiteto:** Gemini (Senior Architect Mode) **Status:** Em Execução (Fase de Estabilidade) --- ## 1. Objetivo Principal Transformar o "Capitão" de um robô reativo em um **Ecossistema de Atendimento Inteligente**, focado em **Consistência de Marca (Jasmine)**, **Zero Alucinação** e **Eficiência Operacional**. --- ## 2. O que já Concluímos (Fundação) - [x] **Consciência Temporal:** O agente agora sabe a data, dia da semana e hora exata no fuso de Brasília. - [x] **Arquitetura de Delegação (Supervisor Pattern):** - A Jasmine é a orquestradora única. - Sub-agentes (Daniela, Maria, Jamile) operam como "Departamentos Internos" acessados via ferramentas (`consultar_...`). - **Motivo:** Evita a quebra de tom de voz e permite roteamento dinâmico entre vários especialistas em uma única conversa. - [x] **Humanização de Interface:** - Simulação de digitação adaptativa (50ms por caractere). - Ativação do status "Digitando..." no Chatwoot. - [x] **Camada de Segurança (Sentimento):** - Identificação de raiva/frustração no JSON de resposta. - Toggle no Frontend para ativar Handoff Automático para humanos em casos críticos. - [x] **Sanitização de API:** Proteção contra chaves corrompidas e fallback de erros amigáveis. --- ## 3. Próximos Passos (O Roadmap) ### Fase 1: Zero Alucinação (Strict RAG) - **Implementação:** Injetar um "Confidence Score" no retorno da busca de documentos. - **Regra de Ouro:** Se a similaridade for inferior a 0.7, a IA é proibida de afirmar fatos. Ela deve usar o fallback: *"Não localizei essa informação específica agora, vou confirmar com o gerente para você"*. - **Risco:** Tornar o robô muito "travado". Precisamos calibrar o threshold. ### Fase 2: Memória de Longo Prazo (Fact Extraction) - **Implementação:** Um serviço pós-conversa que lê o chat e extrai fatos (ex: "O cliente prefere suíte com Alexa", "Aniversário em 10/05"). - **Ação:** Salvar esses dados automaticamente nos `Custom Attributes` do contato. - **Benefício:** Na próxima conversa, a Jasmine já saúda o cliente com: *"Oi João, que bom te ver de novo! Quer aquela suíte Alexa que você gosta?"*. ### Fase 3: Roteamento Proativo - **Implementação:** Melhorar o orquestrador para que ele possa consultar dois departamentos antes de responder. - **Exemplo:** *"Vou ver as fotos com a Maria e os preços com a Daniela e já te mando tudo"*. --- ## 4. Análise de Riscos e Mitigação 1. **Latência (Risco de Performance):** - *Problema:* O modelo de Delegação (Jasmine pergunta para Daniela) dobra o tempo de resposta. - *Mitigação:* Usar modelos mais rápidos (GPT-4o-mini ou Gemini Flash) para os sub-agentes e o modelo robusto (GPT-4o) apenas para a orquestradora. 2. **Custo de Tokens:** - *Problema:* Injetar muitos blocos de contexto (Tabela de Preços) em todas as mensagens aumenta o custo. - *Mitigação:* Implementar cache de contexto ou usar busca vetorial (RAG) até para os preços, em vez de prompt fixo. 3. **Perda de Contexto no Handoff Interno:** - *Problema:* A Daniela pode não saber o que o cliente disse para a Jasmine. - *Mitigação:* A ferramenta `consultar_...` deve enviar um resumo do chat atual para o sub-agente. --- ## 5. Como Validar a Evolução - **Testes de Regressão:** Usar o script `test_multi_agent_flow.rb` após cada mudança. - **Playground:** Validar visualmente o nome do agente que está sendo consultado. - **Shadow Mode:** Rodar a IA em modo "rascunho" antes de permitir que ela responda clientes reais (opcional).