3.6 KiB
3.6 KiB
Plano de Evolução do Capitão (Jasmine): De Assistente a Ecossistema
Data: 06/01/2026 Arquiteto: Gemini (Senior Architect Mode) Status: Em Execução (Fase de Estabilidade)
1. Objetivo Principal
Transformar o "Capitão" de um robô reativo em um Ecossistema de Atendimento Inteligente, focado em Consistência de Marca (Jasmine), Zero Alucinação e Eficiência Operacional.
2. O que já Concluímos (Fundação)
- Consciência Temporal: O agente agora sabe a data, dia da semana e hora exata no fuso de Brasília.
- Arquitetura de Delegação (Supervisor Pattern):
- A Jasmine é a orquestradora única.
- Sub-agentes (Daniela, Maria, Jamile) operam como "Departamentos Internos" acessados via ferramentas (
consultar_...). - Motivo: Evita a quebra de tom de voz e permite roteamento dinâmico entre vários especialistas em uma única conversa.
- Humanização de Interface:
- Simulação de digitação adaptativa (50ms por caractere).
- Ativação do status "Digitando..." no Chatwoot.
- Camada de Segurança (Sentimento):
- Identificação de raiva/frustração no JSON de resposta.
- Toggle no Frontend para ativar Handoff Automático para humanos em casos críticos.
- Sanitização de API: Proteção contra chaves corrompidas e fallback de erros amigáveis.
3. Próximos Passos (O Roadmap)
Fase 1: Zero Alucinação (Strict RAG)
- Implementação: Injetar um "Confidence Score" no retorno da busca de documentos.
- Regra de Ouro: Se a similaridade for inferior a 0.7, a IA é proibida de afirmar fatos. Ela deve usar o fallback: "Não localizei essa informação específica agora, vou confirmar com o gerente para você".
- Risco: Tornar o robô muito "travado". Precisamos calibrar o threshold.
Fase 2: Memória de Longo Prazo (Fact Extraction)
- Implementação: Um serviço pós-conversa que lê o chat e extrai fatos (ex: "O cliente prefere suíte com Alexa", "Aniversário em 10/05").
- Ação: Salvar esses dados automaticamente nos
Custom Attributesdo contato. - Benefício: Na próxima conversa, a Jasmine já saúda o cliente com: "Oi João, que bom te ver de novo! Quer aquela suíte Alexa que você gosta?".
Fase 3: Roteamento Proativo
- Implementação: Melhorar o orquestrador para que ele possa consultar dois departamentos antes de responder.
- Exemplo: "Vou ver as fotos com a Maria e os preços com a Daniela e já te mando tudo".
4. Análise de Riscos e Mitigação
-
Latência (Risco de Performance):
- Problema: O modelo de Delegação (Jasmine pergunta para Daniela) dobra o tempo de resposta.
- Mitigação: Usar modelos mais rápidos (GPT-4o-mini ou Gemini Flash) para os sub-agentes e o modelo robusto (GPT-4o) apenas para a orquestradora.
-
Custo de Tokens:
- Problema: Injetar muitos blocos de contexto (Tabela de Preços) em todas as mensagens aumenta o custo.
- Mitigação: Implementar cache de contexto ou usar busca vetorial (RAG) até para os preços, em vez de prompt fixo.
-
Perda de Contexto no Handoff Interno:
- Problema: A Daniela pode não saber o que o cliente disse para a Jasmine.
- Mitigação: A ferramenta
consultar_...deve enviar um resumo do chat atual para o sub-agente.
5. Como Validar a Evolução
- Testes de Regressão: Usar o script
test_multi_agent_flow.rbapós cada mudança. - Playground: Validar visualmente o nome do agente que está sendo consultado.
- Shadow Mode: Rodar a IA em modo "rascunho" antes de permitir que ela responda clientes reais (opcional).