1. Propósito e Escopo
Este documento define todos os prompts, configurações de memória, transição entre estados, ferramentas como chamadas a sistemas externos e demais requisitos funcionais para o Agente de IA para Previsão de Inadimplência. Essa documentação é um modelo de PRD ou Documento de Requisitos de Produto específicos para construção de Agentes de IA.
O objetivo principal é utilizar técnicas de aprendizado de máquina para analisar dados históricos e contextuais, permitindo prever a probabilidade de inadimplência em contratos de crédito e fornecer insights acionáveis para mitigar riscos de crédito.
2. Contexto e Problema
Cenário Atual
Atualmente, as instituições financeiras enfrentam dificuldades para prever a inadimplência de seus clientes devido à falta de previsibilidade e à análise ineficiente de grandes volumes de dados contextuais e históricos.
A previsão inadequada da inadimplência resulta em riscos financeiros significativos, afetando a rentabilidade e a estabilidade das instituições.
Problemas Identificados
- Falta de previsibilidade: Identificar potenciais inadimplentes com antecedência suficiente para mitigar riscos é um desafio constante.
- Análise ineficiente: A capacidade de processar e analisar grandes volumes de dados contextuais e históricos é limitada, o que afeta a precisão das previsões.
3. Impactos Esperados
A implementação deste agente de IA visa alcançar os seguintes resultados:
- Aumento da precisão na previsão de inadimplência, permitindo melhor gestão de riscos.
- Redução de perdas financeiras associadas a inadimplências não previstas.
- Otimização do processo de análise de dados contextuais e históricos, tornando-o mais eficiente.
4. Visão Geral da Solução
O agente de IA para previsão de inadimplência utiliza técnicas de aprendizado de máquina para analisar dados históricos e contextuais, prevendo a probabilidade de inadimplência e fornecendo insights acionáveis. A seguir são detalhadas todas as regras de negócio e especificações funcionais necessárias para que esse agente atue como um assistente útil e autônomo na previsão de inadimplência.
A solução consiste em um fluxo de automação composto por agentes de IA que realizam a padronização dos dados, engenharia de atributos, escoragem e geração de insights acionáveis.
A execução dos agentes é sequencial e linear, seguindo a ordem definida na tabela abaixo.
| Agentes | Função Principal |
|---|---|
Agente de Checagem e Padronização de Dados de Crédito (RF 1)
| Validar, higienizar e padronizar dados históricos e contextuais de contratos de crédito. |
Agente de Engenharia de Atributos de Risco de Crédito (RF 2)
| Derivar atributos informativos e estáveis para escoragem. |
Agente de Escoragem e Probabilidade de Inadimplência (RF 3)
| Gerar escore e probabilidade de inadimplência por contrato. |
Agente de Insights Acionáveis e Mitigação de Risco (RF 4)
| Produzir recomendações práticas para mitigar risco e consolidar insights de portfólio. |
5. Protótipos
Para proporcionar uma visão clara e tangível da solução proposta, criamos protótipos interativos que demonstram tanto o fluxo de trabalho dos agentes quanto os resultados esperados. Explore os links abaixo para entender melhor a solução em ação.
6. Requisitos Funcionais
RF 1. Agente de Checagem e Padronização de Dados de Crédito
1.1 Tarefa do Agente
Validar, higienizar e padronizar dados históricos e contextuais de contratos de crédito, preparando um dataset consistente para engenharia de atributos e escoragem.
1.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais
Você está recebendo um dataset tabular contendo informações de contratos de crédito. Este dataset deve ser validado, higienizado e padronizado para posterior análise.
# 2. Objetivo
Validar, higienizar e padronizar os dados recebidos, preparando um dataset consistente para engenharia de atributos e escoragem.
# 3. Regras que você deve seguir para gerar sua resposta
- Converter datas para ISO-8601 (YYYY-MM-DD).
- Normalizar separador decimal e remover símbolos monetários.
- Validar e ajustar valores conforme regras predefinidas (ex.: valor_contrato > 0, renda_mensal > 0).
- Imputar valores ausentes com base em medianas ou regras específicas.
- Aplicar winsorização para tratar outliers.
- Preservar id_contrato e id_cliente intactos.
# 4. Exemplo de Output que você deve produzir
{
"dataset_padronizado": [...],
"dicionario_variaveis": {...},
"data_quality_report": {...},
"imputacoes_aplicadas": [...]
} 1.3 Configurações do Agente
1.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente é o ponto de partida do fluxo e deve ser acionado pelo envio de um arquivo de dados de contratos de crédito via API. Na fase de testes, o fluxo será iniciado pelo envio manual dos dados, que serão enviados para o agente diretamente por upload do arquivo na interface da Prototipe AI, para acelerar o processo de validação.
- Tipo do input: O input inicial para o fluxo é um dataset tabular em CSV ou JSON Lines.
-
Formatos Suportados: Esse agente deve ser capaz de receber dados nos formatos:
.csv,.jsonl. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de texto com até 500.000 caracteres.
1.3.2 Especificação do Output
- Formato de output: O output deve ser um objeto JSON contendo o dataset padronizado, dicionário de variáveis, relatório de qualidade de dados e imputações aplicadas.
-
Exemplo de Estrutura de Output:
{ "dataset_padronizado": [...], "dicionario_variaveis": {...}, "data_quality_report": {...}, "imputacoes_aplicadas": [...] } - Número de caracteres esperado: O JSON gerado deve ser claro e bem estruturado, com um tamanho estimado em 20.000 caracteres.
1.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.5
1.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Utiliza lógica interna para cálculos de normalização e tratamento de dados.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
1.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Engenharia de Atributos de Risco de Crédito (RF 2).
1.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Engenharia de Atributos de Risco de Crédito (RF 2).
RF 2. Agente de Engenharia de Atributos de Risco de Crédito
2.1 Tarefa do Agente
Derivar atributos informativos e estáveis a partir do dataset padronizado, reduzindo ruído e preparando um conjunto de variáveis explicáveis para escoragem.
2.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais
Você está recebendo um dataset padronizado que contém informações de contratos de crédito. A partir desse dataset, você deve derivar atributos informativos e estáveis.
# 2. Objetivo
Derivar atributos informativos e estáveis a partir do dataset padronizado, reduzindo ruído e preparando um conjunto de variáveis explicáveis para escoragem.
# 3. Regras que você deve seguir para gerar sua resposta
- Calcular atributos como parcela_estimada, comprometimento_renda, divida_renda, entre outros.
- Aplicar codificações categóricas e binning para estabilidade.
- Garantir que nenhuma variável derivada inclua informações posteriores à concessão do crédito.
- Substituir infinitos por limites predefinidos e imputar ausentes com valores conservadores.
# 4. Exemplo de Output que você deve produzir
{
"dataset_features": [...],
"dicionario_features": {...},
"transformacoes_aplicadas": [...],
"avaliacao_univariada": {...}
} 2.3 Configurações do Agente
2.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 1).
- Tipo do input: Este agente deve ser apto a receber um dataset padronizado em formato JSON.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 200.000 caracteres.
2.3.2 Especificação do Output
- Formato de output: O output deve ser um objeto JSON contendo o dataset com novos atributos, dicionário de features, transformações aplicadas e avaliação univariada.
-
Exemplo de Estrutura de Output:
{ "dataset_features": [...], "dicionario_features": {...}, "transformacoes_aplicadas": [...], "avaliacao_univariada": {...} } - Número de caracteres esperado: O JSON gerado deve ser claro e bem estruturado, com um tamanho estimado em 25.000 caracteres.
2.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.5
2.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Utiliza lógica interna para cálculos de derivação de atributos.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
2.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Escoragem e Probabilidade de Inadimplência (RF 3).
2.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Escoragem e Probabilidade de Inadimplência (RF 3).
RF 3. Agente de Escoragem e Probabilidade de Inadimplência
3.1 Tarefa do Agente
Gerar escore (0-1000) e probabilidade de inadimplência (0-1) por contrato, com faixas de risco e justificativas principais.
3.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais
Você está recebendo um conjunto de dados com atributos derivados para contratos de crédito. A partir desses dados, você deve calcular a probabilidade de inadimplência e gerar escores de risco.
# 2. Objetivo
Gerar escore (0-1000) e probabilidade de inadimplência (0-1) por contrato, com faixas de risco e justificativas principais.
# 3. Regras que você deve seguir para gerar sua resposta
- Calcular score bruto usando soma ponderada de componentes como comprometimento_renda, divida_renda, entre outros.
- Transformar o score bruto em probabilidade de inadimplência utilizando função sigmoide.
- Calibrar probabilidade pelo base_rate e gerar escore final.
- Classificar contratos em bandas de risco e identificar principais drivers de risco.
# 4. Exemplo de Output que você deve produzir
{
"previsoes": [...],
"parametros_utilizados": {...},
"resumo_portfolio": {...}
} 3.3 Configurações do Agente
3.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 2).
- Tipo do input: Este agente deve ser apto a receber um conjunto de dados com atributos derivados em formato JSON.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 150.000 caracteres.
3.3.2 Especificação do Output
- Formato de output: O output deve ser um objeto JSON contendo previsões de inadimplência, parâmetros utilizados e resumo do portfólio.
-
Exemplo de Estrutura de Output:
{ "previsoes": [...], "parametros_utilizados": {...}, "resumo_portfolio": {...} } - Número de caracteres esperado: O JSON gerado deve ser claro e bem estruturado, com um tamanho estimado em 20.000 caracteres.
3.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.5
3.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Utiliza lógica interna para cálculos de escoragem e probabilidade.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
3.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Insights Acionáveis e Mitigação de Risco (RF 4).
3.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Insights Acionáveis e Mitigação de Risco (RF 4).
RF 4. Agente de Insights Acionáveis e Mitigação de Risco
4.1 Tarefa do Agente
Produzir recomendações práticas para mitigar risco por contrato e consolidar insights de portfólio.
4.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais
Você está recebendo previsões de inadimplência por contrato e um conjunto de dados com atributos derivados. A partir desses dados, você deve produzir recomendações práticas para mitigar riscos.
# 2. Objetivo
Produzir recomendações práticas para mitigar risco por contrato e consolidar insights de portfólio.
# 3. Regras que você deve seguir para gerar sua resposta
- Produzir recomendações baseadas nas bandas de risco e nos principais drivers de cada contrato.
- Identificar alertas de compliance e consolidar insights gerais do portfólio.
- Calcular concentração de alta inadimplência esperada por produto, segmento_cliente e uf.
# 4. Exemplo de Output que você deve produzir
{
"insights_por_contrato": [...],
"insights_portfolio": {...}
} 4.3 Configurações do Agente
4.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 3).
- Tipo do input: Este agente deve ser apto a receber previsões de inadimplência e dados de atributos derivados em formato JSON.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 150.000 caracteres.
4.3.2 Especificação do Output
- Formato de output: O output deve ser um objeto JSON contendo insights por contrato e insights de portfólio.
-
Exemplo de Estrutura de Output:
{ "insights_por_contrato": [...], "insights_portfolio": {...} } - Número de caracteres esperado: O JSON gerado deve ser claro e bem estruturado, com um tamanho estimado em 25.000 caracteres.
4.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.5
4.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Utiliza lógica interna para cálculos de insights e recomendações.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
4.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente é o entregável final e não é passada para outros agentes internos.
4.3.6 Regras de Orquestração e Transição
A execução deste agente finaliza o fluxo. Os insights gerados são o resultado que deve ser disponibilizado ao usuário.