1. Propósito e Escopo
Este documento define todos os prompts, configurações de memória, transição entre estados, ferramentas como chamadas a sistemas externos e demais requisitos funcionais para o Agente de IA para Padronização de Relatórios de Crédito. Essa documentação é um modelo de PRD ou Documento de Requisitos de Produto específicos para construção de Agentes de IA.
O objetivo deste agente é transformar dados financeiros de múltiplas fontes em relatórios padronizados para análise de crédito, garantindo consistência, precisão e eficiência no processo de geração de relatórios.
2. Contexto e Problema
Cenário Atual
Atualmente, a falta de padronização nos relatórios de crédito é um desafio significativo devido à diversidade de fontes de dados. Os processos manuais de compilação de relatórios financeiros são demorados e propensos a erros.
Problemas Identificados
- Falta de padronização: A diversidade de fontes de dados resulta em relatórios de crédito inconsistentes.
- Processos manuais: A compilação manual de relatórios financeiros é demorada e suscetível a erros.
3. Impactos Esperados
A implementação deste agente de IA visa alcançar os seguintes resultados:
- Aumento da eficiência: Automatizar a geração de relatórios de crédito para aumentar a eficiência.
- Consistência e precisão: Garantir a consistência e precisão dos dados em todos os relatórios gerados.
4. Visão Geral da Solução
O agente de IA para padronização de relatórios de crédito processa dados financeiros de múltiplas fontes, aplica regras de padronização e gera relatórios consistentes e precisos para análise de crédito. A seguir são detalhadas todas as regras de negócio e especificações funcionais necessárias para que esse agente atue como um assistente útil e autônomo na padronização de relatórios de crédito.
A solução consiste em um fluxo de automação composto por 4 agentes de IA. O processo inicia com a padronização e mapeamento de dados financeiros e termina com a geração de um relatório de crédito padronizado.
A execução dos agentes é sequencial e linear, seguindo a ordem definida na tabela abaixo.
| Agentes | Função Principal |
|---|---|
Agente de Padronização e Mapeamento de Dados Financeiros (RF 1)
| Unificar e normalizar dados financeiros heterogêneos em um esquema canônico consistente para análise de crédito. |
Agente de Validação de Consistência e Qualidade de Dados (RF 2)
| Avaliar a integridade, consistência e suficiência analítica do dataset padronizado antes do cálculo de risco. |
Agente de Cálculo de Indicadores de Risco de Crédito (RF 3)
| Calcular métricas padronizadas de risco e capacidade de pagamento a partir do dataset validado. |
Agente de Geração de Relatórios de Crédito (RF 4)
| Produzir relatório de crédito padronizado e pronto para consumo humano e sistêmico. |
5. Protótipos
Para proporcionar uma visão clara e tangível da solução proposta, criamos protótipos interativos que demonstram tanto o fluxo de trabalho dos agentes quanto o resultado final que o cliente receberá. Explore os links abaixo para entender melhor a solução em ação.
6. Requisitos Funcionais
RF 1. Agente de Padronização e Mapeamento de Dados Financeiros
1.1 Tarefa do Agente
Unificar e normalizar dados financeiros heterogêneos em um esquema canônico consistente para análise de crédito.
1.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais
Você está recebendo uma lista de payloads financeiros oriundos de múltiplas fontes. Cada item contém: {source_name, ingestion_timestamp, currency, locale, customer_identifiers (CPF/CNPJ/ID interno), raw_records[], data_dictionary quando disponível}.
# 2. Objetivo
Unificar e normalizar esses dados em um esquema canônico consistente para análise de crédito.
# 3. Regras que você deve seguir para gerar sua resposta
- Defina o schema canônico explicitamente e mapeie cada campo de origem para o canônico; quando um campo não existir na origem, atribua null e registre mapping_log.
- Normalização de moeda: converta todos os valores monetários para a currency dominante do dataset (se múltiplas, use a primeira por frequência).
- Datas: padronize em YYYY-MM-DD.
- Números: remova separadores locais, interprete locale para decimal; valores negativos em despesas devem ser convertidos para positivos.
- Pessoa Física vs Jurídica: infira person_type por formato do identificador.
- Deduplicação: agregue registros por customer_id + reference_date.
- Preencha currency como ISO-4217.
- Inclua data_quality_summary com contagens e percentuais de ausência por campo. 1.3 Configurações do Agente
1.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente é o ponto de partida do fluxo e deve ser acionado pelo envio de dados financeiros via API. Na fase de testes, o fluxo será iniciado pelo envio manual dos dados, que serão enviados para o agente diretamente por upload de um arquivo csv na interface da Prototipe AI, para acelerar o processo de validação.
- Tipo do input: Lista de payloads financeiros oriundos de múltiplas fontes.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs nos formatos:
.csv,.json. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de texto com até 100.000 caracteres.
1.3.2 Especificação do Output
- Formato de output: O output deve ser um arquivo JSON contendo o esquema canônico padronizado.
-
Exemplo de Estrutura de Output:
{"canonical_schema": {"customer_id": "string", "person_type": "PF|PJ", "income_gross": "number", "income_net": "number", "expenses_total": "number", "loan_amount": "number", "interest_rate_annual": "number", "term_months": "integer", "installment_amount": "number", "open_debts_total": "number", "open_debts_count": "integer", "payment_history": "array", "collateral_value": "number", "currency": "ISO-4217", "reference_date": "YYYY-MM-DD"}, "standardized_records": [...], "mapping_log": [...], "normalization_log": [...], "data_quality_summary": {"records_input": 0, "records_output": 0, "fields_missing_rate": {}, "deduplications": 0}, "acceptance_preread_flag": "true|false"} - Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em torno de 10.000 caracteres.
1.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
1.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
1.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Validação de Consistência e Qualidade de Dados (RF 2).
1.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Validação de Consistência e Qualidade de Dados (RF 2).
RF 2. Agente de Validação de Consistência e Qualidade de Dados
2.1 Tarefa do Agente
Avaliar a integridade, consistência e suficiência analítica do dataset padronizado antes do cálculo de risco.
2.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo um objeto padronizado contendo canonical_schema, standardized_records[], mapping_log[], normalization_log[], data_quality_summary e acceptance_preread_flag. # 2. Objetivo Avaliar a integridade, consistência e suficiência analítica do dataset padronizado antes do cálculo de risco. # 3. Regras que você deve seguir para gerar sua resposta - Completeness: falhe se missing_rate de income_net E income_gross for > 0.5 simultaneamente; passe se pelo menos um tiver missing_rate <= 0.5. - Coerência de valores: income_net <= income_gross quando ambos presentes. - Limites plausíveis: interest_rate_annual entre -0.05 e 5.0. - Integridade de dívida: se open_debts_total < 0 marque fail para o registro. - Histórico de pagamento: se payment_history ausente, gere warning. - Proporção de outliers: se mais de 10% dos registros tiverem interest_rate_annual > 100% a.a., marque blocking_issues. - Respeite acceptance_preread_flag do agente anterior. - Produza dq_report detalhando cada check com name, status, value, threshold e recomendação.
2.3 Configurações do Agente
2.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 1).
- Tipo do input: Objeto padronizado contendo canonical_schema, standardized_records[], mapping_log[], normalization_log[], data_quality_summary e acceptance_preread_flag.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 10.000 caracteres.
2.3.2 Especificação do Output
- Formato de output: O output deve ser um JSON contendo standardized_records, dq_report e acceptance_flag.
-
Exemplo de Estrutura de Output:
{"standardized_records": [...], "dq_report": {"checks": [{"name": "missing_rate_income_net", "status": "pass|fail", "value": 0.12, "threshold": 0.2}], "blocking_issues": [], "warnings": []}, "acceptance_flag": "true|false"} - Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em torno de 5.000 caracteres.
2.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
2.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
2.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Cálculo de Indicadores de Risco de Crédito (RF 3).
2.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Cálculo de Indicadores de Risco de Crédito (RF 3).
RF 3. Agente de Cálculo de Indicadores de Risco de Crédito
3.1 Tarefa do Agente
Calcular métricas padronizadas de risco e capacidade de pagamento a partir do dataset validado.
3.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo standardized_records filtrados como válidos e dq_report com acceptance_flag=true. # 2. Objetivo Calcular métricas padronizadas de risco e capacidade de pagamento a partir do dataset validado. # 3. Regras que você deve seguir para gerar sua resposta - Definições: DTI = (open_debts_total) / max(income_net, income_gross*0.8 quando net ausente). - Alavancagem: leverage = (open_debts_total + loan_amount) / max(income_12m, income_net*12). - Cobertura: coverage_ratio = income_net / max(expenses_total, installment_amount). - Inadimplência: delinquency_ratio_12m = (# de status != 'on_time' nos últimos 12 meses) / 12. - Garantia: collateral_ltv = loan_amount / collateral_value. - Bandas de risco: A (dti<=0.3 e delinquency<=0.05); B (dti<=0.4 e delinquency<=0.1); C (dti<=0.5 e delinquency<=0.2); D (dti<=0.6 ou delinquency<=0.3); E (caso contrário). - Arredondamento: apresente métricas com 2 casas decimais. - Rationale: explique em uma frase os fatores que mais contribuíram para a banda.
3.3 Configurações do Agente
3.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 2).
- Tipo do input: Standardized_records filtrados como válidos e dq_report com acceptance_flag=true.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 10.000 caracteres.
3.3.2 Especificação do Output
- Formato de output: O output deve ser um JSON contendo risk_metrics e computation_notes.
-
Exemplo de Estrutura de Output:
{"risk_metrics": [{"customer_id": "string", "dti": 0.35, "leverage": 1.8, "installment_to_income": 0.25, "coverage_ratio": 2.1, "delinquency_ratio_12m": 0.08, "collateral_ltv": 0.6, "risk_band": "A|B|C|D|E", "rationale": "string"}], "computation_notes": []} - Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em torno de 5.000 caracteres.
3.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
3.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
3.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Geração de Relatórios de Crédito (RF 4).
3.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Geração de Relatórios de Crédito (RF 4).
RF 4. Agente de Geração de Relatórios de Crédito
4.1 Tarefa do Agente
Produzir relatório de crédito padronizado e pronto para consumo humano e sistêmico, com indicadores, avaliação e recomendações.
4.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo risk_metrics calculados, standardized_records válidos e dq_report. # 2. Objetivo Produzir relatório de crédito padronizado e pronto para consumo humano e sistêmico. # 3. Regras que você deve seguir para gerar sua resposta - Estruture o relatório com seções fixas: header, customer_summary, financial_indicators, risk_assessment, recommendation, data_quality, appendix. - Header: inclua generated_at em ISO-8601, owner = 'Cheila Portela' e version do template. - Customer_summary: apresente identificação mascarada. - Financial_indicators: liste dti, leverage, installment_to_income, coverage_ratio, delinquency_ratio_12m, collateral_ltv com 2 casas decimais. - Risk_assessment: traga risk_band e rationale do cálculo. - Recomendação automática: APROVAR se banda A e coverage_ratio>=1.2. - Data_quality: inclua resumo de dq_report. - Appendix: inclua até 10 entradas ilustrativas de mapping_log e normalization_log. - Mensagens e linguagem: objetiva e neutra; inclua disclaimer.
4.3 Configurações do Agente
4.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 3).
- Tipo do input: Risk_metrics calculados, standardized_records válidos e dq_report.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 15.000 caracteres.
4.3.2 Especificação do Output
- Formato de output: O output deve ser um JSON contendo o relatório de crédito padronizado.
-
Exemplo de Estrutura de Output:
{"report": {"header": {"generated_at": "ISO-8601", "owner": "Cheila Portela", "version": "v1.0"}, "customer_summary": {...}, "financial_indicators": {...}, "risk_assessment": {"risk_band": "A-E", "rationale": "string"}, "recommendation": {"decision": "APROVAR|APROVAR_COM_CONDICOES|REPROVAR", "conditions": ["string"]}, "data_quality": {...}, "appendix": {"mapping_log_excerpt": [...]}}, "report_format": "json+markdown", "status": "emitido|nao_emitido"} - Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em torno de 10.000 caracteres.
4.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
4.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
4.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente é o entregável final e não é passada para outros agentes internos.
4.3.6 Regras de Orquestração e Transição
A execução deste agente finaliza o fluxo. O relatório gerado é o resultado que deve ser disponibilizado ao usuário.