1. Propósito e Escopo
Este documento define todos os prompts, configurações de memória, transição entre estados e demais requisitos funcionais para o Agente de IA para Padronização de Dados Administrativos. Essa documentação é um modelo de PRD ou Documento de Requisitos de Produto específico para construção de Agentes de IA.
O objetivo principal deste agente é organizar e padronizar dados administrativos de pronto atendimento, facilitando a geração de relatórios precisos e análises detalhadas.
2. Contexto e Problema
Atualmente, os dados administrativos de pronto atendimento estão desorganizados, o que dificulta a geração de relatórios e análises. A falta de padronização compromete a clareza e a utilidade dos dados, tornando o processo de análise mais demorado e propenso a erros.
- Dados administrativos desorganizados que dificultam a geração de relatórios e análises.
- Necessidade de padronização para melhorar a clareza e a utilidade dos dados.
3. Impactos Esperados
A implementação deste agente de IA visa alcançar os seguintes resultados:
- Organização contínua dos dados administrativos para facilitar a análise e a geração de relatórios.
- Padronização dos dados para garantir conformidade com padrões e normas.
- Redução de erros e inconsistências nos dados processados.
4. Visão Geral da Solução
O agente de IA para padronização de dados administrativos organiza e padroniza dados de pronto atendimento, aplicando regras de conformidade e facilitando a geração de relatórios e análises. A seguir são detalhadas todas as regras de negócio e especificações funcionais necessárias para que esse agente atue como um assistente útil e autônomo na padronização de dados administrativos.
A solução consiste em um fluxo de automação composto por 4 agentes de IA. O processo inicia com a leitura e profiling dos dados, seguida pela especificação de esquema alvo e mapeamento, a padronização e normalização, e finaliza com a validação, deduplicação e geração do relatório final.
| Agentes | Função Principal |
|---|---|
Agente de Leitura e Profiling dos Dados (RF 1)
| Ingerir arquivos administrativos, identificar cabeçalhos, tipos de dados e anomalias. |
Agente de Especificação de Esquema Alvo e Mapeamento (RF 2)
| Definir o esquema de dados padronizado e instruções de mapeamento. |
Agente de Padronização e Normalização (RF 3)
| Aplicar o mapeamento definido, normalizar formatos e produzir dataset padronizado. |
Agente de Validação, Deduplicação e Relatório Final (RF 4)
| Executar checagens de qualidade, resolver duplicidades e gerar saída final para relatórios. |
5. Protótipos
Para proporcionar uma visão clara e tangível da solução proposta, criamos protótipos interativos que demonstram tanto o fluxo de trabalho dos agentes quanto o resultado final que o cliente receberá. Explore os links abaixo para entender melhor a solução em ação.
6. Requisitos Funcionais
RF 1. Agente de Leitura e Profiling dos Dados
1.1 Tarefa do Agente
Ingerir arquivos administrativos (CSV/XLSX), identificar cabeçalhos, tipos de dados e anomalias, produzindo perfil e esquema inferido.
1.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais
Você está recebendo arquivos administrativos em formatos CSV ou XLSX. Estes arquivos contêm dados de pronto atendimento que precisam ser organizados e padronizados.
# 2. Objetivo
Ingerir os arquivos, identificar cabeçalhos, tipos de dados e anomalias, e produzir um perfil e esquema inferido.
# 3. Regras que você deve seguir para gerar sua resposta
- Detecte cabeçalho: se múltiplas linhas candidatas existirem, escolha a primeira linha com maior proporção de strings distintas e sem números majoritários.
- Tipos possíveis por coluna: ['string','integer','decimal','date','datetime','boolean','categorical']. Atribua tipo_inferido pelo maior suporte consistente.
- Datas: reconheça formatos comuns (dd/mm/aaaa, mm/dd/aaaa, aaaa-mm-dd, dd-mm-aaaa).
- Valores ausentes: trate como nulos os tokens ['', 'NA', 'N/A', 'null', '-', '--', 's/d', 'sem dado'].
- Valores fora de tipo: conte como outliers_de_tipo e exemplifique até 5 ocorrências por coluna.
- Cardinalidade: registre total_distinto e top_10_valores por coluna categórica.
- Linhas vazias: descarte linhas onde 90%+ das colunas são nulas.
- Abas múltiplas: processe cada aba separadamente.
# 4. Exemplo de Output que você deve produzir
{
"dataset_bruto": [ ... ],
"inferred_schema": [ ... ],
"data_profile": [ ... ],
"issues_iniciais": [ ... ]
} 1.3 Configurações do Agente
1.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente é o ponto de partida do fluxo e deve ser acionado pelo envio de arquivos CSV ou XLSX via API. Na fase de testes, o fluxo será iniciado pelo envio manual dos dados, que serão enviados para o agente diretamente por upload na interface da Prototipe AI, para acelerar o processo de validação.
- Tipo do input: Arquivos CSV ou planilhas Excel contendo dados administrativos de pronto atendimento.
-
Formatos Suportados: Esse agente deve ser capaz de receber arquivos nos formatos:
.csv,.xlsx. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 100.000 caracteres.
1.3.2 Especificação do Output
- Formato de output: O output deve ser um objeto JSON contendo o dataset bruto, o esquema inferido, o perfil dos dados e as questões iniciais detectadas.
-
Exemplo de Estrutura de Output:
{ "dataset_bruto": [ ... ], "inferred_schema": [ ... ], "data_profile": [ ... ], "issues_iniciais": [ ... ] } - Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em 5.000 caracteres.
1.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
1.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
1.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Especificação de Esquema Alvo e Mapeamento (RF 2).
1.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Especificação de Esquema Alvo e Mapeamento (RF 2).
RF 2. Agente de Especificação de Esquema Alvo e Mapeamento
2.1 Tarefa do Agente
Definir o esquema de dados padronizado e instruções de mapeamento a partir do perfil e do esquema inferido.
2.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais
Você está recebendo o esquema inferido, o perfil dos dados e as questões iniciais detectadas pelo agente anterior.
# 2. Objetivo
Definir o esquema de dados padronizado e instruções de mapeamento a partir do perfil e do esquema inferido.
# 3. Regras que você deve seguir para gerar sua resposta
- Target_schema mínimo recomendado: ['id_registro', 'data_atendimento', 'hora_atendimento', 'unidade', 'setor', 'tipo_atendimento', 'status', 'responsavel', 'observacoes', 'data_registro'].
- Nomes canônicos: use snake_case, sem acentos.
- Tipos alvo: ['string','integer','decimal','date','datetime','boolean','categorical'].
- Defina mapping_instructions para cada coluna de origem.
- Categorias padrão: para 'status' use {'aberto','em_andamento','concluido','cancelado','pendente'}.
# 4. Exemplo de Output que você deve produzir
{
"target_schema": [ ... ],
"mapping_instructions": [ ... ],
"categorias_padrao": [ ... ],
"chaves_tecnicas": [ ... ],
"politicas_nulos": [ ... ]
} 2.3 Configurações do Agente
2.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão bem-sucedida do agente anterior (RF 1).
- Tipo do input: Este agente deve ser apto a receber como input o esquema inferido, o perfil dos dados e as questões iniciais detectadas pelo agente anterior.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json(JSON). - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 6.000 caracteres.
2.3.2 Especificação do Output
- Formato de output: O output deve ser um objeto JSON contendo o target_schema, as mapping_instructions, as categorias_padrao, as chaves_tecnicas e as politicas_nulos.
-
Exemplo de Estrutura de Output:
{ "target_schema": [ ... ], "mapping_instructions": [ ... ], "categorias_padrao": [ ... ], "chaves_tecnicas": [ ... ], "politicas_nulos": [ ... ] } - Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em 4.000 caracteres.
2.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
2.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
2.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Padronização e Normalização (RF 3).
2.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Padronização e Normalização (RF 3).
RF 3. Agente de Padronização e Normalização
3.1 Tarefa do Agente
Aplicar o mapeamento definido, normalizar formatos e produzir dataset padronizado pronto para validação.
3.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais
Você está recebendo o dataset bruto, o target_schema e as mapping_instructions do agente anterior.
# 2. Objetivo
Aplicar o mapeamento definido, normalizar formatos e produzir dataset padronizado pronto para validação.
# 3. Regras que você deve seguir para gerar sua resposta
- Padronize 'unidade' e 'setor' em Title Case.
- Converta datas válidas para 'yyyy-mm-dd'.
- Normalize horas para 'HH:MM' 24h.
- Aceite {'sim','não','nao','true','false','1','0'} para booleanos.
- Aplique equivalências definidas em categorias_padrao.
# 4. Exemplo de Output que você deve produzir
{
"standardized_dataset": [ ... ],
"normalization_log": [ ... ],
"registros_rejeitados": [ ... ],
"padronizacao_realizada": "sim",
"normalizacoes_aplicadas": [ ... ]
} 3.3 Configurações do Agente
3.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão bem-sucedida do agente anterior (RF 2).
- Tipo do input: Este agente deve ser apto a receber o dataset bruto, o target_schema e as mapping_instructions do agente anterior.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json(JSON). - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 10.000 caracteres.
3.3.2 Especificação do Output
- Formato de output: O output deve ser um objeto JSON contendo o conjunto de dados padronizado, o log de normalização, os registros rejeitados e a confirmação da padronização realizada.
-
Exemplo de Estrutura de Output:
{ "standardized_dataset": [ ... ], "normalization_log": [ ... ], "registros_rejeitados": [ ... ], "padronizacao_realizada": "sim", "normalizacoes_aplicadas": [ ... ] } - Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em 5.000 caracteres.
3.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
3.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
3.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Validação, Deduplicação e Relatório Final (RF 4).
3.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Validação, Deduplicação e Relatório Final (RF 4).
RF 4. Agente de Validação, Deduplicação e Relatório Final
4.1 Tarefa do Agente
Executar checagens de qualidade, resolver duplicidades conforme chaves técnicas e gerar saída final para relatórios e análises.
4.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais
Você está recebendo o conjunto de dados padronizado, o log de normalização e as chaves técnicas do agente anterior.
# 2. Objetivo
Executar checagens de qualidade, resolver duplicidades conforme chaves técnicas e gerar saída final para relatórios e análises.
# 3. Regras que você deve seguir para gerar sua resposta
- Validações sintáticas: confirme tipos conforme target_schema.
- Regras de consistência: se 'data_registro' < 'data_atendimento', marque inconsistente.
- Deduplicação: aplique chave_primaria.
- Unicidade: garanta que id_registro final seja único.
- Métricas obrigatórias no data_quality_report.
# 4. Exemplo de Output que você deve produzir
{
"dados_padronizados": [ ... ],
"data_quality_report": [ ... ],
"duplicates_report": [ ... ],
"compliance_report": [ ... ],
"variaveis_de_controle": [ ... ]
} 4.3 Configurações do Agente
4.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão bem-sucedida do agente anterior (RF 3).
- Tipo do input: Este agente deve ser apto a receber o conjunto de dados padronizado, o log de normalização e as chaves técnicas do agente anterior.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json(JSON). - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 12.000 caracteres.
4.3.2 Especificação do Output
- Formato de output: O output deve ser um objeto JSON contendo os dados padronizados, o relatório de qualidade dos dados, o relatório de duplicidades, o relatório de conformidade e as variáveis de controle.
-
Exemplo de Estrutura de Output:
{ "dados_padronizados": [ ... ], "data_quality_report": [ ... ], "duplicates_report": [ ... ], "compliance_report": [ ... ], "variaveis_de_controle": [ ... ] } - Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em 6.000 caracteres.
4.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
4.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
4.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente é o entregável final e não é passada para outros agentes internos.
4.3.6 Regras de Orquestração e Transição
A execução deste agente finaliza o fluxo. Os dados padronizados e os relatórios gerados são os resultados que devem ser disponibilizados para análise e relatórios.