Agente de IA para Padronização de Dados Administrativos

18 de December de 2025 • Tempo de leitura: 5 min

Como criar um agente de IA que organiza e padroniza dados administrativos de pronto atendimento.

1. Propósito e Escopo

Este documento define todos os prompts, configurações de memória, transição entre estados e demais requisitos funcionais para o Agente de IA para Padronização de Dados Administrativos. Essa documentação é um modelo de PRD ou Documento de Requisitos de Produto específico para construção de Agentes de IA.

O objetivo principal deste agente é organizar e padronizar dados administrativos de pronto atendimento, facilitando a geração de relatórios precisos e análises detalhadas.

2. Contexto e Problema

Atualmente, os dados administrativos de pronto atendimento estão desorganizados, o que dificulta a geração de relatórios e análises. A falta de padronização compromete a clareza e a utilidade dos dados, tornando o processo de análise mais demorado e propenso a erros.

  • Dados administrativos desorganizados que dificultam a geração de relatórios e análises.
  • Necessidade de padronização para melhorar a clareza e a utilidade dos dados.

3. Impactos Esperados

A implementação deste agente de IA visa alcançar os seguintes resultados:

  • Organização contínua dos dados administrativos para facilitar a análise e a geração de relatórios.
  • Padronização dos dados para garantir conformidade com padrões e normas.
  • Redução de erros e inconsistências nos dados processados.

4. Visão Geral da Solução

O agente de IA para padronização de dados administrativos organiza e padroniza dados de pronto atendimento, aplicando regras de conformidade e facilitando a geração de relatórios e análises. A seguir são detalhadas todas as regras de negócio e especificações funcionais necessárias para que esse agente atue como um assistente útil e autônomo na padronização de dados administrativos.

A solução consiste em um fluxo de automação composto por 4 agentes de IA. O processo inicia com a leitura e profiling dos dados, seguida pela especificação de esquema alvo e mapeamento, a padronização e normalização, e finaliza com a validação, deduplicação e geração do relatório final.

Agentes Função Principal
Agente de Leitura e Profiling dos Dados (RF 1) Ingerir arquivos administrativos, identificar cabeçalhos, tipos de dados e anomalias.
Agente de Especificação de Esquema Alvo e Mapeamento (RF 2) Definir o esquema de dados padronizado e instruções de mapeamento.
Agente de Padronização e Normalização (RF 3) Aplicar o mapeamento definido, normalizar formatos e produzir dataset padronizado.
Agente de Validação, Deduplicação e Relatório Final (RF 4) Executar checagens de qualidade, resolver duplicidades e gerar saída final para relatórios.

5. Protótipos

Para proporcionar uma visão clara e tangível da solução proposta, criamos protótipos interativos que demonstram tanto o fluxo de trabalho dos agentes quanto o resultado final que o cliente receberá. Explore os links abaixo para entender melhor a solução em ação.

6. Requisitos Funcionais

RF 1. Agente de Leitura e Profiling dos Dados

1.1 Tarefa do Agente

Ingerir arquivos administrativos (CSV/XLSX), identificar cabeçalhos, tipos de dados e anomalias, produzindo perfil e esquema inferido.

1.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo arquivos administrativos em formatos CSV ou XLSX. Estes arquivos contêm dados de pronto atendimento que precisam ser organizados e padronizados.

# 2. Objetivo
Ingerir os arquivos, identificar cabeçalhos, tipos de dados e anomalias, e produzir um perfil e esquema inferido.

# 3. Regras que você deve seguir para gerar sua resposta
- Detecte cabeçalho: se múltiplas linhas candidatas existirem, escolha a primeira linha com maior proporção de strings distintas e sem números majoritários.
- Tipos possíveis por coluna: ['string','integer','decimal','date','datetime','boolean','categorical']. Atribua tipo_inferido pelo maior suporte consistente.
- Datas: reconheça formatos comuns (dd/mm/aaaa, mm/dd/aaaa, aaaa-mm-dd, dd-mm-aaaa).
- Valores ausentes: trate como nulos os tokens ['', 'NA', 'N/A', 'null', '-', '--', 's/d', 'sem dado'].
- Valores fora de tipo: conte como outliers_de_tipo e exemplifique até 5 ocorrências por coluna.
- Cardinalidade: registre total_distinto e top_10_valores por coluna categórica.
- Linhas vazias: descarte linhas onde 90%+ das colunas são nulas.
- Abas múltiplas: processe cada aba separadamente.

# 4. Exemplo de Output que você deve produzir
{
  "dataset_bruto": [ ... ],
  "inferred_schema": [ ... ],
  "data_profile": [ ... ],
  "issues_iniciais": [ ... ]
}
1.3 Configurações do Agente

1.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente é o ponto de partida do fluxo e deve ser acionado pelo envio de arquivos CSV ou XLSX via API. Na fase de testes, o fluxo será iniciado pelo envio manual dos dados, que serão enviados para o agente diretamente por upload na interface da Prototipe AI, para acelerar o processo de validação.
  • Tipo do input: Arquivos CSV ou planilhas Excel contendo dados administrativos de pronto atendimento.
  • Formatos Suportados: Esse agente deve ser capaz de receber arquivos nos formatos: .csv, .xlsx.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 100.000 caracteres.

1.3.2 Especificação do Output

  • Formato de output: O output deve ser um objeto JSON contendo o dataset bruto, o esquema inferido, o perfil dos dados e as questões iniciais detectadas.
  • Exemplo de Estrutura de Output:
     {
      "dataset_bruto": [ ... ],
      "inferred_schema": [ ... ],
      "data_profile": [ ... ],
      "issues_iniciais": [ ... ]
    }
  • Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em 5.000 caracteres.

1.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

1.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

1.3.5 Memória

1.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Especificação de Esquema Alvo e Mapeamento (RF 2).

RF 2. Agente de Especificação de Esquema Alvo e Mapeamento

2.1 Tarefa do Agente

Definir o esquema de dados padronizado e instruções de mapeamento a partir do perfil e do esquema inferido.

2.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo o esquema inferido, o perfil dos dados e as questões iniciais detectadas pelo agente anterior.

# 2. Objetivo
Definir o esquema de dados padronizado e instruções de mapeamento a partir do perfil e do esquema inferido.

# 3. Regras que você deve seguir para gerar sua resposta
- Target_schema mínimo recomendado: ['id_registro', 'data_atendimento', 'hora_atendimento', 'unidade', 'setor', 'tipo_atendimento', 'status', 'responsavel', 'observacoes', 'data_registro'].
- Nomes canônicos: use snake_case, sem acentos.
- Tipos alvo: ['string','integer','decimal','date','datetime','boolean','categorical'].
- Defina mapping_instructions para cada coluna de origem.
- Categorias padrão: para 'status' use {'aberto','em_andamento','concluido','cancelado','pendente'}.

# 4. Exemplo de Output que você deve produzir
{
  "target_schema": [ ... ],
  "mapping_instructions": [ ... ],
  "categorias_padrao": [ ... ],
  "chaves_tecnicas": [ ... ],
  "politicas_nulos": [ ... ]
}
2.3 Configurações do Agente

2.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão bem-sucedida do agente anterior (RF 1).
  • Tipo do input: Este agente deve ser apto a receber como input o esquema inferido, o perfil dos dados e as questões iniciais detectadas pelo agente anterior.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json (JSON).
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 6.000 caracteres.

2.3.2 Especificação do Output

  • Formato de output: O output deve ser um objeto JSON contendo o target_schema, as mapping_instructions, as categorias_padrao, as chaves_tecnicas e as politicas_nulos.
  • Exemplo de Estrutura de Output:
     {
      "target_schema": [ ... ],
      "mapping_instructions": [ ... ],
      "categorias_padrao": [ ... ],
      "chaves_tecnicas": [ ... ],
      "politicas_nulos": [ ... ]
    }
  • Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em 4.000 caracteres.

2.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

2.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

2.3.5 Memória

  • Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
  • Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Padronização e Normalização (RF 3).

2.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Padronização e Normalização (RF 3).

RF 3. Agente de Padronização e Normalização

3.1 Tarefa do Agente

Aplicar o mapeamento definido, normalizar formatos e produzir dataset padronizado pronto para validação.

3.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo o dataset bruto, o target_schema e as mapping_instructions do agente anterior.

# 2. Objetivo
Aplicar o mapeamento definido, normalizar formatos e produzir dataset padronizado pronto para validação.

# 3. Regras que você deve seguir para gerar sua resposta
- Padronize 'unidade' e 'setor' em Title Case.
- Converta datas válidas para 'yyyy-mm-dd'.
- Normalize horas para 'HH:MM' 24h.
- Aceite {'sim','não','nao','true','false','1','0'} para booleanos.
- Aplique equivalências definidas em categorias_padrao.

# 4. Exemplo de Output que você deve produzir
{
  "standardized_dataset": [ ... ],
  "normalization_log": [ ... ],
  "registros_rejeitados": [ ... ],
  "padronizacao_realizada": "sim",
  "normalizacoes_aplicadas": [ ... ]
}
3.3 Configurações do Agente

3.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão bem-sucedida do agente anterior (RF 2).
  • Tipo do input: Este agente deve ser apto a receber o dataset bruto, o target_schema e as mapping_instructions do agente anterior.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json (JSON).
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 10.000 caracteres.

3.3.2 Especificação do Output

  • Formato de output: O output deve ser um objeto JSON contendo o conjunto de dados padronizado, o log de normalização, os registros rejeitados e a confirmação da padronização realizada.
  • Exemplo de Estrutura de Output:
     {
      "standardized_dataset": [ ... ],
      "normalization_log": [ ... ],
      "registros_rejeitados": [ ... ],
      "padronizacao_realizada": "sim",
      "normalizacoes_aplicadas": [ ... ]
    }
  • Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em 5.000 caracteres.

3.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

3.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

3.3.5 Memória

3.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Validação, Deduplicação e Relatório Final (RF 4).

RF 4. Agente de Validação, Deduplicação e Relatório Final

4.1 Tarefa do Agente

Executar checagens de qualidade, resolver duplicidades conforme chaves técnicas e gerar saída final para relatórios e análises.

4.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo o conjunto de dados padronizado, o log de normalização e as chaves técnicas do agente anterior.

# 2. Objetivo
Executar checagens de qualidade, resolver duplicidades conforme chaves técnicas e gerar saída final para relatórios e análises.

# 3. Regras que você deve seguir para gerar sua resposta
- Validações sintáticas: confirme tipos conforme target_schema.
- Regras de consistência: se 'data_registro' < 'data_atendimento', marque inconsistente.
- Deduplicação: aplique chave_primaria.
- Unicidade: garanta que id_registro final seja único.
- Métricas obrigatórias no data_quality_report.

# 4. Exemplo de Output que você deve produzir
{
  "dados_padronizados": [ ... ],
  "data_quality_report": [ ... ],
  "duplicates_report": [ ... ],
  "compliance_report": [ ... ],
  "variaveis_de_controle": [ ... ]
}
4.3 Configurações do Agente

4.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão bem-sucedida do agente anterior (RF 3).
  • Tipo do input: Este agente deve ser apto a receber o conjunto de dados padronizado, o log de normalização e as chaves técnicas do agente anterior.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json (JSON).
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 12.000 caracteres.

4.3.2 Especificação do Output

  • Formato de output: O output deve ser um objeto JSON contendo os dados padronizados, o relatório de qualidade dos dados, o relatório de duplicidades, o relatório de conformidade e as variáveis de controle.
  • Exemplo de Estrutura de Output:
     {
      "dados_padronizados": [ ... ],
      "data_quality_report": [ ... ],
      "duplicates_report": [ ... ],
      "compliance_report": [ ... ],
      "variaveis_de_controle": [ ... ]
    }
  • Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em 6.000 caracteres.

4.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

4.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

4.3.5 Memória

  • Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
  • Visibilidade da Resposta: A resposta gerada por este agente é o entregável final e não é passada para outros agentes internos.

4.3.6 Regras de Orquestração e Transição

A execução deste agente finaliza o fluxo. Os dados padronizados e os relatórios gerados são os resultados que devem ser disponibilizados para análise e relatórios.

© 2025 prototipe.ai. Todos os direitos reservados.