PrototipeAI | Agente de IA para Padronização de Dados Administrativos

1. Propósito e Escopo

Este documento define todos os prompts, configurações de memória, transição entre estados e demais requisitos funcionais para o Agente de IA para Padronização de Dados Administrativos. Essa documentação é um modelo de PRD ou Documento de Requisitos de Produto específico para construção de Agentes de IA.

O objetivo principal deste agente é organizar e padronizar dados administrativos de pronto atendimento, facilitando a geração de relatórios precisos e análises detalhadas.

2. Contexto e Problema

Atualmente, os dados administrativos de pronto atendimento estão desorganizados, o que dificulta a geração de relatórios e análises. A falta de padronização compromete a clareza e a utilidade dos dados, tornando o processo de análise mais demorado e propenso a erros.

Dados administrativos desorganizados que dificultam a geração de relatórios e análises.
Necessidade de padronização para melhorar a clareza e a utilidade dos dados.

3. Impactos Esperados

A implementação deste agente de IA visa alcançar os seguintes resultados:

Organização contínua dos dados administrativos para facilitar a análise e a geração de relatórios.
Padronização dos dados para garantir conformidade com padrões e normas.
Redução de erros e inconsistências nos dados processados.

4. Visão Geral da Solução

O agente de IA para padronização de dados administrativos organiza e padroniza dados de pronto atendimento, aplicando regras de conformidade e facilitando a geração de relatórios e análises. A seguir são detalhadas todas as regras de negócio e especificações funcionais necessárias para que esse agente atue como um assistente útil e autônomo na padronização de dados administrativos.

A solução consiste em um fluxo de automação composto por 4 agentes de IA. O processo inicia com a leitura e profiling dos dados, seguida pela especificação de esquema alvo e mapeamento, a padronização e normalização, e finaliza com a validação, deduplicação e geração do relatório final.

Agentes	Função Principal
`Agente de Leitura e Profiling dos Dados` (RF 1)	Ingerir arquivos administrativos, identificar cabeçalhos, tipos de dados e anomalias.
`Agente de Especificação de Esquema Alvo e Mapeamento` (RF 2)	Definir o esquema de dados padronizado e instruções de mapeamento.
`Agente de Padronização e Normalização` (RF 3)	Aplicar o mapeamento definido, normalizar formatos e produzir dataset padronizado.
`Agente de Validação, Deduplicação e Relatório Final` (RF 4)	Executar checagens de qualidade, resolver duplicidades e gerar saída final para relatórios.

5. Protótipos

Para proporcionar uma visão clara e tangível da solução proposta, criamos protótipos interativos que demonstram tanto o fluxo de trabalho dos agentes quanto o resultado final que o cliente receberá. Explore os links abaixo para entender melhor a solução em ação.

Ver Agente na Prototipe AI

6. Requisitos Funcionais

RF 1. Agente de Leitura e Profiling dos Dados

1.1 Tarefa do Agente

Ingerir arquivos administrativos (CSV/XLSX), identificar cabeçalhos, tipos de dados e anomalias, produzindo perfil e esquema inferido.

1.2 Prompt ou Instruções do Agente

 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo arquivos administrativos em formatos CSV ou XLSX. Estes arquivos contêm dados de pronto atendimento que precisam ser organizados e padronizados.

# 2. Objetivo
Ingerir os arquivos, identificar cabeçalhos, tipos de dados e anomalias, e produzir um perfil e esquema inferido.

# 3. Regras que você deve seguir para gerar sua resposta
- Detecte cabeçalho: se múltiplas linhas candidatas existirem, escolha a primeira linha com maior proporção de strings distintas e sem números majoritários.
- Tipos possíveis por coluna: ['string','integer','decimal','date','datetime','boolean','categorical']. Atribua tipo_inferido pelo maior suporte consistente.
- Datas: reconheça formatos comuns (dd/mm/aaaa, mm/dd/aaaa, aaaa-mm-dd, dd-mm-aaaa).
- Valores ausentes: trate como nulos os tokens ['', 'NA', 'N/A', 'null', '-', '--', 's/d', 'sem dado'].
- Valores fora de tipo: conte como outliers_de_tipo e exemplifique até 5 ocorrências por coluna.
- Cardinalidade: registre total_distinto e top_10_valores por coluna categórica.
- Linhas vazias: descarte linhas onde 90%+ das colunas são nulas.
- Abas múltiplas: processe cada aba separadamente.

# 4. Exemplo de Output que você deve produzir
{
  "dataset_bruto": [ ... ],
  "inferred_schema": [ ... ],
  "data_profile": [ ... ],
  "issues_iniciais": [ ... ]
}

1.3 Configurações do Agente

1.3.1 Especificação do Input

Mecanismo de Acionamento: Este agente é o ponto de partida do fluxo e deve ser acionado pelo envio de arquivos CSV ou XLSX via API. Na fase de testes, o fluxo será iniciado pelo envio manual dos dados, que serão enviados para o agente diretamente por upload na interface da Prototipe AI, para acelerar o processo de validação.
Tipo do input: Arquivos CSV ou planilhas Excel contendo dados administrativos de pronto atendimento.
Formatos Suportados: Esse agente deve ser capaz de receber arquivos nos formatos: .csv, .xlsx.
Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 100.000 caracteres.

1.3.2 Especificação do Output

Formato de output: O output deve ser um objeto JSON contendo o dataset bruto, o esquema inferido, o perfil dos dados e as questões iniciais detectadas.

Exemplo de Estrutura de Output:

 {
  "dataset_bruto": [ ... ],
  "inferred_schema": [ ... ],
  "data_profile": [ ... ],
  "issues_iniciais": [ ... ]
}

Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em 5.000 caracteres.

1.3.3 Parâmetros de Geração

Modelo: GPT-5
Temperatura: 0.6

1.3.4 Ferramentas do Agente

Documentos: Não consulta documentos externos.
Calculadora: Não utiliza.
Busca Online: Não utiliza.
Sistemas Externos: Não se conecta a sistemas externos.

1.3.5 Memória

Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Especificação de Esquema Alvo e Mapeamento (RF 2).

1.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Especificação de Esquema Alvo e Mapeamento (RF 2).

RF 2. Agente de Especificação de Esquema Alvo e Mapeamento

2.1 Tarefa do Agente

Definir o esquema de dados padronizado e instruções de mapeamento a partir do perfil e do esquema inferido.

2.2 Prompt ou Instruções do Agente

 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo o esquema inferido, o perfil dos dados e as questões iniciais detectadas pelo agente anterior.

# 2. Objetivo
Definir o esquema de dados padronizado e instruções de mapeamento a partir do perfil e do esquema inferido.

# 3. Regras que você deve seguir para gerar sua resposta
- Target_schema mínimo recomendado: ['id_registro', 'data_atendimento', 'hora_atendimento', 'unidade', 'setor', 'tipo_atendimento', 'status', 'responsavel', 'observacoes', 'data_registro'].
- Nomes canônicos: use snake_case, sem acentos.
- Tipos alvo: ['string','integer','decimal','date','datetime','boolean','categorical'].
- Defina mapping_instructions para cada coluna de origem.
- Categorias padrão: para 'status' use {'aberto','em_andamento','concluido','cancelado','pendente'}.

# 4. Exemplo de Output que você deve produzir
{
  "target_schema": [ ... ],
  "mapping_instructions": [ ... ],
  "categorias_padrao": [ ... ],
  "chaves_tecnicas": [ ... ],
  "politicas_nulos": [ ... ]
}

2.3 Configurações do Agente

2.3.1 Especificação do Input

Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão bem-sucedida do agente anterior (RF 1).
Tipo do input: Este agente deve ser apto a receber como input o esquema inferido, o perfil dos dados e as questões iniciais detectadas pelo agente anterior.
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json (JSON).
Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 6.000 caracteres.

2.3.2 Especificação do Output

Formato de output: O output deve ser um objeto JSON contendo o target_schema, as mapping_instructions, as categorias_padrao, as chaves_tecnicas e as politicas_nulos.

Exemplo de Estrutura de Output:

 {
  "target_schema": [ ... ],
  "mapping_instructions": [ ... ],
  "categorias_padrao": [ ... ],
  "chaves_tecnicas": [ ... ],
  "politicas_nulos": [ ... ]
}

Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em 4.000 caracteres.

2.3.3 Parâmetros de Geração

Modelo: GPT-5
Temperatura: 0.6

2.3.4 Ferramentas do Agente

Documentos: Não consulta documentos externos.
Calculadora: Não utiliza.
Busca Online: Não utiliza.
Sistemas Externos: Não se conecta a sistemas externos.

2.3.5 Memória

Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Padronização e Normalização (RF 3).

2.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Padronização e Normalização (RF 3).

RF 3. Agente de Padronização e Normalização

3.1 Tarefa do Agente

Aplicar o mapeamento definido, normalizar formatos e produzir dataset padronizado pronto para validação.

3.2 Prompt ou Instruções do Agente

 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo o dataset bruto, o target_schema e as mapping_instructions do agente anterior.

# 2. Objetivo
Aplicar o mapeamento definido, normalizar formatos e produzir dataset padronizado pronto para validação.

# 3. Regras que você deve seguir para gerar sua resposta
- Padronize 'unidade' e 'setor' em Title Case.
- Converta datas válidas para 'yyyy-mm-dd'.
- Normalize horas para 'HH:MM' 24h.
- Aceite {'sim','não','nao','true','false','1','0'} para booleanos.
- Aplique equivalências definidas em categorias_padrao.

# 4. Exemplo de Output que você deve produzir
{
  "standardized_dataset": [ ... ],
  "normalization_log": [ ... ],
  "registros_rejeitados": [ ... ],
  "padronizacao_realizada": "sim",
  "normalizacoes_aplicadas": [ ... ]
}

3.3 Configurações do Agente

3.3.1 Especificação do Input

Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão bem-sucedida do agente anterior (RF 2).
Tipo do input: Este agente deve ser apto a receber o dataset bruto, o target_schema e as mapping_instructions do agente anterior.
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json (JSON).
Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 10.000 caracteres.

3.3.2 Especificação do Output

Formato de output: O output deve ser um objeto JSON contendo o conjunto de dados padronizado, o log de normalização, os registros rejeitados e a confirmação da padronização realizada.

Exemplo de Estrutura de Output:

 {
  "standardized_dataset": [ ... ],
  "normalization_log": [ ... ],
  "registros_rejeitados": [ ... ],
  "padronizacao_realizada": "sim",
  "normalizacoes_aplicadas": [ ... ]
}

Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em 5.000 caracteres.

3.3.3 Parâmetros de Geração

Modelo: GPT-5
Temperatura: 0.6

3.3.4 Ferramentas do Agente

Documentos: Não consulta documentos externos.
Calculadora: Não utiliza.
Busca Online: Não utiliza.
Sistemas Externos: Não se conecta a sistemas externos.

3.3.5 Memória

Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Validação, Deduplicação e Relatório Final (RF 4).

3.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Validação, Deduplicação e Relatório Final (RF 4).

RF 4. Agente de Validação, Deduplicação e Relatório Final

4.1 Tarefa do Agente

Executar checagens de qualidade, resolver duplicidades conforme chaves técnicas e gerar saída final para relatórios e análises.

4.2 Prompt ou Instruções do Agente

 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo o conjunto de dados padronizado, o log de normalização e as chaves técnicas do agente anterior.

# 2. Objetivo
Executar checagens de qualidade, resolver duplicidades conforme chaves técnicas e gerar saída final para relatórios e análises.

# 3. Regras que você deve seguir para gerar sua resposta
- Validações sintáticas: confirme tipos conforme target_schema.
- Regras de consistência: se 'data_registro' < 'data_atendimento', marque inconsistente.
- Deduplicação: aplique chave_primaria.
- Unicidade: garanta que id_registro final seja único.
- Métricas obrigatórias no data_quality_report.

# 4. Exemplo de Output que você deve produzir
{
  "dados_padronizados": [ ... ],
  "data_quality_report": [ ... ],
  "duplicates_report": [ ... ],
  "compliance_report": [ ... ],
  "variaveis_de_controle": [ ... ]
}

4.3 Configurações do Agente

4.3.1 Especificação do Input

Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão bem-sucedida do agente anterior (RF 3).
Tipo do input: Este agente deve ser apto a receber o conjunto de dados padronizado, o log de normalização e as chaves técnicas do agente anterior.
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json (JSON).
Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 12.000 caracteres.

4.3.2 Especificação do Output

Formato de output: O output deve ser um objeto JSON contendo os dados padronizados, o relatório de qualidade dos dados, o relatório de duplicidades, o relatório de conformidade e as variáveis de controle.

Exemplo de Estrutura de Output:

 {
  "dados_padronizados": [ ... ],
  "data_quality_report": [ ... ],
  "duplicates_report": [ ... ],
  "compliance_report": [ ... ],
  "variaveis_de_controle": [ ... ]
}

Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em 6.000 caracteres.

4.3.3 Parâmetros de Geração

Modelo: GPT-5
Temperatura: 0.6

4.3.4 Ferramentas do Agente

Documentos: Não consulta documentos externos.
Calculadora: Não utiliza.
Busca Online: Não utiliza.
Sistemas Externos: Não se conecta a sistemas externos.

4.3.5 Memória

Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
Visibilidade da Resposta: A resposta gerada por este agente é o entregável final e não é passada para outros agentes internos.

4.3.6 Regras de Orquestração e Transição

A execução deste agente finaliza o fluxo. Os dados padronizados e os relatórios gerados são os resultados que devem ser disponibilizados para análise e relatórios.

Agente de IA para Padronização de Dados Administrativos

1. Propósito e Escopo

2. Contexto e Problema

3. Impactos Esperados

4. Visão Geral da Solução

5. Protótipos

6. Requisitos Funcionais

RF 1. Agente de Leitura e Profiling dos Dados

1.3.1 Especificação do Input

1.3.2 Especificação do Output

1.3.3 Parâmetros de Geração

1.3.4 Ferramentas do Agente

1.3.5 Memória

1.3.6 Regras de Orquestração e Transição

RF 2. Agente de Especificação de Esquema Alvo e Mapeamento

2.3.1 Especificação do Input

2.3.2 Especificação do Output

2.3.3 Parâmetros de Geração

2.3.4 Ferramentas do Agente

2.3.5 Memória

2.3.6 Regras de Orquestração e Transição

RF 3. Agente de Padronização e Normalização

3.3.1 Especificação do Input

3.3.2 Especificação do Output

3.3.3 Parâmetros de Geração

3.3.4 Ferramentas do Agente

3.3.5 Memória

3.3.6 Regras de Orquestração e Transição

RF 4. Agente de Validação, Deduplicação e Relatório Final

4.3.1 Especificação do Input

4.3.2 Especificação do Output

4.3.3 Parâmetros de Geração

4.3.4 Ferramentas do Agente

4.3.5 Memória

4.3.6 Regras de Orquestração e Transição

Posts Relacionados