PrototipeAI | Agente de IA para Padronização de Dados de Estudantes

1. Propósito e Escopo

Este documento define todos os prompts, configurações de memória, transição entre estados e demais requisitos funcionais para o Agente de IA de Padronização de Dados de Estudantes. Essa documentação é um modelo de PRD ou Documento de Requisitos de Produto específicos para construção de Agentes de IA.

O objetivo principal é garantir a consistência e padronização dos dados dos estudantes em sistemas escolares, assegurando que nomes, endereços e informações de contato estejam corretos e uniformes, minimizando problemas administrativos e melhorando a comunicação com os pais.

2. Contexto e Problema

Cenário Atual

As escolas enfrentam desafios significativos devido a inconsistências nos dados dos estudantes, que podem se manifestar em erros de digitação, padronização inadequada de endereços e informações de contato incompletas ou incorretas. Esses problemas podem levar a dificuldades administrativas e falhas na comunicação com os pais.

Problemas Identificados

Inconsistências nos dados: Erros de digitação ou capitalização incorreta nos nomes dos estudantes podem causar duplicação de registros.
Dados duplicados ou incorretos: Informações de contato inconsistentes podem resultar em falhas de comunicação com os pais.
Integração de sistemas: A necessidade de integrar dados de diferentes sistemas escolares sem criar duplicações ou erros.

3. Impactos Esperados

A implementação deste agente de IA visa alcançar os seguintes resultados:

Melhorar a precisão dos dados dos estudantes em todas as plataformas escolares.
Reduzir o tempo gasto na correção manual de dados incorretos ou duplicados.
Aumentar a eficiência administrativa, permitindo que as escolas se concentrem em tarefas mais estratégicas.
Melhorar a comunicação com os pais através de dados de contato consistentes e corretos.

4. Visão Geral da Solução

O agente de IA para padronização de dados de estudantes processa informações de diversos sistemas escolares, aplica regras de padronização e integra os dados em um formato uniforme e consistente. A seguir são detalhadas todas as regras de negócio e especificações funcionais necessárias para que esse agente atue como um assistente útil e autônomo na padronização dos dados escolares.

A solução consiste em um único agente de IA que atua de forma contínua para identificar e corrigir inconsistências nos dados dos estudantes, integrando informações de diferentes sistemas escolares.

Agente	Função Principal
`Agente de Padronização de Dados de Estudantes` (RF 1)	Identificar e corrigir inconsistências nos dados dos estudantes, garantindo a padronização de acordo com critérios estabelecidos.

5. Protótipos

Para proporcionar uma visão clara e tangível da solução proposta, criamos protótipos interativos que demonstram o fluxo de trabalho do agente e como ele padroniza os dados dos estudantes. Explore os links abaixo para entender melhor a solução em ação.

Ver Agente na Prototipe AI

6. Requisitos Funcionais

RF 1. Agente de Padronização de Dados de Estudantes

1.1 Tarefa do Agente

Identificar e corrigir inconsistências nos dados dos estudantes, garantindo a padronização de acordo com critérios estabelecidos, e integrar dados de diferentes sistemas escolares.

1.2 Prompt ou Instruções do Agente

# 1. Contexto e explicações sobre inputs iniciais
Você está recebendo dados dos estudantes de diferentes sistemas escolares. Esses dados incluem nomes, endereços e informações de contato.

# 2. Objetivo
Identificar e corrigir inconsistências nos dados dos estudantes, garantindo a padronização de acordo com critérios estabelecidos e integrando dados de diferentes sistemas escolares.

# 3. Regras que você deve seguir para gerar sua resposta
- Identifique e corrija inconsistências nos nomes, como erros de digitação ou capitalização incorreta. Para isso, utilize um banco de dados de nomes comuns como referência.
- Padronize os endereços, garantindo que sigam o formato estabelecido, incluindo abreviações e ordem dos componentes. Utilize serviços de validação de endereços para assegurar precisão.
- Verifique e padronize informações de contato, assegurando que os números de telefone e e-mails estejam completos e no formato correto. Aplique regex para validar formatos.
- Implemente um sistema de verificação cruzada para detectar e eliminar dados duplicados, utilizando chaves únicas como CPF ou ID de estudante.
- Integre dados de diferentes sistemas escolares, garantindo que as informações sejam consolidadas corretamente sem duplicação. Utilize identificadores únicos para mapear registros entre sistemas.
- Realize verificações de consistência para assegurar que todas as informações do estudante estejam alinhadas entre diferentes registros. Aplique regras de negócio definidas para cada campo de dados.

# 4. Exemplo de Output que você deve produzir
{
"nome": "João da Silva",
"endereco": "Rua das Flores, 123, Centro, São Paulo, SP",
"contato": {
"telefone": "+55 11 91234-5678",
"email": "joao.silva@email.com"
}
}

1.3 Configurações do Agente

1.3.1 Especificação do Input

Mecanismo de Acionamento: Este agente é o ponto de partida do fluxo e deve ser acionado pelo envio de dados dos estudantes via API. Na fase de testes, os dados serão enviados pelo agente diretamente por upload de um csv na interface da Prototipe AI, para acelerar o processo de validação.
Tipo do input: O input inicial para o fluxo é um conjunto de dados dos estudantes, incluindo nomes, endereços e informações de contato.
Formatos Suportados: Esse agente deve ser capaz de receber dados nos formatos: .csv, .json.
Número de caracteres esperado: Este agente deve ter capacidade para processar um input de texto com até 100.000 caracteres.

1.3.2 Especificação do Output

Formato de output: O output deve ser um arquivo no formato JSON contendo os dados dos estudantes padronizados, com campos 'nome', 'endereco', e 'contato'.

Exemplo de Estrutura de Output:

 {
  "nome": "João da Silva",
  "endereco": "Rua das Flores, 123, Centro, São Paulo, SP",
  "contato": {
    "telefone": "+55 11 91234-5678",
    "email": "joao.silva@email.com"
  }
}

Número de caracteres esperado: O JSON gerado deve ser claro e direto, com um tamanho estimado em 2.000 caracteres por registro.

1.3.3 Parâmetros de Geração

Modelo: GPT-5
Temperatura: 0.6

1.3.4 Ferramentas do Agente

Documentos: Não consulta documentos externos.
Calculadora: Não utiliza.
Busca Online: Não utiliza.
Sistemas Externos: Integra-se a serviços de validação de endereços para garantir precisão.

1.3.5 Memória

Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
Visibilidade da Resposta: A resposta gerada por este agente é o entregável final e não é passada para outros agentes internos.

1.3.6 Regras de Orquestração e Transição

A execução deste agente finaliza o fluxo, garantindo que os dados dos estudantes estejam padronizados e prontos para uso administrativo.

Agente de IA para Padronização de Dados de Estudantes