Agente de IA para Validação de Documentos Escolares

23 de December de 2025 • Tempo de leitura: 5 min

Como criar um agente de IA que verifica a consistência e a validade de registros e documentos acadêmicos.

1. Propósito e Escopo

Este documento define todos os prompts, configurações de memória, transição entre estados e demais requisitos funcionais para o Fluxo de Agentes "Validação de Documentos Escolares", uma solução de automação projetada para assegurar a consistência e validade de registros acadêmicos e documentos escolares. Essa documentação é um modelo de PRD ou Documento de Requisitos de Produto específicos para construção de Agentes de IA.

O objetivo principal é automatizar a verificação de dados acadêmicos, identificar inconsistências e validar documentos com base em regras predefinidas, garantindo que todos os dados estejam corretos e completos.

2. Contexto e Problema

Cenário Atual

As instituições de ensino enfrentam desafios significativos na manutenção da precisão e consistência dos registros acadêmicos e documentos escolares. Problemas comuns incluem:

  • Erros e inconsistências em registros acadêmicos.
  • Falta de verificação de validade de documentos.
  • Processos manuais demorados para revisão de documentos.

Atualmente, a validação desses documentos é frequentemente manual e propensa a erros, consumindo tempo valioso que poderia ser direcionado para atividades mais estratégicas.


Problemas Identificados

  • Consumo de tempo: A revisão manual de documentos acadêmicos é demorada e ineficiente.
  • Erros Humanos: A falta de automação aumenta o risco de erros e inconsistências nos registros.
  • Falta de Padronização: A ausência de processos padronizados leva a variações na qualidade da validação documental.

3. Impactos Esperados

A implementação deste fluxo de automação visa alcançar os seguintes resultados:

  • Reduzir o tempo de revisão de documentos em pelo menos 70%.
  • Melhorar a precisão na validação de registros acadêmicos.
  • Padronizar os processos de verificação documental em toda a instituição.
  • Diminuir o risco de erros e inconsistências nos documentos acadêmicos.

4. Visão Geral da Solução

O agente de IA para validação de documentos escolares verifica a consistência e validade de registros acadêmicos, aplica regras de acordo com padrões institucionais e automatiza alertas para documentos que necessitam de revisão. A seguir são detalhadas todas as regras de negócio e especificações funcionais necessárias para que esse agente atue como um assistente útil e autônomo na verificação e validação de documentos acadêmicos.

A solução consiste em um fluxo de automação composto por 4 agentes de IA. O processo inicia com a verificação de consistência dos dados e termina com a geração de alertas e notificações para documentos que necessitam de revisão.

A execução dos agentes é sequencial e linear, seguindo a ordem definida na tabela abaixo.

Agentes Função Principal
Agente de Verificação de Consistência de Dados Acadêmicos (RF 1) Implementar verificações automáticas de consistência em registros acadêmicos estruturados.
Agente de Execução de Consulta a Documento (RF 2) Realizar consulta e extração estruturada de informações de documentos acadêmicos.
Agente de Validação de Documents Acadêmicos (RF 3) Validar documentos acadêmicos com base em regras institucionais e coerência de conteúdo.
Agente de Automação de Alertas e Notificações (RF 4) Gerar alertas e notificações operacionais para documentos inválidos ou inconsistentes.

5. Protótipos

Para proporcionar uma visão clara e tangível da solução proposta, criamos protótipos interativos que demonstram tanto o fluxo de trabalho dos agentes quanto o resultado final que a instituição receberá. Explore os links abaixo para entender melhor a solução em ação.

6. Requisitos Funcionais

RF 1. Agente de Verificação de Consistência de Dados Acadêmicos

1.1 Tarefa do Agente

Implementar verificações automáticas de consistência em registros acadêmicos estruturados (CSV/JSON) e produzir um diagnóstico padronizado por registro.

1.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo registros acadêmicos em formato CSV ou JSON. Cada registro contém campos como: registro_id, aluno_id, curso_id, disciplina_id, periodo_letivo, data_matricula, data_conclusao, status_matricula, nota, frequencia, carga_horaria, email_aluno, documento_oficial_aluno.

# 2. Objetivo
Implementar verificações automáticas de consistência nos registros acadêmicos e produzir um diagnóstico padronizado por registro.

# 3. Regras que você deve seguir para gerar sua resposta
- Valide a presença dos campos obrigatórios mínimos: registro_id, aluno_id, status_matricula, periodo_letivo.
- Verifique a tipagem e formato dos campos, como datas e emails.
- Aplique regras de domínio para validar notas, frequências e status de matrícula.
- Consistência referencial intralote: verifique referências como curso_id e disciplina_id.
- Detecte duplicidades e aplique normalizações necessárias.
- Classifique a severidade das inconsistências e gere um resumo agregado.
1.3 Configurações do Agente

1.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente é o ponto de partida do fluxo e deve ser acionado pelo envio de registros acadêmicos via API. Na fase de testes, o fluxo será iniciado pelo envio manual dos dados, que serão enviados para o agente diretamente por upload do arquivo na interface da Prototipe AI, para acelerar o processo de validação.
  • Tipo do input: O input inicial para o fluxo é um arquivo CSV ou JSON, que contém registros acadêmicos estruturados.
  • Formatos Suportados: Esse agente deve ser capaz de receber dados nos formatos: .csv, .json.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de texto com até 100.000 caracteres.

1.3.2 Especificação do Output

  • Formato de output: O output deve ser uma lista de objetos JSON por registro, incluindo informações sobre inconsistências, normalizações aplicadas e um resumo agregado.
  • Exemplo de Estrutura de Output:
     {
      "registro_id": "12345",
      "consistente": false,
      "inconsistencias": [
        {
          "codigo": "CAMPO_OBRIGATORIO_AUSENTE",
          "campo": "disciplina_id",
          "valor_encontrado": null,
          "descricao": "Campo obrigatório ausente.",
          "severidade": "erro",
          "sugestao_correcao": "Preencher campo disciplina_id."
        }
      ],
      "normalizacoes_aplicadas": [
        {
          "campo": "periodo_letivo",
          "valor_original": "2025/1",
          "valor_normalizado": "2025.1"
        }
      ],
      "resumo": {
        "total": 100,
        "consistentes": 80,
        "inconsistentes": 20,
        "duplicados": 5
      }
    }
  • Número de caracteres esperado: O JSON gerado deve ser claro e direto, com um tamanho estimado em 5.000 caracteres por registro.

1.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

1.3.4 Ferramentas do Agente

  • Documentos: Não consulta.
  • Calculadora: Utiliza lógica interna para validação de consistência.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não utiliza.

1.3.5 Memória

  • Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
  • Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Execução de Consulta a Documento (RF 2).

1.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Execução de Consulta a Documento (RF 2).

RF 2. Agente de Execução de Consulta a Documento

2.1 Tarefa do Agente

Realizar consulta e extração estruturada de informações de documentos acadêmicos (ex.: histórico, diploma, declaração) a partir de parâmetros de busca/consulta já definidos.

2.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo parâmetros de busca para consultar e extrair informações de documentos acadêmicos.

# 2. Objetivo
Realizar a consulta e extração de informações dos documentos acadêmicos com base nos parâmetros recebidos.

# 3. Regras que você deve seguir para gerar sua resposta
- Utilize os parâmetros fornecidos para localizar e extrair informações dos documentos.
- Retorne as informações extraídas em um formato estruturado.
2.3 Configurações do Agente

2.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 1).
  • Tipo do input: Este agente deve ser apto a receber parâmetros de busca para consulta de documentos acadêmicos.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de texto com até 10.000 caracteres.

2.3.2 Especificação do Output

  • Formato de output: O output deve ser um JSON estruturado contendo as informações extraídas dos documentos.
  • Exemplo de Estrutura de Output:
     {
      "documento_id": "67890",
      "tipo_de_documento": "historico_escolar",
      "campos_extraidos": {
        "nome_aluno": "João Silva",
        "curso": "Engenharia",
        "data_emissao": "2025-12-23"
      }
    }
  • Número de caracteres esperado: O JSON gerado deve ser claro e direto, com um tamanho estimado em 2.000 caracteres por documento.

2.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

2.3.4 Ferramentas do Agente

  • Documentos: Não consulta.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não utiliza.

2.3.5 Memória

2.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Validação de Documentos Acadêmicos (RF 3).

RF 3. Agente de Validação de Documentos Acadêmicos

3.1 Tarefa do Agente

Validar documentos acadêmicos com base em regras institucionais, requisitos de completude, conformidade de layout e coerência de conteúdo com registros acadêmicos estruturados.

3.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo dados estruturados de documentos acadêmicos e, quando disponíveis, resumos de consistência de registros acadêmicos.

# 2. Objetivo
Validar os documentos acadêmicos com base nas regras institucionais e coerência de conteúdo.

# 3. Regras que você deve seguir para gerar sua resposta
- Verifique a completude de cada documento conforme seu tipo.
- Valide a conformidade de datas e assinaturas.
- Cheque a coerência entre dados dos documentos e registros acadêmicos.
3.3 Configurações do Agente

3.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 2).
  • Tipo do input: Este agente deve ser apto a receber dados estruturados de documentos acadêmicos e resumos de consistência de registros acadêmicos.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de texto com até 12.000 caracteres.

3.3.2 Especificação do Output

  • Formato de output: O output deve ser um JSON estruturado validando cada documento e destacando inconsistências.
  • Exemplo de Estrutura de Output:
     {
      "documento_id": "67890",
      "valido": true,
      "issues": [
        {
          "codigo": "DATA_EMISSAO_FUTURA",
          "descricao": "Data de emissão do documento está no futuro.",
          "severidade": "erro"
        }
      ]
    }
  • Número de caracteres esperado: O JSON gerado deve ser claro e direto, com um tamanho estimado em 3.000 caracteres por documento.

3.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

3.3.4 Ferramentas do Agente

  • Documentos: Não consulta.
  • Calculadora: Utiliza lógica interna para validação de documentos.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não utiliza.

3.3.5 Memória

3.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Automação de Alertas e Notificações (RF 4).

RF 4. Agente de Automação de Alertas e Notificações

4.1 Tarefa do Agente

Gerar eventos de alerta e notificações operacionais para responsáveis quando houver inconsistências ou documentos inválidos, classificando prioridade e destinatários.

4.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo resultados consolidados dos agentes anteriores, incluindo registros inconsistentes e documentos que necessitam de revisão.

# 2. Objetivo
Gerar alertas e notificações operacionais para responsáveis, classificando a prioridade e os destinatários.

# 3. Regras que você deve seguir para gerar sua resposta
- Crie eventos de alerta e notificações para cada item sinalizado.
- Classifique a severidade e defina os destinatários apropriados.
- Gere um sumário por severidade para facilitar o monitoramento.
4.3 Configurações do Agente

4.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 3).
  • Tipo do input: Este agente deve ser apto a receber resultados consolidados dos agentes anteriores.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de texto com até 15.000 caracteres.

4.3.2 Especificação do Output

  • Formato de output: O output deve ser um JSON estruturado contendo os eventos de alerta e notificações gerados.
  • Exemplo de Estrutura de Output:
     {
      "eventos": [
        {
          "tipo_item": "documento",
          "id": "67890",
          "severidade": "alta",
          "motivo_principal": "DATA_EMISSAO_FUTURA",
          "destinatarios": [
            {
              "papel": "secretaria_academica",
              "canal_preferencial": "sistema"
            }
          ],
          "prazo_resposta_horas": 24,
          "mensagem": "[VALIDAÇÃO ACADÊMICA] Documento com data de emissão futura.",
          "deduplicacao_chave": "abc123",
          "enviar": true
        }
      ],
      "resumo": {
        "total_eventos": 10,
        "por_severidade": {
          "alta": 5,
          "media": 3,
          "baixa": 2
        }
      }
    }
  • Número de caracteres esperado: O JSON gerado deve ser claro e direto, com um tamanho estimado em 5.000 caracteres por evento.

4.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

4.3.4 Ferramentas do Agente

  • Documentos: Não consulta.
  • Calculadora: Utiliza lógica interna para geração de alertas e notificações.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não utiliza.

4.3.5 Memória

  • Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
  • Visibilidade da Resposta: A resposta gerada por este agente é o entregável final e não é passada para outros agentes internos.

4.3.6 Regras de Orquestração e Transição

A execução deste agente finaliza o fluxo. Os eventos de alerta e notificações gerados são os resultados que devem ser disponibilizados aos responsáveis.

© 2025 prototipe.ai. Todos os direitos reservados.