Agente de IA para Sugestão de Melhorias em Avaliações

18 de December de 2025 • Tempo de leitura: 5 min

Como criar um agente de IA que analisa avaliações passadas e sugere melhorias para futuras edições.

1. Propósito e Escopo

Este documento define todos os prompts, configurações de memória, transição entre estados, ferramentas como chamadas a sistemas externos e demais requisitos funcionais para o agente de IA "Sugestão de Melhorias em Avaliações". Essa documentação é um modelo de PRD ou Documento de Requisitos de Produto específicos para construção de Agentes de IA.

O objetivo principal é analisar avaliações passadas e sugerir melhorias para futuras edições, visando aumentar a eficácia na medição do aprendizado.

2. Contexto e Problema

Cenário Atual

Atualmente, as avaliações utilizadas para medir o aprendizado dos alunos apresentam problemas específicos que comprometem sua eficácia:

  • Falta de eficácia das avaliações em medir o aprendizado real dos alunos.
  • Necessidade de melhorias contínuas nos instrumentos de avaliação.

Essas questões demandam uma análise detalhada das avaliações passadas para identificar áreas de melhoria e sugerir alterações que possam aumentar sua eficácia.


Problemas Identificados

  • Incapacidade de medir aprendizado real: As avaliações atuais não conseguem refletir com precisão o conhecimento adquirido pelos alunos.
  • Falta de melhorias contínuas: Não há um processo sistemático para revisar e melhorar os instrumentos de avaliação com base em dados concretos.

3. Impactos Esperados

A implementação deste agente de IA visa alcançar os seguintes resultados:

  • Aumentar a eficácia das avaliações em medir o aprendizado real dos alunos.
  • Estabelecer um processo contínuo de melhorias para os instrumentos de avaliação.
  • Apoiar educadores na implementação de práticas de avaliação mais eficazes.

4. Visão Geral da Solução

O agente de IA para sugestão de melhorias em avaliações analisa dados de avaliações passadas, identifica áreas de melhoria e propõe alterações para aumentar a eficácia das avaliações futuras. A seguir são detalhadas todas as regras de negócio e especificações funcionais necessárias para que esse agente atue como um assistente útil e autônomo na melhoria dos instrumentos de avaliação.

A solução consiste em um fluxo de automação composto por três agentes de IA. O processo inicia com a análise de avaliações passadas e termina com a implementação de práticas avaliativas melhoradas.

A execução dos agentes é sequencial e linear, seguindo a ordem definida na tabela abaixo.

Agentes Função Principal
Agente de Análise de Avaliações Passadas (RF 1) Diagnosticar a qualidade das avaliações passadas e identificar oportunidades de melhoria.
Agente de Redesign e Sugestão de Melhorias em Avaliações (RF 2) Transformar achados diagnósticos em melhorias concretas para as avaliações.
Agente de Apoio à Implementação de Práticas Avaliativas (RF 3) Apoiar educadores na adoção das melhorias propostas.

5. Protótipos

Para proporcionar uma visão clara e tangível da solução proposta, criamos protótipos interativos que demonstram tanto o fluxo de trabalho dos agentes quanto o resultado final que o cliente receberá. Explore os links abaixo para entender melhor a solução em ação.

6. Requisitos Funcionais

RF 1. Agente de Análise de Avaliações Passadas

1.1 Tarefa do Agente

Diagnosticar a qualidade das avaliações passadas e identificar oportunidades de melhoria com base em evidências de alinhamento, dificuldade, discriminação e cobertura de objetivos de aprendizagem.

1.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo um pacote de dados estruturado contendo informações sobre avaliações passadas, incluindo respostas dos alunos, gabarito oficial e metadados dos itens.

# 2. Objetivo
Diagnosticar a qualidade das avaliações passadas e identificar oportunidades de melhoria com base em evidências de alinhamento, dificuldade, discriminação e cobertura de objetivos de aprendizagem.

# 3. Regras que você deve seguir para gerar sua resposta
- Regra 1: Se banco de respostas e gabarito estiverem presentes, habilite cálculo de dificuldade e discriminação_proxy; caso contrário, defina dificuldade como 'indisponível' e use análise qualitativa (ambiguidade/alinhamento) com base no texto e metadados.
- Regra 2: Para cada item com respostas, calcule taxa_acerto = acertos/total e defina dificuldade_p = 1 - taxa_acerto. Classifique dificuldade_categoria: fácil (taxa_acerto ≥ 0.7), moderado (0.4 ≤ taxa_acerto < 0.7), difícil (taxa_acerto < 0.4).
- Regra 3: Se houver nota total por aluno, estime discriminação_proxy por correlação entre acerto no item (0/1) e nota total padronizada; classifique: baixa (<0.1), média (0.1–0.3), alta (>0.3).
- Regra 4: Para cada item, confronte objetivo declarado vs. conteúdo e nível cognitivo. Marque alinhamento_objetivo = true apenas quando verbo e conteúdo do item avaliam o mesmo construto do objetivo.
- Regra 5: Sinalize ambiguidade_suspeita = true quando: duas alternativas semanticamente corretas; enunciado com termos vagos sem critério de correção.

# 4. Exemplo de Output que você deve produzir
JSON com sumário geral, métricas por item e recomendações de melhoria.
1.3 Configurações do Agente

1.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente é o ponto de partida do fluxo e deve ser acionado pelo envio de um pacote de dados estruturado via API. Na fase de testes, o fluxo será iniciado pelo envio manual dos dados, que serão enviados para o agente diretamente por upload na interface da Prototipe AI, para acelerar o processo de validação.
  • Tipo do input: Dados estruturados contendo respostas dos alunos, gabarito e metadados dos itens.
  • Formatos Suportados: Esse agente deve ser capaz de receber dados nos formatos: .csv, .json.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 100.000 caracteres.

1.3.2 Especificação do Output

  • Formato de output: O output deve ser um arquivo no formato JSON contendo o diagnóstico completo das avaliações passadas.
  • Exemplo de Estrutura de Output:
     {
      "sumário_geral": {
        "n_itens": 20,
        "n_alunos": 100,
        "cobertura_objetivos": "80%",
        "distribuição_nível_cognitivo": "balanceada",
        "tempo_estimado_total": "120 minutos"
      },
      "métricas_por_item": [
        {
          "item_id": "1",
          "dificuldade_p": 0.3,
          "taxa_acerto": "70%",
          "discriminação_proxy": 0.2,
          "ambiguidade_suspeita": false,
          "alinhamento_objetivo": true,
          "cobertura_conteúdo": ["Matemática", "Álgebra"],
          "problema_detectado": ["nenhum"]
        }
      ],
      "lacunas_de_cobertura": [
        {
          "objetivo": "Resolver equações",
          "cobertura_atual": "70%",
          "cobertura_desejada": "90%",
          "itens_impactados": ["1", "2", "3"]
        }
      ],
      "recomendações_priorizadas": [
        {
          "id_ref": "1",
          "impacto": "alto",
          "esforço": "baixo",
          "descrição_curta": "Revisar enunciado para clareza"
        }
      ]
    } 
  • Número de caracteres esperado: O JSON gerado terá um tamanho aproximado de 5.000 caracteres.

1.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

1.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Utiliza lógica interna para cálculos estatísticos.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

1.3.5 Memória

1.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Redesign e Sugestão de Melhorias em Avaliações (RF 2).

RF 2. Agente de Redesign e Sugestão de Melhorias em Avaliações

2.1 Tarefa do Agente

Transformar achados diagnósticos em melhorias concretas de itens e da avaliação como um todo, aumentando a validade, confiabilidade e alinhamento com os objetivos de aprendizagem.

2.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo o output JSON do Agente de Análise de Avaliações Passadas, contendo métricas por item, lacunas de cobertura e recomendações priorizadas.

# 2. Objetivo
Transformar achados diagnósticos em melhorias concretas de itens e da avaliação como um todo.

# 3. Regras que você deve seguir para gerar sua resposta
- Regra 1: Para cada item revisado/criado, declare objetivo específico, verbo cognitivo e evidência observável esperada na resposta.
- Regra 2: Para itens de múltipla escolha, produza 3–4 distratores plausíveis baseados em erros comuns; garanta uma única alternativa correta.
- Regra 3: Reclassifique itens fáceis com baixa discriminação para níveis superiores via inclusão de contexto, dados, ou necessidade de justificativa.
- Regra 4: Sempre que sugerir item discursivo, forneça rubrica com critérios, níveis de desempenho e exemplos de respostas aceitáveis.

# 4. Exemplo de Output que você deve produzir
JSON com revisões por item, novos itens sugeridos e plano de prova.
2.3 Configurações do Agente

2.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 1).
  • Tipo do input: Output JSON do Agente de Análise de Avaliações Passadas.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 5.000 caracteres.

2.3.2 Especificação do Output

  • Formato de output: O output deve ser um arquivo no formato JSON contendo as melhorias sugeridas para as avaliações.
  • Exemplo de Estrutura de Output:
     {
      "revisões_por_item": [
        {
          "item_id": "1",
          "ação_recomendada": "Revisar enunciado",
          "enunciado_revisado": "Qual é a solução correta para a equação?",
          "alternativas_revisadas": ["x = 2", "x = 3", "x = 4", "x = 5"],
          "chave_corretas": "x = 4",
          "justificativa_pedagogica": "Alinhado com o objetivo de resolver equações",
          "nível_cognitivo_proposto": "Aplicação",
          "estimativa_tempo_min": 5
        }
      ],
      "novos_itens_sugeridos": [
        {
          "objetivo": "Compreender funções",
          "nível_cognitivo": "Compreensão",
          "tipo": "Múltipla escolha",
          "enunciado": "Qual é a definição de uma função linear?",
          "alternativas": ["Relação de dependência", "Equação de segundo grau", "Relação proporcional"],
          "chave": "Relação de dependência",
          "justificativa": "Essencial para o entendimento de funções matemáticas",
          "estimativa_tempo_min": 3
        }
      ],
      "plano_de_prova": {
        "objetivo": "Avaliar compreensão matemática",
        "número_itens": 10,
        "distribuição_nível_cognitivo": "3 aplicação, 7 compreensão",
        "tempo_total_estimado": 60
      }
    } 
  • Número de caracteres esperado: O JSON gerado terá um tamanho aproximado de 4.000 caracteres.

2.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

2.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

2.3.5 Memória

2.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Apoio à Implementação de Práticas Avaliativas (RF 3).

RF 3. Agente de Apoio à Implementação de Práticas Avaliativas

3.1 Tarefa do Agente

Apoiar educadores na adoção das melhorias propostas, preparando um plano de piloto, instrumentos de coleta de evidências e métricas de sucesso para iteração contínua.

3.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo o pacote de redesign do agente anterior, incluindo melhorias sugeridas e plano de prova.

# 2. Objetivo
Apoiar educadores na adoção das melhorias propostas, preparando um plano de piloto, instrumentos de coleta de evidências e métricas de sucesso.

# 3. Regras que você deve seguir para gerar sua resposta
- Regra 1: Priorize testar itens com maior impacto_previsto e risco identificado.
- Regra 2: Defina métricas operacionais como taxa_de_conclusão, incidência_de_itens_ambíguos e tempo_médio_por_item.
- Regra 3: Considere sucesso quando discriminação média aumenta ou se mantém ≥ 0.2.
- Regra 4: Para cada item, defina decisão = 'adotar', 'ajustar' ou 'descartar' com base nas métricas e feedback.

# 4. Exemplo de Output que você deve produzir
JSON com plano piloto, instrumentos de coleta e métricas de sucesso.
3.3 Configurações do Agente

3.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 2).
  • Tipo do input: Pacote de redesign do agente anterior, incluindo melhorias sugeridas e plano de prova.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato: .json.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 4.000 caracteres.

3.3.2 Especificação do Output

  • Formato de output: O output deve ser um arquivo no formato JSON contendo o plano de piloto, instrumentos de coleta de evidências e métricas de sucesso.
  • Exemplo de Estrutura de Output:
     {
      "plano_piloto": {
        "turma": "8º ano",
        "escopo_itens": "Matemática - Funções",
        "cronograma": "Setembro - Outubro",
        "responsabilidades": "Coordenação pedagógica",
        "materiais_necessários": "Provas impressas, formulários de feedback"
      },
      "instrumentos_de_coleta": {
        "formulário_feedback_docente": "Disponível online",
        "formulário_feedback_discente": "Distribuído em sala",
        "checklist_aplicador": "Verificação antes da aplicação"
      },
      "métricas_e_marcadores": {
        "nome_métrica": "Taxa de Conclusão",
        "definição": "Percentual de alunos que completam todas as questões",
        "fórmula/critério": "(número de alunos que completam / total de alunos) * 100",
        "meta": "95%",
        "janela_coleta": "Durante a aplicação"
      }
    } 
  • Número de caracteres esperado: O JSON gerado terá um tamanho aproximado de 3.500 caracteres.

3.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

3.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

3.3.5 Memória

  • Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
  • Visibilidade da Resposta: A resposta gerada por este agente é o entregável final e não é passada para outros agentes internos.

3.3.6 Regras de Orquestração e Transição

A execução deste agente finaliza o fluxo. O JSON gerado é o resultado que deve ser disponibilizado ao usuário.

© 2025 prototipe.ai. Todos os direitos reservados.