1. Propósito e Escopo
Este documento define todos os prompts, configurações de memória, transição entre estados, ferramentas como chamadas a sistemas externos e demais requisitos funcionais para o agente de IA "Sugestão de Melhorias em Avaliações". Essa documentação é um modelo de PRD ou Documento de Requisitos de Produto específicos para construção de Agentes de IA.
O objetivo principal é analisar avaliações passadas e sugerir melhorias para futuras edições, visando aumentar a eficácia na medição do aprendizado.
2. Contexto e Problema
Cenário Atual
Atualmente, as avaliações utilizadas para medir o aprendizado dos alunos apresentam problemas específicos que comprometem sua eficácia:
- Falta de eficácia das avaliações em medir o aprendizado real dos alunos.
- Necessidade de melhorias contínuas nos instrumentos de avaliação.
Essas questões demandam uma análise detalhada das avaliações passadas para identificar áreas de melhoria e sugerir alterações que possam aumentar sua eficácia.
Problemas Identificados
- Incapacidade de medir aprendizado real: As avaliações atuais não conseguem refletir com precisão o conhecimento adquirido pelos alunos.
- Falta de melhorias contínuas: Não há um processo sistemático para revisar e melhorar os instrumentos de avaliação com base em dados concretos.
3. Impactos Esperados
A implementação deste agente de IA visa alcançar os seguintes resultados:
- Aumentar a eficácia das avaliações em medir o aprendizado real dos alunos.
- Estabelecer um processo contínuo de melhorias para os instrumentos de avaliação.
- Apoiar educadores na implementação de práticas de avaliação mais eficazes.
4. Visão Geral da Solução
O agente de IA para sugestão de melhorias em avaliações analisa dados de avaliações passadas, identifica áreas de melhoria e propõe alterações para aumentar a eficácia das avaliações futuras. A seguir são detalhadas todas as regras de negócio e especificações funcionais necessárias para que esse agente atue como um assistente útil e autônomo na melhoria dos instrumentos de avaliação.
A solução consiste em um fluxo de automação composto por três agentes de IA. O processo inicia com a análise de avaliações passadas e termina com a implementação de práticas avaliativas melhoradas.
A execução dos agentes é sequencial e linear, seguindo a ordem definida na tabela abaixo.
| Agentes | Função Principal |
|---|---|
Agente de Análise de Avaliações Passadas (RF 1)
| Diagnosticar a qualidade das avaliações passadas e identificar oportunidades de melhoria. |
Agente de Redesign e Sugestão de Melhorias em Avaliações (RF 2)
| Transformar achados diagnósticos em melhorias concretas para as avaliações. |
Agente de Apoio à Implementação de Práticas Avaliativas (RF 3)
| Apoiar educadores na adoção das melhorias propostas. |
5. Protótipos
Para proporcionar uma visão clara e tangível da solução proposta, criamos protótipos interativos que demonstram tanto o fluxo de trabalho dos agentes quanto o resultado final que o cliente receberá. Explore os links abaixo para entender melhor a solução em ação.
6. Requisitos Funcionais
RF 1. Agente de Análise de Avaliações Passadas
1.1 Tarefa do Agente
Diagnosticar a qualidade das avaliações passadas e identificar oportunidades de melhoria com base em evidências de alinhamento, dificuldade, discriminação e cobertura de objetivos de aprendizagem.
1.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo um pacote de dados estruturado contendo informações sobre avaliações passadas, incluindo respostas dos alunos, gabarito oficial e metadados dos itens. # 2. Objetivo Diagnosticar a qualidade das avaliações passadas e identificar oportunidades de melhoria com base em evidências de alinhamento, dificuldade, discriminação e cobertura de objetivos de aprendizagem. # 3. Regras que você deve seguir para gerar sua resposta - Regra 1: Se banco de respostas e gabarito estiverem presentes, habilite cálculo de dificuldade e discriminação_proxy; caso contrário, defina dificuldade como 'indisponível' e use análise qualitativa (ambiguidade/alinhamento) com base no texto e metadados. - Regra 2: Para cada item com respostas, calcule taxa_acerto = acertos/total e defina dificuldade_p = 1 - taxa_acerto. Classifique dificuldade_categoria: fácil (taxa_acerto ≥ 0.7), moderado (0.4 ≤ taxa_acerto < 0.7), difícil (taxa_acerto < 0.4). - Regra 3: Se houver nota total por aluno, estime discriminação_proxy por correlação entre acerto no item (0/1) e nota total padronizada; classifique: baixa (<0.1), média (0.1–0.3), alta (>0.3). - Regra 4: Para cada item, confronte objetivo declarado vs. conteúdo e nível cognitivo. Marque alinhamento_objetivo = true apenas quando verbo e conteúdo do item avaliam o mesmo construto do objetivo. - Regra 5: Sinalize ambiguidade_suspeita = true quando: duas alternativas semanticamente corretas; enunciado com termos vagos sem critério de correção. # 4. Exemplo de Output que você deve produzir JSON com sumário geral, métricas por item e recomendações de melhoria.
1.3 Configurações do Agente
1.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente é o ponto de partida do fluxo e deve ser acionado pelo envio de um pacote de dados estruturado via API. Na fase de testes, o fluxo será iniciado pelo envio manual dos dados, que serão enviados para o agente diretamente por upload na interface da Prototipe AI, para acelerar o processo de validação.
- Tipo do input: Dados estruturados contendo respostas dos alunos, gabarito e metadados dos itens.
-
Formatos Suportados: Esse agente deve ser capaz de receber dados nos formatos:
.csv,.json. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 100.000 caracteres.
1.3.2 Especificação do Output
- Formato de output: O output deve ser um arquivo no formato JSON contendo o diagnóstico completo das avaliações passadas.
-
Exemplo de Estrutura de Output:
{ "sumário_geral": { "n_itens": 20, "n_alunos": 100, "cobertura_objetivos": "80%", "distribuição_nível_cognitivo": "balanceada", "tempo_estimado_total": "120 minutos" }, "métricas_por_item": [ { "item_id": "1", "dificuldade_p": 0.3, "taxa_acerto": "70%", "discriminação_proxy": 0.2, "ambiguidade_suspeita": false, "alinhamento_objetivo": true, "cobertura_conteúdo": ["Matemática", "Álgebra"], "problema_detectado": ["nenhum"] } ], "lacunas_de_cobertura": [ { "objetivo": "Resolver equações", "cobertura_atual": "70%", "cobertura_desejada": "90%", "itens_impactados": ["1", "2", "3"] } ], "recomendações_priorizadas": [ { "id_ref": "1", "impacto": "alto", "esforço": "baixo", "descrição_curta": "Revisar enunciado para clareza" } ] } - Número de caracteres esperado: O JSON gerado terá um tamanho aproximado de 5.000 caracteres.
1.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
1.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Utiliza lógica interna para cálculos estatísticos.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
1.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Redesign e Sugestão de Melhorias em Avaliações (RF 2).
1.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Redesign e Sugestão de Melhorias em Avaliações (RF 2).
RF 2. Agente de Redesign e Sugestão de Melhorias em Avaliações
2.1 Tarefa do Agente
Transformar achados diagnósticos em melhorias concretas de itens e da avaliação como um todo, aumentando a validade, confiabilidade e alinhamento com os objetivos de aprendizagem.
2.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo o output JSON do Agente de Análise de Avaliações Passadas, contendo métricas por item, lacunas de cobertura e recomendações priorizadas. # 2. Objetivo Transformar achados diagnósticos em melhorias concretas de itens e da avaliação como um todo. # 3. Regras que você deve seguir para gerar sua resposta - Regra 1: Para cada item revisado/criado, declare objetivo específico, verbo cognitivo e evidência observável esperada na resposta. - Regra 2: Para itens de múltipla escolha, produza 3–4 distratores plausíveis baseados em erros comuns; garanta uma única alternativa correta. - Regra 3: Reclassifique itens fáceis com baixa discriminação para níveis superiores via inclusão de contexto, dados, ou necessidade de justificativa. - Regra 4: Sempre que sugerir item discursivo, forneça rubrica com critérios, níveis de desempenho e exemplos de respostas aceitáveis. # 4. Exemplo de Output que você deve produzir JSON com revisões por item, novos itens sugeridos e plano de prova.
2.3 Configurações do Agente
2.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 1).
- Tipo do input: Output JSON do Agente de Análise de Avaliações Passadas.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 5.000 caracteres.
2.3.2 Especificação do Output
- Formato de output: O output deve ser um arquivo no formato JSON contendo as melhorias sugeridas para as avaliações.
-
Exemplo de Estrutura de Output:
{ "revisões_por_item": [ { "item_id": "1", "ação_recomendada": "Revisar enunciado", "enunciado_revisado": "Qual é a solução correta para a equação?", "alternativas_revisadas": ["x = 2", "x = 3", "x = 4", "x = 5"], "chave_corretas": "x = 4", "justificativa_pedagogica": "Alinhado com o objetivo de resolver equações", "nível_cognitivo_proposto": "Aplicação", "estimativa_tempo_min": 5 } ], "novos_itens_sugeridos": [ { "objetivo": "Compreender funções", "nível_cognitivo": "Compreensão", "tipo": "Múltipla escolha", "enunciado": "Qual é a definição de uma função linear?", "alternativas": ["Relação de dependência", "Equação de segundo grau", "Relação proporcional"], "chave": "Relação de dependência", "justificativa": "Essencial para o entendimento de funções matemáticas", "estimativa_tempo_min": 3 } ], "plano_de_prova": { "objetivo": "Avaliar compreensão matemática", "número_itens": 10, "distribuição_nível_cognitivo": "3 aplicação, 7 compreensão", "tempo_total_estimado": 60 } } - Número de caracteres esperado: O JSON gerado terá um tamanho aproximado de 4.000 caracteres.
2.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
2.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
2.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Apoio à Implementação de Práticas Avaliativas (RF 3).
2.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Apoio à Implementação de Práticas Avaliativas (RF 3).
RF 3. Agente de Apoio à Implementação de Práticas Avaliativas
3.1 Tarefa do Agente
Apoiar educadores na adoção das melhorias propostas, preparando um plano de piloto, instrumentos de coleta de evidências e métricas de sucesso para iteração contínua.
3.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo o pacote de redesign do agente anterior, incluindo melhorias sugeridas e plano de prova. # 2. Objetivo Apoiar educadores na adoção das melhorias propostas, preparando um plano de piloto, instrumentos de coleta de evidências e métricas de sucesso. # 3. Regras que você deve seguir para gerar sua resposta - Regra 1: Priorize testar itens com maior impacto_previsto e risco identificado. - Regra 2: Defina métricas operacionais como taxa_de_conclusão, incidência_de_itens_ambíguos e tempo_médio_por_item. - Regra 3: Considere sucesso quando discriminação média aumenta ou se mantém ≥ 0.2. - Regra 4: Para cada item, defina decisão = 'adotar', 'ajustar' ou 'descartar' com base nas métricas e feedback. # 4. Exemplo de Output que você deve produzir JSON com plano piloto, instrumentos de coleta e métricas de sucesso.
3.3 Configurações do Agente
3.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 2).
- Tipo do input: Pacote de redesign do agente anterior, incluindo melhorias sugeridas e plano de prova.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 4.000 caracteres.
3.3.2 Especificação do Output
- Formato de output: O output deve ser um arquivo no formato JSON contendo o plano de piloto, instrumentos de coleta de evidências e métricas de sucesso.
-
Exemplo de Estrutura de Output:
{ "plano_piloto": { "turma": "8º ano", "escopo_itens": "Matemática - Funções", "cronograma": "Setembro - Outubro", "responsabilidades": "Coordenação pedagógica", "materiais_necessários": "Provas impressas, formulários de feedback" }, "instrumentos_de_coleta": { "formulário_feedback_docente": "Disponível online", "formulário_feedback_discente": "Distribuído em sala", "checklist_aplicador": "Verificação antes da aplicação" }, "métricas_e_marcadores": { "nome_métrica": "Taxa de Conclusão", "definição": "Percentual de alunos que completam todas as questões", "fórmula/critério": "(número de alunos que completam / total de alunos) * 100", "meta": "95%", "janela_coleta": "Durante a aplicação" } } - Número de caracteres esperado: O JSON gerado terá um tamanho aproximado de 3.500 caracteres.
3.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
3.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
3.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente é o entregável final e não é passada para outros agentes internos.
3.3.6 Regras de Orquestração e Transição
A execução deste agente finaliza o fluxo. O JSON gerado é o resultado que deve ser disponibilizado ao usuário.