1. Propósito e Escopo
Este documento define todos os prompts, configurações de memória, transição entre estados e demais requisitos funcionais para o Fluxo de Agentes "Análise de Participação em Atividades Extracurriculares", uma solução de automação projetada para avaliar a participação dos estudantes em atividades extracurriculares e seu impacto no desempenho acadêmico. Essa documentação é um modelo de PRD ou Documento de Requisitos de Produto específicos para construção de Agentes de IA.
O objetivo principal é transformar dados brutos de participação em insights valiosos que possam informar decisões educacionais e promover o desenvolvimento acadêmico dos estudantes.
2. Contexto e Problema
Problemas Identificados
- Dificuldade em avaliar o impacto: Não há uma metodologia clara e sistemática para medir como as atividades extracurriculares influenciam o desempenho acadêmico.
- Falta de dados sistemáticos: A coleta de dados sobre a participação dos estudantes em atividades extracurriculares é inadequada e inconsistente.
3. Impactos Esperados
A implementação deste fluxo de automação visa alcançar os seguintes resultados:
- Melhorar a coleta de dados sobre a participação dos estudantes em atividades extracurriculares.
- Proporcionar insights precisos sobre o impacto dessas atividades no desempenho acadêmico.
- Promover ações educacionais que maximizem os benefícios das atividades extracurriculares.
4. Visão Geral da Solução
O agente de IA para análise de participação em atividades extracurriculares coleta e processa dados sobre a participação dos estudantes, avalia o impacto no desempenho acadêmico e propõe ações para melhorar os resultados educacionais. A seguir são detalhadas todas as regras de negócio e especificações funcionais necessárias para que esse agente atue como um assistente útil e autônomo na avaliação e promoção do desenvolvimento dos estudantes.
A solução consiste em um fluxo de automação composto por 5 agentes de IA. O processo inicia com a coleta de dados de participação e termina com a geração de um plano de ação para maximizar os benefícios das atividades extracurriculares.
| Agentes | Função Principal |
|---|---|
Agente de Coleta de Dados de Participação (RF 1)
| Ingerir e estruturar dados brutos de participação dos estudantes em atividades extracurriculares. |
Agente de Validação e Normalização de Dados (RF 2)
| Validar a qualidade dos dados coletados e normalizar nomes de atividades para uma taxonomia canônica. |
Agente de Consolidação de Desempenho Acadêmico (RF 3)
| Consolidar dados de participação com dados de desempenho acadêmico em um dataset analítico único. |
Agente de Análise de Impacto Acadêmico (RF 4)
| Estimar o impacto da participação em atividades extracurriculares sobre métricas acadêmicas. |
Agente de Proposição de Ações (RF 5)
| Gerar um plano de ações priorizadas para maximizar benefícios acadêmicos das atividades. |
5. Protótipos
Para proporcionar uma visão clara e tangível da solução proposta, criamos protótipos interativos que demonstram tanto o fluxo de trabalho dos agentes quanto o resultado final que o cliente receberá. Explore os links abaixo para entender melhor a solução em ação.
6. Requisitos Funcionais
RF 1. Agente de Coleta de Dados de Participação
1.1 Tarefa do Agente
Ingerir e estruturar dados brutos de participação dos estudantes em atividades extracurriculares a partir de arquivos (ex.: CSV) ou texto tabular.
1.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo dados brutos de participação dos estudantes em atividades extracurriculares. Esses dados podem vir de arquivos CSV ou texto tabular. # 2. Objetivo Ingerir e estruturar esses dados em um formato padronizado para análise subsequente. # 3. Regras que você deve seguir para gerar sua resposta - Mapear cabeçalhos equivalentes para o padrão exigido (ex.: aluno_id → estudante_id; atividade → atividade_nome; data → data_participacao; presente → presenca; minutos → carga_horaria_minutos). - Normalizar datas para YYYY-MM-DD; se inválida, descartar registro e não imputar. - Converter presenca para 0 ou 1 conforme valores (ex.: 'S','Sim','Y','True' → 1; 'N','Não','False' → 0); se ambíguo, definir 0. - Atividade_categoria deve permanecer null nesta etapa; não inferir taxonomia ainda. - Gerar chave_dedup = hash(estudante_id + '|' + atividade_nome + '|' + data_participacao) e remover duplicados, mantendo o primeiro registro válido. - Se carga_horaria_minutos ausente ou <=0, definir null. - Preencher origem_registro com 'csv' quando a fonte for arquivo; 'manual' quando for texto colado. - Calcular periodo_min e periodo_max a partir de data_participacao dos registros válidos. - Não criar métricas agregadas nesta etapa; somente padronização e deduplicação.
1.3 Configurações do Agente
1.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente é o ponto de partida do fluxo e deve ser acionado pelo envio de um arquivo CSV ou texto tabular via API. Na fase de testes, o fluxo será iniciado pelo envio manual dos dados, que serão enviados para o agente diretamente por upload do csv na interface da Prototipe AI, para acelerar o processo de validação.
- Tipo do input: O input inicial para o fluxo é um arquivo CSV ou texto tabular que contém dados de participação dos estudantes.
-
Formatos Suportados: Esse agente deve ser capaz de receber arquivos nos formatos:
.csv,.txt. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de texto com até 100.000 caracteres.
1.3.2 Especificação do Output
- Formato de output: O output deve ser um JSON estruturado com a lista padronizada de registros de participação.
-
Exemplo de Estrutura de Output:
{ "registros": [ { "estudante_id": "string", "atividade_nome": "string", "atividade_categoria": null, "data_participacao": "YYYY-MM-DD", "presenca": 0, "carga_horaria_minutos": null, "origem_registro": "csv", "chave_dedup": "string" } ], "metadados": { "periodo_min": "YYYY-MM-DD", "periodo_max": "YYYY-MM-DD", "total_registros_entrada": 100, "total_registros_saida": 90 } } - Número de caracteres esperado: O JSON gerado deve ser conciso e informativo, com um tamanho estimado em torno de 5.000 caracteres, podendo variar conforme a complexidade dos dados descritos.
1.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
1.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
1.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Validação e Normalização de Dados (RF 2).
1.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Validação e Normalização de Dados (RF 2).
RF 2. Agente de Validação e Normalização de Dados
2.1 Tarefa do Agente
Validar a qualidade dos dados coletados e normalizar nomes de atividades para uma taxonomia canônica.
2.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo um JSON de participação produzido pelo Agente de Coleta de Dados de Participação. # 2. Objetivo Validar a qualidade dos dados coletados e normalizar nomes de atividades para uma taxonomia canônica. # 3. Regras que você deve seguir para gerar sua resposta - Validar presença obrigatória de estudante_id, atividade_nome, data_participacao e presenca; descartar registros faltantes em qualquer obrigatório. - Validar faixa de datas: rejeitar datas futuras superiores a hoje + 1 dia; rejeitar datas anteriores a 10 anos do presente. - Normalizar strings removendo espaços extras, aplicando case consistente (atividade_nome em Title Case, estudante_id como string inalterada em case). - Classificar atividade_nome em atividade_categoria usando taxonomia canônica local com os rótulos: 'Esportes', 'Artes', 'Tecnologia', 'Ciências', 'Voluntariado', 'Liderança', 'Idiomas', 'Clubes Acadêmicos', 'Outros'. Quando não houver correspondência clara, usar 'Outros'. Não inferir subcategorias. - Manter tabela de motivos_descartes por tipo (data inválida, campos obrigatórios ausentes, duplicado, presenca inválida). - Calcular campos_nulos_porcentagem para carga_horaria_minutos e local. - Preencher taxonomia_utilizada.versao com 'v1.0' e listar categorias. - Incluir alertas quando: taxa_registros_descartados > 5%; ou porcentagem de presenca=1 < 20%; ou concentração >70% em uma única atividade_categoria.
2.3 Configurações do Agente
2.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão bem-sucedida do agente anterior (RF 1).
- Tipo do input: Este agente deve ser apto a receber como input um JSON de participação produzido pelo agente anterior.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json(JSON). - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de texto com até 5.000 caracteres.
2.3.2 Especificação do Output
- Formato de output: O output deve ser um JSON de participação validado e normalizado.
-
Exemplo de Estrutura de Output:
{ "registros": [ { "estudante_id": "string", "atividade_nome": "string", "atividade_categoria": "string", "data_participacao": "YYYY-MM-DD", "presenca": 1, "carga_horaria_minutos": null, "origem_registro": "csv", "chave_dedup": "string" } ], "qualidade_dados": { "taxa_registros_descartados": 0.05, "motivos_descartes": [ { "campo": "data_participacao", "quantidade": 5 } ], "campos_nulos_porcentagem": [ { "campo": "carga_horaria_minutos", "porcentagem": 0.2 } ], "alertas": ["taxa_registros_descartados > 5%"] }, "taxonomia_utilizada": { "versao": "v1.0", "categorias": ["Esportes", "Artes", "Tecnologia", "Ciências", "Voluntariado", "Liderança", "Idiomas", "Clubes Acadêmicos", "Outros"] } } - Número de caracteres esperado: O JSON gerado deve ser claro e direto, com um tamanho estimado em 6.000 caracteres.
2.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
2.3.4 Ferramentas do Agente
- Documentos: Não consulta.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não utiliza.
2.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Consolidação de Desempenho Acadêmico (RF 3).
2.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Consolidação de Desempenho Acadêmico (RF 3).
RF 3. Agente de Consolidação de Desempenho Acadêmico
3.1 Tarefa do Agente
Consolidar dados de participação com dados de desempenho acadêmico em um dataset analítico único.
3.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo dois conjuntos de dados: (a) participação validada do agente anterior; (b) desempenho acadêmico no formato especificado. # 2. Objetivo Consolidar esses dados em um único dataset analítico que permita análises detalhadas sobre o impacto das atividades extracurriculares no desempenho acadêmico. # 3. Regras que você deve seguir para gerar sua resposta - Padronizar gpa_atual e gpa_periodo_anterior para escala 0-100 com base em metadados. Se escala ausente, assumir '0-10' e reescalar multiplicando por 10. - Definir gpa_base = gpa_periodo_anterior quando disponível; caso contrário, usar média de gpa_atual dos 20% melhores da turma como baseline aproximado; marcar como null se turma < 10 alunos. - Calcular intensidade_participacao.dias_participados = soma de presenca=1 por estudante no período; horas_estimadas = soma de carga_horaria_minutos/60 quando disponível; se ausente em >60% dos registros, manter null. - Agregar categorias: contar dias por atividade_categoria. - Alinhar janela_analise como interseção entre periodo_referencia do desempenho e periodo_min/max da participação. - Remover estudantes sem correspondência entre os dois conjuntos (sem participação e sem desempenho) do bloco 'uniao', mas manter estatísticas de cobertura em metadados.proporcao_com_dados_completos.
3.3 Configurações do Agente
3.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 2).
- Tipo do input: Este agente deve ser apto a receber dois JSONs: (a) participação validada do agente anterior; (b) desempenho acadêmico no formato especificado.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json(JSON). - Número de caracteres esperado: Este agente deve ter capacidade para processar um input combinado de até 12.000 caracteres.
3.3.2 Especificação do Output
- Formato de output: O output deve ser um dataset analítico unificado.
-
Exemplo de Estrutura de Output:
{ "registros_participacao": [...], "desempenho_por_estudante": [...], "uniao": [ { "estudante_id": "string", "serie_ano": "string", "turma": "string", "genero": "string", "idade": null, "gpa_atual_padronizado": 85, "gpa_base": 80, "frequencia_escolar": 95, "intensidade_participacao": { "dias_participados": 15, "horas_estimadas": 25, "categorias": { "Esportes": { "dias": 5 } } }, "janela_analise": { "inicio": "YYYY-MM-DD", "fim": "YYYY-MM-DD" } } ], "metadados": { "escala_origem": "0-10", "reescalonado_para": "0-100", "proporcao_com_dados_completos": 0.8 } } - Número de caracteres esperado: O dataset gerado deve ser denso, com um tamanho mínimo esperado de 10.000 caracteres.
3.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
3.3.4 Ferramentas do Agente
- Documentos: Não consulta.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não utiliza.
3.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Análise de Impacto Acadêmico (RF 4).
3.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Análise de Impacto Acadêmico (RF 4).
RF 4. Agente de Análise de Impacto Acadêmico
4.1 Tarefa do Agente
Estimar o impacto da participação em atividades extracurriculares sobre métricas acadêmicas.
4.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo o dataset analítico unificado do Agente de Consolidação de Desempenho Acadêmico. # 2. Objetivo Estimar o impacto da participação em atividades extracurriculares sobre métricas acadêmicas e identificar padrões por categoria e segmento de estudantes. # 3. Regras que você deve seguir para gerar sua resposta - Definir grupo 'participantes' como estudantes com dias_participados >= 4 no período; 'baixa participação' entre 1-3 dias; 'não participantes' igual a 0. - Calcular delta_gpa = gpa_atual_padronizado - gpa_base quando gpa_base disponível; senão, estimar delta_gpa relativo à mediana da turma (gpa_atual - mediana_turma) e sinalizar limitação. - Calcular delta de frequência escolar em pontos percentuais quando houver referência anterior; se não houver, reportar apenas nível atual. - Para cada atividade_categoria, comparar participantes (>=4 dias na categoria) vs. não participantes dessa categoria, controlando por série_ano via comparação dentro de série (médias por série e depois média ponderada pelo n da série). - Classificar efeito_tamanho com base em |delta_gpa_medio|: baixo < 1.0; moderado 1.0–2.5; alto > 2.5 (na escala 0-100). - Definir confianca: 'alta' se n>=100 e presente em >=3 séries; 'media' se n entre 30–99; 'baixa' se n<30. Registrar criterio_confianca explicitamente. - Produzir cortes_por_segmento para série_ano, genero e turma quando n por grupo >= 10; caso contrário, omitir o grupo específico. - Incluir limitacoes quando: ausência de gpa_base para >40% dos estudantes; concentração de uma única categoria >70%; janela_analise < 60 dias; horas_estimadas indisponíveis. - Definir flags: amostra_insuficiente = true se n_estudantes < 50; viés_potencial = true se distribuição de genero ou série_ano entre participantes divergir >20 p.p. dos não participantes.
4.3 Configurações do Agente
4.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 3).
- Tipo do input: Este agente deve ser apto a receber o dataset analítico unificado do agente anterior.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json(JSON). - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 10.000 caracteres.
4.3.2 Especificação do Output
- Formato de output: O output deve ser um resumo analítico em JSON.
-
Exemplo de Estrutura de Output:
{ "resumo_markdown": "string", "metricas_gerais": { "n_estudantes": 100, "media_gpa_atual": 85.5, "media_gpa_base": 82.0, "delta_gpa_medio": 3.5, "frequencia_escolar_media": 95 }, "efeitos_por_categoria": [ { "categoria": "Esportes", "n": 50, "delta_gpa_medio": 1.5, "delta_freq_escolar_p.p.": 2.0, "efeito_tamanho": "moderado", "confianca": "media", "criterio_confianca": "n entre 30–99" } ], "cortes_por_segmento": [ { "segmento": "serie_ano", "chave": "2025", "n": 30, "delta_gpa_medio": 2.0 } ], "limitacoes": ["ausência de gpa_base para >40% dos estudantes"], "flags": { "amostra_insuficiente": false, "viés_potencial": true } } - Número de caracteres esperado: O resumo gerado deve ter um tamanho aproximado de 8.000 caracteres.
4.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
4.3.4 Ferramentas do Agente
- Documentos: Não consulta.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não utiliza.
4.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Proposição de Ações (RF 5).
4.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Proposição de Ações (RF 5).
RF 5. Agente de Proposição de Ações
5.1 Tarefa do Agente
Gerar um plano de ações priorizadas para maximizar benefícios acadêmicos das atividades extracurriculares.
5.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo o output do Agente de Análise de Impacto Acadêmico. # 2. Objetivo Gerar um plano de ações priorizadas para maximizar benefícios acadêmicos das atividades extracurriculares, considerando viabilidade e equidade. # 3. Regras que você deve seguir para gerar sua resposta - Gerar ações ancoradas nas categorias com efeito_tamanho 'moderado' ou 'alto' e confianca 'media' ou 'alta'. - Para categorias com 'baixa' confiança, propor pilotos controlados com n alvo entre 20–50 estudantes e indicadores claros. - Calcular prioridade.score = min(100, round( (impacto_potencial*0.6 + viabilidade*0.4) )), onde impacto_potencial: 0-100 mapeado por ganho_esperado (0→0, 3 p.p.→60, 6 p.p.→100) e viabilidade: 0-100 estimada por combinação de recursos_necessarios (menor custo e horas → maior viabilidade). - Sempre incluir pelo menos 1 ação de equidade para grupos subatendidos (ex.: genero minoritário na participação, séries com amostra baixa), quando flags.viés_potencial = true. - Definir indicadores_sucesso específicos à ação (ex.: 'aumento_delta_gpa_categoria_Tecnologia'), com definição e meta numérica alcançável em 3–6 meses. - Incluir riscos_mitigacoes: risco de sobrecarga do estudante, limitação de infraestrutura, adesão baixa; com respectivas estratégias de mitigação. - Diretrizes de implementação devem cobrir: comunicação com responsáveis, cronograma trimestral, critérios de elegibilidade, e mecanismo de monitoramento contínuo.
5.3 Configurações do Agente
5.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 4).
- Tipo do input: Este agente deve ser apto a receber o output do Agente de Análise de Impacto Acadêmico.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json(JSON). - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 8.000 caracteres.
5.3.2 Especificação do Output
- Formato de output: O output deve ser um plano de ações em JSON.
-
Exemplo de Estrutura de Output:
{ "acoes": [ { "acao_id": "string", "titulo": "string", "tipo": "programa", "publico_alvo": { "criterio": "string", "filtro": { "categoria": "string", "serie_ano": "string" } }, "medidas": ["string"], "recursos_necessarios": { "horas_professor": 10, "custo_estimado": 500, "espaços": ["Sala Multiuso"] }, "expectativa_impacto": { "metrica": "gpa", "ganho_esperado": 3, "horizonte_meses": 6 }, "riscos_mitigacoes": ["risco de sobrecarga do estudante"], "indicadores_sucesso": [ { "nome": "aumento_delta_gpa_categoria_Tecnologia", "definicao": "string", "meta": 2, "periodicidade": "trimestral" } ], "prioridade": { "score": 85, "justificativa": "string" } } ], "diretrizes_implementacao": ["comunicação com responsáveis"] } - Número de caracteres esperado: O plano de ações gerado deve ter um tamanho aproximado de 12.000 caracteres.
5.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
5.3.4 Ferramentas do Agente
- Documentos: Não consulta.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não utiliza.
5.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente é o entregável final e não é passada para outros agentes internos.
5.3.6 Regras de Orquestração e Transição
A execução deste agente finaliza o fluxo. O plano de ações gerado é o resultado que deve ser disponibilizado ao usuário.