1. Propósito e Escopo
Este documento define todos os prompts, configurações de memória, transição entre estados e demais requisitos funcionais para o Fluxo de Agentes "Análise de Impacto de Intervenções Educacionais", uma solução projetada para avaliar sistematicamente o impacto de intervenções educacionais específicas. Essa documentação é um modelo de PRD ou Documento de Requisitos de Produto específicos para construção de Agentes de IA.
O objetivo principal é fornecer insights detalhados sobre a eficácia das intervenções e sugerir áreas de melhoria, com base em dados coletados.
2. Contexto e Problema
Cenário Atual
No contexto educacional, muitas intervenções são implementadas sem uma avaliação sistemática de seu impacto, o que dificulta a compreensão de sua eficácia e limita a identificação de áreas de melhoria. Isso resulta em:
- Falta de dados concretos sobre a eficácia das intervenções.
- Dificuldades em ajustar e otimizar intervenções para melhores resultados.
- Desperdício de recursos em programas pouco eficazes.
Problemas Identificados
- Avaliação Insuficiente: Falta de mecanismos eficientes para medir o impacto das intervenções educacionais.
- Necessidade de Insights: Carência de insights claros sobre eficácia e possíveis melhorias das intervenções.
3. Impactos Esperados
A implementação deste fluxo de automação visa alcançar os seguintes resultados:
- Melhorar a avaliação do impacto das intervenções educacionais.
- Fornecer insights detalhados sobre a eficácia das intervenções.
- Identificar áreas de melhoria para otimizar futuras intervenções.
4. Visão Geral da Solução
O agente de IA para análise de impacto de intervenções educacionais processa dados coletados, aplica regras de análise e fornece insights sobre a eficácia e áreas de melhoria. A seguir são detalhadas todas as regras de negócio e especificações funcionais necessárias para que esse agente atue como um assistente útil e autônomo na avaliação e otimização de intervenções educacionais.
A solução consiste em um fluxo de automação composto por 4 agentes de IA. O processo inicia com a padronização e validação dos dados de intervenções e termina com a geração de insights acionáveis.
A execução dos agentes é sequencial e linear, seguindo a ordem definida na tabela abaixo.
| Agentes | Função Principal |
|---|---|
Agente de Padronização e Validação de Dados de Intervenções (RF 1)
| Padronizar o dataset de intervenções e validar sua consistência mínima para análise de impacto. |
Agente de Cálculo de Impacto e Eficácia (RF 2)
| Estimar o impacto da intervenção e classificar sua eficácia com base em métricas padronizadas. |
Agente de Análise de Subgrupos e Sensibilidade (RF 3)
| Explorar heterogeneidade de efeitos por subgrupos e testar sensibilidade das conclusões. |
Agente de Geração de Insights e Áreas de Melhoria (RF 4)
| Sintetizar resultados em insights acionáveis e recomendar áreas de melhoria. |
5. Protótipos
Para proporcionar uma visão clara e tangível da solução proposta, criamos protótipos interativos que demonstram tanto o fluxo de trabalho dos agentes quanto o resultado final que o cliente receberá. Explore os links abaixo para entender melhor a solução em ação.
6. Requisitos Funcionais
RF 1. Agente de Padronização e Validação de Dados de Intervenções
1.1 Tarefa do Agente
Padronizar o dataset de intervenções educacionais e validar sua consistência mínima para análise de impacto.
1.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo um conjunto de dados brutos sobre intervenções educacionais. Este conjunto contém informações variadas sobre as intervenções, grupos de tratamento e controle, e resultados pré e pós-intervenção. # 2. Objetivo Padronizar o dataset e validar sua consistência mínima para garantir que está pronto para análise de impacto. # 3. Regras que você deve seguir para gerar sua resposta - Validar presença de chaves mínimas por linha: aluno_id, grupo, periodo_pre, periodo_pos; marcar pronto_para_analise=false se qualquer uma tiver >20% de faltantes. - Garantir tipos: converter periodo_pre e periodo_pos para numéricos; linhas não convertíveis devem ser marcadas em validations.alertas e excluídas da análise. - Resolver duplicatas por aluno_id mantendo o registro com data_pos mais recente; registrar contagem em validations.duplicatas_por_aluno. - Normalizar grupos aceitando variações (ex.: T, trat, tratamento → tratamento; C, ctrl, controle → controle); se não houver grupo controle presente, registrar gruos_detectados e permitir análise do tipo pre_pos_sem_controle. - Padronizar escalas se informado variavel_resultado com escala explícita (ex.: 0-10, 0-100): converter todas para 0-100 e registrar a transformação em tratamentos_aplicados. - Calcular métricas descritivas básicas por grupo: média_pre, média_pos, n, desvio_padrao_pre, desvio_padrao_pos; incluir em dataset_padronizado.metadados. - Regra de missing: se faltantes em periodo_pos > 15% em qualquer grupo, adicionar alerta crítico; não imputar valores neste estágio. - Validar coerência temporal: data_pos >= data_pre; linhas com inconsistência temporal devem ser removidas e relatadas. - Se houver variáveis de fidelidade (fidelity) ou presença (presenca), padronizar em 0-1; valores fora do intervalo devem ser truncados para [0,1] e alertados. - Definir validations.pronto_para_analise=true apenas se: (i) tipos coerentes, (ii) duplicatas resolvidas, (iii) faltantes em periodo_pos <= 20% total e (iv) ao menos 30 unidades (aluno_id) no total.
1.3 Configurações do Agente
1.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente é o ponto de partida do fluxo e deve ser acionado pelo envio de dados estruturados sobre intervenções educacionais via API. Na fase de testes, os dados serão enviados para o agente diretamente por upload de um csv na interface da Prototipe AI, para acelerar o processo de validação.
- Tipo do input: Dados estruturados de intervenções educacionais.
-
Formatos Suportados: Esse agente deve ser capaz de receber dados nos formatos:
.csv. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 100.000 caracteres.
1.3.2 Especificação do Output
- Formato de output: O output deve ser um JSON contendo o dataset padronizado e validado, além de metadados e validações aplicadas.
-
Exemplo de Estrutura de Output:
{"dataset_padronizado": [...linhas normalizadas...], "schema": {"chaves_obrigatorias": ["aluno_id","grupo","periodo_pre","periodo_pos"], "tipos": {"periodo_pre":"numerico","periodo_pos":"numerico"}}, "validations": {"linhas_totais": 1234, "faltantes": {"periodo_pre": 12, "periodo_pos": 9}, "duplicatas_por_aluno": 3, "grupos_detectados": ["tratamento","controle"], "alertas": ["mais de 10% de faltantes em periodo_pos"], "pronto_para_analise": true}, "tratamentos_aplicados": ["imputacao_simples_nao_aplicada","remoção de duplicatas por aluno_id mantendo último registro"]} - Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado de 5.000 caracteres.
1.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
1.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
1.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Cálculo de Impacto e Eficácia (RF 2).
1.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Cálculo de Impacto e Eficácia (RF 2).
RF 2. Agente de Cálculo de Impacto e Eficácia
2.1 Tarefa do Agente
Estimar o impacto da intervenção educacional e classificar sua eficácia com base em métricas padronizadas.
2.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais
Você está recebendo o dataset padronizado e validado de intervenções educacionais, pronto para análise de impacto.
# 2. Objetivo
Calcular as métricas de impacto e eficácia da intervenção, classificando sua eficácia.
# 3. Regras que você deve seguir para gerar sua resposta
- Escolha do enquadramento metodológico: (a) Se existem medidas pre e pos para tratamento e controle → pre_pos_com_controle; (b) Se apenas tratamento tem pre e pos, sem controle → pre_pos_sem_controle; (c) Se há apenas pos com controle comparável → pos_somente_com_controle.
- Efeito absoluto: calcular delta_trat = media_pos_trat - media_pre_trat; se houver controle, delta_ctrl = media_pos_ctrl - media_pre_ctrl; efeito_absoluto = delta_trat - delta_ctrl quando aplicável, caso contrário efeito_absoluto = delta_trat.
- Efeito relativo percentual: (efeito_absoluto / max(1e-9, media_pre_trat)) * 100 ao reportar em escala 0-100.
- Tamanho de efeito (tamanho_de_efeito): usar diferença padronizada aproximada: efeito_absoluto / desvio_padrao_pre_pooled; se desvio_padrao_pre_pooled for 0 ou ausente, usar desvio_padrao_pos_pooled.
- Diferença-em-diferenças (dif_in_dif): reportar somente quando houver controle e medidas pre e pos válidas; caso contrário, defina como null.
- Sinalização de robustez qualitativa (confianca_qualitativa): alta se n_trat>=100 e n_ctrl>=100 (quando aplicável) e faltantes_pos<10%; moderada se n>=60 e faltantes_pos<=15%; baixa caso contrário.
- Classificação de eficácia: alta se tamanho_de_efeito>=0.6 ou efeito_relativo_percentual>=15 e confianca_qualitativa∈{alta,moderada}; moderada se 0.3<=tamanho_de_efeito<0.6 ou 8<=efeito_relativo_percentual<15; baixa se tamanho_de_efeito<0.3 e efeito_relativo_percentual<8; inconclusiva se confianca_qualitativa=baixa ou dados insuficientes. 2.3 Configurações do Agente
2.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 1).
- Tipo do input: Dados estruturados e padronizados de intervenções educacionais prontos para análise de impacto.
-
Formatos Suportados: Esse agente deve ser capaz de receber dados no formato:
.json. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 10.000 caracteres.
2.3.2 Especificação do Output
- Formato de output: O output deve ser um JSON contendo as métricas de impacto e eficácia da intervenção, incluindo classificações e observações relevantes.
-
Exemplo de Estrutura de Output:
{"metodologia": "pre_pos_com_controle", "metricas": {"efeito_absoluto": 8.2, "efeito_relativo_percentual": 12.5, "tamanho_de_efeito": 0.45, "dif_in_dif": 5.1, "confianca_qualitativa": "moderada"}, "classificacao_eficacia": "alta", "suposicoes": ["tendencias_paralelas razoáveis"], "observacoes": ["grupo controle presente com n>=30"]} - Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado de 3.000 caracteres.
2.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
2.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
2.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Análise de Subgrupos e Sensibilidade (RF 3).
2.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Análise de Subgrupos e Sensibilidade (RF 3).
RF 3. Agente de Análise de Subgrupos e Sensibilidade
3.1 Tarefa do Agente
Explorar heterogeneidade de efeitos por subgrupos e testar sensibilidade das conclusões a variações plausíveis dos dados.
3.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo as métricas de impacto e eficácia calculadas para intervenções educacionais, juntamente com o dataset padronizado. # 2. Objetivo Explorar a heterogeneidade de efeitos por subgrupos e testar a sensibilidade das conclusões. # 3. Regras que você deve seguir para gerar sua resposta - Definir lista padrão de subgrupos se disponíveis: sexo, faixa_etaria (ex.: <10, 10-12, 13-15, >15), escola, turma, proficiência_baseline (tercis por periodo_pre). - Calcular tamanho_de_efeito por subgrupo usando mesma regra do agente anterior; omitir subgrupo com n<25 por célula e registrar motivo. - Sinalizar heterogeneidade relevante quando diferença entre maiores e menores efeitos por subgrupo ≥ 0.2 no tamanho_de_efeito ou ≥ 8 p.p. no efeito_relativo_percentual. - Testes de sensibilidade mínimos: (a) remoção de outliers (excluir top/bottom 1% de periodo_pos); (b) exclusão de casos com fidelity<0.6; (c) restrição a presença≥0.8. Reportar como variou o tamanho_de_efeito. - Robustez qualitativa: alta se as conclusões (sinal e classificação) se mantiverem em ≥2 dos 3 testes de sensibilidade; moderada se mantiverem em 1; baixa se não se mantiverem. - Gerar implicacoes práticas por subgrupo apenas quando efeito_subgrupo for pelo menos moderado e robustez_subgrupo != baixa. - Se houver múltiplas escolas com variância alta entre elas (coeficiente de variação do efeito ≥ 0.4), recomendar investigação de implementação local.
3.3 Configurações do Agente
3.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 2).
- Tipo do input: Métricas de impacto e eficácia das intervenções, juntamente com o dataset padronizado.
-
Formatos Suportados: Esse agente deve ser capaz de receber dados no formato:
.json. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 15.000 caracteres.
3.3.2 Especificação do Output
- Formato de output: O output deve ser um JSON detalhando os resultados da análise de subgrupos e sensibilidade, incluindo observações e recomendações.
-
Exemplo de Estrutura de Output:
{"subgrupos_analisados": ["sexo","faixa_etaria","escola"], "efeitos_por_subgrupo": {"sexo": {"feminino": {"tamanho_de_efeito": 0.52}, "masculino": {"tamanho_de_efeito": 0.31}}}, "sensibilidade": {"remocao_outliers": {"tamanho_de_efeito": 0.42}, "exclusao_fidelidade_baixa": {"tamanho_de_efeito": 0.47}}, "implicacoes": ["efeito mais forte em feminino"], "robustez_qualitativa": "moderada"} - Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado de 4.000 caracteres.
3.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
3.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
3.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Geração de Insights e Áreas de Melhoria (RF 4).
3.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Geração de Insights e Áreas de Melhoria (RF 4).
RF 4. Agente de Geração de Insights e Áreas de Melhoria
4.1 Tarefa do Agente
Sintetizar os resultados em insights acionáveis, recomendar áreas de melhoria e próximos passos de implementação.
4.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo as análises de subgrupos e sensibilidade, juntamente com as métricas globais de eficácia das intervenções. # 2. Objetivo Sintetizar os resultados em insights acionáveis e recomendar áreas de melhoria e próximos passos de implementação. # 3. Regras que você deve seguir para gerar sua resposta - Mapear a classificacao_eficacia para narrativa clara: alta (manter e escalar), moderada (otimizar e reavaliar), baixa (revisar desenho), inconclusiva (coletar mais dados). - Gerar de 3 a 5 principais_insights diretamente apoiados por métricas (referir explicitamente tamanho_de_efeito, efeito_relativo_percentual ou heterogeneidade detectada). - Propor áreas_de_melhoria alinhadas aos gargalos detectados: fidelidade baixa, presença baixa, implementação desigual, necessidade de reforço didático, adequação de conteúdo ao baseline. - Priorizar recomendações em três níveis (alta, média, baixa) usando critérios: magnitude do efeito potencial, custo de implementação estimado (baixo/médio/alto se fornecido), e urgência (prazos escolares). - Incluir ao menos um indicador de monitoramento para cada área_de_melhoria, definindo meta direcional (ex.: aumentar presenca para ≥0.85 em 8 semanas). - Se robustez_qualitativa=baixa ou classificacao_eficacia=inconclusiva, recomendar coletar nova medição e especificar quais variáveis críticas faltaram. - Evitar recomendações genéricas: cada recomendação deve citar qual métrica a motivou e qual subgrupo será beneficiado quando aplicável.
4.3 Configurações do Agente
4.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 3).
- Tipo do input: Análises de subgrupos e sensibilidade, juntamente com as métricas globais de eficácia.
-
Formatos Suportados: Esse agente deve ser capaz de receber dados no formato:
.json. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 20.000 caracteres.
4.3.2 Especificação do Output
- Formato de output: O output deve ser um JSON contendo insights acionáveis, áreas de melhoria recomendadas e próximos passos de implementação.
-
Exemplo de Estrutura de Output:
{"eficacia_global": "moderada", "principais_insights": ["ganhos concentrados em alunos com baseline baixo"], "areas_de_melhoria": ["aumentar aderência (fidelity) para ≥0.75","reforçar formação docente para turmas com efeito baixo"], "recomendacoes_priorizadas": [{"acao": "planejar reforço de implementação", "prioridade": "alta", "criterio": "efeito moderado com baixa fidelidade"}], "riscos_e_mitigacoes": [{"risco": "heterogeneidade alta entre escolas", "mitigacao": "pilotos com protocolo padronizado"}], "indicadores_de_monitoramento": ["fidelity_mensal","presenca_media","progresso_em_resultado"]} - Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado de 5.000 caracteres.
4.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.6
4.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
4.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente é o resultado final e não é passada para outros agentes internos.
4.3.6 Regras de Orquestração e Transição
A execução deste agente finaliza o fluxo. Os insights gerados são o resultado que deve ser disponibilizado ao usuário.