Agente de IA para Análise de Resultados de Experimentos

13 de December de 2025 • Tempo de leitura: 5 min

Como criar um agente de IA que analisa dados de experimentos realizados em laboratório.

1. Propósito e Escopo

Este documento define todos os prompts, configurações de memória, transição entre estados e demais requisitos funcionais para o Fluxo de Agentes "Análise de Resultados de Experimentos", uma solução projetada para analisar dados de experimentos laboratoriais, identificar tendências e gerar insights para discussões em sala de aula. Essa documentação é um modelo de PRD ou Documento de Requisitos de Produto específicos para construção de Agentes de IA.

O objetivo principal é transformar o input de dados experimentais em insights acionáveis que facilitam discussões acadêmicas, reduzindo o tempo e o esforço necessários para a análise e interpretação manual dos dados.

2. Contexto e Problema

Em ambientes acadêmicos e de pesquisa, a análise de dados experimentais é frequentemente realizada de forma manual, o que pode ser demorado e propenso a erros. Problemas específicos incluem a dificuldade em identificar tendências e padrões nos dados, bem como a necessidade de gerar insights significativos para discussões em sala de aula.

O agente de IA proposto busca resolver essas questões ao automatizar a análise de dados, identificar padrões e gerar insights úteis e relevantes.

3. Impactos Esperados

A implementação deste fluxo de automação visa alcançar os seguintes resultados:

  • Reduzir o tempo de análise de dados em pelo menos 70%.
  • Aumentar a precisão na identificação de tendências e padrões.
  • Gerar insights acionáveis que enriquecem as discussões acadêmicas.
  • Facilitar a interpretação dos dados por meio de visualizações e sumários claros.

4. Visão Geral da Solução

O agente de IA para análise de resultados de experimentos processa dados brutos de experimentos laboratoriais, aplica técnicas estatísticas para identificar tendências e padrões, e gera insights que podem ser usados em discussões acadêmicas. A seguir são detalhadas todas as regras de negócio e especificações funcionais necessárias para que esse agente atue como um assistente útil e autônomo na análise de dados experimentais.

A solução consiste em um fluxo de automação composto por 6 agentes de IA. O processo inicia com a leitura dos dados experimentais e termina com a geração de um documento consolidado que inclui insights e padrões identificados.

Agentes Função Principal
Agente de Leitura e Entendimento do Dataset Experimental (RF 1) Ler e interpretar a estrutura dos dados experimentais brutos.
Agente de Validação e Padronização dos Dados (RF 2) Validar a consistência e padronizar os formatos dos dados.
Agente de Estatística Descritiva e Sumários Visuais (RF 3) Produzir estatísticas descritivas e planos de visualização.
Agente de Detecção de Padrões e Tendências (RF 4) Identificar tendências temporais e diferenças entre grupos.
Agente de Geração de Insights para Discussão em Sala (RF 5) Converter padrões identificados em insights pedagógicos.
Agente de Empacotamento e Entrega do Resultado (RF 6) Consolidar todos os outputs em um documento final.

5. Protótipos

Para proporcionar uma visão clara e tangível da solução proposta, criamos protótipos interativos que demonstram tanto o fluxo de trabalho dos agentes quanto o resultado final que o cliente receberá. Explore os links abaixo para entender melhor a solução em ação.

6. Requisitos Funcionais

RF 1. Agente de Leitura e Entendimento do Dataset Experimental

1.1 Tarefa do Agente

Ler arquivos CSV de experimentos, inferir a estrutura do conjunto de dados e mapear o delineamento experimental para orientar as etapas seguintes.

1.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo um ou mais arquivos CSV contendo dados brutos de experimentos laboratoriais. Opcionalmente, um texto curto pode fornecer contexto adicional sobre o experimento, como hipótese, variáveis principais, grupos, tempo e unidade de medida.

# 2. Objetivo
Analisar os arquivos para inferir a estrutura do conjunto de dados, identificar variáveis e seus tipos, e mapear o delineamento experimental.

# 3. Regras que você deve seguir para gerar sua resposta
- Detecte automaticamente delimitador (vírgula, ponto e vírgula, tab) e separador decimal (ponto ou vírgula). Se ambiguidades coexistirem, priorize: delimitador = vírgula e decimal = ponto, a menos que a frequência de padrões no arquivo indique o contrário de forma inequívoca.
- Identifique tokens de valores ausentes comuns: '', 'NA', 'N/A', 'NaN', '-', '--', '.', 'null', 'NULL'. Registre todos os tokens encontrados.
- Classifique tipos por heurística: presença de apenas dígitos e separador decimal -> numérica; poucos valores únicos e não numéricos -> categórica; padrões de data -> data/hora; texto longo -> texto.
- Sugira papéis de variáveis: nomes contendo 'grupo', 'tratamento', 'dose' -> independentes; 'tempo', 'dia', 'semana' -> tempo; 'id', 'amostra', 'sujeito' -> identificadores; medidas contínuas não de identificação -> candidatas a dependentes.
- Se houver variável de tempo e medidas repetidas por sujeito, sinalize delineamento intra-sujeitos; se houver múltiplos fatores categóricos, sinalize delineamento fatorial.
- Não modifique valores; apenas leia e descreva. Em caso de colunas com mistura de tipos, sinalize como 'tipo misto' e liste exemplos conflitantes.
- Se o usuário fornecer contexto, priorize-o para ajustar papéis das variáveis; registre conflitos entre inferência e contexto.
1.3 Configurações do Agente

1.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente é o ponto de partida do fluxo e deve ser acionado pelo envio de um ou mais arquivos CSV de dados experimentais via API. Na fase de testes, o fluxo será iniciado pelo envio manual dos dados, que serão enviados para o agente diretamente por upload dos arquivos na interface da Prototipe AI, para acelerar o processo de validação.
  • Tipo do input: O input inicial para o fluxo é um ou mais arquivos CSV contendo dados brutos de experimentos laboratoriais.
  • Formatos Suportados: Esse agente deve ser capaz de receber arquivos nos formatos: .csv.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de texto com até 100.000 caracteres.

1.3.2 Especificação do Output

  • Formato de output: O output deve ser um JSON contendo a lista de variáveis, tipo inferido por variável, possíveis papéis, unidades se detectáveis, tokens de ausentes detectados, delimitador, separador decimal, chaves de repetição e delineamento sugerido.
  • Exemplo de Estrutura de Output:
     {
      "variaveis": ["tempo", "grupo", "sujeito_id", "medida"],
      "tipos": {"tempo": "data/hora", "grupo": "categórica", "sujeito_id": "identificador", "medida": "numérica"},
      "papeis": {"tempo": "tempo", "grupo": "independente", "sujeito_id": "identificador", "medida": "dependente"},
      "unidades": {"medida": "mg"},
      "tokens_ausentes": ["", "NA", "null"],
      "delimitador": ",",
      "separador_decimal": ".",
      "chaves_repeticao": ["sujeito_id", "tempo"],
      "delineamento": "intra-sujeitos"
    } 
  • Número de caracteres esperado: O JSON gerado deve ter um tamanho em torno de 2.500 caracteres, dependendo da complexidade dos dados experimentais.

1.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

1.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

1.3.5 Memória

1.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Validação e Padronização dos Dados (RF 2).

RF 2. Agente de Validação e Padronização dos Dados

2.1 Tarefa do Agente

Validar consistência, padronizar formatos e preparar um dataset analítico sem alterar o significado dos dados.

2.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo um JSON de esquema e delineamento do agente anterior, além dos dados brutos em CSV.

# 2. Objetivo
Validar a consistência dos dados, padronizar os formatos e preparar um dataset analítico adequado para análise posterior.

# 3. Regras que você deve seguir para gerar sua resposta
- Não imputar valores por padrão; apenas marcar ausentes. Se houver instrução explícita do usuário, descreva a imputação proposta, mas não a execute.
- Normalizar formatos: datas para ISO (YYYY-MM-DD), separador decimal para ponto ao relatar estatísticas; remover espaços lideres/trailing em categorias; unificar capitalização mantendo rótulo original mapeado.
- Detectar duplicatas com base em identificadores combinados (por exemplo, sujeito_id + tempo). Relatar contagens; não remover, apenas sinalizar.
- Harmonizar unidades quando detectadas na coluna (ex.: 'mg' e 'g'): padronize por uma unidade alvo e inclua fator de conversão aplicado; se incerto, não converta e sinalize a ambiguidade.
- Outliers: sinalize observações com critério IQR (Q1 - 1.5*IQR, Q3 + 1.5*IQR) e z-score absoluto > 3, sem remover. Reporte proporção por variável.
- Balanço de grupos: reporte n por grupo e por tempo; sinalize desequilíbrios severos (qualquer célula com n < 5).
- Preservar mapeamento de transformações: para cada coluna, registre operações realizadas.
2.3 Configurações do Agente

2.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão bem-sucedida do agente anterior (RF 1).
  • Tipo do input: Este agente deve ser apto a receber o JSON de esquema e delineamento, além dos dados brutos em CSV.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs nos formatos: .json e .csv.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input combinado de até 100.000 caracteres.

2.3.2 Especificação do Output

  • Formato de output: O output deve ser um pacote contendo o dataset padronizado em texto/markdown, relatório de qualidade com porcentagem de ausentes, categorias raras, duplicatas potenciais, checagens de faixa plausível, unidades harmonizadas e lista de transformações aplicadas.
  • Exemplo de Estrutura de Output:
     {
      "dataset_padronizado": "...",
      "relatorio_qualidade": {
        "ausentes_porcentagem": {"tempo": 0, "grupo": 0, "sujeito_id": 0, "medida": 5},
        "categorias_raras": {"grupo": ["controle"]},
        "duplicatas": {"sujeito_id+tempo": 0},
        "outliers": {"medida": 3}
      },
      "transformacoes": ["Datas padronizadas para ISO", "Unidade de medida padronizada para mg"]
    } 
  • Número de caracteres esperado: O pacote gerado deve ter um tamanho em torno de 5.000 caracteres.

2.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

2.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Utiliza lógica interna para cálculos de verificação de qualidade dos dados.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não utiliza.

2.3.5 Memória

2.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Estatística Descritiva e Sumários Visuais (RF 3).

RF 3. Agente de Estatística Descritiva e Sumários Visuais

3.1 Tarefa do Agente

Produzir estatísticas descritivas e um plano de visualizações para sustentar análise de tendências.

3.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo um dataset padronizado e um esquema/delineamento dos dados.

# 2. Objetivo
Gerar estatísticas descritivas e criar um plano de visualizações para análise de tendências nos dados.

# 3. Regras que você deve seguir para gerar sua resposta
- Para variáveis numéricas aproximadamente simétricas use correlação de Pearson; caso contrário ou com outliers relevantes, reporte Spearman. Informe o critério adotado.
- Calcule IC95% da média por aproximação t quando n >= 10; caso contrário, informe que o intervalo é menos confiável.
- Para cada dependente, estratifique por fatores identificados (grupo, dose, tempo) quando existirem.
- Sinalize células com n < 5 como evidência fraca para inferências.
- Especifique gráficos com detalhes suficientes para reprodutibilidade (ex.: 'linha: x=tempo, y=média de resposta, cor=grupo, erro=IC95%').
3.3 Configurações do Agente

3.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão bem-sucedida do agente anterior (RF 2).
  • Tipo do input: Este agente deve ser apto a receber o dataset padronizado e o esquema/delineamento dos dados.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs nos formatos: .json e .csv.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input combinado de até 100.000 caracteres.

3.3.2 Especificação do Output

  • Formato de output: O output deve ser um markdown contendo tabelas de descritivos por variável dependente, matriz de correlação para variáveis numéricas, tabelas de frequência para categóricas e lista de gráficos recomendados.
  • Exemplo de Estrutura de Output:
     {
      "estatisticas_descritivas": "...",
      "matriz_correlacao": "...",
      "tabelas_frequencia": "...",
      "graficos_recomendados": ["linha: x=tempo, y=média de resposta, cor=grupo, erro=IC95%"]
    } 
  • Número de caracteres esperado: O markdown gerado deve ter um tamanho em torno de 5.000 caracteres.

3.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

3.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Utiliza lógica interna para cálculos estatísticos.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não utiliza.

3.3.5 Memória

  • Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
  • Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Detecção de Padrões e Tendências (RF 4).

3.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Detecção de Padrões e Tendências (RF 4).

RF 4. Agente de Detecção de Padrões e Tendências

4.1 Tarefa do Agente

Identificar tendências temporais, diferenças entre grupos e relações dose–resposta, quantificando intensidade e robustez.

4.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo descritivos e plano visual do agente anterior, além do dataset padronizado.

# 2. Objetivo
Identificar e quantificar tendências temporais, diferenças entre grupos e relações dose–resposta nos dados experimentais.

# 3. Regras que você deve seguir para gerar sua resposta
- Tendências ao longo do tempo: calcule a direção monotônica usando o sinal de Spearman rho; magnitudes: |rho| categorizado (fraca 0.1–0.3, moderada 0.3–0.5, forte >0.5). Reforce cautela se n temporal < 5.
- Diferenças entre dois grupos em variável contínua: estime tamanho de efeito d de Cohen aproximado: d = (m1 - m2) / spooled, com spooled via desvio-padrão combinado. Classifique: pequeno≈0.2, médio≈0.5, grande≈0.8. Para distribuições assimétricas, reporte também diferença de medianas.
- Para ordinais ou assimétricas, reporte delta de Cliff qualitativamente: |δ| pequeno≈0.147, médio≈0.33, grande≈0.474.
- Relação dose–resposta: avalie monotonicidade entre dose (ordenada) e resposta via Spearman; sinalize plateaus ou inversões se segmentos apresentarem sinais opostos.
- Interações candidatas: quando o efeito de grupo varia ao longo do tempo (linhas não paralelas na média por tempo), descreva como potencial interação grupo×tempo, sem inferir causalidade.
- Robustez: marque padrões como frágeis se dependem de 1–2 pontos outliers já sinalizados ou se baseados em amostras com n muito pequeno (n<5 por célula).
4.3 Configurações do Agente

4.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão bem-sucedida do agente anterior (RF 3).
  • Tipo do input: Este agente deve ser apto a receber descritivos, plano visual e dataset padronizado.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs nos formatos: .json e .csv.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input combinado de até 100.000 caracteres.

4.3.2 Especificação do Output

  • Formato de output: O output deve ser um JSON com candidatos a padrões e uma seção textual resumida com bullets sobre tendências temporais, diferenças entre grupos e associações.
  • Exemplo de Estrutura de Output:
     {
      "padroes": ["tendencia_temporal", "diferenca_grupos"],
      "resumo": "..."
    } 
  • Número de caracteres esperado: O JSON gerado deve ter um tamanho em torno de 3.500 caracteres.

4.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

4.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Utiliza lógica interna para cálculos estatísticos.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não utiliza.

4.3.5 Memória

4.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Geração de Insights para Discussão em Sala (RF 5).

RF 5. Agente de Geração de Insights para Discussão em Sala

5.1 Tarefa do Agente

Converter padrões identificados em insights pedagógicos claros e acionáveis para discussão em sala.

5.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo um JSON de padrões e tendências, além do contexto do experimento e descritivos.

# 2. Objetivo
Converter padrões identificados em insights pedagógicos que possam ser usados em discussões acadêmicas.

# 3. Regras que você deve seguir para gerar sua resposta
- Evite afirmações causais; prefira linguagem observacional (associação, tendência, diferença observada).
- Sempre referencie números-chave (médias, diferenças, |rho|, d) ao sustentar um insight.
- Adapte a linguagem para público leigo: explique termos na primeira ocorrência; use o glossário para fixar conceitos.
- Inclua pelo menos uma limitação relacionada à qualidade dos dados (ausentes, desequilíbrios, outliers) quando aplicável.
- Proponha próximos passos que sejam factíveis com os dados ou com uma nova coleta controlada (ex.: aumentar n em células críticas, controlar variável de confusão, repetir em outra dose/tempo).
5.3 Configurações do Agente

5.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão bem-sucedida do agente anterior (RF 4).
  • Tipo do input: Este agente deve ser apto a receber o JSON de padrões e tendências, contexto do experimento e descritivos.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs nos formatos: .json.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 10.000 caracteres.

5.3.2 Especificação do Output

  • Formato de output: O output deve ser um markdown estruturado com resumo executivo, principais achados, perguntas norteadoras, limitações e suposições, próximos passos e glossário.
  • Exemplo de Estrutura de Output:
     {
      "resumo_executivo": "...",
      "principais_achados": ["Tendência temporal identificada..."],
      "perguntas_norteadoras": ["O que poderia explicar a diferença observada entre os grupos?"],
      "limitacoes": ["Dados ausentes em proporção significativa..."],
      "proximos_passos": ["Aumentar o tamanho da amostra..."],
      "glossario": {"rho": "Coeficiente de correlação de Spearman..."}
    } 
  • Número de caracteres esperado: O markdown gerado deve ter um tamanho em torno de 4.000 caracteres.

5.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

5.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não utiliza.

5.3.5 Memória

  • Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
  • Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Empacotamento e Entrega do Resultado (RF 6).

5.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Empacotamento e Entrega do Resultado (RF 6).

RF 6. Agente de Empacotamento e Entrega do Resultado

6.1 Tarefa do Agente

Consolidar todos os outputs em um artefato único em Markdown, garantindo rastreabilidade entre achados e evidências.

6.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo descritivos, padrões e insights dos agentes anteriores.

# 2. Objetivo
Consolidar todos os outputs em um único documento em Markdown contendo sumário, contexto, metodologia, descritivos, padrões, insights e anexo técnico.

# 3. Regras que você deve seguir para gerar sua resposta
- Cada afirmação no texto deve referenciar a evidência correspondente (tabela, métrica ou padrão) por identificador simples.
- Inclua, no anexo técnico, todas as tabelas de descritivos e a lista de checagens de qualidade aplicadas.
- Destaque alertas críticos (n muito baixo, outliers dominantes, inconsistências não resolvidas) em uma seção 'Notas de qualidade dos dados'.
- Preserve terminologia e nomes de variáveis exatamente como padronizados anteriormente.
6.3 Configurações do Agente

6.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão bem-sucedida do agente anterior (RF 5).
  • Tipo do input: Este agente deve ser apto a receber descritivos, padrões e insights.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs nos formatos: .json.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 10.000 caracteres.

6.3.2 Especificação do Output

  • Formato de output: O output deve ser um documento final em Markdown contendo sumário, contexto, metodologia, descritivos, padrões, insights e anexo técnico.
  • Exemplo de Estrutura de Output:
     {
      "sumario": "...",
      "contexto": "...",
      "metodologia": "...",
      "descritivos": "...",
      "padroes": "...",
      "insights": "...",
      "anexo_tecnico": "..."
    } 
  • Número de caracteres esperado: O documento gerado deve ter um tamanho em torno de 8.000 caracteres.

6.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

6.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não utiliza.

6.3.5 Memória

  • Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
  • Visibilidade da Resposta: A resposta gerada por este agente é o entregável final e não é passada para outros agentes internos.

6.3.6 Regras de Orquestração e Transição

A execução deste agente finaliza o fluxo. O documento gerado é o resultado que deve ser disponibilizado ao usuário.

© 2025 prototipe.ai. Todos os direitos reservados.