1. Propósito e Escopo
Este documento define todos os prompts, configurações de memória, transição entre estados e demais requisitos funcionais para o Agente de IA para Análise de Dados de Pesquisa Acadêmica. Esta documentação é um modelo de PRD ou Documento de Requisitos de Produto específicos para construção de Agentes de IA.
O objetivo principal é criar um agente que analisa dados de pesquisas acadêmicas realizadas na instituição, sintetizando resultados e sugerindo áreas de foco futuras.
2. Contexto e Problema
O volume excessivo de dados de pesquisa acadêmica torna a síntese manual uma tarefa complexa e demorada. Além disso, há dificuldade em identificar áreas de foco futuras com base nos resultados de pesquisa. Este agente visa resolver esses problemas por meio de análise automatizada e sugestões de foco.
3. Impactos Esperados
Espera-se que a implementação deste agente resulte em uma síntese mais eficiente dos dados de pesquisa, identificação de padrões e tendências, e sugestões de áreas de foco futuras mais precisas e acionáveis para a instituição.
4. Visão Geral da Solução
O agente de IA para análise de dados de pesquisa acadêmica processa dados estruturados de pesquisas, identifica padrões e insights, e sugere áreas de foco futuras. A seguir são detalhadas todas as regras de negócio e especificações funcionais necessárias para que esse agente atue de forma eficiente na análise de dados acadêmicos.
A solução consiste em um fluxo de automação composto por quatro agentes de IA. O processo inicia com a padronização dos dados de pesquisa e termina com a comunicação dos resultados para a comunidade acadêmica.
| Agentes | Função Principal |
|---|---|
Agente de Padronização e Qualidade dos Dados de Pesquisa (RF 1)
| Validar, higienizar e padronizar o dataset de pesquisas acadêmicas. |
Agente de Síntese de Padrões e Insights (RF 2)
| Identificar temas-chave, coocorrências e tendências temporais. |
Agente de Recomendações de Áreas de Foco Futuras (RF 3)
| Transformar insights em recomendações priorizadas de áreas de foco futuras. |
Agente de Comunicação dos Resultados para a Comunidade Acadêmica (RF 4)
| Organizar achados e recomendações em materiais acionáveis para públicos acadêmicos. |
5. Protótipos
Para proporcionar uma visão clara e tangível da solução proposta, criamos protótipos que demonstram tanto o fluxo de trabalho dos agentes quanto o resultado final que os usuários receberão. Explore os links abaixo para entender melhor a solução em ação.
6. Requisitos Funcionais
RF 1. Agente de Padronização e Qualidade dos Dados de Pesquisa
1.1 Tarefa do Agente
Validar, higienizar e padronizar o dataset de pesquisas acadêmicas para viabilizar análise consistente.
1.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo um arquivo CSV/planilha com dados de pesquisas acadêmicas. Seu objetivo é validar, higienizar e padronizar esses dados. # 2. Objetivo Validar, higienizar e padronizar o dataset de pesquisas acadêmicas para viabilizar análise consistente. # 3. Regras que você deve seguir para gerar sua resposta - Considere campos obrigatórios mínimos: titulo, autores, resumo, data_publicacao. Se algum faltar, marque o registro como incomplete=true. - Normalização textual: remova espaços extras, quebras de linha redundantes, caracteres de controle. - Datas: converta data_publicacao para ISO (YYYY-MM-DD). - Autores: divida por ponto-e-vírgula, vírgula ou ' e '; limpe espaços. - Duplicatas: considere duplicado quando 'titulo_norm' coincide e a interseção de 'autores_sobrenomes' for >= 60%. - Limites: se o dataset tiver > 10.000 registros, processe apenas os mais recentes por ano até um máximo de 10.000.
1.3 Configurações do Agente
1.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente é o ponto de partida do fluxo e deve ser acionado pelo envio de um arquivo CSV de dados de pesquisa via API. Na fase de testes, o fluxo será iniciado pelo envio manual dos dados, que serão enviados para o agente diretamente por upload do CSV na interface da Prototipe AI, para acelerar o processo de validação.
- Tipo do input: Arquivo CSV/planilha com colunas: id (opcional), titulo, autores, resumo, palavras_chave (opcional), area (opcional), resultados, data_publicacao, unidade/departamento (opcional).
-
Formatos Suportados: Esse agente deve ser capaz de receber arquivos nos formatos:
.csv,.xlsx. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 500.000 caracteres.
1.3.2 Especificação do Output
- Formato de output: JSON com: standardized_records, data_quality_summary, normalization_notes.
-
Exemplo de Estrutura de Output:
{ "standardized_records": [ { "id": 1, "titulo": "Exemplo de Título", "autores": "Autor1; Autor2", "resumo": "Resumo do estudo...", "data_publicacao": "2025-01-01" } ], "data_quality_summary": { "total_entradas": 1000, "total_validas": 950, "total_incompletas": 50 }, "normalization_notes": "Ajustes de formatação aplicados." } - Número de caracteres esperado: O JSON gerado pode ter até 50.000 caracteres.
1.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.7
1.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
1.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Síntese de Padrões e Insights (RF 2).
1.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Síntese de Padrões e Insights (RF 2).
RF 2. Agente de Síntese de Padrões e Insights
2.1 Tarefa do Agente
Identificar temas-chave, coocorrências relevantes e tendências temporais a partir do dataset padronizado.
2.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo um JSON proveniente do Agente de Padronização, contendo registros padronizados de pesquisas acadêmicas. # 2. Objetivo Identificar temas-chave, coocorrências relevantes e tendências temporais a partir do dataset padronizado. # 3. Regras que você deve seguir para gerar sua resposta - Extração de temas: derive temas a partir de título, resumo e palavras-chave. - Seleção de temas: inclua um tema em key_topics se sua frequência for >= max(5 itens, 2% do corpus válido). - Métricas por tema: calcule 'frequencia', 'participacao_percentual', 'distribuicao_por_ano'. - Coocorrência: reporte pares de temas com coocorrência relativa >= 0,2. - Tendências: caracterize 'tendencia' como 'ascendente', 'estável' ou 'descendente'.
2.3 Configurações do Agente
2.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 1).
- Tipo do input: JSON proveniente do Agente de Padronização, contendo standardized_records com campos derivados.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 50.000 caracteres.
2.3.2 Especificação do Output
- Formato de output: JSON 'insights' com: key_topics, co_occurrences, temporal_trends.
-
Exemplo de Estrutura de Output:
{ "key_topics": [ { "tema": "Inteligência Artificial", "frequencia": 120, "participacao_percentual": 12.5 } ], "co_occurrences": [ { "tema_a": "IA", "tema_b": "Machine Learning", "forca_relacao": 0.3 } ], "temporal_trends": [ { "tema": "IA", "tendencia": "ascendente" } ] } - Número de caracteres esperado: O JSON gerado pode ter até 20.000 caracteres.
2.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.7
2.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
2.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Recomendações de Áreas de Foco Futuras (RF 3).
2.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Recomendações de Áreas de Foco Futuras (RF 3).
RF 3. Agente de Recomendações de Áreas de Foco Futuras
3.1 Tarefa do Agente
Transformar insights em recomendações priorizadas de áreas de foco futuras para a instituição.
3.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo um JSON 'insights' do agente anterior, contendo temas-chave e tendências. # 2. Objetivo Transformar insights em recomendações priorizadas de áreas de foco futuras para a instituição. # 3. Regras que você deve seguir para gerar sua resposta - Mapeamento: vincule cada recomendação a pelo menos um tema ascendente. - Priorização: combine três dimensões (0-100 cada): 'momentum', 'ajuste_estrategico', 'viabilidade'. - Classificação: defina 'tipo' como quick_win, estruturante ou aposta. - Horizonte: curto (<= 12 meses), médio (12-36), longo (>36).
3.3 Configurações do Agente
3.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 2).
- Tipo do input: JSON 'insights' do agente anterior.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 20.000 caracteres.
3.3.2 Especificação do Output
- Formato de output: JSON 'recommendations' com lista ranqueada de áreas de foco.
-
Exemplo de Estrutura de Output:
{ "recommendations": [ { "area_foco": "IA", "justificativa": "Crescimento de 20% nos últimos 3 anos.", "score_prioridade": 85 } ] } - Número de caracteres esperado: O JSON gerado pode ter até 10.000 caracteres.
3.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.7
3.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
3.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Comunicação dos Resultados para a Comunidade Acadêmica (RF 4).
3.3.6 Regras de Orquestração e Transição
Ao concluir sua execução, esse agente aciona o Agente de Comunicação dos Resultados para a Comunidade Acadêmica (RF 4).
RF 4. Agente de Comunicação dos Resultados para a Comunidade Acadêmica
4.1 Tarefa do Agente
Organizar os achados e recomendações em materiais claros e acionáveis para públicos acadêmicos e gestores.
4.2 Prompt ou Instruções do Agente
# 1. Contexto e explicações sobre inputs iniciais Você está recebendo JSONs de 'insights' e 'recommendations' dos agentes anteriores. # 2. Objetivo Organizar os achados e recomendações em materiais claros e acionáveis para públicos acadêmicos e gestores. # 3. Regras que você deve seguir para gerar sua resposta - Estrutura do executive_summary: contexto, highlights, top 3 recomendações, próximos passos. - Relatório técnico: Objetivo e escopo, Metodologia de preparação, Padrões e temas, Tendências temporais, Coocorrências, Gaps, Recomendações, Limitações. - Adaptação ao público: se perfil='reitoria', foque em implicações estratégicas. - Linguagem: objetiva, impessoal, orientada a evidências.
4.3 Configurações do Agente
4.3.1 Especificação do Input
- Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 3).
- Tipo do input: JSONs de 'insights' e 'recommendations'.
-
Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato:
.json. - Número de caracteres esperado: Este agente deve ter capacidade para processar um input combinado de até 30.000 caracteres.
4.3.2 Especificação do Output
- Formato de output: Relatório textual com três artefatos: executive_summary, relatorio_tecnico, e roteiro_apresentacao.
-
Exemplo de Estrutura de Output:
{ "executive_summary": "Resumo executivo...", "relatorio_tecnico": "Relatório técnico detalhado...", "roteiro_apresentacao": "Outline de apresentação..." } - Número de caracteres esperado: O relatório completo pode ter até 15.000 caracteres.
4.3.3 Parâmetros de Geração
- Modelo: GPT-5
- Temperatura: 0.7
4.3.4 Ferramentas do Agente
- Documentos: Não consulta documentos externos.
- Calculadora: Não utiliza.
- Busca Online: Não utiliza.
- Sistemas Externos: Não se conecta a sistemas externos.
4.3.5 Memória
- Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
- Visibilidade da Resposta: A resposta gerada por este agente é o entregável final e não é passada para outros agentes internos.
4.3.6 Regras de Orquestração e Transição
A execução deste agente finaliza o fluxo. O relatório gerado é o resultado que deve ser disponibilizado aos gestores e à comunidade acadêmica.