Agente de IA para Monitoramento de Espera em Pronto Atendimento

16 de December de 2025 • Tempo de leitura: 5 min

Como criar um agente de IA que monitora o tempo de espera dos pacientes e alerta a equipe sobre tempos críticos.

1. Propósito e Escopo

Este documento define todos os prompts, configurações de memória, transição entre estados e demais requisitos funcionais para o Agente de IA para Monitoramento de Espera em Pronto Atendimento. Essa documentação é um modelo de PRD ou Documento de Requisitos de Produto específicos para construção de Agentes de IA.

O objetivo principal é monitorar o tempo de espera dos pacientes no pronto atendimento e alertar a equipe médica sobre tempos críticos, sugerindo ajustes na alocação de recursos para otimizar o fluxo de pacientes.

2. Contexto e Problema

Cenário Atual

Longos tempos de espera podem comprometer a qualidade do atendimento e a satisfação do paciente. Atualmente, a falta de visibilidade sobre os tempos de espera em tempo real dificulta a tomada de decisões rápidas e eficazes.


Problemas Identificados

  • Longos tempos de espera: Podem comprometer a qualidade do atendimento e a satisfação do paciente.
  • Falta de visibilidade: Dificulta a tomada de decisões rápidas e eficazes.

3. Impactos Esperados

A implementação deste agente visa alcançar os seguintes resultados:

  • Reduzir o tempo de espera dos pacientes em pronto atendimento.
  • Melhorar a alocação de recursos humanos e materiais.
  • Aumentar a satisfação do paciente através de um atendimento mais ágil.

4. Visão Geral da Solução

O agente de IA para monitoramento de espera em pronto atendimento processa dados em tempo real sobre tempos de espera dos pacientes e sugere ajustes na alocação de recursos. A seguir são detalhadas todas as regras de negócio e especificações funcionais necessárias para que esse agente atue como um assistente útil e autônomo na gestão de tempos de espera no pronto atendimento.

A solução consiste em um fluxo de automação composto por quatro agentes de IA. O processo inicia com a coleta de dados do sistema de pronto atendimento e termina com a geração de ações operacionais para otimizar o fluxo de pacientes.

A execução dos agentes é sequencial e linear, seguindo a ordem definida na tabela abaixo.

Agentes Função Principal
Agente de Execução de Chamada à API — Coleta de Dados do PA (RF 1) Realizar chamada à API do Sistema de Pronto Atendimento para obter dados em tempo quase real sobre pacientes, filas, triagem, equipe e ocupação de recursos.
Agente de Cálculo de Métricas de Espera (RF 2) Calcular tempos de espera e indicadores operacionais do pronto atendimento a partir dos dados coletados.
Agente de Decisão de Alertas de Espera (RF 3) Determinar quando e com que severidade emitir alertas operacionais sobre tempos de espera, consolidando motivos e priorizações.
Agente de Recomendação de Alocação de Recursos (RF 4) Gerar plano de ações operacionais para reduzir tempos de espera e mitigar gargalos no pronto atendimento.

5. Protótipos

Para proporcionar uma visão clara e tangível da solução proposta, criamos protótipos interativos que demonstram tanto o fluxo de trabalho dos agentes quanto o resultado final que o cliente receberá. Explore os links abaixo para entender melhor a solução em ação.

6. Requisitos Funcionais

RF 1. Agente de Execução de Chamada à API — Coleta de Dados do PA

1.1 Tarefa do Agente

Realizar chamada à API do Sistema de Pronto Atendimento para obter dados em tempo quase real sobre pacientes, filas, triagem, equipe e ocupação de recursos.

1.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está encarregado de realizar chamadas à API do Sistema de Pronto Atendimento para obter dados em tempo quase real sobre pacientes, filas, triagem, equipe e ocupação de recursos.

# 2. Objetivo
Realizar a coleta de dados necessários para o monitoramento de espera em pronto atendimento.

# 3. Regras que você deve seguir para gerar sua resposta
- Use os endpoints e credenciais fornecidos para acessar a API.
- Obtenha dados de pacientes, filas, triagem, equipe e ocupação de recursos.
- Retorne os dados em um JSON bruto sem realizar cálculos ou decisões.

# 4. Exemplo de Output que você deve produzir
JSON bruto com coleções: pacientes_em_espera[], pacientes_em_atendimento[], pacientes_atendidos[], eventos_fluxo[], equipe_em_plantao[], salas_e_baias[], ocupacao_recursos[]. 
1.3 Configurações do Agente

1.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado pelo envio de um payload pronto contendo: endpoints, credenciais/token, janela de tempo, parâmetros de paginação, filtros de unidade/PA, e campos solicitados. Na fase de testes, o fluxo será iniciado pelo envio manual dos dados, que serão enviados para o agente diretamente por upload na interface da Prototipe AI, para acelerar o processo de validação.
  • Tipo do input: Payload contendo endpoints, credenciais/token, janela de tempo, parâmetros de paginação, filtros de unidade/PA, e campos solicitados.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato JSON.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 10.000 caracteres.

1.3.2 Especificação do Output

  • Formato de output: O output deve ser um JSON bruto contendo coleções de dados sobre pacientes, filas, triagem, equipe e ocupação de recursos.
  • Exemplo de Estrutura de Output:
     {"pacientes_em_espera":[], "pacientes_em_atendimento":[], "pacientes_atendidos":[], "eventos_fluxo":[], "equipe_em_plantao":[], "salas_e_baias":[], "ocupacao_recursos":[]} 
  • Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em torno de 5.000 caracteres.

1.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

1.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Executa chamada à API do Sistema de Pronto Atendimento.

1.3.5 Memória

  • Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
  • Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Cálculo de Métricas de Espera (RF 2).

1.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Cálculo de Métricas de Espera (RF 2).

RF 2. Agente de Cálculo de Métricas de Espera

2.1 Tarefa do Agente

Calcular tempos de espera e indicadores operacionais do pronto atendimento a partir dos dados coletados.

2.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo um JSON de dados brutos do PA contendo pacientes, triagem, timestamps (checkin, início e fim), equipe, ocupação de salas/recursos.

# 2. Objetivo
Calcular tempos de espera e indicadores operacionais do pronto atendimento a partir dos dados coletados.

# 3. Regras que você deve seguir para gerar sua resposta
- Calcule tempos de espera por nível de triagem (vermelho, amarelo, verde, azul) e consolidado.
- Descarte outliers de espera para estatística se espera > 480 min.
- Calcule taxa de chegada e conclusão por 15 min.
- Estime capacidade por 15 min e backlog estimado.
- Produza status_geral preliminar: normal, atencao, alerta, critico.

# 4. Exemplo de Output que você deve produzir
{"timestamp_referencia":"2025-12-16T12:21:00Z","metricas":{ "por_categoria": {"vermelho": {"em_espera": 2, "espera_media_min": 8, "espera_p90_min": 12, "espera_max_min": 15}, "amarelo": {...}, "verde": {...}, "azul": {...}}, "geral": {"em_espera": 45, "espera_media_min": 41, "mediana_min": 36, "p90_min": 78, "max_min": 130}, "taxa_chegada_por_15min": 22, "taxa_conclusao_por_15min": 17, "backlog_estimado": 23, "capacidade_estimada_por_15min": 18}, "assuncoes": {"janela_calculo_min": 120, "regras_outlier": {"limite_superior_min": 480}, "fallback_tempo_servico_padrao_min": {"vermelho": 15, "amarelo": 25, "verde": 35, "azul": 45}}} 
2.3 Configurações do Agente

2.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 1).
  • Tipo do input: JSON de dados brutos do PA contendo pacientes, triagem, timestamps (checkin, início e fim), equipe, ocupação de salas/recursos.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato JSON.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 10.000 caracteres.

2.3.2 Especificação do Output

  • Formato de output: O output deve ser um JSON contendo métricas de espera e indicadores operacionais.
  • Exemplo de Estrutura de Output:
     {"timestamp_referencia":"2025-12-16T12:21:00Z","metricas":{ "por_categoria": {"vermelho": {"em_espera": 2, "espera_media_min": 8, "espera_p90_min": 12, "espera_max_min": 15}, "amarelo": {...}, "verde": {...}, "azul": {...}}, "geral": {"em_espera": 45, "espera_media_min": 41, "mediana_min": 36, "p90_min": 78, "max_min": 130}, "taxa_chegada_por_15min": 22, "taxa_conclusao_por_15min": 17, "backlog_estimado": 23, "capacidade_estimada_por_15min": 18}, "assuncoes": {"janela_calculo_min": 120, "regras_outlier": {"limite_superior_min": 480}, "fallback_tempo_servico_padrao_min": {"vermelho": 15, "amarelo": 25, "verde": 35, "azul": 45}}} 
  • Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em torno de 4.000 caracteres.

2.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

2.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Utiliza lógica interna para calcular métricas de espera.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

2.3.5 Memória

  • Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
  • Visibilidade da Resposta: A resposta gerada por este agente deve ser visível para o Agente de Decisão de Alertas de Espera (RF 3).

2.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Decisão de Alertas de Espera (RF 3).

RF 3. Agente de Decisão de Alertas de Espera

3.1 Tarefa do Agente

Determinar quando e com que severidade emitir alertas operacionais sobre tempos de espera, consolidando motivos e priorizações.

3.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo um JSON de métricas calculadas contendo tempos por categoria, consolidado, taxas, backlog e status_geral preliminar.

# 2. Objetivo
Determinar quando e com que severidade emitir alertas operacionais sobre tempos de espera, consolidando motivos e priorizações.

# 3. Regras que você deve seguir para gerar sua resposta
- Determine a severidade do alerta com base em tempos de espera e backlog.
- Identifique motivos e categorias afetadas.
- Liste pacientes mais impactados.
- Produza mensagem curta para comunicação do alerta.

# 4. Exemplo de Output que você deve produzir
{"alerta": {"severidade": "critico|alerta|atencao|nenhum", "motivos": ["p90_verde acima do SLA em 1.7x", "backlog_60min = 30"], "categorias_afetadas": ["amarelo","verde"], "pacientes_mais_impactados_ids": ["p123","p456"], "cooldown_sugerido_min": 15, "mensagem_curta": "Tempo de espera crítico: p90 geral 78 min (>1.5x SLA). Ação imediata recomendada."}} 
3.3 Configurações do Agente

3.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 2).
  • Tipo do input: JSON de métricas calculadas contendo tempos por categoria, consolidado, taxas, backlog e status_geral preliminar.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato JSON.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 5.000 caracteres.

3.3.2 Especificação do Output

  • Formato de output: O output deve ser um JSON estruturando o conteúdo do alerta.
  • Exemplo de Estrutura de Output:
     {"alerta": {"severidade": "critico|alerta|atencao|nenhum", "motivos": ["p90_verde acima do SLA em 1.7x", "backlog_60min = 30"], "categorias_afetadas": ["amarelo","verde"], "pacientes_mais_impactados_ids": ["p123","p456"], "cooldown_sugerido_min": 15, "mensagem_curta": "Tempo de espera crítico: p90 geral 78 min (>1.5x SLA). Ação imediata recomendada."}} 
  • Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em torno de 2.500 caracteres.

3.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

3.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Utiliza lógica interna para determinar a severidade do alerta.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

3.3.5 Memória

3.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Recomendação de Alocação de Recursos (RF 4).

RF 4. Agente de Recomendação de Alocação de Recursos

4.1 Tarefa do Agente

Gerar plano de ações operacionais para reduzir tempos de espera e mitigar gargalos no pronto atendimento.

4.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo métricas consolidadas e contexto operacional (equipe em plantão, ocupação de salas e recursos, taxas de chegada e conclusão).

# 2. Objetivo
Gerar plano de ações operacionais para reduzir tempos de espera e mitigar gargalos no pronto atendimento.

# 3. Regras que você deve seguir para gerar sua resposta
- Calcule déficit de capacidade e sugira realocações de recursos.
- Produza ao menos 2 ações quando severidade >= alerta.
- Inclua estimativas de tempo de implantação e risco.

# 4. Exemplo de Output que você deve produzir
{"plano_de_acao": [{"acao": "realocar 1 enfermeiro do setor Observação para Triagem", "impacto_estimado": {"aumento_capacidade_por_15min": 3, "reducao_p90_min": 10}, "criterio": "ocupacao_observacao < 50% e p90_triagem > SLA", "tempo_implantacao_min": 5, "pre_requisitos": ["liberar escala"], "risco": "baixo"}, {"acao": "abrir sala adicional de atendimento clinico", "impacto_estimado": {"aumento_capacidade_por_15min": 4}, "tempo_implantacao_min": 10, "pre_requisitos": ["sala DISP-3"], "risco": "medio"}], "priorizacao": "ordenar por (impacto_estimado alto, tempo_implantacao baixo, risco baixo)", "observacoes": "priorizar amarelo e verde até normalização do p90"} 
4.3 Configurações do Agente

4.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 3).
  • Tipo do input: Métricas consolidadas e contexto operacional (equipe em plantão, ocupação de salas e recursos, taxas de chegada e conclusão).
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato JSON.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 4.000 caracteres.

4.3.2 Especificação do Output

  • Formato de output: O output deve ser um JSON detalhando o plano de ações operacionais.
  • Exemplo de Estrutura de Output:
     {"plano_de_acao": [{"acao": "realocar 1 enfermeiro do setor Observação para Triagem", "impacto_estimado": {"aumento_capacidade_por_15min": 3, "reducao_p90_min": 10}, "criterio": "ocupacao_observacao < 50% e p90_triagem > SLA", "tempo_implantacao_min": 5, "pre_requisitos": ["liberar escala"], "risco": "baixo"}, {"acao": "abrir sala adicional de atendimento clinico", "impacto_estimado": {"aumento_capacidade_por_15min": 4}, "tempo_implantacao_min": 10, "pre_requisitos": ["sala DISP-3"], "risco": "medio"}], "priorizacao": "ordenar por (impacto_estimado alto, tempo_implantacao baixo, risco baixo)", "observacoes": "priorizar amarelo e verde até normalização do p90"} 
  • Número de caracteres esperado: O JSON gerado deve ter um tamanho estimado em torno de 3.000 caracteres.

4.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

4.3.4 Ferramentas do Agente

  • Documentos: Não consulta documentos externos.
  • Calculadora: Utiliza lógica interna para calcular déficit de capacidade e sugerir realocações.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não se conecta a sistemas externos.

4.3.5 Memória

  • Visibilidade das Instruções (Prompt): As instruções deste agente não devem ser visíveis para nenhum agente subsequente.
  • Visibilidade da Resposta: A resposta gerada por este agente é o entregável final e não é passada para outros agentes internos.

4.3.6 Regras de Orquestração e Transição

A execução deste agente finaliza o fluxo. O plano de ação gerado é o resultado que deve ser disponibilizado ao usuário.

© 2025 prototipe.ai. Todos os direitos reservados.