Agente de IA para Gestão de Fluxo de Pacientes no Pronto Atendimento

24 de December de 2025 • Tempo de leitura: 5 min

Como criar um agente de IA que analisa dados de fluxo de pacientes para otimizar a alocação de recursos e reduzir o tempo de espera.

1. Propósito e Escopo

Este documento define todos os prompts, configurações de memória, transição entre estados, ferramentas como chamadas a sistemas externos e demais requisitos funcionais para o Fluxo de Agentes "Gestão de Fluxo de Pacientes no Pronto Atendimento", uma solução de automação projetada para otimizar a alocação de recursos e reduzir o tempo de espera no atendimento a pacientes. Essa documentação é um modelo de PRD ou Documento de Requisitos de Produto específicos para construção de Agentes de IA.

O objetivo principal é monitorar em tempo real o fluxo de pacientes e recursos disponíveis, fornecendo recomendações para otimização da distribuição de pessoal e equipamentos, prevendo picos de demanda e oferecendo painéis de controle para gestores.

2. Contexto e Problema

Cenário Atual

As unidades de pronto atendimento enfrentam desafios significativos na gestão do fluxo de pacientes, resultando em ineficiências na alocação de recursos humanos e materiais e longos tempos de espera. Esses problemas impactam diretamente a satisfação do paciente e a qualidade do atendimento prestado.


Problemas Identificados

  • Ineficiências na alocação de recursos: A falta de dados em tempo real impede a distribuição eficaz de pessoal e materiais.
  • Longos tempos de espera: A demora no atendimento afeta a experiência do paciente e pode comprometer o desfecho clínico.

3. Impactos Esperados

A implementação deste fluxo de automação visa alcançar os seguintes resultados:

  • Reduzir o tempo de espera em pelo menos 50%.
  • Otimizar a alocação de recursos, garantindo que a equipe e os equipamentos sejam usados de forma eficiente.
  • Aumentar a satisfação do paciente através de um atendimento mais rápido e eficaz.

4. Visão Geral da Solução

O agente de IA para gestão de fluxo de pacientes no pronto atendimento monitora dados em tempo real, fornecendo recomendações para otimização de recursos e reduzindo o tempo de espera. A seguir são detalhadas todas as regras de negócio e especificações funcionais necessárias para que esse agente atue como um assistente útil e autônomo na gestão de fluxo de pacientes.

A solução consiste em um fluxo de automação composto por 7 agentes de IA. O processo inicia com a coleta de dados de pacientes e termina com a apresentação de painéis de controle para gestores.

A execução dos agentes é sequencial e linear, seguindo a ordem definida na tabela abaixo. O fluxo inclui etapas condicionais que são executadas apenas se critérios específicos forem atendidos, conforme detalhado após a tabela.

Agentes Função Principal
Agente de Execução de Consultas em Banco de Dados (RF 1) Realizar conexão com o banco de dados operacional do hospital para obter dados de fluxo de pacientes e capacidade.
Agente de Execução de Chamada à API (RF 2) Realizar chamadas à API dos sistemas de RH/Escala e de equipamentos para obter disponibilidade de pessoal e status de recursos materiais.
Agente de Consolidação e Normalização de Dados (RF 3) Unificar e padronizar os dados brutos de pacientes, capacidade, equipe e equipamentos em um snapshot coerente para análise.
Agente de Previsão de Picos de Demanda (RF 4) Estimar picos de chegada e carga de atendimento por intervalos de 15 minutos nas próximas 24-72 horas para ajuste proativo de recursos.
Agente de Monitoramento de Fluxo de Pacientes (RF 5) Calcular e atualizar KPIs operacionais do pronto atendimento em tempo quase real a partir do snapshot consolidado.
Agente de Recomendação de Alocação de Recursos (RF 6) Sugerir redistribuição de pessoal e equipamentos para reduzir tempos de espera e aliviar gargalos, respeitando restrições operacionais.
Agente de Visualização de Métricas de Desempenho (RF 7) Preparar especificações de painéis para gestores com foco em clareza e ação, incluindo destaque de áreas críticas.

5. Protótipos

Para proporcionar uma visão clara e tangível da solução proposta, criamos protótipos interativos que demonstram tanto o fluxo de trabalho dos agentes quanto o resultado final que o gestor receberá. Explore os links abaixo para entender melhor a solução em ação.

6. Requisitos Funcionais

RF 1. Agente de Execução de Consultas em Banco de Dados

1.1 Tarefa do Agente

Realizar conexão com o banco de dados operacional do hospital (HIS/EMR/ADT) para obter dados de fluxo de pacientes e capacidade.

1.2 Prompt ou Instruções do Agente
 Este agente não necessita de instruções de LLM; sua função é exclusivamente executar a consulta ao banco com os parâmetros recebidos. 
1.3 Configurações do Agente

1.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente é o ponto de partida do fluxo e deve ser acionado pelo envio de parâmetros prontos para consulta via API. Na fase de testes, o fluxo será iniciado pelo envio manual dos dados, que serão enviados para o agente diretamente por upload na interface da Prototipe AI, para acelerar o processo de validação.
  • Tipo do input: Parâmetros prontos para consulta: {conexao_id, janela_tempo_inicio, janela_tempo_fim, tabelas: [triagem, atendimentos, leitos, movimentacoes], campos_requeridos, filtros, limite_registros}.
  • Formatos Suportados: Esse agente deve ser capaz de receber parâmetros em formato JSON.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 5.000 caracteres.

1.3.2 Especificação do Output

  • Formato de output: Dados brutos das consultas em formato tabular/JSON com registros de pacientes (check-in, triagem, timestamps por etapa, destino), ocupação de leitos, movimentações e tempos de permanência.
  • Número de caracteres esperado: O output gerado terá um tamanho aproximado de 10.000 caracteres.

1.3.3 Parâmetros de Geração

  • Modelo: Não se aplica

1.3.4 Ferramentas do Agente

  • Documentos: Não consulta.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Conecta-se ao banco de dados operacional para execução de consultas.

1.3.5 Memória

1.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Execução de Chamada à API (RF 2).

RF 2. Agente de Execução de Chamada à API

2.1 Tarefa do Agente

Realizar chamadas à API dos sistemas de RH/Escala e de equipamentos para obter disponibilidade de pessoal e status de recursos materiais.

2.2 Prompt ou Instruções do Agente
 Este agente não necessita de instruções de LLM; sua função é exclusivamente executar a chamada à API com o payload recebido. 
2.3 Configurações do Agente

2.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 1).
  • Tipo do input: Payload pronto contendo endpoints, headers, credenciais seguras (referência), parâmetros de data/hora e filtros por setor/unidade.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato JSON.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 5.000 caracteres.

2.3.2 Especificação do Output

  • Formato de output: Dados brutos em JSON sobre escala de profissionais (cargo, skill, turno, presença), e inventário/status de equipamentos e salas (disponível/em uso/indisponível).
  • Número de caracteres esperado: O output gerado terá um tamanho aproximado de 10.000 caracteres.

2.3.3 Parâmetros de Geração

  • Modelo: Não se aplica

2.3.4 Ferramentas do Agente

  • Documentos: Não consulta.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Conecta-se aos sistemas de RH/Escala e de equipamentos para execução de chamadas à API.

2.3.5 Memória

2.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Consolidação e Normalização de Dados (RF 3).

RF 3. Agente de Consolidação e Normalização de Dados

3.1 Tarefa do Agente

Unificar e padronizar os dados brutos de pacientes, capacidade, equipe e equipamentos em um snapshot coerente para análise.

3.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo dados brutos de pacientes e recursos de dois agentes anteriores.

# 2. Objetivo
Unificar e padronizar os dados brutos de pacientes, capacidade, equipe e equipamentos em um snapshot coerente para análise.

# 3. Regras que você deve seguir para gerar sua resposta
- Mapear protocolos de triagem distintos para escala unificada 1-5: Manchester (Vermelho=1, Laranja=2, Amarelo=3, Verde=4, Azul=5); ESI (1=1, 2=2, 3=3, 4=4, 5=5).
- Normalizar fusos para UTC e incluir offset local; calcular espera_min = now - chegada_ts quando etapa_atual estiver em fila/triagem/espera por leito.
- Deduplicar pacientes por patient_id escolhendo o registro com maior updated_ts; descartar registros com chegada_ts futuro.
- Classificar prioridade: triagem_nivel 1-2 => critica/alta; 3 => media; 4-5 => baixa. Em caso de falta de triagem, inferir prioridade como media e marcar flag prioridade_estimada=true.
- Tratar faltantes: se etapa_atual ausente, inferir pelo último timestamp conhecido (ex.: tem triagem e sem médico => 'aguardando_atendimento'); marcar campos inferidos com sufixo _estimado=true.
- Validar consistência: leitos_ocupados ≤ leitos_totais; se violado, ajustar leitos_ocupados para leitos_totais e registrar campo ajuste_capacidade=true por setor.
- Calcular taxa_utilizacao_equipe por função = (profissionais em atendimento)/(profissionais presentes); definir como 0 quando denominador=0.
- Produzir lista ordenada de pacientes por severidade(desc) e espera_min(desc) para consumo dos próximos agentes. 
3.3 Configurações do Agente

3.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 2).
  • Tipo do input: Saídas dos Agentes de Execução de Consultas em Banco de Dados e de Chamada à API referentes à mesma janela de tempo.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato JSON.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input combinado de até 20.000 caracteres.

3.3.2 Especificação do Output

  • Formato de output: JSON consolidado com schema: {timestamp_coleta, pacientes:[{patient_id, chegada_ts, triagem_sistema, triagem_nivel(1-5), etapa_atual, espera_min, prioridade(baixa/media/alta/critica), destino_previsto}], recursos:{equipe:[{id, funcao, skillset, setor, turno, status(presente/ausente/em_pausa), carga_horas_disponivel}], equipamentos:[{id, tipo, setor, status, tempo_disponibilidade_min} ]}, capacidade:{setores:[{nome, leitos_totais, leitos_ocupados, leitos_bloqueados}]}}
  • Número de caracteres esperado: O JSON gerado terá um tamanho aproximado de 15.000 caracteres.

3.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

3.3.4 Ferramentas do Agente

  • Documentos: Não consulta.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não utiliza.

3.3.5 Memória

3.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Previsão de Picos de Demanda (RF 4).

RF 4. Agente de Previsão de Picos de Demanda

4.1 Tarefa do Agente

Estimar picos de chegada e carga de atendimento por intervalos de 15 minutos nas próximas 24-72 horas para ajuste proativo de recursos.

4.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo séries históricas agregadas de chegadas, início de atendimento e altas.

# 2. Objetivo
Estimar picos de chegada e carga de atendimento por intervalos de 15 minutos nas próximas 24-72 horas para ajuste proativo de recursos.

# 3. Regras que você deve seguir para gerar sua resposta
- Agregar histórico por 15 min e por setor do pronto atendimento, diferenciando adulto/pediatria quando aplicável.
- Calcular baseline por dia_da_semana e hora, ajustando por feriados: se feriado=true usar mediana histórica dos feriados do mesmo tipo; caso contrário, usar mediana dos últimos N (≥8) períodos equivalentes.
- Ajustar tendências recentes: aplicar fator de correção = média(chegadas últimas 2 semanas)/média(chegadas referências sazonais) limitado a faixa [0.7, 1.3].
- Definir intervalo de confiança com base em percentis 20-80 das observações equivalentes; garantir chegadas_esperadas ≥ 0 e valores inteiros arredondando para cima.
- Sinalizar janelas de pico quando chegadas_esperadas estiver entre os 15% maiores do horizonte; campo pico=true.
- Produzir sugestão preliminar de reforço de equipe por função: para cada pico, recomendar incremento mínimo necessário para manter relação alvo de pacientes por profissional (parâmetros padrão: médico_critico=1:3, enfermagem_critico=1:2, médico_geral=1:8, enfermagem_geral=1:5), respeitando limites de lotação física. 
4.3 Configurações do Agente

4.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 3).
  • Tipo do input: Séries históricas agregadas de chegadas, início de atendimento e altas por intervalo de 15 min dos últimos 90-365 dias.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato JSON.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 10.000 caracteres.

4.3.2 Especificação do Output

  • Formato de output: JSON com previsões por intervalo: [{inicio_janela, fim_janela, chegadas_esperadas, atendimentos_esperados, intervalo_confianca_min, intervalo_confianca_max, fator_sazonal, feriado(bool)}] e métricas de acurácia histórica (MAPE/MAE) baseadas em backtesting mais recente.
  • Número de caracteres esperado: O JSON gerado terá um tamanho aproximado de 10.000 caracteres.

4.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

4.3.4 Ferramentas do Agente

  • Documentos: Não consulta.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não utiliza.

4.3.5 Memória

4.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Monitoramento de Fluxo de Pacientes (RF 5).

RF 5. Agente de Monitoramento de Fluxo de Pacientes

5.1 Tarefa do Agente

Calcular e atualizar KPIs operacionais do pronto atendimento em tempo quase real a partir do snapshot consolidado.

5.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo o snapshot consolidado de dados atualizados de pacientes e recursos.

# 2. Objetivo
Calcular e atualizar KPIs operacionais do pronto atendimento em tempo quase real a partir do snapshot consolidado.

# 3. Regras que você deve seguir para gerar sua resposta
- Recalcular a cada execução com base no snapshot; incluir carimbo ts UTC e local.
- Espera: usar mediana e p90 por triagem_nivel; quando N<5, reportar somente média e marcar baixa_confianca=true.
- Fila por etapa: triagem, aguardando_atendimento, em_atendimento, aguardando_leito, exames, alta.
- Ocupação de leitos por setor = leitos_ocupados/(leitos_totais - leitos_bloqueados), truncando a faixa [0,1].
- Utilização de equipe por função = casos_ativos atribuídos/profissionais presentes; se >1, gerar alerta severidade=alta de subdimensionamento.
- Definir SLAs padrão: porta-médico alvo ≤ 20 min para triagem 1-2 e ≤ 60 min para triagem 3; porta-leito ≤ 120 min após decisão de internação. Avaliar dentro_sla por triagem.
- Gerar alertas quando: p90_espera triagem 1-2 > 15 min (alta), ocupacao > 0.9 (media) e >0.95 (alta), utilizacao_equipe > 0.85 (media) e >0.95 (alta). 
5.3 Configurações do Agente

5.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 4).
  • Tipo do input: Snapshot consolidado do Agente de Consolidação e Normalização de Dados.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato JSON.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 15.000 caracteres.

5.3.2 Especificação do Output

  • Formato de output: JSON de KPIs: {ts, kpis:{tempo_espera_mediana_por_triagem, p90_espera_por_triagem, pacientes_em_fila_por_etapa, taxa_ocupacao_leitos_por_setor, utilizacao_equipe_por_funcao, taxa_retorno_24h, tempo_porta_medico_mediana, tempo_porta_leito_mediana}, alertas:[{tipo, severidade, descricao, setor}], sla_status:{indicador, dentro_sla(bool)}}
  • Número de caracteres esperado: O JSON gerado terá um tamanho aproximado de 10.000 caracteres.

5.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

5.3.4 Ferramentas do Agente

  • Documentos: Não consulta.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não utiliza.

5.3.5 Memória

5.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Recomendação de Alocação de Recursos (RF 6).

RF 6. Agente de Recomendação de Alocação de Recursos

6.1 Tarefa do Agente

Sugerir redistribuição de pessoal e equipamentos para reduzir tempos de espera e aliviar gargalos, respeitando restrições operacionais.

6.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo os KPIs atuais e previsões de picos de demanda.

# 2. Objetivo
Sugerir redistribuição de pessoal e equipamentos para reduzir tempos de espera e aliviar gargalos, respeitando restrições operacionais.

# 3. Regras que você deve seguir para gerar sua resposta
- Priorização: tratar primeiro triagens 1-2; depois triagem 3; por fim 4-5. Concentrar recursos onde p90_espera/limite_SLA for maior.
- Ratios alvo de cobertura (parâmetro): crítico (1-2) médico ≤ 3 pacientes/profissional; enfermagem ≤ 2; não crítico médico ≤ 8; enfermagem ≤ 5. Calcular déficit por setor e função.
- Restrições obrigatórias: manter mínimo de 1 médico e 2 de enfermagem por setor ativo; preservar competências (skillset) exigidas; evitar mover profissional se restante do setor ficar abaixo do mínimo.
- Logística de movimentação: no máximo 1 realocação por profissional por janela de 4h; sugerir movimentos em blocos de ≥60 min. Respeitar intervalos de pausa cadastrados (status em_pausa).
- Equipamentos: priorizar deslocamento de monitores/ventiladores para setores com pacientes de prioridade alta sem equipamento; não sugerir se status=indisponível.
- Cenários What-if: para cada recomendação, estimar impacto em p90_espera assumindo ganho de produtividade por profissional adicional: crítico=-4 min/paciente, geral=-2 min/paciente; limitar reduções para não ultrapassar 30% do valor atual do KPI.
- Geração de plano: ordenar ações por maior impacto_estimado/duração_min; incluir alternativas quando restrições inviabilizarem a ação principal. 
6.3 Configurações do Agente

6.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 5).
  • Tipo do input: KPIs atuais do Agente de Monitoramento + snapshot consolidado de recursos + previsões de picos do Agente de Previsão (quando disponíveis).
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato JSON.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input combinado de até 20.000 caracteres.

6.3.2 Especificação do Output

  • Formato de output: JSON com recomendações: [{acao, alvo(setor/funcao/equipamento), quantidade, inicio, duracao_min, justificativa, impacto_estimado:{kpi, delta}, restricoes_consideradas:[...], risco_execucao(baixa/media/alta)}] e um plano de reequilíbrio por setor.
  • Número de caracteres esperado: O JSON gerado terá um tamanho aproximado de 15.000 caracteres.

6.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

6.3.4 Ferramentas do Agente

  • Documentos: Não consulta.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não utiliza.

6.3.5 Memória

6.3.6 Regras de Orquestração e Transição

Ao concluir sua execução, esse agente aciona o Agente de Visualização de Métricas de Desempenho (RF 7).

RF 7. Agente de Visualização de Métricas de Desempenho

7.1 Tarefa do Agente

Preparar especificações de painéis para gestores com foco em clareza e ação, incluindo destaque de áreas críticas.

7.2 Prompt ou Instruções do Agente
 # 1. Contexto e explicações sobre inputs iniciais
Você está recebendo os KPIs, alertas e recomendações consolidados dos agentes anteriores.

# 2. Objetivo
Preparar especificações de painéis para gestores com foco em clareza e ação, incluindo destaque de áreas críticas.

# 3. Regras que você deve seguir para gerar sua resposta
- Destacar widgets para: tempo porta-médico por triagem, p90 por setor, ocupação de leitos, utilização por função, previsão próximas 24-72h (heatmap 15 min), e lista ordenada de recomendações com impacto estimado.
- Aplicar codificação de cores por severidade (verde ≤ limite alvo, amarelo até 10% acima, vermelho >10%).
- Incluir referência temporal (última atualização ts) em todos os widgets; permitir troca de granularidade (15 min / hora / dia) via parâmetro do widget.
- Sinalizar explicitamente setores com dentro_sla=false no topo do painel e ancorar links_de_acao para recomendações correspondentes.
- Garantir acessibilidade: rótulos claros, unidades (min, %), e tooltips com definição de cada KPI. 
7.3 Configurações do Agente

7.3.1 Especificação do Input

  • Mecanismo de Acionamento: Este agente deve ser acionado automaticamente após a conclusão do agente anterior (RF 6).
  • Tipo do input: KPIs, alertas e recomendações consolidados dos agentes anteriores.
  • Formatos Suportados: Esse agente deve ser capaz de receber inputs no formato JSON.
  • Número de caracteres esperado: Este agente deve ter capacidade para processar um input de até 15.000 caracteres.

7.3.2 Especificação do Output

  • Formato de output: Especificação de dashboard em JSON: {layouts:[{titulo, widgets:[{tipo(linha/barra/kpi/tabela/heatmap), origem_dados, metrica, dimensoes, periodo, destaque_limites:{alto,medio}, explicacao}] }], secoes_de_alertas:[{prioridade, texto}] , links_de_acao:[{descricao, acao_referencia}]}
  • Número de caracteres esperado: O JSON gerado terá um tamanho aproximado de 15.000 caracteres.

7.3.3 Parâmetros de Geração

  • Modelo: GPT-5
  • Temperatura: 0.6

7.3.4 Ferramentas do Agente

  • Documentos: Não consulta.
  • Calculadora: Não utiliza.
  • Busca Online: Não utiliza.
  • Sistemas Externos: Não utiliza.

7.3.5 Memória

  • Visibilidade das Instruções (Prompt): As instruções deste agente não são visíveis para nenhum agente subsequente.
  • Visibilidade da Resposta: A resposta (especificação de dashboard) é o entregável final e não é passada para outros agentes internos.

7.3.6 Regras de Orquestração e Transição

A execução deste agente finaliza o fluxo. A especificação de dashboard gerada é o resultado que deve ser disponibilizado aos gestores.

© 2025 prototipe.ai. Todos os direitos reservados.