throughput

Categoria: modelos e inferência

Quantidade de requisições de inferência que o endpoint do modelo consegue processar por unidade de tempo, determinando a capacidade de escala do agente sob carga.

throughput

Converse com a Esther

Conversar Agora

Agendar Conversa

Escolha o melhor horário

Seu email

Esther está preparando tudo

Qual é o seu momento?

Já tenho um agente

Quero aprender