streaming

Categoria: modelos e inferência

Modo de entrega da resposta do modelo onde os tokens são enviados incrementalmente conforme são gerados, em vez de esperar a geração completa. Reduz a latência percebida pelo usuário.

streaming

Converse com a Esther

Conversar Agora

Agendar Conversa

Escolha o melhor horário

Seu email

Esther está preparando tudo

Qual é o seu momento?

Já tenho um agente

Quero aprender