max output tokens
Categoria: modelos e inferência
Parâmetro que limita o número máximo de tokens na resposta gerada pelo modelo, controlando o tamanho da saída e evitando respostas excessivamente longas ou custos inesperados.
Experimente 5 minutos
Uma IA de voz que entende seu projeto e constrói os agentes com você