Руководства
Стриминг
Как использовать стриминг для получения ответов в реальном времени.
Стриминг позволяет получать ответ модели токен за токеном, не дожидаясь полной генерации.
Как включить
Передайте stream: true в параметрах запроса:
stream = client.chat.completions.create(
model="openai/gpt-4o",
messages=[{"role": "user", "content": "Напиши стихотворение"}],
stream=True
)
for chunk in stream:
if chunk.choices[0].delta.content:
print(chunk.choices[0].delta.content, end="")const stream = await client.chat.completions.create({
model: 'openai/gpt-4o',
messages: [{ role: 'user', content: 'Напиши стихотворение' }],
stream: true
})
for await (const chunk of stream) {
const content = chunk.choices[0]?.delta?.content
if (content) process.stdout.write(content)
}curl https://api.zveno.ai/v1/chat/completions \
-H "Authorization: Bearer sk-your-key" \
-H "Content-Type: application/json" \
-d '{"model": "openai/gpt-4o", "messages": [{"role": "user", "content": "Напиши стихотворение"}], "stream": true}'Все модели в ZvenoAI поддерживают стриминг. Статус поддержки можно проверить в каталоге моделей.