Руководства
Мультимодальность
Работа с изображениями и другими типами контента через ZvenoAI API.
ZvenoAI поддерживает мультимодальные запросы — отправку изображений вместе с текстом.
Vision (анализ изображений)
response = client.chat.completions.create(
model="openai/gpt-4o",
messages=[{
"role": "user",
"content": [
{"type": "text", "text": "Что на этом изображении?"},
{"type": "image_url", "image_url": {"url": "https://example.com/image.jpg"}}
]
}]
)const response = await client.chat.completions.create({
model: 'openai/gpt-4o',
messages: [{
role: 'user',
content: [
{ type: 'text', text: 'Что на этом изображении?' },
{ type: 'image_url', image_url: { url: 'https://example.com/image.jpg' } }
]
}]
})Поддерживаемые форматы: PNG, JPEG, GIF, WebP.
Модели с поддержкой vision
| Модель | Vision | Аудио |
|---|---|---|
openai/gpt-4o | Yes | Yes |
anthropic/claude-sonnet-4-20250514 | Yes | No |
google/gemini-2.5-pro | Yes | Yes |