Руководства
Лимиты и квоты
Баланс счета, мониторинг использования токенов и обработка ошибок в ZvenoAI. Настройте алерты и ретраи, чтобы избегать 402 ошибок.
ZvenoAI использует модель оплаты по факту использования (pay-as-you-go). Средства списываются с баланса счета за каждый запрос. Мониторьте баланс и настройте алерты, чтобы избегать ошибок 402 (недостаточно средств).
Как работает биллинг
| Описание | |
|---|---|
| Баланс счета (Pay-as-you-go) | Средства списываются с баланса за каждый запрос по цене модели. Пополняйте баланс по мере необходимости. При недостатке средств запрос вернет ошибку 402. |
| Овердрафт (По договоренности) | Для корпоративных клиентов доступен овердрафт. Обратитесь в поддержку для настройки лимита овердрафта и условий его использования. |
Бесплатные модели
Бесплатные модели поставляются «как есть» и регулируются лимитами провайдера. Предоставление модели без ограничений не гарантируется.
Мониторинг использования
Отслеживайте баланс и потребление через API Reference:
GET /v1/credits— текущий балансGET /v1/activity— статистика использованияGET /v1/generation— детали конкретной генерации
Практические советы
- Мониторьте баланс счета и настраивайте алерты при низком остатке.
- Используйте batch-запросы для однотипных задач, чтобы сократить overhead.
- Логируйте latency и количество токенов на каждый запрос — это помогает оптимизировать использование.