Лимиты и квоты

Баланс счета, мониторинг использования токенов и обработка ошибок в ZvenoAI. Настройте алерты и ретраи, чтобы избегать 402 ошибок.

ZvenoAI использует модель оплаты по факту использования (pay-as-you-go). Средства списываются с баланса счета за каждый запрос. Мониторьте баланс и настройте алерты, чтобы избегать ошибок 402 (недостаточно средств).

Как работает биллинг

	Описание
Баланс счета (Pay-as-you-go)	Средства списываются с баланса за каждый запрос по цене модели. Пополняйте баланс по мере необходимости. При недостатке средств запрос вернет ошибку 402.
Овердрафт (По договоренности)	Для корпоративных клиентов доступен овердрафт. Обратитесь в поддержку для настройки лимита овердрафта и условий его использования.

Бесплатные модели

Бесплатные модели поставляются «как есть» и регулируются лимитами провайдера. Предоставление модели без ограничений не гарантируется.

Мониторинг использования

Отслеживайте баланс и потребление через API Reference:

GET /v1/credits — текущий баланс
GET /v1/activity — статистика использования
GET /v1/generation — детали конкретной генерации

Практические советы

Мониторьте баланс счета и настраивайте алерты при низком остатке.
Используйте batch-запросы для однотипных задач, чтобы сократить overhead.
Логируйте latency и количество токенов на каждый запрос — это помогает оптимизировать использование.

Как работает биллинг

	Описание
Баланс счета (Pay-as-you-go)	Средства списываются с баланса за каждый запрос по цене модели. Пополняйте баланс по мере необходимости. При недостатке средств запрос вернет ошибку 402.
Овердрафт (По договоренности)	Для корпоративных клиентов доступен овердрафт. Обратитесь в поддержку для настройки лимита овердрафта и условий его использования.

Бесплатные модели

Мониторинг использования

Отслеживайте баланс и потребление через API Reference:

GET /v1/credits — текущий баланс
GET /v1/activity — статистика использования
GET /v1/generation — детали конкретной генерации

Практические советы

Мониторьте баланс счета и настраивайте алерты при низком остатке.
Используйте batch-запросы для однотипных задач, чтобы сократить overhead.
Логируйте latency и количество токенов на каждый запрос — это помогает оптимизировать использование.

Лимиты и квоты

Как работает биллинг

Бесплатные модели

Мониторинг использования

Практические советы

On this page

Лимиты и квоты

Как работает биллинг

Бесплатные модели

Мониторинг использования

Практические советы

On this page