Руководства
Лимиты и квоты
ZvenoAI использует модель оплаты по факту использования (pay-as-you-go). Средства списываются с баланса счета за каждый запрос. Мониторьте баланс и настройте алерты, чтобы избегать ошибок 402 (недостаточно средств).
Как работает биллинг
Баланс счета
Pay-as-you-go
Средства списываются с баланса за каждый запрос по цене модели. Пополняйте баланс по мере необходимости. При недостатке средств запрос вернет ошибку 402.
Овердрафт
По договоренности
Для корпоративных клиентов доступен овердрафт. Обратитесь в поддержку для настройки лимита овердрафта и условий его использования.
Бесплатные модели
Бесплатные модели поставляются «как есть» и регулируются лимитами провайдера. Предоставление модели без ограничений не гарантируется.
Мониторинг использования
Используйте панель ZvenoAI или API, чтобы отслеживать потребление токенов и количество запросов. Пример получения статистики:
// Получить список записей использования
const response = await fetch('https://api.zveno.ai/v1/users/me/usage?limit=20&offset=0', {
headers: {
'Authorization': `Bearer ${process.env.ZVENOAI_API_KEY}`,
},
});
const data = await response.json();
console.log(data.usage); // Массив записей использования
// Получить суммарную статистику
const summary = await fetch('https://api.zveno.ai/v1/users/me/usage/summary?period=7d&groupBy=model', {
headers: {
'Authorization': `Bearer ${process.env.ZVENOAI_API_KEY}`,
},
});
const summaryData = await summary.json();
console.log(summaryData.total_tokens, summaryData.total_requests);Что отслеживать
- Текущий баланс счета и история пополнений
- Количество токенов за период (день / неделя / месяц)
- Использование по моделям — какие модели съедают больше всего средств
- Ошибки 402 — индикатор необходимости пополнить баланс
Практические советы
- Мониторьте баланс счета и настраивайте алерты при низком остатке.
- Используйте batch-запросы для однотипных задач, чтобы сократить overhead.
- Логируйте latency и количество токенов на каждый запрос — это помогает оптимизировать использование.