Audio Transcriptions
Транскрибирует аудиофайл в текст.
Совместим с OpenAI Audio Transcriptions API — можно использовать любой OpenAI SDK,
указав base_url: "https://api.zveno.ai/v1".
Поддерживает форматы: mp3, mp4, mpeg, mpga, m4a, wav, webm, ogg, flac.
Модель указывается в формате vendor/model (например, openai/whisper-1).
Аутентификация: Authorization: Bearer <api-key>.
Authorization
BearerAuth In: header
Request Body
multipart/form-data
TypeScript Definitions
Use the request body type in TypeScript.
Response Body
application/json
curl -X POST "http://localhost:8080/v1/audio/transcriptions" \ -F file="string" \ -F model="string"{
"duration": 0.1,
"language": "string",
"logprobs": [
{
"bytes": [
0
],
"logprob": 0.1,
"token": "string"
}
],
"segments": [
{
"avg_logprob": 0.1,
"compression_ratio": 0.1,
"end": 0.1,
"id": "string",
"no_speech_prob": 0.1,
"seek": 0,
"speaker": "string",
"start": 0.1,
"temperature": 0.1,
"text": "string",
"tokens": [
0
],
"type": "string"
}
],
"task": "string",
"text": "string",
"usage": {
"input_token_details": {
"audio_tokens": 0,
"text_tokens": 0
},
"input_tokens": 0,
"output_tokens": 0,
"seconds": 0,
"total_tokens": 0,
"type": "string"
},
"words": [
{
"end": 0.1,
"start": 0.1,
"word": "string"
}
]
}