POST/v1/audio/gemini

原生 Gemini 音频格式

使用原生 Gemini 格式进行音频处理，支持语音识别和音频理解。

请求地址

POST https://token.wlj.weifaner.net:8001/v1/audio/gemini

请求头

参数名	类型	必填	说明
`Authorization`	string	是	Bearer Token 认证
`Content-Type`	string	是	multipart/form-data

请求参数

参数名	类型	必填	说明
`file`	file	是	音频文件（支持 mp3, wav, ogg, m4a）
`model`	string	是	模型名称，如 gemini-1.5-pro
`prompt`	string	否	处理提示词

请求示例

curl -X POST https://token.wlj.weifaner.net:8001/v1/audio/gemini \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@audio.mp3" \
  -F "model=gemini-1.5-pro" \
  -F "prompt=请转录这段音频内容"

响应示例

{
  "text": "这是音频的转录文本内容...",
  "language": "zh",
  "duration": 120.5,
  "usage": {
    "prompt_tokens": 100,
    "completion_tokens": 50,
    "total_tokens": 150
  }
}

开发者文档

原生 Gemini 音频格式

请求地址

请求头

请求参数

请求示例

响应示例