开发者文档

完整的 API 文档,兼容 OpenAI 接口标准

POST/v1/audio/gemini

原生 Gemini 音频格式

使用原生 Gemini 格式进行音频处理,支持语音识别和音频理解。

请求地址

POST https://token.wlj.weifaner.net:8001/v1/audio/gemini

请求头

参数名类型必填说明
AuthorizationstringBearer Token 认证
Content-Typestringmultipart/form-data

请求参数

参数名类型必填说明
filefile音频文件(支持 mp3, wav, ogg, m4a)
modelstring模型名称,如 gemini-1.5-pro
promptstring处理提示词

请求示例

curl -X POST https://token.wlj.weifaner.net:8001/v1/audio/gemini \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@audio.mp3" \
  -F "model=gemini-1.5-pro" \
  -F "prompt=请转录这段音频内容"

响应示例

{
  "text": "这是音频的转录文本内容...",
  "language": "zh",
  "duration": 120.5,
  "usage": {
    "prompt_tokens": 100,
    "completion_tokens": 50,
    "total_tokens": 150
  }
}

最后更新于 2026/5/25