跳至主要內容

大约 3 分钟约 751 字

语音识别

  • 效果示意:点击跳转
  • 积分消耗:1积分/次
  • 调用方式:同步/异步
  • 任务类型:1002
  • 输入参数:
参数名名称类型必填说明
audio音频文件file仅支持中文且时长不超过60s的文件
  • 输出参数
参数名名称类型说明
text识别的文字string
  • 输入示例
{
  "task_type": 1002,
  "input": {
    "audio": {
      "name": "speech.wav",
      "path": "tmp/65b1aa96d633cb4aefb7871e/c2c48e1037024587bf2d897300c5ac45.wav",
      "source": 1,
      "size": 638046
    }
  }
}
  • 输出示例
{
  "code": 0,
  "data": {
    "text": "你好,欢迎使用智由剪辑,这是一款智能视频处理工具,让剪辑更加智能,无论是简单的字幕提取,还是复杂的字幕生成,统统都能搞定。还拥有创意实验室,无论是实用的语音合成,还是热门的AI绘画,这里都能找到。"
  },
  "msg": "ok"
}
  • SDK实现
python
from zyjj_open_sdk import Client, FileObject

client = Client('sk-xxxx')
res = client.audio.voice_recognize(audio=FileObject.from_path("speech.wav")).execute()
print(res.text)

语音合成(微软)

  • 效果示意:点击跳转
  • 积分消耗:1积分/次
  • 调用方式:同步/异步
  • 任务类型:1004
  • 输入参数:
参数名名称类型必填说明
voice_name说话人string具体效果可以点效果示意试听。支持:zh-CN-YunzeNeural(云泽)、zh-CN-XiaoxiaoNeural(晓晓)、zh-CN-YunxiNeural(云希)、zh-CN-YunjianNeural(云健)、zh-CN-XiaochenNeural(晓辰)、zh-CN-XiaoyiNeural(晓伊)、zh-CN-YunyangNeural(云扬)、zh-CN-XiaohanNeural(晓涵)、zh-CN-XiaomengNeural(晓梦)、zh-CN-XiaomoNeural(晓墨)、zh-CN-XiaozhenNeural(晓甄)、zh-CN-XiaoyouNeural(晓悠)、zh-CN-YunfengNeural(云枫)、zh-CN-YunhaoNeural(云皓)、zh-CN-YunxiaNeural(云夏)、zh-CN-YunyeNeural(云野)
text待合成文本string100字以内
  • 输出参数
参数名名称类型说明
audio_url合成的音频连接string有效期6小时
  • 输入示例
{
  "task_type": 1004,
  "input": {
    "voice_name": "zh-CN-YunzeNeural",
    "text": "欢迎使用智游剪辑"
  }
}
  • 输出示例
{
  "code": 0,
  "data": {
    "audio_url": "https://cos-origin.zyjj.cc/tmp/65b1aa96d633cb4aefb7871e/8236127b-93e8-4425-8ca9-10f38398d905.wav?q-sign-algorithm=sha1&q-ak=AKIDAA2xkcSD0487ETpDd4a7Ymy32taYXfHn&q-sign-time=1734395649%3B1734395889&q-key-time=1734395649%3B1734395889&q-header-list=&q-url-param-list=&q-signature=cbb826f58ba7d3b0cdc2c415b9c3184694ba9e31"
  },
  "msg": "ok"
}
  • SDK实现
python
from zyjj_open_sdk import Client, FileObject

client = Client('sk-xxxx')
res = client.audio.voice_generate_azure(voice_name="zh-CN-YunzeNeural", text="欢迎使用智游剪辑").execute()
print(res.audio_url)

人声伴奏分离

  • 效果示意:点击跳转
  • 积分消耗:20积分/次
  • 调用方式:异步
  • 任务类型:1030
  • 输入参数:
参数名名称类型必填说明
audio音乐文件file需要有人声和伴奏
option需要的内容stringvocals(人声),no_vocals(伴奏)
  • 输出参数
参数名名称类型说明
vocals人声或者伴奏文件链接string有效期6小时
  • 输入示例
{
  "task_type": 1030,
  "input": {
    "audio": {
      "name": "黑泽明.mp3",
      "path": "tmp/65b1aa96d633cb4aefb7871e/b4717297925b4d6892e0bf01f7da92cf.mp3",
      "source": 1,
      "size": 6750852
    },
    "option": "no_vocals"
  }
}
  • 输出示例
{
  "code": 0,
  "data": {
    "status": 2,
    "output": {
      "vocals": "https://cos-origin.zyjj.cc/tmp/65b1aa96d633cb4aefb7871e/8db419ba-ca17-4896-bf0e-9085f3ea4b15.mp3?q-sign-algorithm=sha1&q-ak=AKIDAA2xkcSD0487ETpDd4a7Ymy32taYXfHn&q-sign-time=1734655072%3B1734676732&q-key-time=1734655072%3B1734676732&q-header-list=&q-url-param-list=&q-signature=213dee2af0baf0633e37d793556e4505118db638"
    },
    "progress": 100.0,
    "err_code": 0,
    "err_msg": "",
    "point_cost": 10
  },
  "msg": "ok"
}
  • SDK实现
python
from zyjj_open_sdk import Client, FileObject

client = Client('sk-xxxx')
res = client.audio.audio_separate(audio=FileObject.from_path("黑泽明.mp3"), option="no_vocals").execute_async().wait(lambda i: print(f"progres: {i}"))
print(res.vocals)
上次编辑于:
贡献者: xiaoyou