setting alipay wechat success appmanage dollor user cart order workorder logout left1 left2 app unfree free chart coupon note copy pencil price-tag database cog bin list link plus minus codepen 审核 cross table search user-tie eye github cancel-circle checkmark icon-upload icon-smartphon icon-auth-user icon-arroba-symbol icon-check-pass icon-red-cross icon-pwd-key icon-used icon-expired android appleinc tux windows8 java webAPI mail vip

    # 讯飞开放平台语音识别音频文件格式说明

    讯飞语音能力一般情况下支持如下音频格式:

    1. pcm(pcm_s16le),wav,speex(speex-wb)
    2. 采样率为16000 或者 8000. 推荐使用16000,比特率为16bit
    3. 单声道

    建议您自行下载Cool Edit Pro软件查看音频格式是否符合要求。

    # 音频文件格式转换工具ffmpeg

    # 简介

    FFmpeg是一套可以用来记录、转换数字音频、视频,并能将其转化为流的开源计算机程序。 详情可参考:http://ffmpeg.org/

    # 示例

    Mp3 转换为 16k 16bit 单声道 pcm

    ffmpeg -y -i test.mp3 -acodec pcm_s16le -f s16le -ac 1 -ar 16000 test.pcm
    

    wav 转换为 16k 16bit 单声道 pcm

    ffmpeg -y -i test.wav -acodec pcm_s16le -f s16le -ac 1 -ar 16000 test.pcm
    

    44100,16bit,单声道pcm 转换为 16k 16bit 单声道 pcm

    ffmpeg -y -f s16le -ar 44100 -ac 1 -i test.pcm -acodec pcm_s16le -f s16le -ac 1 -ar 16000 test.pcm
    

    参数解释:

    -y: 表示无需询问,直接覆盖输出文件;

    -acodec: 用于设置音频的编码器和解码器;

    -f s16le: 用于设置文件格式为 s16le;

    -ar 16000: 用于设置音频采样频率为 16k;

    -ac 1: 用于设置通道数为 1;

    -i: 用于设置输入文件;

    # speex编码

    讯飞开放平台rest_api支持speex编码压缩音频文件,相较于PCM可以节约网络传输成本,推荐使用speex格式。
    请注意压缩前的原始音频文件,必须为采样率16K、16bits、单声道的PCM格式。

    接口支持标准开源speex编码(speex-size参数必传)和讯飞定制speex编码(讯飞定制speex,无需额外传speex-size参数)

    说明:

    1. 标准开源speex编解码,需下载编译speex库。详情可参考:https://www.speex.org/
    2. 标准开源speex格式,speex_size与speex库压缩等级(quantity)关系表如下:
    quantity(压缩等级) 0 1 2 3 4 5 6 7 8 9 10
    speex_size(speex)8k 6 10 15 20 20 28 28 38 38 46 62
    speex_size(speex-wb)16k 10 15 20 25 32 42 52 60 70 86 106
    1. 讯飞定制编解码工具下载(点击下载),使用讯飞定制编码时,无需传speex_size参数