setting alipay wechat success appmanage dollor user cart order workorder logout left1 left2 app unfree free chart coupon note copy pencil price-tag database cog bin list link plus minus codepen 审核 cross table search user-tie eye github cancel-circle checkmark icon-upload icon-smartphon icon-auth-user icon-arroba-symbol icon-check-pass icon-red-cross icon-pwd-key icon-used icon-expired android appleinc tux windows8 java webAPI mail vip

    # 语音听写自训练平台使用指南

    基于科大讯飞的语音识别技术,可自行上传语言文本数据集,对语音听写引擎模型进行深度定制。提升垂直领域的语音识别准确率。

    # 第一步:进入语音听写自训练平台

    成功登录讯飞开放平台账户后,通过左上角的【产品服务】-【语音识别】-【语音听写自训练平台】,进入语言模型自训练平台产品页,点击“立即定制”,进入到自训练平台

    # 第二步:训练自己的模型

    目前每个人用户可以免费训练10个模型,通过创建模型-上传测试集-选择基础模型-上传训练数据集,即可进行自动化训练和测试。最终测试的结果会形成测试报告,供您对比训练前后的提升效果。

    1、当前版本基础模型只提供听写通用模型,后续将更新更多领域模型。

    2、上传的测试集,包含音频和对应的标注文本结果,用来测试训练前后模型的数据效果差异。必须为zip压缩包(最大10M),压缩包结构audio文件夹(存放16K 16BIT 单声道WAV或PCM音频)、text文件夹(UTF-8编码的txt文件,内容与音频对应)。

    3、上传的训练集,包含您的垂直行业领域的文本内容,提升对应行业领域音频的识别准确率。要求为UTF-8的txt文件,不支持标点、字母、空格与不可见字符,大小限制在1M以内,训练集文本单行最大42字,并且在文本最后要空一行。

    # 第三步:接口调用

    1、训练完成后,若您觉得效果不错,可以选择上线。

    2、上线时,选择绑定的APPID,即可使用该APPID语音听写服务拥有的服务调用次数

    3、上线后,可使用语音听写接口进行调用,但是需对以下部分内容进行调整:

    (1)接口地址更改为:ws[s]: //ws-api-hu.xfyun.cn/v2/iat

    (2)参数domain固定传参 iat_patch

    (3)增加patch_id参数,传参值为对应模型的patch_id值,该值可在听写自训练平台列表中获取

    # 常见问题

    1、可以训练多少个模型?

    答:每个账号最多可以免费训练10个模型,后续商用策略有变动,将会及时通知

    2、训练的模型删除后还可以用吗?

    答:训练后的模型删除后,将不可用,所以已经上线的模型需谨慎删除

    3、上线的模型接口调用次数怎么获取?

    答:上线时,将绑定APPID应用,调用接口将对应消耗该APPID应用的语音听写服务量。若服务量不足,可及时购买

    4、训练后的模型,能不能直接在原先语音听写接口调用?

    答:暂时不可以,需在接口侧做改动,后续我们将不断提升接口调用便利性。