icon-auth-user dollor setting alipay success appmanage user order logout workorder cart mail

 

1 概述

    语音识别技术(Auto Speech Recognize,简称ASR)所要解决的问题是让机器能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来,相当于给机器安装上“耳朵”,使其具备“能听”的功能。

2 主要功能

2.1 音频压缩格式

    支持speex音频压缩,节省数据传输量

2.2 多语种音频

    支持中文、英语、粤语等语种音频识别

2.3 返回结果多样化

    支持XML、JSON、PLAIN等格式,方便用户解析

2.4 多识别结果和置信度输出

    (1)识别引擎向应用程序返回满足条件的多个识别结果,供用户选择

    (2)置信度反映了识别结果的可信程度,可以通过置信度的值进行分析和后续处理

2.5 多种结果编码格式

    支持GB2312、UNICODE、UTF8等编码格式

2.6 识别多样化

    支持中英文、数字、字母、命令词等识别

2.7 支持VAD端点检测

    智能分析用户说话的起点和终点,同时计算出声音的强度,提高用户体验

2.8 噪音消除

    噪音无处不在,通过高效的降噪算法和模型,显著提高了识别率

3 核心技术特色

3.1 深度神经网络(DNN)声学建模技术

    (1)支持海量数据的DNN并行训练

    (2)支持多语种共享结构的DNN训练

    (3)支持个性化DNN建模

    (4)基于DNN的非线性建模提升鲁棒性

3.2 用户个性化声学建模技术和二遍解码技术

    (1)数万小时声学模型训练数据,显著提升通讯录人名的个性化识别

    (2)一遍解码生成Lattice后,根据人名列表对Lattice进行优化,再进行二遍解码

3.3 针对超大规模语言模型的快速更新技术

    (1)支持小语言模型和WFST网络建模

    (2)并联小语言模型网络和更新相对较慢的通用超大规模语言模型网络,并调节权重

3.4 针对说话人和口音方言的自适应技术

    (1)引入可变长度的码字层,改变传统DNN结构

    (2)引入对模型参数变化的限制

    (3)将目标函数从帧级别的信息熵扩展到串级别区分性准则

3.5 海量多语种语言模型的高速训练和数据资源库构建

    (1)支持T级以上语料的统计语言模型训练

    (2)覆盖中英粤维藏等多语种海量语音语言数据的收集、整理和标注

4 语音听写

4.1 概述

    语音听写是基于自然语言处理技术,将自然语言转换为文本输出。语音听写技术与语音识别技术的不同在于,语音听写不需要基于某个具体的命令词列表,其识别范围是整个语种内的词条。

4.2 功能特色

1、业界最领先的准确率

    国际领先的连续语音识别技术,识别准确率超过95%

2、信息沟通最方便快捷

    语音输入速度达180字/分,识别结果响应时间低于500ms——无论是识别实时率还是响应时间,系统运行效率都让信息沟通变得无比顺畅

3、语音服务最人性化

    支持中英粤藏维等5个语种、川豫和东北等方言。同时,还提供多个满足条件的识别结果,供用户进行二次选择,实现开发更加灵活、更加人性化的业务流程

4、识别最个性

    基于用户通话的语音特征,建立个性化词条定制的语言模型,调整识别参数,持续优化识别效果,提高用户的个性化词条识别准确率

4.3 接入流程

5 在线命令词识别

5.1 概述

在线命令词识别是基于“云端”技术实现的语义识别,只需集成不足1M的SDK,通过云端处理,应用就可具备超过99.9%的识别率,同时支持个性化定制,业界绝对领先!。

5.2 接入流程

6 离线命令词识别

6.1 概述

    即用户对设备(手机、玩具、家电等)说出操作指令(即“命令词”),设备即作出相应的反馈,开启语音交互。将资源集成在SDK中,通过本地调用,无需网络,轻松识别。

6.2 功能特点

1、业界领先的高识别率

    超过99.9%的识别率,且支持个性化定制

2、快速便捷的语音交互

    无网络无负担,离线识别

3、小巧精悍的SDK

    设计精巧,仅9M轻量级SDK,小巧精悍!

6.3 应用场景

1、智能家庭

    未来,手机App和智能电视、智能家居实现智能互动,只需要集成离线命令词识别能力,便可根据需要语音操控所有家居、家电等设备。

2、驾驶

    手握方向盘,哪有精力分神去选择音乐、打电话、看新闻……,但有了离线命令词识别,可以仅仅动动口,说出您的命令即可!

3、智能硬件

    语音交互为穿戴设备等硬件提供了新的使用方式,离线命令词识别更是让其可以听从指令,还无需网络!

6.4 用户协议

    提示:在接受本协议之前,请您仔细阅读本协议的全部内容(特别是以粗体下划线标注的内容)。如果您对本协议的条款有疑问,请通过科大讯飞开放平台进行询问,科大讯飞将向您解释条款内容。如果您不同意本协议的任意内容,或者无法准确理解科大讯飞对条款的解释,请不要进行后续操作。(2014年6月20日协议更新)

1、缔约主体

    本协议由同意并承诺遵守本协议规定使用讯飞开放平台服务的开发者与科大讯飞股份有限公司(以下简称“科大讯飞”)共同订立。

2、协议内容及生效

    2.1 本协议内容包括协议正文及所有科大讯飞已经发布的或将来可能发布的服务使用规则。所有规则为本协议不可分割的一部分,与协议正文具有相同法律效力。

    2.2 科大讯飞有权不时修改本协议和相关规则的内容,修改后的内容将公布于讯飞开放平台网站,开发者如继续使用科大讯飞服务的,则视为对修改后的内容不持异议并同意遵守。如对修改存有异议,或者不同意科大讯飞公布的规则的,则应立即停止使用服务,同时向科大讯飞提交书面终止通知。

    2.3 开发者通过网络页面点击确认或以其他方式选择接受本协议或实际已使用本协议服务,即表示与科大讯飞已达成协议并同意接受本协议的全部约定内容。

3、定义

    3.1 讯飞开放平台:是指科大讯飞面向移动互联网开发者提供智能人机交互服务能力的平台,开发者通过集成服务能力便可让应用具备能听会说会思考的能力。开放平台可能包括但不限于一个或多个平台

    3.2 应用:是指由开发者提供的,依据讯飞开放平台提供的SDK集成开发的,并在讯飞开放平台上提交审核的软件、材料等。

    3.3 开发者:是指接受并依据本协议条款,集成讯飞开放平台服务能力的开发应用产品的任何公司、单位、个人及其他组织。

    3.4 用户:是指所有直接或间接使用讯飞开放平台上展示的各种应用和服务的用户。

    3.5 离线命令词识别:是指讯飞开放平台提供的一种服务能力,它是一种特定语音识别技术,应用集成离线命令词识别能力之后,应用即可以智能识别用户发出的指令,进而开启全语音交互。

     3.6 装机量授权:离线命令词识别服务按照装机量收费,购买后即获得相应授权。装机量按照使用了开发者应用的终端设备信息进行统计,即在终端设备上安装了应用并启用了离线引擎,即计为一个装机量。另外,同一个终端设备上卸载(重装)应用均计为同一个装机量,不重复计数。

4、使用许可

    4.1 开发者使用讯飞开放平台服务能力应遵守本协议的约定以及法律、法规之相关规定。

    4.2 开发者应对在讯飞开放平台提供的服务以及操作所引发的后果承担全部责任(包括科大讯飞或第三方可能因此遭受的损失或损害),科大讯飞对开发者或任何第三方不承担任何责任。

    4.3 开发者向讯飞开放平台提交应用审核时应提供必要的产品信息及安装包。

    4.4 科大讯飞有权审查或测试开发者提交的应用,科大讯飞根据审核规则可自行决定应用是否通过审核。

    4.5 开发者应保证向科大讯飞所提供的信息准确性和及时性。作为产品规范的一部分,科大讯飞可能会要求开发者将个人信息(例如姓名和电子邮件地址)加入应用信息的文件中。并且科大讯飞可以在应用目录中或应用展示时使用该信息。开发者应保证对外沟通电子邮件及联系人发生变更时及时进行信息更新,如由于资料填写有误而导致科大讯飞与开发者联系延误而造成的损失由开发者承担。

    4.6 开发者不得将讯飞开放平台提供的离线命令词识别服务使用于车载方向的应用开发,一经发现,科大讯飞有权中断开发者的离线命令词识别服务,由此引发的后果开发者承担全部责任(包括科大讯飞或第三方可能因此遭受的损失或损害),科大讯飞对开发者或任何第三方不承担任何责任。其中,车载方向的应用指该应用的使用有关联到汽车或同类交通工具,例如在车上使用的硬件产品等。

    4.7 下载的离线命令词识别开发包仅限于开发者本人在一个产品中使用,且仅限于单一平台,涉及到其他平台时,需另行购买与其对应的离线命令词识别开发包。

5、应用审核

    5.1 科大讯飞有权对开发者提交的应用进行审核、评选。

    5.2 科大讯飞有权依据开发者服务水平、公司经营状况等因素综合审查开发者提交应用的申请。

    5.3 开发者提交的应用存在以下情形的,科大讯飞可以自行决定不为其提供服务能力、从讯飞开放平台中删除该应用、以远程方式从用户的系统或设备中停止为该应用提供服务能力、或举报、过滤、修改相关材料(包括但不限于应用名称、介绍、截图)或重新分类该应用。

    1) 违反国家法律、法规强制性规定及本协议约定的;

    2) 侵犯了任何第三方的知识产权或任何其他权利的;

    3) 科大讯飞认为其携带病毒或将其视为恶意软件、间谍软件或会对科大讯飞或第三方的网络产生不利影响;

    4) 可能会导致科大讯飞或任何第三方需要承担责任;

    5) 产品的运行影响了科大讯飞服务器的性能,或者以任何方式干扰或企图干扰讯飞开放平台或科大讯飞网站其任何部分或功能的正常运行;

    6) 避开、尝试避开或声称能够避开任何内容保护机制或者讯飞开放平台数据采集工具;

    7) 其他违反了科大讯飞的托管政策或服务条款的。

    5.4 开发者对应用版本的更新无需重新提交审核。

6、权利授予

    6.1 开发者在此授予科大讯飞及其关联企业非专有的、全球范围的免版权费许可,允许科大讯飞及其关联企业复制、存储、传播、链接至、翻译、公开展示、测试、分发或以其他方式使用开发者在讯飞开放平台提交的应用、应用中包含的、应用所访问的或通过应用传播的任何内容,具体情况根据您在而定。

    6.2 开发者在此向用户授予非专有的、全球范围的永久许可,允许用户在讯飞开放平台中下载、安装和使用开发者在讯飞开放平台应用广场展示的应用、应用中包含的、应用所访问的或通过应用传播的任何内容。

    6.3 开发者可以在自己的应用中添加一份单独的最终用户许可协议(EULA),取代前款对用户的许可授权。

    6.4 开发者声明并保证有权向科大讯飞及其关联企业以及最终用户授予以下应用和内容的相应许可:开发者在讯飞开放平台提交的应用、应用中包含的、应用所访问的或通过应用传播的任何内容,而且将努力保持拥有这些权利。

    6.5 除本协议中授予的许可权利外,开发者保留自己在产品中享受的所有权利;对这些权利的保护和行使负有责任。

    6.6 开发者授权科大讯飞及其关联企业在本协议的有效期内有限的、非专有的许可,允许科大讯飞及其关联企业为了随讯飞开放平台一起使用以及为了履行本协议规定的义务而展示开发者的品牌特征。包括但不限于商号、商品名、商标、服务标记、标识、域名和其他显著的品牌特征。

    6.7 开发者授权科大讯飞及其关联企业在推广讯飞开放平台、科大讯飞产品和服务时使用应用产品、应用中包含的、应用所访问的或通过应用传播的任何内容的开发者品牌特征、屏幕截图、视频和演示。包括但不限于:演示文稿、营销材料、营销活动、开发者活动、财务报告、网站列表、新闻稿和客户列表。

7、权利限制

    7.1 开发者使用讯飞开放平台提供的服务时,不得实施以下行为:

    1) 违反法律、法规的强制性规定;

    2) 干扰、修改、破坏、损坏或以未经授权的方式访问任何第三方的计算机、硬件、设备、服务器、网络、数据或其他财产或服务;

    3) 故意传播计算机病毒等破坏性程序及其他任何危害计算机信息网络安全的;

    4) 未经允许,对计算机信息网络中存储、处理或者传输的数据和应用程序进行删除、修改或者增加;

    5) 侵犯他人的知识产权及其他合法权益;

    6) 制造干扰信息、恶意信息、低俗信息影响用户体验;

    7) 利用应用产品制作、复制、发布、传播含有国家法律、法规禁止的内容的信息,及通过链接展示上述信息。

    7.2 开发者不得以任何方式诱导用户到模仿或假冒讯飞开放平台的任何其他网站。

        7.3 开发者在未经科大讯飞书面同意前,下载的离线命令词识别开发包不能供第三方使用,不允许转让、出租、转授权,或者将其用于多个产品等;并不得从事反汇编、反编辑以及分解、分析、修改以上软件的行为。 

    7.4 保留权利:本协议未明示授权的其他一切权利仍归科大讯飞所有,开发者使用其他权利时必须获得科大讯飞的书面同意。

8、服务的终止

    8.1 在开发者违反本协议相关约定时,科大讯飞有权终止向该开发者提供服务。如该开发者再一次直接或间接或以他人名义注册并登录讯飞开放平台的,科大讯飞有权直接单方面终止向该开发者提供服务。

    8.2 如科大讯飞通过开发者提供的信息与开发者联系时,发现开发者在注册时填写的电子邮箱已不存在或无法接收电子邮件的,经科大讯飞以其它联系方式通知开发者更改,而开发者在三个工作日内仍未能提供新的电子邮箱地址的,科大讯飞有权终止向该开发者提供服务。

    8.3 科大讯飞发现开发者提供的数据或信息中含有虚假内容的,科大讯飞有权随时终止提供服务。

    8.4 科大讯飞可自行全权决定,随时向开发者或用户终止提供服务或服务任何部分,届时科大讯飞将通过网页通告或其他合理方式告知开发者和用户。

    8.5若发现开发者在未经科大讯飞书面同意前,将离线命令词识别开发包提供给第三方,转让、出租、转授权、反编译、破解、或将其用于多款产品等违规行为时,科大讯飞有权终止离线语音合成服务并追究法律责任。 

9、服务终止后的处理

    9.1 服务终止后,科大讯飞没有义务为开发者保留原账户中或与之相关的任何信息,或转发任何未曾阅读或发送的信息给开发者或用户或第三方,亦不就终止服务而对开发者或用户或任何第三方承担任何责任。

    9.2 不论科大讯飞与开发者之间的服务因任何原因以任何方式终止,科大讯飞仍有权:

    1) 保存或不保存该开发者的数据;

    2) 对于开发者在服务终止前实施的违法或违约行为所导致的任何赔偿和责任,开发者必须完全独立地承担,科大讯飞有追索权。

10、知识产权保护

    10.1 开发者保证对其提交到讯飞开放平台的应用拥有充分、完整、排他的所有权及知识产权,并可通过讯飞开放平台开发者协议,将上述产品及产品权利授权或转让给科大讯飞。

    10.2 如果开发者提交的应用中允许用户下载、查看、收听或以其他方式访问或分发第三方内容,包括但不限于文字、图片、音乐、视频等。开发者应保证已经取得第三方权利人的书面授权,并已与前述权利人就权益分配达成内部协议。

    10.3 任何第三方权利人如果发现讯飞开放平台中提供的应用侵犯了其合法权益,可以直接或通过讯飞开放平台发送侵权通知给提供应用的开发者。

    1) 开发者在收到侵权通知之后,应立即删除或禁止访问声明的侵权内容,并同时与权利人协商解决。

    2) 科大讯飞将按照相关法律、法规对第三方权利人发出的合格的侵权通知进行处理,并按照要求删除或禁止访问声明的侵权内容,采用并实施适当的措施,杜绝在相应条件下重复侵权。

    10.4 提交者保证如因其提供给讯飞开放平台的开发作品存在权利瑕疵或侵犯了第三方的合法权益(包括但不限于专利权、商标权、著作权及著作权邻接权、肖像权、隐私权、名誉权等)而导致科大讯飞或与科大讯飞合作的其他单位面临任何索赔、诉讼;或者使科大讯飞或者与科大讯飞合作的其他单位因此遭受任何名誉、声誉或者财产上的损失,都将积极地采取一切可能采取的措施,以保证科大讯飞及与科大讯飞合作的其他单位免受上述索赔、诉讼的影响。同时提交者对科大讯飞及与科大讯飞合作的其他单位因此遭受的直接或间接经济损失负有全部的赔偿责任。

11、隐私权保护

    11.1 为了提供更好的服务和进行大数据分析,科大讯飞可能会从应用收集某些使用情况统计信息,包括但不限于,有关产品的使用方式、使用内容等信息。科大讯飞不会将此数据与用户的个人身份信息对外泄露。

    11.2 科大讯飞会对收集的数据进行大数据挖掘分析,以便为用户和开发者提供更好的用户体验:开发者出于改进产品的需要可以向科大讯飞提交书面申请,科大讯飞会根据申请提供一定的汇总数据。

12、免责与责任限制

    12.1 使用应用的风险由开发者自行承担,在适用法律允许的最大范围内,对因使用或不能使用应用所产生的损害及风险,包括但不限于直接或间接的个人损害、商业赢利的丧失、贸易中断、商业信息的丢失或任何其它经济损失,科大讯飞不承担任何责任。

    12.2 对于因电信系统或互联网网络故障、计算机故障或病毒、信息损坏或丢失、计算机系统问题或其它任何不可抗力原因而产生损失,科大讯飞不承担任何责任。

    12.3 科大讯飞不提供任何类型(明示或隐含)的担保和条件,包括但不限于对适销性、特定用途适用性,以及不侵害他人权利的隐含担保和条件。

    12.4 开发者违反本协议规定,对科大讯飞造成损害的。科大讯飞有权采取包括但不限于终止离线命令词识别服务、删除账户、法律追究等措施。

    12.5 因以下由于开发者责任引起或产生的任何争议、索赔、诉讼,开发者应对科大讯飞及其关联企业造成的全部损失予以赔偿,并有责任在法律允许的最大范围内对科大讯飞及其关联企业进行辩护并使其免受损害。

    1) 开发者的产品使用的行为违反了本协议及适用法律法规

    2) 开发者的产品侵犯了他人的商标、商业机密、专利、外观设计或其他知识产权,或侵犯他人名誉权、隐私权的

    3) 因产品或扩展程序使用行为而引起的任何第三方索赔。

13、法律及争议解决

    本协议之解释与适用,以及与本协议有关的争议,均应依照中华人民共和国法律予以处理,并受科大讯飞所在地人民法院管辖。

14、其他条款

    14.1 如果本协议中的任何条款无论因何种原因完全或部分无效或不具有执行力,或违反任何适用的法律,则该条款被视为删除,但本协议的其余条款仍应有效并且有约束力。

    14.2 科大讯飞有权根据有关法律、法规的变化以及公司经营状况和经营策略的调整等修改本协议。修改后的协议会在科大讯飞开放平台网站(网址是:http://www.xfyun.cn/上公布。当发生有关争议时,以最新的协议文本为准。如果不同意改动的内容,开发者如果继续使用应用开放平台或应用中心服务,则视为您接受本协议的变动。

    14.3 本协议的一切解释权与修改权归科大讯飞。

6.5 帮助文档

1、从讯飞开放平台首页的“产品服务”找到“离线命令词识别”:

  

2、离线命令词识别服务页面,点击[使用服务]按钮:

3、如果未登录,需要在弹出的登录窗口进行登录:

4、登录成功后在弹出的应用中选择应用,进行开通:

5、点击【确定】,会跳转到离线命令词识别包的购买页面,也可以在“我的语音云”的“我的应用”中点击相应应用的离线命令词识别服务进入离线命令词识别包购买页面:

6、如果从未创建过应用,则会跳转至“应用创建”页面:

7、进入离线命令词识别包购买页面,选择需要的离线命令词识别包进行购买,还可以点击【下载语音+】按钮免费下载体验离线命令词识别服务:

8、如果选择基础包的订购,点击【订购】跳转到支付页面:

还可以在“我的语音云”的“我的订单”中查看生成的订单,并点击【去付款】跳转到支付页面:

 

9、选择支付方式,点击【去支付】跳转到相应支付页面:

     支付宝支付页面:

        翼支付支付页面:

 

10、支付完成后,回到离线命令词识别包购买页面,点击【已完成支付】:

11、页面跳转到离线命令词识别包购买页面,点击【SDK下载】下载购买的离线命令词识别包: