icon-auth-user dollor setting alipay success appmanage user order logout workorder cart mail

 

1 概述

    语音合成,又称文语转换(Text to Speech,TTS)技术,涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术,解决的主要问题是如何将文字信息转化为可听的声音信息,也即“让机器像人一样开口说话”。

    科大讯飞在2006年至2014年,已连续九届英文语音合成国际大赛(Blizzard Challenge)荣获第一名。科大讯飞语音合成技术代表着当今世界最高水平,占据语音合成市场70%以上份额,并且在电信、邮政、金融、能源、交通,政府等领域得到成功应用。

2 主要功能

2.1 多发音人

    支持年轻女声小燕,年轻男声小宇,中老年男声老孙,可爱蜡笔小新等声音

2.2 多语种

    支持英语、粤语、维语、地方方言等

2.3 语速和音量设置

    音量和语速支持0-100细粒度的设置,默认值为50。详细介绍可以参考对应平台API文档的相关说明。

2.4 多样化合成方式

    可以由客户端指定文本里面某些内容按照不同风格去合成音频,如可以指定数字10086是按“幺零零八六”来读,还是按照“一万零八十六”来读;还可以指定某段内容是由哪个发音人来发声

2.5 多种合成文本的编码

    支持GB2312、GBK、BIG5、UNICODE、GB18030、UTF8等各种合成文本的编码

2.6 多种数据格式输出

    支持输出多种采用率的线性Wav,A/U率Wav和Vox等格式的语音数据

3 核心技术特色

3.1 基于海量文本语料的自然语言理解技术

    (1)亿万量级词条的词典,高精度的多音字处理

    (2)准确的韵律层级预测,使合成的声音更易理解

3.2 基于语音交互需求的口语对话风格技术

    (1)对话风格语音数据库的设计和录制

    (2)创新性的标注体系的设计和实践

    (3)更高表现力的合成系统的构建

3.3 针对一次会话中合成角色的切换

    针对一段文本使用不同性别,不同年龄、不同风格的角色进行合成的需求,实现了同一段文本中自动切换合成角色,提高了合成复杂文本效果

3.4 提升了通用的基于模型指导的音素拼接的语音合成自然度和音质

    (1)生成式深度神经网络建模

    (2)高回复度语音参数编码方法

    (3)基于人工反馈的声学模型自主学习

3.5 基于大规模录音语料库的统计声学建模

    (1)数十小时的语音语料库

    (2)HMM统计建模框架,有针对性的模型优化,预测的声学参数更贴近真实的语音

    (3)智能中英文内容检测,同音色中英文混读,提供一致性的体验

4 在线语音合成

4.1 概述

    基于云端处理,将文本信息转换为声音信息。提供中英粤多语种、川豫多方言、男女声多风格的选择,音量、语速、音高等参数也支持动态调整,快速构建个性化声音;运行资源占用小,同时安装包尺寸仅为1M,平均每字流量消耗低于100B!

4.2 接入流程

5 离线语音合成

5.1 概述

    将资源封装在SDK中,无需流量,基于本地处理,将文字信息转化为声音信息。

5.2 功能特点

1、实时

    基于嵌入式离线合成引擎,零流量实时响应,实现快速稳定的本地化语音服务

2、个性化

    提供中英粤多语种,男女声多风格的选择,音量、语速、音高等参数也支持动态调整——定制最专属的语音合成

3、精巧

    TB级云端资源,浓缩至仅仅8M的SDK; 高达4.2的合成自然度分值,超过普通人说话水平的4.1

5.3 服务协议

    提示:在接受本协议之前,请您仔细阅读本协议的全部内容(特别是以粗体下划线标注的内容)。如果您对本协议的条款有疑问,请通过科大讯飞开放平台进行询问,科大讯飞将向您解释条款内容。如果您不同意本协议的任意内容,或者无法准确理解科大讯飞对条款的解释,请不要进行后续操作。(2014年6月20日协议更新)

1、缔约主体

    本协议由同意并承诺遵守本协议规定使用讯飞开放平台服务的开发者与科大讯飞股份有限公司(以下简称“乙方”)共同订立。

2、协议内容及生效

    2.1 本协议内容包括协议正文及所有科大讯飞已经发布的或将来可能发布的服务使用规则。所有规则为本协议不可分割的一部分,与协议正文具有相同法律效力。

    2.2 科大讯飞有权不时修改本协议和相关规则的内容,修改后的内容将公布于讯飞开放平台网站,开发者如继续使用科大讯飞服务的,则视为对修改后的内容不持异议并同意遵守。如对修改存有异议,或者不同意科大讯飞公布的规则的,则应立即停止使用服务,同时向科大讯飞提交书面终止通知。

    2.3 开发者通过网络页面点击确认或以其他方式选择接受本协议或实际已使用本协议服务,即表示与科大讯飞已达成协议并同意接受本协议的全部约定内容。

3、定义

    3.1 讯飞开放平台:是指科大讯飞面向移动互联网开发者提供智能人机交互服务能力的平台,开发者通过集成服务能力便可让应用具备能听会说会思考的能力。开放平台可能包括但不限于一个或多个平台API、Demo和文档。

    3.2 应用:是指由开发者提供的,依据讯飞开放平台提供的SDK集成开发的,并在讯飞开放平台上提交审核的软件、材料等。

    3.3 开发者:是指接受并依据本协议条款,集成讯飞开放平台服务能力的开发应用产品的任何公司、单位、个人及其他组织。

    3.4 用户:是指所有直接或间接使用讯飞开放平台上展示的各种应用和服务的用户。

    3.5 离线语音合成:是指讯飞开放平台提供的一种服务能力,涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是中文信息处理领域的一项前沿技术,解决的主要问题是如何在离线状态下,将文字信息转化为可听的声音信息。

     3.6 装机量授权:离线语音合成服务按照装机量收费,购买后即获得相应授权。装机量按照使用了开发者应用的终端设备信息进行统计,即在终端设备上安装了应用并启用了离线引擎,即计为一个装机量。另外,同一个终端设备上卸载(重装)应用均计为同一个装机量,不重复计数。

4、使用许可

    4.1 开发者使用讯飞开放平台服务能力应遵守本协议的约定以及法律、法规之相关规定。

    4.2 开发者应对在讯飞开放平台提供的服务以及操作所引发的后果承担全部责任(包括科大讯飞或第三方可能因此遭受的损失或损害),科大讯飞对开发者或任何第三方不承担任何责任。

    4.3 开发者向讯飞开放平台提交应用审核时应提供必要的产品信息及安装包。

    4.4 科大讯飞有权审查或测试开发者提交的应用,科大讯飞根据审核规则可自行决定应用是否通过审核。

    4.5 开发者应保证向科大讯飞所提供的信息准确性和及时性。作为产品规范的一部分,科大讯飞可能会要求开发者将个人信息(例如姓名和电子邮件地址)加入应用信息的文件中。并且科大讯飞可以在应用目录中或应用展示时使用该信息。开发者应保证对外沟通电子邮件及联系人发生变更时及时进行信息更新,如由于资料填写有误而导致科大讯飞与开发者联系延误而造成的损失由开发者承担。

    4.6  开发者不得将讯飞开放平台提供的离线语音合成服务使用于车载方向的应用开发,一经发现,科大讯飞有权中断开发者的离线语音合成服务,由此引发的后果开发者承担全部责任(包括科大讯飞或第三方可能因此遭受的损失或损害),科大讯飞对开发者或任何第三方不承担任何责任。其中,车载方向的应用指该应用的使用有关联到汽车或同类交通工具,例如在车上使用的硬件产品。

    4.7  下载的离线语音合成开发包仅限于开发者本人在一个产品中使用,且仅限于单一平台,涉及到其他平台时,需另行购买与其对应的离线语音合成开发包。

5、应用审核

    5.1 科大讯飞有权对开发者提交的应用进行审核、评选。

    5.2 科大讯飞有权依据开发者服务水平、公司经营状况等因素综合审查开发者提交应用的申请。

    5.3 开发者提交的应用存在以下情形的,科大讯飞可以自行决定不为其提供服务能力、从讯飞开放平台中删除该应用、以远程方式从用户的系统或设备中停止为该应用提供服务能力、或举报、过滤、修改相关材料(包括但不限于应用名称、介绍、LOGO、截图)或重新分类该应用。

    1)违反国家法律、法规强制性规定及本协议约定的;

    2)侵犯了任何第三方的知识产权或任何其他权利的;

    3)科大讯飞认为其携带病毒或将其视为恶意软件、间谍软件或会对科大讯飞或第三方的网络产生不利影响;

    4)可能会导致科大讯飞或任何第三方需要承担责任;

    5)产品的运行影响了科大讯飞服务器的性能,或者以任何方式干扰或企图干扰讯飞开放平台或科大讯飞网站其任何部分或功能的正常运行;

    6)避开、尝试避开或声称能够避开任何内容保护机制或者讯飞开放平台数据采集工具;

    7)其他违反了科大讯飞的托管政策或服务条款的。

    5.4 开发者对应用版本的更新无需重新提交审核。

6、权利授予

    6.1 开发者在此授予科大讯飞及其关联企业非专有的、全球范围的免版权费许可,允许科大讯飞及其关联企业复制、存储、传播、链接至、翻译、公开展示、测试、分发或以其他方式使用开发者在讯飞开放平台提交的应用、应用中包含的、应用所访问的或通过应用传播的任何内容,具体情况根据您在而定。

    6.2 开发者在此向用户授予非专有的、全球范围的永久许可,允许用户在讯飞开放平台中下载、安装和使用开发者在讯飞开放平台应用广场展示的应用、应用中包含的、应用所访问的或通过应用传播的任何内容。

    6.3 开发者可以在自己的应用中添加一份单独的最终用户许可协议 (EULA),取代前款对用户的许可授权。

    6.4 开发者声明并保证有权向科大讯飞及其关联企业以及最终用户授予以下应用和内容的相应许可:开发者在讯飞开放平台提交的应用、应用中包含的、应用所访问的或通过应用传播的任何内容,而且将努力保持拥有这些权利。

    6.5  除本协议中授予的许可权利外,开发者保留自己在产品中享受的所有权利;对这些权利的保护和行使负有责任。

    6.6 开发者授权科大讯飞及其关联企业在本协议的有效期内有限的、非专有的许可,允许科大讯飞及其关联企业为了随讯飞开放平台一起使用以及为了履行本协议规定的义务而展示开发者的品牌特征。包括但不限于商号、商品名、商标、服务标记、标识、域名和其他显著的品牌特征。

    6.7 开发者授权科大讯飞及其关联企业在推广讯飞开放平台、科大讯飞产品和服务时使用应用产品、应用中包含的、应用所访问的或通过应用传播的任何内容的开发者品牌特征、屏幕截图、视频和演示。包括但不限于:演示文稿、营销材料、营销活动、开发者活动、财务报告、网站列表、新闻稿和客户列表。

7、权利限制

    7.1  开发者使用讯飞开放平台提供的服务时,不得实施以下行为:

    1)违反法律、法规的强制性规定;

    2)干扰、修改、破坏、损坏或以未经授权的方式访问任何第三方的计算机、硬件、设备、服务器、网络、数据或其他财产或服务;

    3)故意传播计算机病毒等破坏性程序及其他任何危害计算机信息网络安全的;

    4)未经允许,对计算机信息网络中存储、处理或者传输的数据和应用程序进行删除、修改或者增加;

    5)侵犯他人的知识产权及其他合法权益;

    6)制造干扰信息、恶意信息、低俗信息影响用户体验;

    7)利用应用产品制作、复制、发布、传播含有国家法律、法规禁止的内容的信息,及通过链接展示上述信息。

    7.2 开发者不得以任何方式诱导用户到模仿或假冒讯飞开放平台的任何其他网站。

    7.3 开发者在未经科大讯飞书面同意前,下载的离线语音合成开发包不能供第三方使用,不允许转让、出租、转授权,或者将其用于多个产品等;并不得从事反汇编、反编辑以及分解、分析、修改以上软件的行为。 

    7.4 保留权利:本协议未明示授权的其他一切权利仍归科大讯飞所有,开发者使用其他权利时必须获得科大讯飞的书面同意。

8、服务的终止

    8.1 在开发者违反本协议相关约定时,科大讯飞有权终止向该开发者提供服务。如该开发者再一次直接或间接或以他人名义注册并登录讯飞开放平台的,科大讯飞有权直接单方面终止向该开发者提供服务。

    8.2  如科大讯飞通过开发者提供的信息与开发者联系时,发现开发者在注册时填写的电子邮箱已不存在或无法接收电子邮件的,经科大讯飞以其它联系方式通知开发者更改,而开发者在三个工作日内仍未能提供新的电子邮箱地址的,科大讯飞有权终止向该开发者提供服务。

    8.3  科大讯飞发现开发者提供的数据或信息中含有虚假内容的,科大讯飞有权随时终止提供服务。

    8.4  科大讯飞可自行全权决定,随时向开发者或用户终止提供服务或服务任何部分 ,届时科大讯飞将通过网页通告或其他合理方式告知开发者和用户。

    8.5若发现开发者在未经科大讯飞书面同意前,将离线语音合成开发包提供给第三方,转让、出租、转授权、反编译、破解、或将其用于多款产品等违规行为时,科大讯飞有权终止离线语音合成服务并追究法律责任。 

9、服务终止后的处理

    9.1  服务终止后,科大讯飞没有义务为开发者保留原账户中或与之相关的任何信息,或转发任何未曾阅读或发送的信息给开发者或用户或第三方,亦不就终止服务而对开发者或用户或任何第三方承担任何责任。

    9.2  不论科大讯飞与开发者之间的服务因任何原因以任何方式终止,科大讯飞仍有权:

    1)保存或不保存该开发者的数据;

    2)对于开发者在服务终止前实施的违法或违约行为所导致的任何赔偿和责任,开发者必须完全独立地承担,科大讯飞有追索权。

10、知识产权保护

    10.1  开发者保证对其提交到讯飞开放平台的应用拥有充分、完整、排他的所有权及知识产权,并可通过讯飞开放平台开发者协议,将上述产品及产品权利授权或转让给科大讯飞。

    10.2  如果开发者提交的应用中允许用户下载、查看、收听或以其他方式访问或分发第三方内容,包括但不限于文字、图片、音乐、视频等。开发者应保证已经取得第三方权利人的书面授权,并已与前述权利人就权益分配达成内部协议。

    10.3  任何第三方权利人如果发现讯飞开放平台中提供的应用侵犯了其合法权益,可以直接或通过讯飞开放平台发送侵权通知给提供应用的开发者。

    1)开发者在收到侵权通知之后,应立即删除或禁止访问声明的侵权内容,并同时与权利人协商解决。

    2)科大讯飞将按照相关法律、法规对第三方权利人发出的合格的侵权通知进行处理,并按照要求删除或禁止访问声明的侵权内容,采用并实施适当的措施,杜绝在相应条件下重复侵权。

    10.4  提交者保证如因其提供给讯飞开放平台的开发作品存在权利瑕疵或侵犯了第三方的合法权益(包括但不限于专利权、商标权、著作权及著作权邻接权、肖像权、隐私权、名誉权等)而导致科大讯飞或与科大讯飞合作的其他单位面临任何索赔、诉讼;或者使科大讯飞或者与科大讯飞合作的其他单位因此遭受任何名誉、声誉或者财产上的损失,都将积极地采取一切可能采取的措施,以保证科大讯飞及与科大讯飞合作的其他单位免受上述索赔、诉讼的影响。同时提交者对科大讯飞及与科大讯飞合作的其他单位因此遭受的直接或间接经济损失负有全部的赔偿责任。

11、隐私权保护

    11.1  为了提供更好的服务和进行大数据分析,科大讯飞可能会从应用收集某些使用情况统计信息,包括但不限于,有关产品的使用方式、使用内容等信息。科大讯飞不会将此数据与用户的个人身份信息对外泄露。

    11.2 科大讯飞会对收集的数据进行大数据挖掘分析,以便为用户和开发者提供更好的用户体验:开发者出于改进产品的需要可以向科大讯飞提交书面申请,科大讯飞会根据申请提供一定的汇总数据。

12、免责与责任限制

    12.1  使用应用的风险由开发者自行承担,在适用法律允许的最大范围内,对因使用或不能使用应用所产生的损害及风险,包括但不限于直接或间接的个人损害、商业赢利的丧失、贸易中断、商业信息的丢失或任何其它经济损失,科大讯飞不承担任何责任。

    12.2  对于因电信系统或互联网网络故障、计算机故障或病毒、信息损坏或丢失、计算机系统问题或其它任何不可抗力原因而产生损失,科大讯飞不承担任何责任。

    12.3  科大讯飞不提供任何类型(明示或隐含)的担保和条件,包括但不限于对适销性、特定用途适用性,以及不侵害他人权利的隐含担保和条件。

    12.4 开发者违反本协议规定,对科大讯飞造成损害的。科大讯飞有权采取包括但不限于终止离线语音合成服务、删除账户、法律追究等措施。

    12.5 因以下由于开发者责任引起或产生的任何争议、索赔、诉讼,开发者应对科大讯飞及其关联企业造成的全部损失予以赔偿,并有责任在法律允许的最大范围内对科大讯飞及其关联企业进行辩护并使其免受损害。

    1)开发者的产品使用的行为违反了本协议及适用法律法规,

    2)开发者的产品侵犯了他人的商标、商业机密、专利、外观设计或其他知识产权,或侵犯他人名誉权、隐私权的

    3)因产品或扩展程序使用行为而引起的任何第三方索赔。

13、法律及争议解决

    本协议之解释与适用,以及与本协议有关的争议,均应依照中华人民共和国法律予以处理,并受科大讯飞所在地人民法院管辖。

14、其他条款

    14.1  如果本协议中的任何条款无论因何种原因完全或部分无效或不具有执行力,或违反任何适用的法律,则该条款被视为删除,但本协议的其余条款仍应有效并且有约束力。

    14.2 科大讯飞有权根据有关法律、法规的变化以及公司经营状况和经营策略的调整等修改本协议。修改后的协议会在科大讯飞开放平台网站(网址是:http://www.xfyun.cn/)上公布。当发生有关争议时,以最新的协议文本为准。如果不同意改动的内容,开发者如果继续使用应用开放平台或应用中心服务,则视为您接受本协议的变动。

5.4 帮助文档

1、从讯飞开放平台首页的“产品服务”找到“离线语音合成”:

2、离线语音合成服务页面,点击“使用服务”按钮:

3、如果未登录,需要在弹出的登录窗口进行登录:

4、登录成功后在弹出的应用中选择应用,进行开通:

5、点击【确定】,会跳转到离线语音合成包的购买页面,也可以在“我的语音云”的“我的应用”中点击相应应用的离线语音合成服务进入离线语音合成包购买页面:

6、如果从未创建过应用,则会跳转至“应用创建”页面:

7、进入离线语音合成包购买页面,选择需要的离线语音合成包进行购买,还可以点击【下载语音+】按钮免费下载体验离线语音合成服务:

8、如果选择基础包的订购,点击【订购】跳转到支付页面:

还可以在“我的语音云”的“我的订单”中查看生成的订单,并点击【去付款】跳转到支付页面:

9、选择支付方式,点击【去支付】跳转到相应支付页面:

      支付宝支付页面:

        翼支付支付页面:

10、支付完成后,回到离线语音合成包购买页面,点击【已完成支付】:

11、页面跳转到离线语音合成包购买页面,点击【SDK下载】下载购买的离线语音合成包: