产品体验
合成优势
-
讯飞的语音技术讯飞先进的语音技术、简单的语音接口、稳定的语音服务、给力的技术支持——实现快速构建语音应用。
-
自然清晰的语音体验文本转换为流畅、清晰、自然和具有表现力的语音数据——高质量合成音频的自然度和清晰度已经超过了普通人的朗读水平。
-
专属的语音个性定制提供中英日韩等18种多语种、川豫粤等多方言、男女声多风格的选择,音量、语速、音调等参数也支持动态调整——定制专属的语音合成。
-
精巧的语音服务在线语音合成服务运行资源占用小,同时安装包尺寸仅为1M,平均每字流量消耗低于100B!
-
阅读软件
-
出行导航软件
-
智能硬件
产品价格
以下套餐服务量可用于“WebAPI流式接口”和“SDK版本接口”,原先“WebAPI普通版”服务不再提供续费,可迁移至新版流式接口续费。
套餐 | 免费包 | 新用户礼包 | 套餐一 | 套餐二 | 套餐三 | 套餐四 |
---|---|---|---|---|---|---|
服务量 | 5万 | 最高50万 | 100万 | 500万 | 1000万 | 1000万以上 |
价格 | 免费 | 免费 |
|
|
|
商务咨询
|
服务量有效期 | 90天 | 一年 | 一年 | 一年 | 一年 | - |
单价(万次) | 免费 | 免费 |
商务咨询
|
|||
赠送3个自选发音人 (不可叠加) |
无 | 无 | 有 | 有 | 有 | 有 |
使用服务 | 领取 | 领取 | 立即购买 | 立即购买 | 立即购买 | 商务对接 |
温馨提示:
1、新用户默认可使用500次/日服务量进行测试使用;
2、用户等级升级后,可免费领取百万次服务量,前往用户等级中心查看升级规则;
3、在线购买的套餐并发将限制在100路以下,若需要更多并发,请进行商务对接;
4、更多发音人可在控制台添加试用,申请路径:控制台-发音人授权管理-特色发音人-添加新发音人音库;
5、赠送自选发音人:限首次购买指定套餐(不同套餐不可叠加赠送数量),可供自选的发音人参考下方列表。若已成功购买指定套餐,请前往控制台-语音合成-发音人授权管理页面领取。赠送的发音人有效期为自领取后一年。
推荐发音人 | 音色 | 试听 | 价格 | 是否为购买套餐 赠送自选发音人 |
购买 |
---|
-
Android
-
iOS
-
Linux
-
Java
-
Windows
-
Web API
讯飞开放平台致力于为开发者打造一站式智能人机交互解决方案,开发者在未经科大讯飞书面同意前,不得对科大讯飞语音合成能力直接进行单独销售、出租、转授权。
疑问解答
-
现在支持哪些小语种?
-
WebAPI接口支持16种小语种发音人,包括日语、韩语、法语、西班牙语、俄语、泰语、德语、意大利语、葡萄牙语等。SDK暂不支持。持续迭代中,敬请期待。
-
我想要做一款阅读软件产品,集成哪个SDK?
-
在线语音合成支持Android、iOS、Linux、Windows、Java平台的SDK,以及不限制开发平台的WebAPI接口,请根据实际需求场景选择。比如要做手机APP,请选择Android和iOS的SDK,要做网站则选择集成WebAPI接口。
-
在线语音合成支持哪些发音人,如何体验发音人效果?
-
在线语音合成目前支持中文普通话、部分中文方言以及英文播报,音色涉及男声、女声、童声、中年等。官网有发音人列表,建议先在线体验发音人效果,然后到控制台-我的应用-服务管理处添加符合需求的发音人,利用SDK或WebAPI接口进行实际测试。发音人的试用期限为添加后的15天内,500次/日,超过期限请按照官网提示进行购买。
-
在线语音合成可以进行个性化设置吗?
-
对于已有的发音人,在线语音合成可以通过参数设置来调节语速、音量、语调,以获得更丰富的效果。我们也有能力为您定制专属音库,如有需要请在官网提交申请。
-
在线语音合成的音频数据,可以保存为哪些格式的音频文件?
-
在线语音合成SDK合成的音频默认为采样率8K或16K(通过参数可设置)、位长16bit、单声道的pcm,部分SDK也支持wav格式,其他格式需要您自行进行转换。在线语音合成WebAPI支持pcm格式。
-
在线语音合成单次最多合成多长的文字?想合成大段文本怎么办?
-
在线语音合成SDK单次最多支持8192个字节,WebAPI接口单次最多支持8000个字节。超过限制的话需要先分段合成,而后请自行进行拼接处理。
-
在线语音合成可以指定文字发音吗?
-
针对一些定制发音的需求,可以选择在文本中加入一些特殊的标记来实现,比如标记汉字读音、英文单词发音方式、加入停顿等。有cssml标记和简单标记两种方法,不过请注意并非所有发音人都支持标记,具体操作方法请参照这里。请注意以上目前仅适用于SDK,不适用于WebAPI接口。
-
在线语音合成可以指定数字读音吗?
-
指定数字读音有两种方式,参数设置和文本标记。参数设置是通过rdn这个参数设置的,默认为0:数值优先,还可以设置1:完全数值,2:完全字符串,3:字符串优先,作用范围是本次合成的整段文字。文本标记即上文提到的cssml标记或简单标记的方式,作用范围仅是标记内的部分文字。请根据您的需求选择合适的方法。
-
在线语音合成的音频播放不完整怎么办?
-
针对SDK,首先请下载并更新为新版重新进行测试,如新版还有问题,请按照以下思路进行排查(可参考论坛)。
1、将播放的音频文件保存下来;
2、检查保存下来的音频是否完整力;
3、如果音频文件完整,那就说明是播放器的问题,建议自定义播放器去播放;
4、如果音频文件内容不完整,请测试SDK中的Demo在该设备上是否有同样的问题;
5、如果Demo没有同样的问题,请对照Demo检查自己的程序。如果Demo也有同样的问题,请到控制台-我的提问处提交问题,请提供设备型号、音频文件、日志文件msc.log、logcat日志等信息供我们调查。日志生成方法:可参考论坛。针对WebAPI接口,请提供sid以及音频文件,到控制台-我的提问处提交问题,工作人员会尽快回复处理。
-
SDK在语音合成播报的时候,可以同时进行语音识别吗?可以同时播放音乐吗?
-
同时开启语音合成和识别,或者同时播放音乐会引起音频焦点冲突,而SDK本身是不处理音频焦点的,需要您自行管理音频焦点。附一篇关于iOS不同音频场景的经验总结供参考;
-
更多问题,这里讨论