产品体验

  • 特色发音人
  • 基础发音人(免费)
场景:
    声音年龄:
          语速
          正常
          音量
          7

          温馨提示:在线体验时的背景音乐在实际调用接口使用服务时不会出现;

          如果您不方便通过编程方式使用,可以前往讯飞配音官网,通过网页界面输入文字,实现文字转语音功能。

          合成优势

          • 讯飞的语音技术
            讯飞先进的语音技术、简单的语音接口、稳定的语音服务、给力的技术支持——实现快速构建语音应用。
          • 自然清晰的语音体验
            文本转换为流畅、清晰、自然和具有表现力的语音数据——高质量合成音频的自然度和清晰度已经超过了普通人的朗读水平。
          • 专属的语音个性定制
            提供中英日韩等18种多语种、川豫粤等多方言、男女声多风格的选择,音量、语速、音调等参数也支持动态调整——定制专属的语音合成。
          • 精巧的语音服务
            在线语音合成服务运行资源占用小,同时安装包尺寸仅为1M,平均每字流量消耗低于100B!
          应用场景
          • 阅读软件
          • 出行导航软件
          • 智能硬件

          场景描述

          已有超过千万用户选择使用带有讯飞语音合成技术的阅读软件,为阅读精选更多不同音色声音,让每篇文章都像是真人主播在为用户朗读。

          客户案例
          • 得到
          • QQ阅读
          • 咪咕阅读
          • 起点读书
          • 书旗小说
          • 追书神器

          场景描述

          讯飞已和高德、腾讯、滴滴等出行相关企业进行合作,定制的明星音库,可以让导航的声音更具特色,让开车途中不再孤单,现服务用户已超过数亿人次。

          客户案例
          • 滴滴出行
          • 高德地图
          • 腾讯地图
          • 曹操专车
          • 灵犀语音助手
          • 飞鱼车载助手

          场景描述

          讯飞丰富的语音合成音库可以满足不同领域和场景的智能硬件使用,在机器能听会思考的同时也能发出媲美真人的声音,让智能硬件具人性化。

          客户案例
          • 暴风电视
          • 优必选
          • 讯飞淘云
          • 狗尾草
          • 叮咚音箱
          • 锤子科技

          产品价格

          以下套餐服务量可用于“WebAPI流式接口”和“SDK版本接口”,原先“WebAPI普通版”服务不再提供续费,可迁移至新版流式接口续费。

          套餐 免费包 套餐一 套餐二 套餐三 套餐四
          服务量 5万 100万 500万 1000万 1000万以上
          价格 免费
          ¥5800.00
          ¥27000.00
          ¥50000.00
          商务咨询
          服务量有效期 90天 一年 一年 一年 -
          单价(万次) 免费
          ¥58.00
          ¥54.00
          ¥50.00
          商务咨询
          赠送3个自选发音人
          (不可叠加)
          使用服务 领取 立即购买 立即购买 立即购买 商务对接

          温馨提示:

          1、新用户默认可使用500次/日服务量进行测试使用;

          2、用户等级升级后,可免费领取百万次服务量,前往用户等级中心查看升级规则;

          3、在线购买的套餐并发将限制在100路以下,若需要更多并发,请进行商务对接

          4、更多发音人可在控制台添加试用,申请路径:控制台-发音人授权管理-特色发音人-添加新发音人音库;

          5、赠送自选发音人:限首次购买指定套餐(不同套餐不可叠加赠送数量),可供自选的发音人参考下方列表。若已成功购买指定套餐,请前往控制台-语音合成-发音人授权管理页面领取。赠送的发音人有效期为自领取后一年。

          推荐应用场景
            推荐发音人 音色 试听 价格 是否为购买套餐
            赠送自选发音人
            购买
            温馨提示

            讯飞开放平台致力于为开发者打造一站式智能人机交互解决方案,开发者在未经科大讯飞书面同意前,不得对科大讯飞语音合成能力直接进行单独销售、出租、转授权。

            疑问解答

            • 现在支持哪些小语种?

            • WebAPI接口支持16种小语种发音人,包括日语、韩语、法语、西班牙语、俄语、泰语、德语、意大利语、葡萄牙语等。SDK暂不支持。持续迭代中,敬请期待。

            • 我想要做一款阅读软件产品,集成哪个SDK?

            • 在线语音合成支持Android、iOS、Linux、Windows、Java平台的SDK,以及不限制开发平台的WebAPI接口,请根据实际需求场景选择。比如要做手机APP,请选择Android和iOS的SDK,要做网站则选择集成WebAPI接口。

            • 在线语音合成支持哪些发音人,如何体验发音人效果?

            • 在线语音合成目前支持中文普通话、部分中文方言以及英文播报,音色涉及男声、女声、童声、中年等。官网有发音人列表,建议先在线体验发音人效果,然后到控制台-我的应用-服务管理处添加符合需求的发音人,利用SDK或WebAPI接口进行实际测试。发音人的试用期限为添加后的15天内,500次/日,超过期限请按照官网提示进行购买。

            • 在线语音合成可以进行个性化设置吗?

            • 对于已有的发音人,在线语音合成可以通过参数设置来调节语速、音量、语调,以获得更丰富的效果。我们也有能力为您定制专属音库,如有需要请在官网提交申请

            • 在线语音合成的音频数据,可以保存为哪些格式的音频文件?

            • 在线语音合成SDK合成的音频默认为采样率8K或16K(通过参数可设置)、位长16bit、单声道的pcm,部分SDK也支持wav格式,其他格式需要您自行进行转换。在线语音合成WebAPI支持pcm格式。

            • 在线语音合成单次最多合成多长的文字?想合成大段文本怎么办?

            • 在线语音合成SDK单次最多支持8192个字节,WebAPI接口单次最多支持8000个字节。超过限制的话需要先分段合成,而后请自行进行拼接处理。

            • 在线语音合成可以指定文字发音吗?

            • 针对一些定制发音的需求,可以选择在文本中加入一些特殊的标记来实现,比如标记汉字读音、英文单词发音方式、加入停顿等。有cssml标记和简单标记两种方法,不过请注意并非所有发音人都支持标记,具体操作方法请参照这里。请注意以上目前仅适用于SDK,不适用于WebAPI接口。

            • 在线语音合成可以指定数字读音吗?

            • 指定数字读音有两种方式,参数设置和文本标记。参数设置是通过rdn这个参数设置的,默认为0:数值优先,还可以设置1:完全数值,2:完全字符串,3:字符串优先,作用范围是本次合成的整段文字。文本标记即上文提到的cssml标记或简单标记的方式,作用范围仅是标记内的部分文字。请根据您的需求选择合适的方法。

            • 在线语音合成的音频播放不完整怎么办?

            • 针对SDK,首先请下载并更新为新版重新进行测试,如新版还有问题,请按照以下思路进行排查(可参考论坛)。

              1、将播放的音频文件保存下来;

              2、检查保存下来的音频是否完整力;

              3、如果音频文件完整,那就说明是播放器的问题,建议自定义播放器去播放;

              4、如果音频文件内容不完整,请测试SDK中的Demo在该设备上是否有同样的问题;

              5、如果Demo没有同样的问题,请对照Demo检查自己的程序。如果Demo也有同样的问题,请到控制台-我的提问处提交问题,请提供设备型号、音频文件、日志文件msc.log、logcat日志等信息供我们调查。日志生成方法:可参考论坛。针对WebAPI接口,请提供sid以及音频文件,到控制台-我的提问处提交问题,工作人员会尽快回复处理。

            • SDK在语音合成播报的时候,可以同时进行语音识别吗?可以同时播放音乐吗?

            • 同时开启语音合成和识别,或者同时播放音乐会引起音频焦点冲突,而SDK本身是不处理音频焦点的,需要您自行管理音频焦点。附一篇关于iOS不同音频场景的经验总结供参考

            • 更多问题,这里讨论

            查看更多