产品体验

语种/方言: 申请试用方言










00: 00 / 01: 00

产品优势

  • 超过98%的准确率
    讯飞开放平台拥有领先的语音识别技术,核心技术达到国际领先水平,语音识别准确率已经超过98%,在业界遥遥领先。
  • 支持多种语种和方言
    支持中文、英文两个语种的识别,同时,我们还提供粤语、河南话、四川话等方言的识别。
  • 方便快捷的信息沟通
    语音输入速度达180字/分,识别结果响应时间低于200ms——系统运行效率让信息沟通变得无比顺畅。
  • 个性的语音识别
    基于用户语音特征,建立个性化的词条语言模型,调整识别参数,持续优化识别效果,提高用户的个性化词条识别准确率。
  • 中文标点智能预测
    语音听写使用超大规模的语言模型,对识别结果语句智能预测其对话语境,提供智能断句和标点符号的预测。
  • 支持垂直领域和应用级听写
    基于大量垂直领域语料,我们不断对模型进行训练,目前提供三个垂直领域的听写模型:商旅、视频和音乐。

应用场景

  • 社交聊天
    使用社交应用聊天时,将用户的语音信息(≤60秒),转成文字信息
  • 语音输入法
    使用输入法输入时,将语音信息转成文字信息,提升用户阅读体验
  • 游戏娱乐
    将游戏娱乐中的音频文件转成文字消息,大大提升用户体验
  • 人机交互
    人机交互时,将双方的语音信息转成文字信息,提升交互体验

客户案例

  • 讯飞输入法
  • 京东
  • 猎豹浏览器
  • 有道翻译官
  • 新浪微博
  • 携程

垂直听写模型

  • 商旅听写模型
  • 音乐听写模型
  • 视频听写模型

个性化听写

  • 点击使用服务
  • 选择您的应用
  • 上传热词文件
  • 发布热词文件
  • 完成

开发者资源

疑问解答

  • “音频参数”?

  • 音频参数 数值
    音频长度(Input Length) ≤60s
    采样率(Sampling Rate) 支持8KHz和16KHz
    采样精度(Bit Depth) 16bits
    声道(Channel) 单声道
    语音起点(begin of the speech) 小于参数vad_bos
    音频终点(end of the speech) 小于参数vad_eos
  • “标点符号支持”?

  • 语言 支持标点
    中文(普通话) 。,?!
    英文 . , ? !
    中文(粤语) 。,?!
    中文(四川话) 。,?!
  • 支持哪些平台?

  • Android、iOS、Linux、WebAPI、Windows Phone、Java等平台。

  • 支持的返回结果有几种?

  • 支持JSON、PLAIN等格式,方便解析。

  • 语音听写与语音转写的区别?

  • 不超过60秒。如果需大于60秒的,请移步到语音转写服务。

  • SDK形式是否支持多路并发?

  • 不支持。SDK调用形式只支持单路,WebAPI支持多路并发。

查看更多