产品优势

  • 行业领先的准确率
    讯飞开放平台拥有领先的语音识别技术,核心技术达到国际领先水平,语音识别准确率已经超过98%,在业界遥遥领先
  • 支持个性化热词
    用户可将一些非常见的词汇上传至识别引擎,在转写的音频中,出现该词汇可将其识别出来,提高识别准确率
  • 中文标点智能预测
    运用超大规模的语言模型,智能预测语境,提供智能断句和标点符号的预测
  • 文字格式智能转换
    对结果中出现数字、日期、时间等内容格式化成规整的文本

技术规格

  • 输入

    • 形式:已录制音频

      声道:单声道&多声道

      支持格式:

      wav,flac,opus,m4a,mp3

    • 支持语种:中文普通话

      采样率:8KHz,16KHz

      采样精度:8bits,16bits

  • 输出

    • 形式:json格式字符串

      编码:UTF-8

      结果:分词形式&完整句子形式,词&句置信息度词&句时间戳,词属性,多候选词,文法格式智能转换双发音人分离

注:

1、文法格式智能转换包括电话号码、车牌、日期、时间以及量词的规整,如“五点三十”引擎会识别规整为“5:30”。

2、词属性包括:普通词;语气犹豫词,如“嗯”、“啊”、“呃”或者无意义的重复词等;标点符号,如“,”等。

3、语言支持:中国大陆地区普通话。

4、使用本服务前请参阅最佳实践指南,以获得更高的转写准确率。

应用场景

  • 电话销售&客服
    将坐席通话转成文字,帮助电话质检和信息同步,也为数据挖掘提供原料基础
  • 会议&访谈记录
    将会议和访谈的音频转换成文字存稿,让后期的信息检索和整理更方便快捷
  • 字幕生成
    将视频中音频文件进行语音转写,轻松生成与视频相对应的字幕文件
  • 语音鉴别
    可以从转写出的文字结果中搜索匹配相关词类,对黄暴/涉政内容进行高效鉴别

客户案例

  • 上海电视台
  • 天润融通
  • 唱吧
  • 掌众金服
  • 爱屋吉屋

计费方式

  • 讯飞开放平台语音转写服务目前提供有“批量购买”和“按单价购买”两种模式,价格范围为4.9~9.9元/小时 立即购买

  • 每项转写产品提供5小时免费试用,每帐号限领取一次
  • 套餐使用情况请通过“控制台-我的应用-XXX(某个具体应用)-语音转写-服务管理”进行相关查询

疑问解答

  • “语音转写 ”与 “语音听写 ”的区别是?

  • 产品名称 支持的音频时长 使用场景
    语音听写 一分钟以内 人机对话,如输入法、语音搜索
    语音转写 五小时以内 更自然地贴近日常的对话和演讲
  • “已录制音频转写”和“实时音频流转写”的区别是?

  • 已录制音频(recorded audio)转写:将预先录制完毕的完整音频文件传输至云端,转写服务处理完成后将输出此音频对应的完整文字结果。该流程为异步&非实时;

    实时音频流(real-time streaming)转写:在采集音频的同时,连续上传音频流至云端,转写服务将实时返回文字结果。可以实现文字和声音的同步展现。

    实时语音转写已上线,欢迎使用。
查看更多