产品类型

    • 标准版

      输入

      形式: 已录制音频

      声道: 单声道&多声道

      支持格式: wav,flac,opus,m4a,mp3

      输出

      形式: json格式字符串

      结果:分词形式&完整句子形式,词&句置信度

      词&句时间戳,词属性,多候选词,文法格式智能转换

    • 电话专用版

      输入

      形式: 已录制音频

      声道: 单声道&多声道

      支持格式: wav,flac,mp3

      输出

      形式: json格式字符串

      结果:分词形式&完整句子形式,词&句置信度

      词&句时间戳,词属性,多候选词,文法格式智能转换

      双发音人分离

注:

1、文法格式智能转换包括电话号码、车牌、日期、时间以及量词的规整,如“五点三十”引擎会识别规整为“5:30”。

2、词属性包括:普通词;语气犹豫词,如“嗯”、“啊”、“呃”或者无意义的重复词等;标点符号,如“,”等。

3、语言支持:中国大陆地区普通话。

4、使用本服务前请参阅最佳实践指南,以获得更高的转写准确率。

5、讯飞开放平台的语音转写为使用sdk接入,针对有编程基础的用户。如果您不想通过编程方式,可以去讯飞听见官网,上传音频,直接实现语音转文字功能。

应用场景

  • 电话销售&客服
    将坐席通话转成文字,帮助电话质检和信息同步,也为数据挖掘提供原料基础
  • 会议&访谈记录
    将会议和访谈的音频转换成文字存稿,让后期的信息检索和整理更方便快捷
  • 字幕生成
    将视频中音频文件进行语音转写,轻松生成与视频相对应的字幕文件
  • 语音鉴别
    可以从转写出的文字结果中搜索匹配相关词类,对黄暴/涉政内容进行高效鉴别

客户案例

  • 上海电视台
  • 天润融通
  • 唱吧
  • 掌众金服
  • 爱屋吉屋

计费方式

  • 讯飞开放平台语音转写服务目前提供有“批量购买”和“按单价购买”两种模式,价格范围为4.9~9.9元/小时 立即购买

  • 每项转写产品提供5小时免费试用,每帐号限领取一次
  • 套餐使用情况请通过“控制台-我的应用-XXX(某个具体应用)-语音转写-服务管理”进行相关查询

疑问解答

  • “语音转写 ”与 “语音听写 ”的区别是?

  • 产品名称 支持的音频时长 使用场景
    语音听写 一分钟以内 人机对话,如输入法、语音搜索
    语音转写 五小时以内 更自然地贴近日常的对话和演讲
  • “已录制音频转写”和“实时音频流转写”的区别是?

  • 已录制音频(recorded audio)转写:将预先录制完毕的完整音频文件传输至云端,转写服务处理完成后将输出此音频对应的完整文字结果。该流程为异步&非实时;

    实时音频流(real-time streaming)转写:在采集音频的同时,连续上传音频流至云端,转写服务将实时返回文字结果。可以实现文字和声音的同步展现。

    实时语音转写已上线,欢迎使用。
查看更多