产品特性

  • 支持个性化热词
    用户可将一些非常见的词汇上传至识别引擎,当实时转写的音频流中出现该词汇时,引擎可将其识别出来,提高专业用语识别准确率。
  • 上下文纠错
    针对上下文进行语义理解,将中间结果进行智能纠错,确保准确性。
  • 文字流时间戳
    对于音频流实现毫秒级识别,并返回带有时间戳的文字流,便于二次开发。
  • 标点智能预测
    运用超大规模的语言模型,智能预测语境,提供智能断句和标点符号的预测。

技术规格

  • 输入

    • 形式:实时音频流

      支持格式:PCM

      采样率:16KHz

      采样精度:16bits

    • 支持语种:中文普通话

      声道:单声道

      分片时长:40ms

  • 输出

    • 形式:json格式字符串

      编码:UTF-8

      结果:句子开始&结束时间&词识别内容&词标识&词开始时间&词结束时间&结果类型标识&段落ID,整句的中间结果,整句的最终结果

注:

1、文法格式智能转换包括电话号码、车牌、日期、时间以及量词的规整,如“五点三十”引擎会识别规整为“5:30”。

2、词属性包括:普通词;语气犹豫词,如“嗯”、“啊”、“呃”或者无意义的重复词等;标点符号,如“,”等。

3、语言支持:中国大陆地区普通话。后续将支持更多语种。

4、讯飞开放平台的实时语音转写需接入WebSocket API接口,针对有编程基础的开发者用户。如果您是个人用户,不想通过编程方式直接实现语音转写功能,可以去讯飞听见官网,了解语音转写功能的更多详情。

应用场景

  • 直播字幕
    在电视直播或现场直播过程中提供实时字幕,提升直播效果
  • 视频会议&电话会议
    将视频以及电话会议中的发言内容实时识别为文字,防止错过重要会议内容,提高会议效率
  • 客服中心
    将客户的电话语音内容实时识别为文字,作为客服答疑的参考记录

客户案例

  • 上海电视台
  • 天润融通
  • 唱吧
  • 掌众金服
  • 爱屋吉屋
产品价格
套餐 免费包 时长套餐一 时长套餐二 时长套餐三 时长套餐四 并发套餐
时长 24小时 10小时 200小时 1000小时 3000小时 不限时长
支持并发 1路 10路 10路 10路 10路 按需
有效期 15天 一年 一年 一年 一年 一年
价格 免费 ¥99.00 ¥1780.00 ¥6900.00 ¥14700.00 按并发收费
单价(元/小时) 免费 ¥9.90 ¥8.90 ¥6.90 ¥4.90 1万元-2万元(每路每年)
使用产品 领取 立即购买 立即购买 立即购买 立即购买 商务对接

温馨提示:

1、每个用户仅可领取一次免费包;

2、购买时长套餐,可使用10路并发,若需要更多并发或者一次性购买量较大,可进行商务工单对接;

3、时长套餐与并发套餐成本计算方式不同,暂不提供套餐转换功能,请根据您的需要选择。

开发者资源

温馨提示

  • 开放平台“实时语音转写”需要WebSocket接入,针对是有编程基础的开发者用户。如果您是个人用户,不想通过编程方式直接实现语音转写功能,可以去讯飞听见官网,了解语音转写功能的更多详情。