博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
基于百度AI平台的语音识别功能开发-SDK调用
阅读量:3974 次
发布时间:2019-05-24

本文共 1026 字,大约阅读时间需要 3 分钟。

文章目录

一、前期工作

1.拥有一个百度智能云账号

2.创建一个语音应用,创建成功后会显示有一个应用

在这里插入图片描述3.在应用列表里查看自己的应用

在这里插入图片描述强调:
这里的AppID、API Key、Secret Key 很重要
百度除了语音识别等其余的api调用也离不开这三个重要的参数。

二、调用百度语音SDK,基于python3

操作流程:

1.下包
我使用的是pip install baidu-aip

在这里插入图片描述

2.新建AipSpeech

from aip import AipSpeech""" 你的 APPID AK SK """APP_ID = '你的 App ID'API_KEY = '你的 Api Key'SECRET_KEY = '你的 Secret Key'client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

3.配置AipSpeech(一般不需要)

4.请求说明

以识别本地语音文件为例,假设本地有个语音文件是audio.pcm:

# 读取文件def get_file_content(filePath):    with open(filePath, 'rb') as fp:        return fp.read()# 识别本地文件client.asr(get_file_content('audio.pcm'), 'pcm', 16000, {
'dev_pid': 1537,})

注意:

1.本地语音文件的后缀名要和后面的参数一一对应
2.音频的采样率固定为16000/8000,不符合此采样率的音频识别不出来
3.语音文件的格式支持pcm / wav / amr

// 成功返回{
"err_no": 0, "err_msg": "success.", "corpus_no": "15984125203285346378", "sn": "481D633F-73BA-726F-49EF-8659ACCC2F3D", "result": ["北京天气"]}// 失败返回{
"err_no": 2000, "err_msg": "data empty.", "sn": null}

更多详情请见

百度语音识别官网技术文档(https://cloud.baidu.com/doc/SPEECH/s/1k4o0bmc7)

转载地址:http://ayxki.baihongyu.com/

你可能感兴趣的文章
使用微信api将内容分享给好友,或者发送到朋友圈
查看>>
android开发中输入法的弹出和隐藏
查看>>
Android 如何在自定义界面上启用输入法 (How to enable inputmethod for the custom UI)
查看>>
Android MediaCodec小结
查看>>
YUV格式说明
查看>>
MediaCodec and Camera: colorspaces don't match
查看>>
android adb 读写模式 挂载文件系统
查看>>
onTouchEvent方法的使用
查看>>
Android详细解释键盘和鼠标事件
查看>>
如何成为强大的程序员?
查看>>
打包时sun.misc.ServiceConfigurationError
查看>>
摘自 管理自己[Managing Oneself]
查看>>
程序员开发大型应用程序的技巧
查看>>
远程团队管理的10条戒律
查看>>
在服务器上排除问题的头五分钟
查看>>
Diagnosing DFC Configuration Problems
查看>>
jboss java.lang.NoClassDefFoundError: Could not initialize class com.documentum.fc.client.DfClient
查看>>
芯片常见封装
查看>>
什么是oc门
查看>>
上拉电阻 下拉电阻的汇总
查看>>