前言

Mind+ V1.5.6及以上版本增加了语音识别及语音合成功能,无需智能硬件,方便大家零成本体验最新的语音识别及合成技术。

基础教程

准备工作

加载AI图像识别

积木说明:

文字朗读相关积木:

【朗读[你好]】

说明: 使用电脑喇叭播放文字声音。

【使用[中音/高音/尖细/巨人/小猫]】

说明: 设置使用不同的嗓音播放声音。注意其中“小猫”没法发出人声。

【将朗读语言设置为[中文]】

说明: 设置使用不同的语言播放声音。

语音识别相关积木:

** 语音识别原理:录音一段时长并上传到云端做识别然后返回结果。 **

【当听到[开始]】

说明: 事件程序,当开始语音输入之后得到的结果为此事件程序设定的结果时触发。

【听候语音输入】

说明: 开始录音,直到设置的“每次听的时间”结束或者执行“语音识别结束听”。 注意:开始语音输入时请保持周围环境安静或者使用独立麦克风。

(识别结果)

说明: 返回识别的结果,前面勾选之后舞台可以直接显示结果。

【设置每次听[10]秒】

说明: 设置每次录音时长,到时间后自动结束听,最长60秒。

【语音识别结束听】

说明: 提前结束语音识别过程并上传获取结果。

【[显示/隐藏]声波图】

说明: 可以显示或者隐藏声波提示图。

【切换语音识别服务器为[服务器1/服务器2]】

说明: Mind+中语音识别有两个服务器,服务器1为MIT服务器,在国外,服务器2为百度服务器,在国内。因此当一个服务器没有反应时可以尝试使用此模块切换到另一个服务器。

应用教程