前言

Mind+ V1.6.0新增了“AI图像识别功能”。通过图像识别功能,可以进行人脸识别、人脸对比、常用物体识别、文字识别、车牌识别、手势识别、人体关键点识别等功能。 无需任何开源硬件,只用一台带摄像头的电脑即可体验AI玩法,同时可以配合原有的语音识别、语音合成、文字翻译功能组合出更多玩法。

基础教程

准备工作

加载AI图像识别

积木说明:

积木分三大类,同时也表示了使用的三大步骤:

  1. 基础设置。包含了账户控制、摄像头相关操作及图像保存选项,只需要选择性的调用一次即可。
  2. 获取图像。获取图像源数据,可以从摄像头、本地、网络三种方式获取。仅从摄像头获取需要用到电脑摄像头。
  3. 识别图像。获取图像之后通过识别相关的积木进行图像识别操作并获得结果。

基础设置相关积木:

【切换至独立账户】


说明:

  1. AI图像识别功能调用的百度AI服务,因此需要使用百度AI的账户。
  2. Mind+默认有一个公用的账户,因此无需单独注册账户也可以使用,但是公用账户有同时访问限制,因此推荐使用自己注册的账户。

账户注册方法:

  1. 登录百度AI开放平台,http://ai.baidu.com,点击页面右上角“控制台”,然后“注册”或者“登录”自己的百度账号。
  2. 登录成功后进入控制台页面,点击左边栏“人脸识别”,在新页面中点击“创建应用”,将“语音技术”、“文字识别”、“图像识别”、“人体分析”全部勾选,(有些用不上,但是都可以勾选,可以多选不可少选)。
  3. 在“应用管理”中复制AppID、API Key、Secret Key下方的参数,填到Mind+中“切换至独立账户”中。
  4. 填好之后可以点击一下此积木,如果运行出错会提示错误信息,没有提示即为正确。

【使用[弹窗/舞台]显示摄像头画面】

说明:
切换显示的位置,使用舞台时可以与舞台交互,使用弹窗时不影响舞台效果同时也可以隐藏。
注意:调用此模块时不会立即打开摄像头。

【[开启/关闭/镜像开启]摄像头】

说明:
调用此模块时将打开摄像头。
镜像开启功能在使用文字识别等功能时使用。

【[关闭/打开]保存视频截图到本地】

说明:
可以开启和关闭在拍照时将图片保存到本地计算机的选项,点击“齿轮”图标可以手动填写文件夹地址或者打开对应地址。


获取图像相关积木:

(从摄像头画面截取图片)

说明: 调用此模块即可从摄像头截取一帧画面,返回得到图片数据,可以将图片存储到变量或者列表中进行二次判断。

(从本地文件获取图片[地址])

说明: 调用此模块即可从电脑文件中调用一张图片,返回得到图片数据,文件路径可以使用变量或列表插入积木中。

(从网址获取图片[网址])

说明: 调用此模块即可从一个网址调用一张图片,返回得到图片数据,网址路径可以使用变量或列表插入积木中。


人脸识别相关积木:

【识别图中[图片数据]人脸信息】

说明: 调用此模块将图片数据上传到服务器进行识别

<人脸识别成功?>

说明: 人脸识别中有人脸则此数据为真(true),否则为假(false)

(人脸识别获取结果[年龄/性别/颜值/脸型/眼镜/表情/真人])

说明: 获取人脸识别的结果,需要先运行一次人脸识别积木。

(对比图片[图片数据]与图片[图片数据]中的人脸)

说明: 对比两张图片的人脸相似度,返回百分比,最大100最小0。


图像识别相关:

(识别图中[图片数据]包含的[图像主体/通用物体和场景/植物/动物/货币])

说明: 识别图片中对应的物体,返回文字结果。

(识别图中[图片数据]包含的[文字/数字/车牌号/手写字])

说明: 识别图中的文字信息,注意使用此功能前需要使用“镜像开启”摄像头,否则文字可能是反着的。

(识别图中[图片数据]包含的手势)

说明: 识别图中的手势动作,注意使用时最好遮挡住脸。

(手势[One(数字1)])

说明: 用作与“识别图中手势”积木返回结果进行判断用。 当前可以识别的手势有:数字1-9、拳头、OK、祈祷、作揖、作别、单手比心、点赞、Diss、我爱你、掌心向上、双手比心1、双手比心2、双手比心3、Rock、竖中指、脸。


人体关键点相关积木:

【识别图中[图片数据]的人体关键点】

说明: 将图片发送到服务器,识别人体关键点。

<人体关键点识别成功?>

说明: 根据图片是否有人体判定是否识别成功,成功返回真(true),失败返回假(false)。

(人体关键点获取结果[头部]的[X/Y]坐标)

说明: 根据图中人体识别关键点坐标。 人体关键点:头部、脖子、鼻子、左/右脚踝、左/右耳、左/右手肘、左/右眼、左/右臀、左/右膝、左/右嘴角、左/右肩、左/右手腕。

应用教程

颜值测试

使用AI图像识别,让Mind+说出你的颜值。

程序

操作

程序编写完成后,全屏显示,点击绿旗,此时按下键盘的空格键,等待一两秒,Mind+就会播出你的颜值多高。

效果

人脸打卡

程序

操作

效果

手写数字识别

程序

操作

效果

手势识别

程序

操作

效果

人体关键点识别

程序

操作

效果