×
我们使用cookies帮助改善LingQ。通过浏览本网站,表示你同意我们的
cookie 政策.
李永乐老师 Youtube, 人脸识别啥原理?人工智能(二)卷积神经网络 (1)
人脸识别 啥 原理 ?人工智能 (二 )卷积 神经网络 (1)
各位 同学 大家 好 我 是 李永乐 老师
在 上 一回 咱们 介绍 了
人工智能 的 基本概念 和 算法
为 大家 介绍 了 梯度 下降 算法
机器 学习 和 神经网络 的 基本概念
有个 小朋友 就 跟 我 说
他 下载 了 一个 人工智能 软件
可以 通过 拍照 的 方法 来 识别 物体
我 还 特意 试 了 一下 这个 软件
发现 这个 软件 不光 能够 识别 出 我们 家 的 狗
还 能 认出 狗 的 类型
威尔士 柯基
大家 知道 计算机 是 如何 进行 图像识别 的 吗
那 今天 我们 就 来 介绍 一下
在 图像识别 里面 最 流行 的 一种 算法
卷积 神经网络
为了 介绍 卷积 神经网络
我们 首先 先 来 介绍 一下 视觉 的 原理
人 和 动物 如何 能够 把 看到 的 图像
转化成 他 大脑 中 的 一个 概念
比如 这个 是 猫 那个 是 狗 的 呢
我们 知道 计算机 实际上 是 把 一幅 图
转化成 一大堆 的 数字 对 吧
然后 通过 训练 就 可以 知道
这些 数字 代表 一个 什么样 的 含义
但是 如果 我们 用上 节课 所说 的 这种 方法
来 进行 训练 费时费力
而且 一旦 这个 图片 发生 了 一点 放缩 旋转
或者 是 一些 变化
那么 这个 计算机 就 认不出来 了
但是 我们 的 眼睛 效率 就 特别 高
如果 我 看过 一次 汽车 和 摩托车 之后
我 就 能 立刻 把 它们 的 区别 分辨 出来
下次 再 看到 这个 摩托车 的 时候
哪怕 这个 摩托车 方向 变 了
位置 变 了 或者 是 它 破损 了
我们 依然 能 认出来 它 是 一辆 摩托车
而 不是 一个 汽车
这是 为什么 呢
在 1981 年 的 时候
1981 年 的 时候
诺贝尔 生理学 和 医学奖 授予 给 两位 神经 科学家
他们 的 名字 一个 叫做 大卫 · 休伯尔
还有 一个 是 他 的 合作者 叫做 威泽尔
那么 这 两位 科学家 他们 用 猫 做 实验 猫
把 这个 电极 插入 到 猫 的 脑子 当中 去
然后 给 猫 看 各种各样 不同 的 图片
去 研究 猫 脑子 的 反应
结果 他 就 发现
这个 跟 视觉 相关 的 这个 大脑 中 的 一些 细胞
分为 两种
第一种 叫做 简单 的 细胞
这种 简单 的 视觉 神经细胞
它 的 特点 是 对 某 一些 线条 是 比较 敏感 的
某个 方向 的 线条 出现 了 之后
这些 细胞 就 会 比较 敏感 就 能 看 出来
还有 一些 是 比较复杂 的 细胞
这些 复杂 的 细胞 不光 能够 对 线条 产生 反应
它 还 能够 对 线条 的 运动 产生 反应 对 吧
于是 他们 提出 了 这样 的 一个 理论
去 解释 人 的 眼睛 是 如何 看到 物体 的
那么 后来 在 他们 的 启发 下
有 一个 日本 的 科学家
名字 叫做 福岛 邦彦
他 就 提出 了 一个 模型
叫做 神经 认知 模型
就是说 这个 人 他 是 如何 看 出来
这个 物体 是 猫 还是 狗 的 呢
他 说 人 大脑 里面 有 很多 的 皮层
是 一层 一层 对 这个 视觉 信号 进行 处理 的
你 这个 光 从 眼睛 里面 进去 之后
你 先进 到 第一个 皮层
然后 又 进到 第二个 皮层
然后 又 进到 第三个 皮层
然后 一直 往下进
那么 可能 有 五六个 皮层
每 一个 皮层
它 对于 这个 信号 的 处理方式 是 不 一样 的
最 开始 刚进 到 眼睛 的 视网膜 里面 的 时候
实际上 我们 看到 的 光线 是 一大堆 的 像素点
一大堆 的 像素点 是 吧
然后 在 第一个 皮层 之中
这些 像素点 抽象 出 一些 特征
比如说 边缘 是 吧
这个 边缘 它 是 具有 方向性 的 是 吧
你 是 横 着 的 边缘 呢 还是 竖 着 的 边缘 呢
还是 斜 着 的 边缘 呢
在 某 一个 皮层 中 我们 就 抽象 出 这些 特征 了
好 找 完 了 这个 特征 之后
继续 下 一个 皮层 就 会 把 这些 特征 组合 起来
形成 什么 呢
形成 这个 物体 的 轮廓 轮廓
以及 这个 物体 的 更 多 的 细节 是 吧
大体 来讲 是 轮廓 里边 是 细节
然后 最后 我们 再 把 这些 个 轮廓 和 细节
组合成 一个 整体
最终 才 会 做出 一个 判断 是 吧
这 过程 是 比较复杂 的
所以 它 是 有 一层 一层 的 这样 的 关系
去 认识 到 这个 物体 的
比如说 你 现在 看到 我
你 说 我 是 李永乐 老师
但是 你 开始 看到 的 时候 并 不是 我 李永乐 老师
你 看到 的 是 一大堆 像素点
这些 个 像素点 进到 你 的 脑子 里面 之后
它 首先 会 抽象 出 边缘 和 方向 信息
你 发现 我 好像 直立 行走 的 对 不 对
然后 进而 你 又 发现 了 更 多 的 轮廓 和 细节
你 发现 我 好像 有 两个 胳膊 两个 腿 是 吧
两个 眼睛 一个 鼻子 一个 嘴 是不是
然后 你 觉得 这 应该 不是 个 昆虫
你 继续 去 看
然后 你 才 会 抽象 出来
原来 这个 人 他 是 李永乐 老师 对 吧
这 就是 人 的 眼睛 是 如何 看出 物体 的
那么 根据 这个 原理
我们 上节 课 谈到 的 著名 的 科学家 杨立昆
他 就 发明 出来 了 一种
能够 实用 的 图像识别 的 方法
称之为 卷积 神经网络
那 这种 方法 简写 叫 CNN
好像 还有 一个 机构 简写 也 是 CNN 是 吧
好 那么 这个 卷积 神经网络 到底 是 怎么回事 呢
下面 我 就 来 介绍 一下
这 里面 会 涉及 到 比较 多 的 数学 内容
我们 首先 来说 一说 卷积
什么 是 卷积 呢
在 通信 里面 经常 会谈 到 卷积
那么 这里 我们 说 的 卷积
跟 那个 通讯 的 卷积 形式 上 有点 不 一样
那 卷积 是 什么 意思 呢
我们 举个 例子
比如说 我们 有 一幅 图片
我 想 判断 一下 这 幅 图片 是不是 X
我们 知道 这个 X 有 很 多种 写法
但是 不管 是 哪 一种 写法
它 都 有 一些 共同 的 特征
比如说 它 中间 有 一个 这样 的 叉 对 不 对
它 有 一个 往右 下 的 线
还有 一个 往 左下 的 线 对 不 对
越 符合 这些 特征
那么 这幅 图 就 越 有 可能 是 X 对 不 对
所以 卷积 的 作用 就是
我们 希望 用 一种 数学 的 方法
然后 怎么样 呢
能够 提取 出
提取 出 这个 图像 中 的 这些 特征
你 这个 图像 需要 一些 特征
那么 这些 特征 我 通过 卷积 的 方法 提取 出来
我们 来举 一个 具体 的 例子
大家 看 我 给出 了 一幅 7×7 的 图片
我 想 让 计算机 告诉 我
这个 7×7 图片 到底 是不是 X
怎么 判断 呢
首先 计算机 会 把 它 转化成 数字
就是 所有 的 这个 亮 的 地方 设为 1
比如说 这个 地方 是 1 1 1 1 1 对 吧
这亮 的 地方 就是 1
因为 它 是 纯 黑白 的
那么 所有 黑 的 地方 就是 0 了
于是 我们 把 其它 地方 补上 0
所以 这 幅 图片 在 计算机 看来
就是 这么 一大堆 数字
那么 这 一堆 数字 计算机 要认
说 它 到底 是 X 呢 还 是不是 X
它 怎么 去 做 呢
首先 要 提取 特征 提取 特征 的 方法
就是 使用 一个 叫做 卷积 核 的 东西
来 做 卷积 运算
卷积 核 也 是 一个 矩阵 一个 方块
这个 方块 一般 是 3×3 或者 5×5 的
比如说 我们 这里 有 一个 卷积 核
这个 卷积 核它 是 3×3 的
并且 里面 的 数字 是 这样 的
这 三个 数字 它 是 1 其他 的 数字 它 是 0
好 这 就是 我们 的 一个 卷积 核 了
这个 卷积 核
我们 和 左边 的 这个 图像 做 卷积 运算
什么 叫 卷积 运算 呢
它 的 意思 就是 把 这个 卷积 核
放到 图片 上 某 一个 3×3 的 部位
让 它们 对应 元素 相乘
比如说 你 先 把 它 放到 左边 的 这个 部位
然后 盖住 了
盖住 了 之后 它 不是 有 对应 元素 吗
然后 对应 元素 乘起来
就 1×0+0×0+0×0+0×0+...
这么 一直 加 加完 了 之后
再 把 它 写 到 中间 这个 位置 我 再说 一遍
就是 把 这个 卷积 核 放到 它 这个 部位
对应 元素 相乘 乘 完 了 之后 相加
再 放到 正 中央 这个 部位
于是 就 会 构成 一张 新 的 图
这张 新 的 图 就 叫做 特征 图
特征 图 的 第一个 元素
就是 把 这个 卷积 核 和 这 一块 元素
对应 相乘 再 相加
我们 仔细 看 就 会 发现
这个 卷积 核 只有 这么 斜 着 的 三个 元素 是 1
其他 全都 是 0
所以 我 只要 把 这里 边 的 这 三个 数加 起来
是不是 就 应该 是 第一个 结果 了 对 不 对
我们 把 它 算 出来
这个 是 0 这个 是 1 这个 是 1
一加 结果 应该 是 2 对 不 对
特征 图 第一个 元素 就是 2
那 特征 图 第二个 元素 我们 该 怎么 找 呢
很 简单
你 只 需要 把 这个 卷积 核 往右边 平移 一下
找到 这样 的 一个 方块 是不是
找到 这样 一个 方块
你 把 这个 卷积 核 和 这个 方块 一 叠加
然后 对应 元素 相乘 再 相加 这 叫 卷积
事实上 也 就是 把 第二个 方块 的
这 三个 元素 加 起来
因为 只有 这 三个 数是 1 其他 都 是 0
那 把 它们 三个 一 相加 结果 是 几
结果 是 0
这 就是 特征 图 的 第二个 元素
你 按照 这种 方法 把 所有 的 元素 都 写 出来
我 把 它 写 完
这样 我们 就 得到 了 所谓 的 特征 图
好 那 咱们 来 解释一下
你 说 你 干 了 这件 事 之后 到底 得到 了 什么 呢
我们 仔细 看 就 会 知道
这个 卷积 核 只有 斜 着 的 这 3 个 元素 是 1
所以 如果 原来 那 张图 上
也 是 斜 着 这 3 个 元素 是 1 的话
最后 它们 一做 卷积 这个 数字 就 会 特别 大
也就是说 我们 提取 到 了 这个 特征
你 在 这 张图 上 找 一 找 说 哪个 数字 特别 大
这个 数字 特别 大
就 说明 在 这个 部位
特别 满足 这种 斜 着 的 线条 的 特征 对 吗
这个 数字 是 3 也 特别 大
这 就 说明 在 这个 部位
也 有 一个 斜 着 右 下 的 线条 这个 数字 也 是 3
就 说明 这个 部位 也 有 一个 斜 的 线条
那么 2 和 2 这 两个 部位
就 说明 它 的 特征性 稍 微弱 一点
事实上 你 会 发现 左上 和 右 下 这 两个 角
它 虽然 也 有 一个 右下 的 1 和 1
但 它 缺 了 一个角 对 不 对 缺 了 一个角
其它 地方 还有 数字 小 的
比如 0 和 1 就 说明 这样 的 部位
它 没有 斜 向 右 下 的 线条
所以 我们 这 一个 卷积 核
其实 就是 对应 了 一个 特征
这个 特征 就是 一个 斜 向 右 下 的 线条
而 在 这个 特征 图中 那个 数字 比较 大 的 部位
就 说明 这些 个 部位 它 就 满足 这个 特征
其它 的 部位 数字 越小 它 就 越 不 满足 特征
这 不 就是 用 数学方法 提取 图像 特征 吗
当然 你 刚才 说 的 这个 卷积 核
它 是 右 下 的 3 个 数字 是 1
所以 就 提取 出来 一个
往 右下方 斜 的 一个 线段 这个 特征
那么 如果 你 想 提出 来 一个
比如说 往 左下 斜 的 线段 的 特征
你 应该 找 什么样 的 卷积 核 呢
那 应该 是 这 3 个 元素 是 1
其他 是 0 对 不 对
你 说 我 想要 一个 竖 着 的 线段 那 怎么办
那 就是 这 3 个 元素 是 1 其他 是 0
你 说 我 想要 一个 这样 的 圈 怎么办
那 就是 这 几个 数字 是 1 其他 是 0
总而言之 通过 不同 的 卷积 核
我们 就 能够 对 图像 进行 不同 的 处理
得到 不同 的 特征 图 显示 出来 这种 特征
它 分布 在 图像 的 什么样 的 位置
卷积 之后 下 一个 步骤 就是 池化 池化
还有 就是 激活
我们 来 介绍 一下 这 两个 步骤
什么 叫 池化 呢
这张 特征 图 元素 个数 还是 比较 多 的
你 比如 左上角
左上角 到底 有没有 一个
往 右下方 的 线条 这个 特征
它 有 对 吧
这个 2 这个 3 就 说明 它 已经 有 了
人脸识别 啥 原理 ?人工智能 (二 )卷积 神经网络 (1)
What is the principle of face recognition? Artificial Intelligence (II) Convolutional Neural Network (1)
各位 同学 大家 好 我 是 李永乐 老师
在 上 一回 咱们 介绍 了
人工智能 的 基本概念 和 算法
为 大家 介绍 了 梯度 下降 算法
机器 学习 和 神经网络 的 基本概念
有个 小朋友 就 跟 我 说
他 下载 了 一个 人工智能 软件
可以 通过 拍照 的 方法 来 识别 物体
我 还 特意 试 了 一下 这个 软件
发现 这个 软件 不光 能够 识别 出 我们 家 的 狗
还 能 认出 狗 的 类型
威尔士 柯基
Welsh Corgi
大家 知道 计算机 是 如何 进行 图像识别 的 吗
那 今天 我们 就 来 介绍 一下
在 图像识别 里面 最 流行 的 一种 算法
卷积 神经网络
为了 介绍 卷积 神经网络
我们 首先 先 来 介绍 一下 视觉 的 原理
人 和 动物 如何 能够 把 看到 的 图像
转化成 他 大脑 中 的 一个 概念
比如 这个 是 猫 那个 是 狗 的 呢
我们 知道 计算机 实际上 是 把 一幅 图
转化成 一大堆 的 数字 对 吧
然后 通过 训练 就 可以 知道
这些 数字 代表 一个 什么样 的 含义
但是 如果 我们 用上 节课 所说 的 这种 方法
来 进行 训练 费时费力
而且 一旦 这个 图片 发生 了 一点 放缩 旋转
And once the picture is zoomed and rotated a bit
或者 是 一些 变化
那么 这个 计算机 就 认不出来 了
但是 我们 的 眼睛 效率 就 特别 高
如果 我 看过 一次 汽车 和 摩托车 之后
我 就 能 立刻 把 它们 的 区别 分辨 出来
下次 再 看到 这个 摩托车 的 时候
哪怕 这个 摩托车 方向 变 了
位置 变 了 或者 是 它 破损 了
我们 依然 能 认出来 它 是 一辆 摩托车
而 不是 一个 汽车
这是 为什么 呢
在 1981 年 的 时候
1981 年 的 时候
诺贝尔 生理学 和 医学奖 授予 给 两位 神经 科学家
他们 的 名字 一个 叫做 大卫 · 休伯尔
还有 一个 是 他 的 合作者 叫做 威泽尔
那么 这 两位 科学家 他们 用 猫 做 实验 猫
把 这个 电极 插入 到 猫 的 脑子 当中 去
然后 给 猫 看 各种各样 不同 的 图片
去 研究 猫 脑子 的 反应
结果 他 就 发现
这个 跟 视觉 相关 的 这个 大脑 中 的 一些 细胞
分为 两种
第一种 叫做 简单 的 细胞
这种 简单 的 视觉 神经细胞
它 的 特点 是 对 某 一些 线条 是 比较 敏感 的
某个 方向 的 线条 出现 了 之后
这些 细胞 就 会 比较 敏感 就 能 看 出来
还有 一些 是 比较复杂 的 细胞
这些 复杂 的 细胞 不光 能够 对 线条 产生 反应
它 还 能够 对 线条 的 运动 产生 反应 对 吧
于是 他们 提出 了 这样 的 一个 理论
去 解释 人 的 眼睛 是 如何 看到 物体 的
那么 后来 在 他们 的 启发 下
Then, under their inspiration
有 一个 日本 的 科学家
名字 叫做 福岛 邦彦
他 就 提出 了 一个 模型
叫做 神经 认知 模型
Neurocognitive model
就是说 这个 人 他 是 如何 看 出来
这个 物体 是 猫 还是 狗 的 呢
他 说 人 大脑 里面 有 很多 的 皮层
是 一层 一层 对 这个 视觉 信号 进行 处理 的
你 这个 光 从 眼睛 里面 进去 之后
你 先进 到 第一个 皮层
然后 又 进到 第二个 皮层
然后 又 进到 第三个 皮层
然后 一直 往下进
那么 可能 有 五六个 皮层
每 一个 皮层
它 对于 这个 信号 的 处理方式 是 不 一样 的
最 开始 刚进 到 眼睛 的 视网膜 里面 的 时候
实际上 我们 看到 的 光线 是 一大堆 的 像素点
一大堆 的 像素点 是 吧
然后 在 第一个 皮层 之中
这些 像素点 抽象 出 一些 特征
These pixels abstract some features
比如说 边缘 是 吧
这个 边缘 它 是 具有 方向性 的 是 吧
你 是 横 着 的 边缘 呢 还是 竖 着 的 边缘 呢
还是 斜 着 的 边缘 呢
在 某 一个 皮层 中 我们 就 抽象 出 这些 特征 了
好 找 完 了 这个 特征 之后
继续 下 一个 皮层 就 会 把 这些 特征 组合 起来
形成 什么 呢
形成 这个 物体 的 轮廓 轮廓
以及 这个 物体 的 更 多 的 细节 是 吧
大体 来讲 是 轮廓 里边 是 细节
然后 最后 我们 再 把 这些 个 轮廓 和 细节
组合成 一个 整体
最终 才 会 做出 一个 判断 是 吧
这 过程 是 比较复杂 的
所以 它 是 有 一层 一层 的 这样 的 关系
去 认识 到 这个 物体 的
比如说 你 现在 看到 我
你 说 我 是 李永乐 老师
但是 你 开始 看到 的 时候 并 不是 我 李永乐 老师
你 看到 的 是 一大堆 像素点
这些 个 像素点 进到 你 的 脑子 里面 之后
它 首先 会 抽象 出 边缘 和 方向 信息
你 发现 我 好像 直立 行走 的 对 不 对
然后 进而 你 又 发现 了 更 多 的 轮廓 和 细节
你 发现 我 好像 有 两个 胳膊 两个 腿 是 吧
两个 眼睛 一个 鼻子 一个 嘴 是不是
然后 你 觉得 这 应该 不是 个 昆虫
你 继续 去 看
然后 你 才 会 抽象 出来
原来 这个 人 他 是 李永乐 老师 对 吧
这 就是 人 的 眼睛 是 如何 看出 物体 的
那么 根据 这个 原理
我们 上节 课 谈到 的 著名 的 科学家 杨立昆
他 就 发明 出来 了 一种
能够 实用 的 图像识别 的 方法
称之为 卷积 神经网络
那 这种 方法 简写 叫 CNN
好像 还有 一个 机构 简写 也 是 CNN 是 吧
好 那么 这个 卷积 神经网络 到底 是 怎么回事 呢
下面 我 就 来 介绍 一下
这 里面 会 涉及 到 比较 多 的 数学 内容
我们 首先 来说 一说 卷积
什么 是 卷积 呢
在 通信 里面 经常 会谈 到 卷积
那么 这里 我们 说 的 卷积
跟 那个 通讯 的 卷积 形式 上 有点 不 一样
那 卷积 是 什么 意思 呢
我们 举个 例子
比如说 我们 有 一幅 图片
我 想 判断 一下 这 幅 图片 是不是 X
我们 知道 这个 X 有 很 多种 写法
但是 不管 是 哪 一种 写法
它 都 有 一些 共同 的 特征
比如说 它 中间 有 一个 这样 的 叉 对 不 对
它 有 一个 往右 下 的 线
还有 一个 往 左下 的 线 对 不 对
越 符合 这些 特征
那么 这幅 图 就 越 有 可能 是 X 对 不 对
所以 卷积 的 作用 就是
我们 希望 用 一种 数学 的 方法
然后 怎么样 呢
能够 提取 出
提取 出 这个 图像 中 的 这些 特征
你 这个 图像 需要 一些 特征
那么 这些 特征 我 通过 卷积 的 方法 提取 出来
我们 来举 一个 具体 的 例子
大家 看 我 给出 了 一幅 7×7 的 图片
我 想 让 计算机 告诉 我
这个 7×7 图片 到底 是不是 X
怎么 判断 呢
首先 计算机 会 把 它 转化成 数字
就是 所有 的 这个 亮 的 地方 设为 1
比如说 这个 地方 是 1 1 1 1 1 对 吧
这亮 的 地方 就是 1
因为 它 是 纯 黑白 的
那么 所有 黑 的 地方 就是 0 了
于是 我们 把 其它 地方 补上 0
所以 这 幅 图片 在 计算机 看来
就是 这么 一大堆 数字
那么 这 一堆 数字 计算机 要认
说 它 到底 是 X 呢 还 是不是 X
它 怎么 去 做 呢
首先 要 提取 特征 提取 特征 的 方法
就是 使用 一个 叫做 卷积 核 的 东西
来 做 卷积 运算
卷积 核 也 是 一个 矩阵 一个 方块
这个 方块 一般 是 3×3 或者 5×5 的
比如说 我们 这里 有 一个 卷积 核
这个 卷积 核它 是 3×3 的
并且 里面 的 数字 是 这样 的
这 三个 数字 它 是 1 其他 的 数字 它 是 0
好 这 就是 我们 的 一个 卷积 核 了
这个 卷积 核
我们 和 左边 的 这个 图像 做 卷积 运算
什么 叫 卷积 运算 呢
它 的 意思 就是 把 这个 卷积 核
放到 图片 上 某 一个 3×3 的 部位
让 它们 对应 元素 相乘
比如说 你 先 把 它 放到 左边 的 这个 部位
然后 盖住 了
盖住 了 之后 它 不是 有 对应 元素 吗
然后 对应 元素 乘起来
就 1×0+0×0+0×0+0×0+...
这么 一直 加 加完 了 之后
再 把 它 写 到 中间 这个 位置 我 再说 一遍
就是 把 这个 卷积 核 放到 它 这个 部位
对应 元素 相乘 乘 完 了 之后 相加
再 放到 正 中央 这个 部位
于是 就 会 构成 一张 新 的 图
这张 新 的 图 就 叫做 特征 图
特征 图 的 第一个 元素
就是 把 这个 卷积 核 和 这 一块 元素
对应 相乘 再 相加
我们 仔细 看 就 会 发现
这个 卷积 核 只有 这么 斜 着 的 三个 元素 是 1
其他 全都 是 0
所以 我 只要 把 这里 边 的 这 三个 数加 起来
是不是 就 应该 是 第一个 结果 了 对 不 对
我们 把 它 算 出来
这个 是 0 这个 是 1 这个 是 1
一加 结果 应该 是 2 对 不 对
特征 图 第一个 元素 就是 2
那 特征 图 第二个 元素 我们 该 怎么 找 呢
很 简单
你 只 需要 把 这个 卷积 核 往右边 平移 一下
找到 这样 的 一个 方块 是不是
找到 这样 一个 方块
你 把 这个 卷积 核 和 这个 方块 一 叠加
然后 对应 元素 相乘 再 相加 这 叫 卷积
事实上 也 就是 把 第二个 方块 的
这 三个 元素 加 起来
因为 只有 这 三个 数是 1 其他 都 是 0
那 把 它们 三个 一 相加 结果 是 几
结果 是 0
这 就是 特征 图 的 第二个 元素
你 按照 这种 方法 把 所有 的 元素 都 写 出来
我 把 它 写 完
这样 我们 就 得到 了 所谓 的 特征 图
好 那 咱们 来 解释一下
你 说 你 干 了 这件 事 之后 到底 得到 了 什么 呢
我们 仔细 看 就 会 知道
这个 卷积 核 只有 斜 着 的 这 3 个 元素 是 1
所以 如果 原来 那 张图 上
也 是 斜 着 这 3 个 元素 是 1 的话
最后 它们 一做 卷积 这个 数字 就 会 特别 大
也就是说 我们 提取 到 了 这个 特征
你 在 这 张图 上 找 一 找 说 哪个 数字 特别 大
这个 数字 特别 大
就 说明 在 这个 部位
特别 满足 这种 斜 着 的 线条 的 特征 对 吗
这个 数字 是 3 也 特别 大
这 就 说明 在 这个 部位
也 有 一个 斜 着 右 下 的 线条 这个 数字 也 是 3
就 说明 这个 部位 也 有 一个 斜 的 线条
那么 2 和 2 这 两个 部位
就 说明 它 的 特征性 稍 微弱 一点
事实上 你 会 发现 左上 和 右 下 这 两个 角
它 虽然 也 有 一个 右下 的 1 和 1
但 它 缺 了 一个角 对 不 对 缺 了 一个角
其它 地方 还有 数字 小 的
比如 0 和 1 就 说明 这样 的 部位
它 没有 斜 向 右 下 的 线条
所以 我们 这 一个 卷积 核
其实 就是 对应 了 一个 特征
这个 特征 就是 一个 斜 向 右 下 的 线条
而 在 这个 特征 图中 那个 数字 比较 大 的 部位
就 说明 这些 个 部位 它 就 满足 这个 特征
其它 的 部位 数字 越小 它 就 越 不 满足 特征
这 不 就是 用 数学方法 提取 图像 特征 吗
当然 你 刚才 说 的 这个 卷积 核
它 是 右 下 的 3 个 数字 是 1
所以 就 提取 出来 一个
往 右下方 斜 的 一个 线段 这个 特征
那么 如果 你 想 提出 来 一个
比如说 往 左下 斜 的 线段 的 特征
你 应该 找 什么样 的 卷积 核 呢
那 应该 是 这 3 个 元素 是 1
其他 是 0 对 不 对
你 说 我 想要 一个 竖 着 的 线段 那 怎么办
那 就是 这 3 个 元素 是 1 其他 是 0
你 说 我 想要 一个 这样 的 圈 怎么办
那 就是 这 几个 数字 是 1 其他 是 0
总而言之 通过 不同 的 卷积 核
我们 就 能够 对 图像 进行 不同 的 处理
得到 不同 的 特征 图 显示 出来 这种 特征
它 分布 在 图像 的 什么样 的 位置
卷积 之后 下 一个 步骤 就是 池化 池化
The next step after convolution is pooling
还有 就是 激活
我们 来 介绍 一下 这 两个 步骤
什么 叫 池化 呢
这张 特征 图 元素 个数 还是 比较 多 的
你 比如 左上角
左上角 到底 有没有 一个
往 右下方 的 线条 这个 特征
它 有 对 吧
这个 2 这个 3 就 说明 它 已经 有 了
BLACK FRIDAY SALE
Save 40%
Learn
a New Languagefrom
YouTube
Music
Podcasts
News
Books
Register and Save