【入门篇】从函数到神经网络
By 大模型
Summary
Topics Covered
- 世界逻辑皆函数
- 符号主义走不通
- 联结主义靠猜近似
- 激活函数盘活非线性
- 神经网络即复杂函数
Full Transcript
Deep Seek 最近 火出 圈 了 , 连 我 老 了 都 知道 了 不过 可能 不少 人有 这样 的 两难 困境 既 不想
一直 看 一些 几分钟 的 快餐 视频 因为 不论 看 多少 很多 问题 还是 搞 不 明白 但是 又 不想 花太多 时间
从头开始 学 因为 整个 AI 的 知识 体系 实在 是 太 庞大 了 所以 我 决定 做 一个 小 的 系列 视频 把 Deep Seek
以及 之前 涉及 到 的 机器 学习 深度 学习 等 知识 从头 讲 一遍 做到 既快 又 慢 既 深入 又 肤浅 既 有趣 又
严肃 有人 说 你 说 的 这些 都 是 什么 乱七八糟 的 呀 别管 了 我们 直接 进入 正题 吧 现在 你 要 做 的 唯一
一件 事 就是 清空 大脑 忘掉 所有 你 曾经 熟悉 的 或 不 熟悉 的 概念 然后 在 你 脑海中 就 只 留 两个
词 一个 是 我 的 名字 另 一个 就是 我们 这趟 旅行 的 出发点 函数 后面 所有 一切 的 前提 是 你 要 相信
这个 世界 上 的 所有 逻辑 或 知识 都 可以 用 一个 函数 来 表示 那 我们 只 需要 将 现实 世界 抽象 为 符号 再 设置 好
一些 运算 规则 也 就是 函数 最后 算 出来 结果 反过来 解释 现实 世界 就 可以 了 比如说 输入 直角三角形
的 两个 边场 根据 勾 固定 理 就 可以 得到 斜变 的 变长 再 比如 输入 物体 的 质量 和 加速度 根据 牛顿 第二
定律 就 可以 得到 物体 施加 的 力 这 就是 人工智能 早期 的 思路 符号 主义 但 这 条路 走 到头 了 很多
问题 人类 实在 是 想不出 怎么 写成 一个 明确 的 函数 从 上帝 视角 看 就是 人类 还是 太菜 了 比如说
一个 简简单单 的 识别 一张 图片 是 母 是 猫 对 人类 来说 可能 简单 到 爆炸 但是 要 让 计算机 运行
一段 程序 来 识别 那 一下子 就 变成 了 一个 史诗 纪 难题 就 连 有着 明确 语法 规则 和 词典 的 翻译 函数 尚且
没有 办法 做到 足够 丝滑 那 更 别说 复杂多变 了 人类 智能 了 既然 不 知道 这个 函数 长 什么样 怎么办 呢 那
就 别 硬 找 了 换个 思路 我们 先 从 一个 简单 的 例子 入手 比如 我们 知道 一些 X 和 Y 的 值 我们 想
找到 Y 和 X 的 函数 关系 你 有 什么 办法 呢 有人 说 这 不 就是 y 等于 2x 吗 傻子 都 能 看 出来 没错 这 就是
符号 主义 的 思想 觉得 世间 万物 都 能 找到 背后 明确 的 规律 但 假如 我们 一 开始 没有 找到 这个
规律 怎么办 呢 比如说 下面 这种 树 就 不能 一眼 看 出来 那 就 用 人类 有史以来 最具 智慧 的 办法 猜 我们 先
把 这个 xy 放到 坐标轴 上先 随便 猜 一下 比如说 还 说 关系 就是 y 等于 x 也 就是 这里 的 w 和 b 分别
是 1 和 0 然后 我们 一点点 调整 这个 W 和 B 使得 这 条 直线 越来越 贴近 真实 数据 最后 发现
完全 吻合 了 行 就 它 了 但 有 的 时候 可能 很难 找到 完全 吻合 的 函数 比如说 这样 一个 数据 那
可 怎么办 呢 没事 那 就 简化 一下 问题 大 差不差 能 近似 就行了 别 要求 那么 多 我们 的 做法 仍然 是 一点一点
调整 W 和 B 看 差不多 的 时候 就 停下来 这 就是 现代 人工智能 的 思路 猜 和 简化 问题 说白了 实际上
就是 累白烂 了 承认 自己 太菜 了 找 不到 精确 的 函数 了 那 就 找 一个 从 结果 上 看 大 差不差 的 函数 然后
联盟 代才 逐渐 逼近 真实 答案 就 好 了 这种 区别 于 早期 人工智能 符号 主义 的 新 思想 叫做 连结
主义 我们 不再 追求 找到 那个 精确 的 函数 关系 而是 通过 简化 函数 并 试图 寻找 一个
足够 接近 真实 答案 的 近似 解 有人 说 这 联盟 带 猜 的 靠 谱 嘛 一 看 就 不是 什么 正 路子 没错 在 连接
主义 成为 主流 之前 很多 人工智能 的 专家 也 是 这么 想 的 但 就是 这样 靠 联盟 带 猜 的 办法 我们
居然 可以 用 很少 的 参数 轻松 实现 手写 数字 识别 这样 的 任务 正是 这种 方式 在 很多 地方
证明 了 它 的 有效性 人们 才 开始 重视 起来 回到 正题 刚刚 我们 举 的 例子 都 比较简单 只用 直线
方程 就 可以 表示 了 但 假如 数据 稍稍 变化 一下 就 会 发现 不论怎么 调整 这里 的 w 和 b 好像 都 无法 接近
真实 的 数据 这个 时候 就 需要 让 这条 直线 弯一弯 了 换句话说 就是 我们 需要 从 原来 的 线性 函数
进化 到 非线性 函数 了 那 我们 就 来 研究 一下 怎么 把 原来 这个 原本 线性 的 函数 变成 非线性 的 呢
很 简单 在 这个 函数 最 外层 再套 一个 非线性 的 运算 就 可以 了 比如 平方 比如 sin 比如 e 这 就是 激活
函数 它 的 目的 就是 把 原本 死气沉沉 的 线性关系 给 盘活 了 变成 了 变化 能力 更强 的 非线性 关系 听到 非线性
关系 的 同学 千万 不要 害怕 常用 的 激活 函数 都 简单 到 爆炸 但是 就是 能 起到 很 好 的 效果 好 了 回到
这个 新 的 函数 形式 我们 之前 仅仅 有 一个 输入 的 变量 就是 x 但 实际上 可能 有 很多 输入 所以
这里 的 每 一个 x 都 要 对应 一个 w 像 这样 再者 有 的 时候 只套 一层 激活 函数 还是 没有 办法 达到 很
好 的 效果 也就是说 这个 曲线 弯 的 还 不够 灵活 那 这要 怎么办 呢 很 简单 我们 把 刚刚 这 一大 坨 当做
一个 整体 在 此基础 之上 再 进行 一次 线性变换 然后 再套 上 一个 激活 函数 这样 就 可以 无限 的 套
滑下去 了 通过 这样 的 方式 我们 就 可以 构造 出 非常 非常复杂 的 线性关系 而且 理论 上 可以 逼近 任意 的
连续函数 当然 了 这样 写 H 实在 是 太阳 人头 大 的 , 普通人 看个 两层 估计 脑袋 就 炸 了 所以 我们
得换 一种 更 傻瓜 的 更 直观 的 形式 那 回到 最初 的 形式 , 我们 把 这样 一个 线性变换 套 一个 激活 函数 , 画成
下面 这样 左边 是 输入 层 只有 一个 输入 X 右边 是 输出 层 只有 一个 输出 Y 我们 把 这里 的 每 一个 小圈圈
叫做 一个 神经元 当然 这里 我 不 建议 你 把 它 跟 生物 的 神经元 先 类比 因为 它们 两个 其实 一毛钱
关系 都 没有 看似 很 形象 但 实际上 反而 会 影响 理解 总之 就是 这样 两个 圈圈 一连 就 表示 上面
一个 函数 关系 刚刚 我们 说 输入 可能 有 多个 所以 对应 的 变化 就是 输入 层 变成 了 多个 像 这样
我们 还 说 可以 继续 在 外层 不断 的 套 线性变换 再套 激活 函数 那么 每套 一层 就 相当于 神经元 水平
方向 又 扩展 了 一个 当然 扩展 之后 呢 中间 这 一层 就 不再 是 最终 的 输出 了 而是 包裹 在 了 一个 很 复杂 的 函数
变换 之中 看不到 我们 管它 叫做 隐藏 层 而 整个 这大 坨 神经元 互相 连接 形成 的 网络结构 就 叫做 神经网络
好 接下来 我们 看 一下 函数 和 神经网络 的 对应 关系 首先 有 两个 输入 变量 一个 是 X1 另 一个 是 X2
它们 构成 了 输入 层 然后 X1 X2 进行 一次 线性变换 再 进行 一次 激活 函数 就 得到 了 隐藏 层 A 这个
A 对应 的 就是 上面 这 一大 坨 表达式 那 我们 把 它 当作 一个 整体 继续 进行 一次 线性变换 和 一次 激活
函数 这 就 计算 出 了 最终 的 输出 层 Y 重新 再 看 一下 这个 过程 从 神经网络 的 这个 图 来看 的话 似乎 就
像是 一个 信号 从左到右 传播 了 过去 这个 过程 就 叫做 神经网络 的 前 向 传播 但 实际上 就是 一点点
分不着 把 一个 函数 的 值 计算出来 了 而已 神经网络 的 每 一层 神经元 都 可以 无限 增加 同时 隐藏 层 的 层数
也 可以 无限 增加 进而 就 可以 构成 一个 非常 非常复杂 的 非线性 函数 了 虽然 这个 函数 可能
非常复杂 但是 我们 的 目标 却 非常简单 和 明确 就是 根据 已知 的 一组 X 和 Y 的 值 猜出 所有 这里 的 W 和
B 都 是 多少 当然 了 我们 一 开始 举 的 例子 非常简单 光靠 肉眼 法 就 能 慢慢 猜 出 答案 了 但是 现在 有 这么 多 参数
可能 就 无法 凭感觉 猜 了 那 这要 怎么办 呢 预知 后事 如何 窃听 下回分解 觉得 好 的话 给 个 三连杯 回顾
一下 , 这个 视频 的 内容 非常简单 我们 从 一个 最 开始 的 信念 函数 开始 讲 起 早期 的 人工智能 相信 可以
找到 精确 的 函数 来 表示 一切 但 因为 这个 世界 实在 太 复杂 了 所以 人们 就 放弃 了 转向 寻找 一个
足够 接近 真实 答案 的 近四解 那 我们 通过 寻找 一个 线性关系 来 举例 如何 去 猜测 W 和 B 的 值 后来
发现 线性关系 太过 简单 不足以 描述 更 复杂 的 关系 于是 引入 了 非线性 的 激活 函数 通过 线性变换 和
非线性 激活 函数 的 不断 组合 和 套拔 可以 表达 很 复杂 的 关系 , 但是 写成 函数 看太 恶心 了 所以
就 化成 了 神经网络 这种 形式 。
恭喜 你 从 函数 到 神经网络 的 这 条路 已经 被 你 搞懂 了 , 剩下 的 所有 乱七八糟 的 知识 都 仅仅 是 为了 算 出
这个 W 和 B 而已 。
Loading video analysis...