×

We use cookies to help make LingQ better. By visiting the site, you agree to our cookie policy.

Sign Up Free
image

小Lin说, 一口气 搞清楚 ChatGPT (1)

一口气 搞清楚 ChatGPT (1)

你们 都 让 我 聊

我 真的 各种 私信 都 快 了

咱 就 聊聊

我 就 图 省事

咱 就 直接 问问 ChatGPT

能 不能 帮 我 写 一个 视频 大纲

你 看 哗哗哗

1234567 就 列出来 了

你 详细 说 一 说

第二 部分

你 看 有 1234 告诉 我

你 来 帮 我 写 一段 脚本

我 连 稿 都 不用 写 了

你 看 他 这 稿 你 也 不能 深究

我 要是 按 他 这个 讲

估计 每 两期 我 这 粉 就 该 掉光 了

不过

咱 先 刨开 它 这个 内容 质量 不 说

你 就 光 看 它 这个 文字 能力

你 问 它 什么

都 能 给 你 对答如流

还 说 得 有模有样 的

反而 是 把 我 给 震撼 到 了

又 是 拿 美国 的 医学 牌照

又 是 参加 司法 考试

又 能 写 小说 编 代码 查 资料

你 就 感觉

只要 能 用 文字 表达 的 事儿

它 全都 能 干

你 说 这 玩意儿

它 怎么 突然 就 横空出世 了

之前 也 有 聊天 机器人 儿

怎么 就 感觉 它 就要 颠覆 世界 了

让 资本 圈儿

好家伙 那个 兴奋

它 又 有 什么 问题 呢

巨头 们 又 如何 应对

它 到底 会 让 谁 失业 呢

小 Lin 虽然 不是 什么

人工智能 方面 的 专家

不过 今天 咱们 就 一起

把 这些 碎片 的 信息 都 给 串 起来

一 起来 聊 一 聊

关于 ChatGPT

你 需要 知道 的 那些 事儿

这个 聊天 机器人 儿

咱们 得 追溯 到 1950年

那 时候 号称 计算机科学 之 父

人工智能 之父 的 艾伦 · 图灵

发表 了 一篇

具有 划时代 意义 的 论文

他 提出 了 一个 很 有 哲理 的

叫做 模仿 游戏

也就是说 咱们 大名鼎鼎 的

那个 图灵 测试

就是说 当 你 在 不 面对面 的 时候

跟 人家 文字 聊天儿

你 能 不能 准确 地 判断 出来

对方 是 一个 人

还是 个 机器人 儿

如果 你 要是 很 难 分辨 出来

那 就 一定 程度 上

可以 说 这个 机器 它 是 智能 的

你 看 这 图灵 测试

是 不 是 又 简单 又 易懂

又 具体 而且 还 挺 有意思 的

所以 就 吸引 了

很多 计算机 方面 的 科学家

来 向 它 发起 冲击

不过 最 开始 的 时候

都 是 一些 非常 简单 的 指令

它 就是 通过 一些 语言 技巧

就是 小聪明

来 尽量 让 你 感觉 到

你 好像 是 在 跟 一个 人 对话

就 比如说 1966年 的 时候

MIT 实验室 里

就 发明 出来 一个 聊天 机器人 儿

叫 Eliza

这 开发者 就 很 聪明

他 给 Eliza 的 设定 是 个 心理 治疗师

你 看 这种 咨询师

一般 不 都 是 少 说话 多 倾听

所以 它 就 可以 问 人家 说

你 有 没 有 什么 想法

人家 布拉 布拉 说 一大 通

然后 它 又 问 说

你 昨天 休息 的 怎么样

人家 又 布拉布拉 说 一大通

它 少 说 就 少 错

所以 就 真的 让 人 误以为

它 在 倾听 然后 跟 你 沟通

而 其实 它 背后 就是 一些

非常简单 的 if...

then...的 代码

比如说 它 一 看到 说 "mother"

妈妈 这个 词 的 时候

它 就 会 跟 你 说

跟 我 说 说 你 的 家庭

就 类似 这种 的 关键词

大概 有 两百 来个

然后 到 了 三十年 之后 的

1995年

Eliza 又 出来 了 一个 后辈 叫 ALICE

它 就 进化 的 已经 很 强大 了

虽然 跟 ChatGPT 还 没法 比

但 就 很 日常 的 一些 对话

它 已经 都 可以 应付 了

不过 本质 上

不管 是 这个 Eliza 还是 ALICE

它 的 原理

都 是 基于 一个 叫做 Pattern Matching

就是 模式 匹配

听到 一个 关键词

它 就 会 调取 一个

已经 预设 好 的 预案

就 比如说 它 听见 你好

你 就 问 人家 说 吃 了 吗

它 听见 妈妈

它 就 说 跟 我 说 你 的 家庭

类似 这种

其实 即使 是 在 现在

一些 购物 网站

银行 什么 的 机器人 儿

它 基于 的

还是 这种 模式

就 比如说 你 跟 它 聊天

你 一 说到 退货

它 就 给 你 发 个 退货 流程

或者 你 一 说 ATM

它 就 给 你 发个 附近 ATM 的 地图

这种 匹配 模式

它 虽然 称不上 是 非常 的 智能

但 确确实实 减少 了 很多 那种

大量 人力 机械性 的 重复 回答

但 咱 就 从 智能 的 角度 讲

你 说 这种 限定 规则 的 机器人 儿

就算 你 的 规则 写 得 再 复杂

预设 再 多

也 不 可能 穷尽 所有 的 答案

它 更 不 可能 去 创造 新 的 答案

所以

你 要 真的 想 通过 那个 图灵 测试

想要 变成 真正 的 智能

单凭 这种 模式 匹配

是 不 可能 实现 的

于是 就 出现 了

语言 学习 里边 一个 新 的 流派

这个 也 是 人工智能 里边

非常 重要 的 一 部分

就是 机器 学习

顾名思义 它 的 基本 理念

就是 让 机器 去 学习

就是说 我 不 给 你 人为 规定

一些 规则 和 回答 了

就 给 你 一大堆 现成 的 例子

让 你 自己 去 学习 找 规律

听着 是不是 就 感觉 厉害 多 了

也 非常 符合

我们 对 学习 这个 逻辑 的 认知

基于 这个 理念

就 到 2001年

就 有 了 一个 叫做 SmarterChild

更 聪明 小孩

这么 个 机器人 就 火 出圈 了

那 为什么 火 呢

首先 它 用 了 一些 机器 学习 里边

当时 比较 先进 的 模型

来 让 聊天 变得 更 自然

而且 2000年 那会儿

不是 兴起 了 一大批 聊天 软件

什么 AOL Windows Yahoo

那个 SmarterChild

就 把 这些 平台 横扫 了 一遍

就 让 全世界 好几亿 人

都 可以 跟 它 对话

不管 你 问 它 什么

你 甭管 它 答得 怎么 样

总能 跟 你 聊上 两句

可以 算是 ChatGPT 的 大 前辈 了

你 说 这么 好玩 的 东西

那 立马 就 风靡 全球

吸引 了 超过 3000万 的 用户

跟 它 对话 聊天

它 每天 光 接收 的 信息

就要 超过 10亿条

被 各种 人 聊骚

直到 2007年 的 时候

它 被 一家 巨头 公司 给 收购 了

你 猜 是 谁

就是 微软

微软 在 那么 早 的 时候

就 已经 开始 觊觎 这个 领域 了

这个 更 聪明 小孩

虽然 已经 很 能 聊 了

但是 离 通过 图灵 测试

还有 很长 的 距离

就 你 跟 它 聊 两句 就 知道

那 就是 个 机器

好 咱们 继续 进步

到 了 2010年 的 时候

机器 学习 里边 的 一个 领域

开始 闪光 了

叫做 人工 神经 网络

ArtificialNeuralNetworks

你 看 我们 人 的 大脑

其实 是 靠

超过 100亿 个 神经元

通过 网状 链接

来 判断 和 传递 信息 的

虽然 这 每个 神经元 都 很 简单

但是 它们 组合 起来

就 可以 判断 非常 复杂 的 信息

所以 这个 人工 神经 网络

其实 就是 想 模拟 人脑 的

这种 形式

输入 信息 之后

就 会 经过 若干个

隐藏 神经 节点 的 判断

就 跟 神经元 似的

然后 给 你 输出 结果

其实 这个 神经网络 的 思想

早就 有 了

可以 追溯

甚至 可以 追溯 到 1960年代

但是 它 需要 两样 东西 做 支撑

大量 的 数据 和 强大 的 算力

而 这些 在 之前 都 是 不 具备 的

所以 这个 神经网络 的 事

就是 纸上 谈兵

到 了 2010年代

那 不 互联网 时代 了 嘛

数据 肯定 是 有 了

算力 呢

也 是 持续 指数 级别 的 提升

才 让 神经网络 这个

开始 能 应用 起来

人们 就 发现

这个 模式 真的 特别 适合 解决

就是 人们 一看 就 知道

就 凭 直觉 那种 事儿

就 比如说 你 看到 一张 脸

你 就 能 迅速 知道 他 是 谁

当然 刘强 东 除外

我 这 人脸 盲

脸盲

脸盲

我 根本 不 知道 她 漂 不 漂亮

你 想 之前 要是 让 电脑

判断 出 这个 人 是 谁

那 简直 太 难 了

但是 你 用 这个 神经网络

机器 学习 就 能 慢慢 摸索 出 规律

现在 它 的 应用 已经 非常 广 了

不光 是 人脸识别

像 声音 识别 自动 驾驶

包括 前 几年

下围棋 打败 柯洁 那个 AlphaGo

都 是 用 这 招 练 出来

所以 说 这个 神经网络

在 刚才 我们 说 那些 领域

都 可以 大展宏图

但 回到 文字 领域

它 发展 就 不 太 顺

那 为什么 呢

因为 这个 机器 学习

它 一般 都 是 用 一种

叫做 循环 神经 网络

就是 RNN 来 处理 文字 的

它 主要 的 方式

就是 按 顺序 一个 词 一个 词 看

一个 词 一个 词 处理

那 问题 就是

它 没法 同时 进行 大量 的 学习

而且 你 这 句子 也 不能 太 长

要不然 你 学到 后面 的 时候

前面 都 忘 了

直到 2017年 的 时候

谷歌 出 了 一篇 论文

提出 来 了 一个 新 的 学习 框架

叫做 Transformer

具体 的 机制 就 比较 复杂 了

那 肯定 也 不是 小 Lin 能 搞 明白 的

但 结果 就是 它 可以 让 机器

同时 学习 大量 的 文字

就 比如 原来 那些 字 你 得 挨个 学

就 跟 电路 串联 似的

现在 你 可以 同时 学

就 跟 并联 似的

这样 一下 那 训练 的 速度 效率

不 就 大大 提高 了

有 了 这个 Transformer

机器 在 文字 学习 方面

那 就 像 打通 了 任督 二 脉

现在 很多 自然语言 处理 模型

其实 都 是 建立 在

它 的 基础架构 之上 的

谷歌 那个 BERT 里头 的 T

包括 ChatGPT 的 T

都 是 指 这个 Transformer

好 你 看

现在 技术 方面

已经 有 非常 强 的 突破

万事 俱备

那 不 就 差 人 和 钱 了 吗

是 时候 是 ChatGPT 登场 了

就 在 2015年

包括 马斯克 彼得 ·蒂尔 在内

几个 大佬 一起 注资 了

10亿 美金

成立 了 一家 非营利 组织 叫 OpenAI

也 就是 ChatGPT 的 母公司

来 进行 AI 方面 的 研究

你 看 它 非盈利

就 说 我 不是 为了 赚钱

我 纯粹 是 为了

推动 这项 技术 的 发展

所以 它 的 研究成果 包括 专利

都 是 对外 公开 的

你 看 这个 投资人 里

咱们 是不是 听到 了

大家 都 非常 熟悉 的 马斯克

实际上 他 逐渐 发现

他 的 特斯拉 在 AI 方面

也 需要 大量 的 投入 研究

搞 自动 驾驶 什么 的

所以 就 为了 避免 特斯拉 跟 OpenAI

这 两家 公司 的 利益 冲突

他 就 在 2018年

也就是 OpenAI 成立 的 第三年

退出 了 董事会 就 拜拜 不 玩 了

所以 现在 这个 OpenAI

其实 跟 马斯克 已经 关系 不大 了

拜拜

而 OpenAI 这些 大牛们

也 确实 很 厉害

2017年

谷歌 不是 推出 了 那个 Transformer

他们 就 立马 在 这个 基础 上

研究 学习

2018年 发表 了 一篇 论文

介绍 了 一个 新 的 语言 学习 模型

之前 的 语言 学习 模型

它 基本 都 是 需要 人 去 监督

或者 人为 给 它 设定 一些 标签

但是 那个 GPT

就 基本 不怎么 需要 了

你 就 把 一堆 数据 放 进去

他 就 一顿 学 就 给 学 明白 了

反正 大概 就 这个 意思

OpenAI 就 在 2018年 6月

推出 了 第一代 GPT

接着 在 2019年 11月

又 增加 了 训练 的 数据量

推出 了 GPT-2

就 这种 机器 学习

它 其实 主要 就 拼 两件 事儿

一个 是 模型 一个 是 参 数量

模型 就是 决定 了 机器 怎么 学

同样 的 数据 我 进去

我 学 得 比 谁 都 快 比 谁 都 好

那 你 就 厉害

而 参 数量

它 其实 就 需要 大量 的 计算

所以 说白了 就是 要 砸 钱

就算 是 模型 再 好

它 也 得 靠 砸 钱 去 训练 和 验证

这 两者 缺一不可

OpenAI 团队

对 我 这个 模型 是 很 有 信心

那 下 一步 不 就 缺钱 了 吗

而 你 每 进步 一点

都 可能 需要

上升 一个 数量级 的 数据 去 支撑

那 这些

都 是 需要 真 金白银 去 支持 的

你 就 比如说 Google 那个 DeepMind

就是 研究 出来 AlphaGo 的 那个 公司

它 每年 开销 就 四五亿 美元

最 开始 OpenAI 这边

我们 不 说 投 了 10亿美元

那 根本 不够 花

注意

这时候 它 还是 个 非营利 组织

马斯克 也 退出 了 大腿 不在 了

之前 10亿美元 情怀 不够 了

我 上 哪 再 找 那么 多 情怀 去 是 吧

所以 迫于 资金 压力

OpenAI就 在 2019年

从 非营利 组织 转型 了

但是

它 没有 直接 变成 一个 盈利 组织

还是 得 要点 情怀

而是 变成 了 一个

叫做 收益 封顶 的 盈利 组织

它 什么 意思 呢

就是说 任何 投资人 的 投资 回报

都 不能 超过 100倍

超过 100倍 的 部分

投资人 就 拿不到 回报 了

就 都 归 OpenAI 自己 了

但是 我 就 好奇

Learn languages from TV shows, movies, news, articles and more! Try LingQ for FREE