×

We use cookies to help make LingQ better. By visiting the site, you agree to our cookie policy.


image

小Lin说, 一口气 搞清楚 ChatGPT (1)

一口气 搞清楚 ChatGPT (1)

你们 都 让 我 聊

我 真的 各种 私信 都 快 了

咱 就 聊聊

我 就 图 省事

咱 就 直接 问问 ChatGPT

能 不能 帮 我 写 一个 视频 大纲

你 看 哗哗哗

1234567就 列出来 了

你 详细 说一说

第二 部分

你 看 有 1234告诉 我

你 来 帮 我 写 一段 脚本

我连稿 都 不用 写 了

你 看 他 这稿 你 也 不能 深究

我 要是 按 他 这个 讲

估计 每 两期 我 这粉 就 该 掉 光 了

不过

咱先 刨开 它 这个 内容 质量 不说

你 就 光 看 它 这个 文字 能力

你 问 它 什么

都 能 给 你 对答如流

还 说 得 有模有样 的

反而 是 把 我 给 震撼 到 了

又 是 拿 美国 的 医学 牌照

又 是 参加 司法考试

又 能 写 小说 编 代码 查资料

你 就 感觉

只要 能 用 文字 表达 的 事儿

它 全都 能干

你 说 这 玩意儿

它 怎么 突然 就 横空出世 了

之前 也 有 聊天 机器人 儿

怎么 就 感觉 它 就要 颠覆 世界 了

让 资本 圈儿

好家伙 那个 兴奋

它 又 有 什么 问题 呢

巨头 们 又 如何 应对

它 到底 会 让 谁 失业 呢

小 Lin 虽然 不是 什么

人工智能 方面 的 专家

不过 今天 咱们 就 一起

把 这些 碎片 的 信息 都 给 串 起来

一 起来 聊一聊

关于 ChatGPT

你 需要 知道 的 那些 事儿

这个 聊天 机器人 儿

咱们 得 追溯到 1950年

那 时候 号称 计算机科学 之 父

人工智能 之父 的 艾伦 ·图灵

发表 了 一篇

具有 划时代 意义 的 论文

他 提出 了 一个 很 有 哲理 的

叫做 模仿 游戏

也就是说 咱们 大名鼎鼎 的

那个 图灵 测试

就是说 当 你 在 不 面对面 的 时候

跟 人家 文字 聊天儿

你 能 不能 准确 地 判断 出来

对方 是 一个 人

还是 个 机器人 儿

如果 你 要是 很难 分辨 出来

那 就 一定 程度 上

可以 说 这个 机器 它 是 智能 的

你 看 这 图灵 测试

是不是 又 简单 又 易懂

又 具体 而且 还 挺 有意思 的

所以 就 吸引 了

很多 计算机 方面 的 科学家

来 向 它 发起 冲击

不过 最 开始 的 时候

都 是 一些 非常简单 的 指令

它 就是 通过 一些 语言 技巧

就是 小聪明

来 尽量 让 你 感觉 到

你 好像 是 在 跟 一个 人 对话

就 比如说 1966年 的 时候

MIT 实验室 里

就 发明 出来 一个 聊天 机器人 儿

叫 Eliza

这 开发者 就 很 聪明

他 给 Eliza 的 设定 是 个 心理 治疗师

你 看 这种 咨询师

一般 不 都 是 少 说话 多 倾听

所以 它 就 可以 问 人家 说

你 有没有 什么 想法

人家 布拉 布拉 说 一大 通

然后 它 又 问 说

你 昨天 休息 的 怎么样

人家 又 布拉 布拉 说 一大 通

它少 说 就 少错

所以 就 真的 让 人 误以为

它 在 倾听 然后 跟 你 沟通

而 其实 它 背后 就是 一些

非常简单 的 if...

then... 的 代码

比如说 它 一 看到 说"mother"

妈妈 这个 词 的 时候

它 就 会 跟 你 说

跟 我 说 说 你 的 家庭

就 类似 这种 的 关键词

大概 有 两百 来个

然后 到 了 三十年 之后 的

1995年

Eliza 又 出来 了 一个 后辈 叫 ALICE

它 就 进化 的 已经 很 强大 了

虽然 跟 ChatGPT 还 没法 比

但 就 很 日常 的 一些 对话

它 已经 都 可以 应付 了

不过 本质 上

不管 是 这个 Eliza 还是 ALICE

它 的 原理

都 是 基于 一个 叫做 Pattern Matching

就是 模式匹配

听到 一个 关键词

它 就 会 调取 一个

已经 预设 好 的 预案

就 比如说 它 听见 你好

你 就 问 人家 说 吃 了 吗

它 听见 妈妈

它 就 说 跟 我 说 你 的 家庭

类似 这种

其实 即使 是 在 现在

一些 购物 网站

银行 什么 的 机器人 儿

它 基于 的

还是 这种 模式

就 比如说 你 跟 它 聊天

你 一说到 退货

它 就 给 你 发个 退货 流程

或者 你 一 说 ATM

它 就 给 你 发个 附近 ATM 的 地图

这种 匹配 模式

它 虽然 称不上 是 非常 的 智能

但 确确实实 减少 了 很多 那种

大量 人力 机械性 的 重复 回答

但 咱 就 从 智能 的 角度 讲

你 说 这种 限定 规则 的 机器人 儿

就算 你 的 规则 写 得 再 复杂

预设 再 多

也 不 可能 穷尽 所有 的 答案

它 更 不 可能 去 创造 新 的 答案

所以

你 要 真的 想 通过 那个 图灵 测试

想要 变成 真正 的 智能

单凭 这种 模式匹配

是 不 可能 实现 的

于是 就 出现 了

语言 学习 里边 一个 新 的 流派

这个 也 是 人工智能 里边

非常 重要 的 一部分

就是 机器 学习

顾名思义 它 的 基本 理念

就是 让 机器 去 学习

就是说 我 不 给 你 人为 规定

一些 规则 和 回答 了

就 给 你 一大堆 现成 的 例子

让 你 自己 去 学习 找 规律

听 着 是不是 就 感觉 厉害 多 了

也 非常 符合

我们 对 学习 这个 逻辑 的 认知

基于 这个 理念

就 到 2001年

就 有 了 一个 叫做 SmarterChild

更 聪明 小孩

这么 个 机器人 就 火 出圈 了

那 为什么 火 呢

首先 它 用 了 一些 机器 学习 里边

当时 比较 先进 的 模型

来 让 聊天 变得 更 自然

而且 2000年 那会儿

不是 兴起 了 一大批 聊天 软件

什么 AOL Windows Yahoo

那个 SmarterChild

就 把 这些 平台 横扫 了 一遍

就让 全世界 好几亿 人

都 可以 跟 它 对话

不管 你 问 它 什么

你 甭管 它 答得 怎么样

总能 跟 你 聊 上 两句

可以 算是 ChatGPT 的 大 前辈 了

你 说 这么 好玩 的 东西

那 立马 就 风靡 全球

吸引 了 超过 3000万 的 用户

跟 它 对话 聊天

它 每天 光 接收 的 信息

就要 超过 10亿条

被 各种 人聊骚

直到 2007年 的 时候

它 被 一家 巨头 公司 给 收购 了

你 猜 是 谁

就是 微软

微软 在 那么 早 的 时候

就 已经 开始 觊觎 这个 领域 了

这个 更 聪明 小孩

虽然 已经 很能 聊 了

但是 离 通过 图灵 测试

还有 很长 的 距离

就 你 跟 它 聊 两句 就 知道

那 就是 个 机器

好 咱们 继续 进步

到 了 2010年 的 时候

机器 学习 里边 的 一个 领域

开始 闪光 了

叫做 人工神经网络

Artificial Neural Networks

你 看 我们 人 的 大脑

其实 是 靠

超过 100亿个 神经元

通过 网状 链接

来 判断 和 传递信息 的

虽然 这 每个 神经元 都 很 简单

但是 它们 组合 起来

就 可以 判断 非常复杂 的 信息

所以 这个 人工神经网络

其实 就是 想 模拟 人脑 的

这种 形式

输入 信息 之后

就 会 经过 若干个

隐藏 神经 节点 的 判断

就 跟 神经元 似的

然后 给 你 输出 结果

其实 这个 神经网络 的 思想

早就 有 了

可以 追溯

甚至 可以 追溯到 1960年代

但是 它 需要 两样 东西 做 支撑

大量 的 数据 和 强大 的 算力

而 这些 在 之前 都 是 不 具备 的

所以 这个 神经网络 的 事

就是 纸上谈兵

到 了 2010年代

那 不 互联网 时代 了 嘛

数据 肯定 是 有 了

算力 呢

也 是 持续 指数 级别 的 提升

才 让 神经网络 这个

开始 能 应用 起来

人们 就 发现

这个 模式 真的 特别 适合 解决

就是 人们 一看 就 知道

就 凭直觉 那种 事儿

就 比如说 你 看到 一张 脸

你 就 能 迅速 知道 他 是 谁

当然 刘强 东 除外

我 这 人脸 盲

脸盲

脸盲

我 根本 不 知道 她 漂 不 漂亮

你 想 之前 要是 让 电脑

判断 出 这个 人 是 谁

那 简直 太难 了

但是 你 用 这个 神经网络

机器 学习 就 能 慢慢 摸索 出 规律

现在 它 的 应用 已经 非常 广了

不光 是 人脸识别

像 声音 识别 自动 驾驶

包括 前 几年

下围棋 打败 柯洁 那个 AlphaGo

都 是 用 这 招练 出来

所以 说 这个 神经网络

在 刚才 我们 说 那些 领域

都 可以 大展宏图

但 回到 文字 领域

它 发展 就 不 太顺

那 为什么 呢

因为 这个 机器 学习

它 一般 都 是 用 一种

叫做 循环 神经网络

就是 RNN 来 处理 文字 的

它 主要 的 方式

就是 按 顺序 一个 词 一个 词看

一个 词 一个 词 处理

那 问题 就是

它 没法 同时 进行 大量 的 学习

而且 你 这 句子 也 不能 太 长

要不然 你 学到 后面 的 时候

前面 都 忘 了

直到 2017年 的 时候

谷歌 出 了 一篇 论文

提出 来 了 一个 新 的 学习 框架

叫做 Transformer

具体 的 机制 就 比较复杂 了

那 肯定 也 不是 小 Lin 能 搞 明白 的

但 结果 就是 它 可以 让 机器

同时 学习 大量 的 文字

就 比如 原来 那些 字 你 得 挨个 学

就 跟 电路 串联 似的

现在 你 可以 同时 学

就 跟 并联 似的

这样 一下 那 训练 的 速度 效率

不 就 大大提高 了

有 了 这个 Transformer

机器 在 文字 学习 方面

那 就 像 打通 了 任督 二脉

现在 很多 自然语言 处理 模型

其实 都 是 建立 在

它 的 基础架构 之上 的

谷歌 那个 BERT 里头 的T

包括 ChatGPT 的 T

都 是 指 这个 Transformer

好 你 看

现在 技术 方面

已经 有 非常 强 的 突破

万事俱备

那不就 差人 和 钱 了 吗

是 时候 是 ChatGPT 登场 了

就 在 2015年

包括 马斯克 彼得 ·蒂尔 在内

几个 大佬 一起 注资 了

10亿美金

成立 了 一家 非营利 组织 叫 OpenAI

也 就是 ChatGPT 的 母公司

来 进行 AI 方面 的 研究

你 看 它 非盈利

就 说 我 不是 为了 赚钱

我 纯粹 是 为了

推动 这项 技术 的 发展

所以 它 的 研究成果 包括 专利

都 是 对外 公开 的

你 看 这个 投资人 里

咱们 是不是 听到 了

大家 都 非常 熟悉 的 马斯克

实际上 他 逐渐 发现

他 的 特斯拉 在 AI 方面

也 需要 大量 的 投入 研究

搞 自动 驾驶 什么 的

所以 就 为了 避免 特斯拉 跟 OpenAI

这 两家 公司 的 利益冲突

他 就 在 2018年

也 就是 OpenAI 成立 的 第三年

退出 了 董事会 就 拜拜 不玩 了

所以 现在 这个 OpenAI

其实 跟 马斯克 已经 关系不大 了

拜拜

而 OpenAI 这些 大牛们

也 确实 很 厉害

2017年

谷歌 不是 推出 了 那个 Transformer

他们 就 立马 在 这个 基础 上

研究 学习

2018年 发表 了 一篇 论文

介绍 了 一个 新 的 语言 学习 模型

之前 的 语言 学习 模型

它 基本 都 是 需要 人去 监督

或者 人为 给 它 设定 一些 标签

但是 那个 GPT

就 基本 不怎么 需要 了

你 就 把 一堆 数据 放进去

他 就 一顿 学 就 给 学 明白 了

反正 大概 就 这个 意思

OpenAI 就 在 2018年 6月

推出 了 第一代 GPT

接着 在 2019年 11月

又 增加 了 训练 的 数据量

推出 了 GPT-2

就 这种 机器 学习

它 其实 主要 就 拼 两件 事儿

一个 是 模型 一个 是 参 数量

模型 就是 决定 了 机器 怎么 学

同样 的 数据 我 进去

我学得 比 谁 都 快 比 谁 都 好

那 你 就 厉害

而 参 数量

它 其实 就 需要 大量 的 计算

所以 说白了 就是 要 砸 钱

就算 是 模型 再 好

它 也 得 靠 砸 钱 去 训练 和 验证

这 两者 缺一不可

OpenAI 团队

对 我 这个 模型 是 很 有 信心

那下 一步 不 就 缺钱 了 吗

而 你 每 进步 一点

都 可能 需要

上升 一个 数量级 的 数据 去 支撑

那 这些

都 是 需要 真 金白银 去 支持 的

你 就 比如说 Google 那个 DeepMind

就是 研究 出来 AlphaGo 的 那个 公司

它 每年 开销 就 四五 亿美元

最 开始 OpenAI 这边

我们 不 说 投 了 10亿美元

那 根本 不够 花

注意

这时候 它 还是 个 非营利 组织

马斯克 也 退出 了 大腿 不在 了

之前 10亿美元 情怀 不够 了

我 上 哪 再 找 那么 多 情怀 去 是 吧

所以 迫于 资金 压力

OpenAI 就 在 2019年

从 非营利 组织 转型 了

但是

它 没有 直接 变成 一个 盈利 组织

还是 得 要点 情怀

而是 变成 了 一个

叫做 收益 封顶 的 盈利 组织

它 什么 意思 呢

就是说 任何 投资人 的 投资 回报

都 不能 超过 100倍

超过 100倍 的 部分

投资人 就 拿 不到 回报 了

就 都 归 OpenAI 自己 了

但是 我 就 好奇


一口气 搞清楚 ChatGPT (1) Find out ChatGPT in one go (1) ChatGPT de una vez (1) Faire connaissance avec ChatGPT en une seule fois (1) ChatGPTを一気に知る (1) 한 번에 ChatGPT 알아보기 (1) Descubra o ChatGPT de uma só vez (1) Знакомство с ChatGPT за один раз (1)

你们 都 让 我 聊 you all let me talk 너희들 모두 내가 말하게 해줘 todos vocês me deixem falar 你們都讓我聊

我 真的 各种 私信 都 快 了 I really have all kinds of private messages. Je suis vraiment, vraiment, vraiment, vraiment, vraiment, vraiment, vraiment, vraiment proche. 個人的なメッセージは、本当に、本当に、全てに寄り添います。 나는 정말로 모든 종류의 개인 메시지를 가지고 있습니다. Eu realmente tenho todos os tipos de mensagens privadas. 我真的各種私信都快yu了

咱 就 聊聊 let's chat vamos conversar 咱就聊聊

我 就 图 省事 I just try to save trouble 時間短縮のため 난 그냥 문제를 저장하려고 Eu apenas tento evitar problemas 我就圖省事

咱 就 直接 问问 ChatGPT Let's just ask ChatGPT directly Vamos apenas perguntar diretamente ao ChatGPT 咱就直接問問ChatGPT

能 不能 帮 我 写 一个 视频 大纲 can you write a video outline for me ビデオのアウトラインを書くのを手伝ってもらえますか? 能不能幫我寫一個視頻大綱

你 看 哗哗哗 you see boom 見てください、見てください、見てください! 你看嘩嘩嘩

1234567就 列出来 了 1234567 is listed here 1234567就列出來了

你 详细 说一说 You tell us more about it 你詳細說一說

第二 部分 Part II 第二部分

你 看 有 1234告诉 我 You see, 1234 told me 你看有1234告訴我

你 来 帮 我 写 一段 脚本 You help me write a script 你來幫我寫一段腳本

我连稿 都 不用 写 了 I don't even have to write a manuscript 원고를 쓰지 않아도 我連稿都不用寫了

你 看 他 这稿 你 也 不能 深究 Look at his draft and you can't delve into it. 你看他這稿你也不能深究

我 要是 按 他 这个 讲 If I follow him 내가 그의 말을 따른다면 我要是按他這個講

估计 每 两期 我 这粉 就 该 掉 光 了 I think every two issues I should lose all my fans 2号ごとにファンがいなくなりそうな気がします。 두 이슈마다 팬을 모두 잃게 될 것으로 추정된다. 估計每兩期我這粉就該掉光了

不过 However 不過

咱先 刨开 它 这个 内容 质量 不说 Let's put aside its content and quality コンテンツの質の話は置いといて 먼저 파헤쳐 보자 콘텐츠의 품질에 대해 이야기하지 말자 咱先刨開它這個內容質量不說

你 就 光 看 它 这个 文字 能力 You just look at it, the text, the ability to 你就光看它這個文字能力

你 问 它 什么 You ask it what 당신은 무엇을 물어 你問它什麼

都 能 给 你 对答如流 You'll be able to get the answers right 都能給你對答如流

还 说 得 有模有样 的 And you can say it in a good way 꽤 멋지다 還說得有模有樣的

反而 是 把 我 给 震撼 到 了 On the contrary, I was shocked 오히려 충격을 주었다 反而是把我給震撼到了

又 是 拿 美国 的 医学 牌照 Another medical license from the United States もう一つの米国医療ライセンス 미국의 또 다른 의료 면허증 又是拿美國的醫學牌照

又 是 参加 司法考试 Yes, again, to take the judicial exam はいもう一度司法試験を受けてください 又是參加司法考試

又 能 写 小说 编 代码 查资料 You can also write novels, code, and look up information. 소설 쓰기, 코드 컴파일, 정보 확인 가능 又能寫小說編代碼查資料

你 就 感觉 You just feel 你就感覺

只要 能 用 文字 表达 的 事儿 As long as it can be expressed in words 말로 표현할 수 있는 모든 것 只要能用文字表達的事兒

它 全都 能干 It's all... capable. 그것은 모든 것을 할 수 있습니다 它全都能幹

你 说 这 玩意儿 You said that this playful 당신은 이것을 말한다 你說這玩意兒

它 怎么 突然 就 横空出世 了 Why did it suddenly appear out of nowhere? なぜ突然現れたのでしょうか? 它怎麼突然就橫空出世了

之前 也 有 聊天 机器人 儿 There were chatbots before 之前也有聊天機器人兒

怎么 就 感觉 它 就要 颠覆 世界 了 Why does it feel like it's about to turn the world upside down? 怎麼就感覺它就要顛覆世界了

让 资本 圈儿 Let Capital Circle 讓資本圈兒

好家伙 那个 兴奋 Good man, that, excited 好傢伙那個興奮

它 又 有 什么 问题 呢 What's wrong with it? 它又有什麼問題呢

巨头 们 又 如何 应对 What are the giants doing about it? 巨頭們又如何應對

它 到底 会 让 谁 失业 呢 Who does it put out of work? 它到底會讓誰失業呢

小 Lin 虽然 不是 什么 小Lin雖然不是什麼

人工智能 方面 的 专家 人工智能方面的專家

不过 今天 咱们 就 一起 不過今天咱們就一起

把 这些 碎片 的 信息 都 给 串 起来 これらの情報を結びつけて 把這些碎片的信息都給串起來

一 起来 聊一聊 채팅하자 一起來聊一聊

关于 ChatGPT 關於ChatGPT

你 需要 知道 的 那些 事儿 你需要知道的那些事兒

这个 聊天 机器人 儿 這個聊天機器人兒

咱们 得 追溯到 1950年 咱們得追溯到1950年

那 时候 号称 计算机科学 之 父 那時候號稱計算機科學之父

人工智能 之父 的 艾伦 ·图灵 アラン・チューリング、人工知能の父 人工智能之父的艾倫·圖靈

发表 了 一篇 發表了一篇

具有 划时代 意义 的 论文 画期的な論文 획기적인 논문 具有劃時代意義的論文

他 提出 了 一个 很 有 哲理 的 He proposed a very philosophical 他提出了一個很有哲理的

叫做 模仿 游戏 Called imitation games 叫做模仿遊戲

也就是说 咱们 大名鼎鼎 的 In other words, our famous 也就是說咱們大名鼎鼎的

那个 图灵 测试 The Turing test. 那個圖靈測試

就是说 当 你 在 不 面对面 的 时候 That is, when you are not face to face 就是說當你在不面對面的時候

跟 人家 文字 聊天儿 Chat with people in text 跟人家文字聊天兒

你 能 不能 准确 地 判断 出来 Can you accurately determine 你能不能準確地判斷出來

对方 是 一个 人 The other party is a person 對方是一個人

还是 个 机器人 儿 Still a robot 還是個機器人兒

如果 你 要是 很难 分辨 出来 If you... if it's hard to tell... 如果你要是很難分辨出來

那 就 一定 程度 上 Then, to a certain extent 那就一定程度上

可以 说 这个 机器 它 是 智能 的 We can say that this machine is intelligent. 可以說這個機器它是智能的

你 看 这 图灵 测试 You see, this Turing test 你看這圖靈測試

是不是 又 简单 又 易懂 Isn't it simple and easy to understand? 是不是又簡單又易懂

又 具体 而且 还 挺 有意思 的 It's specific and also interesting. 又具體而且還挺有意思的

所以 就 吸引 了 So, it attracts 그래서 매력 所以就吸引了

很多 计算机 方面 的 科学家 Many scientists in computer science 很多計算機方面的科學家

来 向 它 发起 冲击 to launch an attack on it Allez, on y va. 來向它發起衝擊

不过 最 开始 的 时候 But at the very beginning 不過最開始的時候

都 是 一些 非常简单 的 指令 are some very simple commands 都是一些非常簡單的指令

它 就是 通过 一些 语言 技巧 It is, through some linguistic techniques 약간의 언어 트릭을 통해 它就是通過一些語言技巧

就是 小聪明 That's right, smartass. 똑똑하다 就是小聰明

来 尽量 让 你 感觉 到 to try to make you feel 당신이 느끼게하려고 來盡量讓你感覺到

你 好像 是 在 跟 一个 人 对话 It's like you're talking to a person. 你好像是在跟一個人對話

就 比如说 1966年 的 时候 For example, in 1966. 就比如說1966年的時候

MIT 实验室 里 In the MIT lab MIT實驗室裡

就 发明 出来 一个 聊天 机器人 儿 I invented a chatbot. 就發明出來一個聊天機器人兒

叫 Eliza Call Eliza 叫Eliza

这 开发者 就 很 聪明 This developer is very smart. 這開發者就很聰明

他 给 Eliza 的 设定 是 个 心理 治疗师 He set Eliza up as a psychotherapist. 他給Eliza的設定是個心理治療師

你 看 这种 咨询师 You see, this kind of counselor 你看這種諮詢師

一般 不 都 是 少 说话 多 倾听 Generally, no, less talking, more listening 一般不都是少說話多傾聽

所以 它 就 可以 问 人家 说 So it can ask people and say 所以它就可以問人家說

你 有没有 什么 想法 Do you have any ideas? 你有沒有什麼想法

人家 布拉 布拉 说 一大 通 People in Bula Bula said a big pass ブラブラの人はよく言う 브라블라는 많이 말했다 人家布拉布拉說一大通

然后 它 又 问 说 Then it asked again, saying 然後它又問說

你 昨天 休息 的 怎么样 How was your rest yesterday? 你昨天休息的怎麼樣

人家 又 布拉 布拉 说 一大 通 The person also said a lot of Bra Bra 人家又布拉布拉說一大通

它少 说 就 少错 It says less, it's less wrong. 言うことが少なく、間違いが少ない 它少說就少錯

所以 就 真的 让 人 误以为 So, it really makes people think that 所以就真的讓人誤以為

它 在 倾听 然后 跟 你 沟通 It's listening, and then it's communicating with you. 它在傾聽然後跟你溝通

而 其实 它 背后 就是 一些 And in fact, behind it is something 사실 그 뒤에는 몇 가지가 있습니다. 而其實它背後就是一些

非常简单 的 if... Very simple if... 非常簡單的if...

then... 的 代码 then... The code then... 的代碼

比如说 它 一 看到 说"mother" 比如說它一看到說"mother"

妈妈 这个 词 的 时候 When the word "mom" is used 媽媽這個詞的時候

它 就 会 跟 你 说 It will say to you 它就會跟你說

跟 我 说 说 你 的 家庭 Tell me about your family 跟我說說你的家庭

就 类似 这种 的 关键词 Similar to this keyword このキーワードと似たようなもの 이와 같은 키워드 就類似這種的關鍵詞

大概 有 两百 来个 About 200 or so. 약 200 大概有兩百來個

然后 到 了 三十年 之后 的 Then, thirty years later, the 然後到了三十年之後的

1995年 1995 1995年

Eliza 又 出来 了 一个 后辈 叫 ALICE Eliza, there's a new offspring called ALICE. Eliza又出來了一個後輩叫ALICE

它 就 进化 的 已经 很 强大 了 It's already evolved and powerful. 它就進化的已經很強大了

虽然 跟 ChatGPT 还 没法 比 Although it is not comparable to ChatGPT 여전히 ChatGPT와 비교할 수 없지만 雖然跟ChatGPT還沒法比

但 就 很 日常 的 一些 对话 But for some very everyday conversations 但就很日常的一些對話

它 已经 都 可以 应付 了 It can already handle it. 它已經都可以應付了

不过 本质 上 But essentially 하지만 본질적으로 不過本質上

不管 是 这个 Eliza 还是 ALICE 不管是這個Eliza還是ALICE

它 的 原理 Its Principle 它的原理

都 是 基于 一个 叫做 Pattern Matching are all based on a pattern matching 都是基於一個叫做Pattern Matching

就是 模式匹配 就是模式匹配

听到 一个 关键词 聽到一個關鍵詞

它 就 会 调取 一个 그것은 전화 할 것입니다 它就會調取一個

已经 预设 好 的 预案 プリプログラム 已經預設好的預案

就 比如说 它 听见 你好 ただ、言う、それは、聞く、こんにちはのようなものです。 就比如說它聽見你好

你 就 问 人家 说 吃 了 吗 你就問人家說吃了嗎

它 听见 妈妈 它聽見媽媽

它 就 说 跟 我 说 你 的 家庭 It just said, "Tell me about your family. ただ、「あなたの家族のことを教えてください」と書かれていました。 它就說跟我說你的家庭

类似 这种 類似這種

其实 即使 是 在 现在 In fact, even in the present 其實即使是在現在

一些 购物 网站 一些購物網站

银行 什么 的 机器人 儿 Bank what of the robot child 은행 로봇 銀行什麼的機器人兒

它 基于 的 그것은 기반 它基於的

还是 这种 模式 還是這種模式

就 比如说 你 跟 它 聊天 就比如說你跟它聊天

你 一说到 退货 When you talk about returning a product 你一說到退貨

它 就 给 你 发个 退货 流程 It just sends you a return process. 返品手続きを送るだけです。 它就給你發個退貨流程

或者 你 一 说 ATM Or, if you say ATM 或者你一說ATM

它 就 给 你 发个 附近 ATM 的 地图 It just sends you a map of nearby ATMs. 它就給你發個附近ATM的地圖

这种 匹配 模式 This matching pattern 這種匹配模式

它 虽然 称不上 是 非常 的 智能 It is not very smart, though. Il n'est cependant pas très intelligent. 它雖然稱不上是非常的智能

但 确确实实 减少 了 很多 那种 But it's true that there's a lot less of that 但確確實實減少了很多那種

大量 人力 机械性 的 重复 回答 Large amount of manpower Mechanical repetition of answers 많은 인력과 기계적인 반복 답변 大量人力機械性的重複回答

但 咱 就 从 智能 的 角度 讲 But let's look at it from a smart perspective 그러나 지능의 관점에서 이야기합시다 但咱就從智能的角度講

你 说 这种 限定 规则 的 机器人 儿 You said that this limited rules of the robot child 你說這種限定規則的機器人兒

就算 你 的 规则 写 得 再 复杂 Even if your rules are written in a complicated way 규칙이 아무리 복잡해도 就算你的規則寫得再复雜

预设 再 多 Preset More 預設再多

也 不 可能 穷尽 所有 的 答案 It is impossible to exhaust all the answers. すべての答えを出し尽くすことは不可能である 모든 답변을 소진하는 것은 불가능합니다 也不可能窮盡所有的答案

它 更 不 可能 去 创造 新 的 答案 It is even less likely to create new answers 新しい答えを生み出す可能性はさらに低くなります 它更不可能去創造新的答案

所以 So 所以

你 要 真的 想 通过 那个 图灵 测试 You really want to pass that Turing test. 당신은 정말로 튜링 테스트를 통과하고 싶습니다 你要真的想通過那個圖靈測試

想要 变成 真正 的 智能 Want to become truly intelligent 真の知性を身につけたい 想要變成真正的智能

单凭 这种 模式匹配 Based on this pattern matching alone このパターンマッチだけをもとに 이 패턴 매치만 單憑這種模式匹配

是 不 可能 实现 的 It is impossible to achieve 是不可能實現的

于是 就 出现 了 And so, there it is. 於是就出現了

语言 学习 里边 一个 新 的 流派 A new genre in language learning 語言學習裡邊一個新的流派

这个 也 是 人工智能 里边 This is also an artificial intelligence. 這個也是人工智能裡邊

非常 重要 的 一部分 A very important part 非常重要的一部分

就是 机器 学习 That is, machine learning 就是機器學習

顾名思义 它 的 基本 理念 As the name implies, its basic philosophy 顧名思義它的基本理念

就是 让 机器 去 学习 It's all about letting the machine learn. 機械に学習させることが重要なのです。 就是讓機器去學習

就是说 我 不 给 你 人为 规定 That means I don't give you artificial rules. 就是說我不給你人為規定

一些 规则 和 回答 了 Some rules and answers were 一些規則和回答了

就 给 你 一大堆 现成 的 例子 I'll give you a bunch of ready-made examples 既成の例をたくさんあげるだけで 就給你一大堆現成的例子

让 你 自己 去 学习 找 规律 Let you learn to find the rules yourself 讓你自己去學習找規律

听 着 是不是 就 感觉 厉害 多 了 Does that make you feel more powerful? より強くなった気がしませんか? 聽著是不是就感覺厲害多了

也 非常 符合 Also very consistent with 也非常符合

我们 对 学习 这个 逻辑 的 认知 Our perception of the logic of learning 我們對學習這個邏輯的認知

基于 这个 理念 Based on this concept 基於這個理念

就 到 2001年 就到2001年

就 有 了 一个 叫做 SmarterChild 就有了一個叫做SmarterChild

更 聪明 小孩 Smarter Kids 更聰明小孩

这么 个 机器人 就 火 出圈 了 Such a robot on the fire out of the circle そんなロボットが燃えている! 이 로봇은 불타고 있다 這麼個機器人就火出圈了

那 为什么 火 呢 Then why fire? では、なぜ炎上したのでしょうか? 那為什麼火呢

首先 它 用 了 一些 机器 学习 里边 First of all, it uses some machine learning inside 首先它用了一些機器學習裡邊

当时 比较 先进 的 模型 More advanced models at the time 当時の先進的なモデル 當時比較先進的模型

来 让 聊天 变得 更 自然 to make chatting more natural 來讓聊天變得更自然

而且 2000年 那会儿 And, in 2000, when 而且2000年那會兒

不是 兴起 了 一大批 聊天 软件 No, there is a large number of chat software いや、チャットソフトがいっぱい出てきましたね。 不是興起了一大批聊天軟件

什么 AOL Windows Yahoo What AOL Windows Yahoo 什麼AOL Windows Yahoo

那个 SmarterChild The SmarterChild 那個Smart Child

就 把 这些 平台 横扫 了 一遍 Just sweep through these platforms プラットフォームで掃くだけ 就把這些平台橫掃了一遍

就让 全世界 好几亿 人 For hundreds of millions of people around the world 就讓全世界好幾億人

都 可以 跟 它 对话 You can talk to it. 話しかけることができる。 都可以跟它對話

不管 你 问 它 什么 Whatever you ask it what What you ask it What 不管你問它什麼

你 甭管 它 答得 怎么样 You don't care how well it answers 你甭管它答得怎麼樣

总能 跟 你 聊 上 两句 I can always have a conversation with you いつでもおしゃべりができる 總能跟你聊上兩句

可以 算是 ChatGPT 的 大 前辈 了 You can be considered as a senior of ChatGPT. 可以算是ChatGPT的大前輩了

你 说 这么 好玩 的 东西 You said such a fun thing 你說這麼好玩的東西

那 立马 就 风靡 全球 That immediately became a global hit それはすぐに世界的な現象になった 그 후 전 세계적으로 유명해졌습니다. 那立馬就風靡全球

吸引 了 超过 3000万 的 用户 Attracted over 30 million users 3,000万人以上のユーザーを魅了 吸引了超過3000萬的用戶

跟 它 对话 聊天 Talk to it Talk to it 跟它對話聊天

它 每天 光 接收 的 信息 It receives daily light information 毎日受け取る情報 它每天光接收的信息

就要 超过 10亿条 Just over 1 billion articles 就要超過10億條

被 各种 人聊骚 Being chatted by various people いろいろな人から話しかけられる 다양한 사람들의 수다 被各種人聊騷

直到 2007年 的 时候 Until the year 2007 直到2007年的時候

它 被 一家 巨头 公司 给 收购 了 It was acquired by a giant company 它被一家巨頭公司給收購了

你 猜 是 谁 你猜是誰

就是 微软 That is, Microsoft 就是微軟

微软 在 那么 早 的 时候 Microsoft at that early date 너무 이른 마이크로소프트 微軟在那麼早的時候

就 已经 开始 觊觎 这个 领域 了 Already, the field is being eagerly pursued 이미 이 분야를 탐내기 시작했습니다 就已經開始覬覦這個領域了

这个 更 聪明 小孩 This smarter kids 這個更聰明小孩

虽然 已经 很能 聊 了 Although already very chatty 雖然已經很能聊了

但是 离 通过 图灵 测试 But away from passing the Turing test しかし、チューリングテストの合格から遠ざかっている 但是離通過圖靈測試

还有 很长 的 距离 There is still a long distance to go 還有很長的距離

就 你 跟 它 聊 两句 就 知道 Just talk to it for a few minutes and you'll know 就你跟它聊兩句就知道

那 就是 个 机器 It's a machine. 那就是個機器

好 咱们 继续 进步 Okay, let's keep going, keep making progress. よし、このまま進んでいこう、前進していこう。 好咱們繼續進步

到 了 2010年 的 时候 By the time 2010 rolled around 到了2010年的時候

机器 学习 里边 的 一个 领域 機器學習裡邊的一個領域

开始 闪光 了 開始閃光了

叫做 人工神经网络 叫做人工神經網絡

Artificial Neural Networks Artificial Neural Networks

你 看 我们 人 的 大脑 你看我們人的大腦

其实 是 靠 実は、そうなんです。 其實是靠

超过 100亿个 神经元 超過100億個神經元

通过 网状 链接 ビアメッシュリンク 通過網狀鏈接

来 判断 和 传递信息 的 を決定し、情報を伝達する。 來判斷和傳遞信息的

虽然 这 每个 神经元 都 很 简单 雖然這每個神經元都很簡單

但是 它们 组合 起来 但是它們組合起來

就 可以 判断 非常复杂 的 信息 就可以判斷非常複雜的信息

所以 这个 人工神经网络 所以這個人工神經網絡

其实 就是 想 模拟 人脑 的 其實就是想模擬人腦的

这种 形式 這種形式

输入 信息 之后 輸入信息之後

就 会 经过 若干个 就會經過若干個

隐藏 神经 节点 的 判断 ヒドゥンノード判定 隱藏神經節點的判斷

就 跟 神经元 似的 就跟神經元似的

然后 给 你 输出 结果 然後給你輸出結果

其实 这个 神经网络 的 思想 其實這個神經網絡的思想

早就 有 了 早就有了

可以 追溯 トレース可能 可以追溯

甚至 可以 追溯到 1960年代 甚至可以追溯到1960年代

但是 它 需要 两样 东西 做 支撑 但是它需要兩樣東西做支撐

大量 的 数据 和 强大 的 算力 大量的數據和強大的算力

而 这些 在 之前 都 是 不 具备 的 而這些在之前都是不具備的

所以 这个 神经网络 的 事 所以這個神經網絡的事

就是 纸上谈兵 就是紙上談兵

到 了 2010年代 到了2010年代

那 不 互联网 时代 了 嘛 那不互聯網時代了嘛

数据 肯定 是 有 了 數據肯定是有了

算力 呢 算力呢

也 是 持续 指数 级别 的 提升 也是持續指數級別的提升

才 让 神经网络 这个 才讓神經網絡這個

开始 能 应用 起来 開始能應用起來

人们 就 发现 人們就發現

这个 模式 真的 特别 适合 解决 這個模式真的特別適合解決

就是 人们 一看 就 知道 就是人們一看就知道

就 凭直觉 那种 事儿 就憑直覺那種事兒

就 比如说 你 看到 一张 脸 顔が見えるとか。 就比如說你看到一張臉

你 就 能 迅速 知道 他 是 谁 彼が誰なのか、すぐにわかる 你就能迅速知道他是誰

当然 刘强 东 除外 もちろん劉強東は除く 물론 Liu Qiangdong을 제외하고 當然劉強東除外

我 这 人脸 盲 私は顔が見えない 我這人臉盲

脸盲 フェイスブラインドネス 臉盲

脸盲 臉盲

我 根本 不 知道 她 漂 不 漂亮 美人かどうかもわからない。 我根本不知道她漂不漂亮

你 想 之前 要是 让 电脑 你想之前要是讓電腦

判断 出 这个 人 是 谁 判斷出這個人是誰

那 简直 太难 了 那簡直太難了

但是 你 用 这个 神经网络 但是你用這個神經網絡

机器 学习 就 能 慢慢 摸索 出 规律 機械学習は、ゆっくりとルールを解決していくことができる 機器學習就能慢慢摸索出規律

现在 它 的 应用 已经 非常 广了 現在では非常に広く使われています 現在它的應用已經非常廣了

不光 是 人脸识别 不光是人臉識別

像 声音 识别 自动 驾驶 像聲音識別自動駕駛

包括 前 几年 包括前幾年

下围棋 打败 柯洁 那个 AlphaGo 下圍棋打敗柯潔那個AlphaGo

都 是 用 这 招练 出来 都是用這招練出來

所以 说 这个 神经网络 所以說這個神經網絡

在 刚才 我们 说 那些 领域 在剛才我們說那些領域

都 可以 大展宏图 都可以大展宏圖

但 回到 文字 领域 しかし、言葉の領域に戻ると 但回到文字領域

它 发展 就 不 太顺 あまり発展していない 它發展就不太順

那 为什么 呢 那為什麼呢

因为 这个 机器 学习 因為這個機器學習

它 一般 都 是 用 一种 它一般都是用一種

叫做 循环 神经网络 叫做循環神經網絡

就是 RNN 来 处理 文字 的 就是RNN來處理文字的

它 主要 的 方式 它主要的方式

就是 按 顺序 一个 词 一个 词看 就是按順序一個詞一個詞看

一个 词 一个 词 处理 一個詞一個詞處理

那 问题 就是 那問題就是

它 没法 同时 进行 大量 的 学习 たくさんの勉強を同時に行うことはできませんが 它沒法同時進行大量的學習

而且 你 这 句子 也 不能 太 长 そして、この文章を長くしすぎてはいけない 而且你這句子也不能太長

要不然 你 学到 后面 的 时候 そうでないと、クラスの後ろの方になったときに 要不然你學到後面的時候

前面 都 忘 了 前面都忘了

直到 2017年 的 时候 直到2017年的時候

谷歌 出 了 一篇 论文 谷歌出了一篇論文

提出 来 了 一个 新 的 学习 框架 提出來了一個新的學習框架

叫做 Transformer 叫做Transformer

具体 的 机制 就 比较复杂 了 具體的機制就比較複雜了

那 肯定 也 不是 小 Lin 能 搞 明白 的 林も絶対に解らないことです。 那肯定也不是小Lin能搞明白的

但 结果 就是 它 可以 让 机器 しかし、その結果、マシンに 但結果就是它可以讓機器

同时 学习 大量 的 文字 同時學習大量的文字

就 比如 原来 那些 字 你 得 挨个 学 例えば、ひとつひとつ覚えていかなければならない原語。 就比如原來那些字你得挨個學

就 跟 电路 串联 似的 回路を直列にしたようなものです。 就跟電路串聯似的

现在 你 可以 同时 学 現在你可以同時學

就 跟 并联 似的 就跟並聯似的

这样 一下 那 训练 的 速度 效率 這樣一下那訓練的速度效率

不 就 大大提高 了 不就大大提高了

有 了 这个 Transformer 有了這個Transformer

机器 在 文字 学习 方面 機器在文字學習方面

那 就 像 打通 了 任督 二脉 それは、2つのチャンネルを開放するようなもの 那就像打通了任督二脈

现在 很多 自然语言 处理 模型 現在では、多くの自然言語処理モデル 現在很多自然語言處理模型

其实 都 是 建立 在 其實都是建立在

它 的 基础架构 之上 的 のインフラの上に乗っかっているんです。 它的基礎架構之上的

谷歌 那个 BERT 里头 的T 谷歌那個BERT裡頭的T

包括 ChatGPT 的 T 包括ChatGPT的T

都 是 指 这个 Transformer 都是指這個Transformer

好 你 看 好你看

现在 技术 方面 現在技術方面

已经 有 非常 强 的 突破 已經有非常強的突破

万事俱备 萬事俱備

那不就 差人 和 钱 了 吗 そりゃあ、人も金もかかるわな。 那不就差人和錢了嗎

是 时候 是 ChatGPT 登场 了 是時候是ChatGPT登場了

就 在 2015年 就在2015年

包括 马斯克 彼得 ·蒂尔 在内 マスク、ピーター・ティールなどを含む。 包括馬斯克彼得·蒂爾在內

几个 大佬 一起 注资 了 幾個大佬一起注資了

10亿美金 10億美金

成立 了 一家 非营利 组织 叫 OpenAI 成立了一家非營利組織叫OpenAI

也 就是 ChatGPT 的 母公司 也就是ChatGPT的母公司

来 进行 AI 方面 的 研究 來進行AI方面的研究

你 看 它 非盈利 你看它非盈利

就 说 我 不是 为了 赚钱 就說我不是為了賺錢

我 纯粹 是 为了 我純粹是為了

推动 这项 技术 的 发展 推動這項技術的發展

所以 它 的 研究成果 包括 专利 所以它的研究成果包括專利

都 是 对外 公开 的 都是對外公開的

你 看 这个 投资人 里 你看這個投資人裡

咱们 是不是 听到 了 咱們是不是聽到了

大家 都 非常 熟悉 的 马斯克 大家都非常熟悉的馬斯克

实际上 他 逐渐 发现 實際上他逐漸發現

他 的 特斯拉 在 AI 方面 他的特斯拉在AI方面

也 需要 大量 的 投入 研究 也需要大量的投入研究

搞 自动 驾驶 什么 的 搞自動駕駛什麼的

所以 就 为了 避免 特斯拉 跟 OpenAI 所以就為了避免特斯拉跟OpenAI

这 两家 公司 的 利益冲突 這兩家公司的利益衝突

他 就 在 2018年 他就在2018年

也 就是 OpenAI 成立 的 第三年 也就是OpenAI成立的第三年

退出 了 董事会 就 拜拜 不玩 了 退会、さようなら、もういらない 退出了董事會就拜拜不玩了

所以 现在 这个 OpenAI 所以現在這個OpenAI

其实 跟 马斯克 已经 关系不大 了 其實跟馬斯克已經關係不大了

拜拜 拜拜

而 OpenAI 这些 大牛们 而OpenAI這些大牛們

也 确实 很 厉害 也確實很厲害

2017年 2017年

谷歌 不是 推出 了 那个 Transformer 谷歌不是推出了那個Transformer

他们 就 立马 在 这个 基础 上 他們就立馬在這個基礎上

研究 学习 研究學習

2018年 发表 了 一篇 论文 2018年發表了一篇論文

介绍 了 一个 新 的 语言 学习 模型 介紹了一個新的語言學習模型

之前 的 语言 学习 模型 之前的語言學習模型

它 基本 都 是 需要 人去 监督 基本的には人間の監視が必要です。 它基本都是需要人去監督

或者 人为 给 它 设定 一些 标签 或者人為給它設定一些標籤

但是 那个 GPT 但是那個GPT

就 基本 不怎么 需要 了 就基本不怎麼需要了

你 就 把 一堆 数据 放进去 你就把一堆數據放進去

他 就 一顿 学 就 给 学 明白 了 他就一頓學就給學明白了

反正 大概 就 这个 意思 反正大概就這個意思

OpenAI 就 在 2018年 6月 OpenAI就在2018年6月

推出 了 第一代 GPT 推出了第一代GPT

接着 在 2019年 11月 接著在2019年11月

又 增加 了 训练 的 数据量 又增加了訓練的數據量

推出 了 GPT-2 推出了GPT-2

就 这种 机器 学习 就這種機器學習

它 其实 主要 就 拼 两件 事儿 それは、本当に大きく分けて2つのことです。 它其實主要就拼兩件事兒

一个 是 模型 一个 是 参 数量 モデル1件、リファレンス1件 数量 一個是模型一個是參數量

模型 就是 决定 了 机器 怎么 学 模型就是決定了機器怎麼學

同样 的 数据 我 进去 同樣的數據我進去

我学得 比 谁 都 快 比 谁 都 好 我學得比誰都快比誰都好

那 你 就 厉害 那你就厲害

而 参 数量 而參數量

它 其实 就 需要 大量 的 计算 它其實就需要大量的計算

所以 说白了 就是 要 砸 钱 つまり、はっきり言ってしまえば、お金の問題なんです。 所以說白了就是要砸錢

就算 是 模型 再 好 就算是模型再好

它 也 得 靠 砸 钱 去 训练 和 验证 また、お金を使ったトレーニングや検証も必要です 它也得靠砸錢去訓練和驗證

这 两者 缺一不可 どっちが欠けてもダメ 這兩者缺一不可

OpenAI 团队 OpenAI團隊

对 我 这个 模型 是 很 有 信心 對我這個模型是很有信心

那下 一步 不 就 缺钱 了 吗 では、次はお金がなくなるということですか? 那下一步不就缺錢了嗎

而 你 每 进步 一点 而你每進步一點

都 可能 需要 都可能需要

上升 一个 数量级 的 数据 去 支撑 上升一個數量級的數據去支撐

那 这些 那這些

都 是 需要 真 金白银 去 支持 的 全てはリアルマネーでサポートする必要がある 都是需要真金白銀去支持的

你 就 比如说 Google 那个 DeepMind 你就比如說Google那個DeepMind

就是 研究 出来 AlphaGo 的 那个 公司 就是研究出來AlphaGo的那個公司

它 每年 开销 就 四五 亿美元 它每年開銷就四五億美元

最 开始 OpenAI 这边 最開始OpenAI這邊

我们 不 说 投 了 10亿美元 我們不說投了10億美元

那 根本 不够 花 それだけでは使い切れない。 那根本不夠花

注意 注意

这时候 它 还是 个 非营利 组织 這時候它還是個非營利組織

马斯克 也 退出 了 大腿 不在 了 マスクも出ています。 馬斯克也退出了大腿不在了

之前 10亿美元 情怀 不够 了 これまでの10億円では足りなかった 之前10億美元情懷不夠了

我 上 哪 再 找 那么 多 情怀 去 是 吧 どこにこんなに感動があるんだろう。 我上哪再找那麼多情懷去是吧

所以 迫于 资金 压力 そのため、財務的な圧力により 所以迫於資金壓力

OpenAI 就 在 2019年 OpenAI就在2019年

从 非营利 组织 转型 了 從非營利組織轉型了

但是 但是它沒有直接變成一個盈利組織

它 没有 直接 变成 一个 盈利 组织

还是 得 要点 情怀 還是得要點情懷

而是 变成 了 一个 而是變成了一個

叫做 收益 封顶 的 盈利 组织 Capped Earningsという営利団体 叫做收益封頂的盈利組織

它 什么 意思 呢 它什麼意思呢

就是说 任何 投资人 的 投资 回报 つまり、どの投資家の投資に対するリターンも 就是說任何投資人的投資回報

都 不能 超过 100倍 都不能超過100倍

超过 100倍 的 部分 超過100倍的部分

投资人 就 拿 不到 回报 了 投資人就拿不到回報了

就 都 归 OpenAI 自己 了 全てはOpenAI自身へ 就都歸OpenAI自己了

但是 我 就 好奇 但是我就好奇