×

We use cookies to help make LingQ better. By visiting the site, you agree to our cookie policy.

image

絮言.狂想 Rhapsody in Lingo Podcast, RiL Podcast #012: Cloning RiL Podcast

RiL Podcast #012 : Cloning RiLPodcast

以 :其實 我 哋 個 腦 都 係 電腦 嚟 㗎 。 苗 : 係 啊 , 肉腦 啊 , 我 哋 係 。

以 :我 哋 係 機械 人 。

靳 :肉腦 啦 。

以 :都 有 電 喺 裏面 。

苗 :有 。

靳 : 有 有 有 。

苗 :你 啱 。

以 : YES! 我 唔 係 醫生 都 可以 講到 呢 個 。

[jingle ]

以 :歡迎 返到 嚟 《 絮言 . 狂想 》 第十二 集 啊 。 我 係 以色列 。

苗 :我 係 三秒 。

靳 :我 係 靳尼 啊 。

以 :噉 我 諗 呢 ,大家 一 開始 聽 呢 一集 嘅 時候 呢 ,都 應該 最 緊張 嘅 就 係 ,到底 上 一集 搞 乜 鬼 呢 ? 噉 …… 噉 唔 知 大家 有 冇 睇 返 我 哋 後來 Facebook 嗰 個 更新 啦 , 噉 就 話 , 哦 , 其實 就 係 愚人節 嘅 一個 笑話 嚟 嘅 。 噉 當然 我 哋 呢 一個 嘅 笑話 ,都 非常 非常之 同 語言 有 關係 啦 。 我哋 都 精心 佈置 咗 好耐 嘅 。 但係 我哋 而家 講下 先 啦 ,點解 會 有 呢 一個 玩 愚人節 嘅 諗頭 嘅 呢 ?

苗 : 噉 呢 , 呢 個 愚人節 呢 , 就 好多 地方 都 有 個 習俗 啦 , 就 係 尤其 是 係 一 啲 科技 公司 啦 , 咁 佢 哋 就 好多 時會 喺 愚人節 度 推出 一 啲 搞笑 嘅 嘢 啦 , 或者 係 …… 唔 一定 係 搞笑 , 或者 唔 一定 係 呃 人 嘅 , 有時 係 一 啲 比較 …… 比較 好玩 嘅 一 啲 嘢 啦 。 譬如 Google 呢 ,即係 往年 啦 ,咁 今年 同埋 上年 都 冇 做到 啦 。

以 :唉 。

苗 :咁 但 係 往年 呢 , Google 啊 、其他 公司 啊 、 Amazon 啊 嗰 啲 …… 嗰 啲 公司 呢 ,都 會 去 做 一 啲 得意 嘢 啦 。 譬如 有 一次 係 咩 …… 咩 Google Gnome 呀 , 係 咪 啊 ? 有個 類似 Amazon Echo 咁 嘅 物體 , 咁 就 係 一個 地 精 形狀 嘅 , 噉 就 係 …… 就 係 你 可以 擺 喺 個 …… 擺 喺 間 屋 裏面 啊 , 定 係 擺 喺 個 花園 度 , 咁 樣 就 可以 幫 你 解答 問題 噉 樣 , 嗰 啲 奇怪 嘢 囉 。

以 :我 記得 好似 2014 年 呢 ,佢 喺 Google Maps 上面 整 咗 個 搵 寵物 小精靈 嘅 遊戲 囉 。

靳 :啊 ,係 啊 。

以 :之後 呢 個 就 後來 變成 咗 Pokémon Go 囉 ,係 啊 。

苗 :哦 。

以 :嗰 陣 時 我 冇 玩 。 係 啦 , 好衰 啦 , 因為 疫情 關係 而 取消 咗 愚人節 , 連 苦中作樂 都 冇 。

苗 :係 啊 。

以 :咁 於是 呢 ,都 係 因為 我 哋 幾個 係 比較 鐘意 睇 科技 嘢 嘅 人 啦 ,所以 就 決定 就 學 佢 玩 下 呢啲 嘢 。 咁 我 哋 呢 一個 笑話 ,係 介乎 整蠱 同埋 笑話 之間 ,我 諗 。 咁 希望 唔 會 整蠱 得 大家 太 緊要 啦 。

苗 :點樣 整 蠱 啊 ? 即係 聽 完 之後 :「咦 ? 點解 咁 垃圾 嘅 ,呢 集 ? 」噉 樣 ,「完全 唔 知 噏 乜 啊 ! 」靳 :「點解 聽 唔 明 嘅 ,呢 集 ? 」咁 樣 ,「我 科勞 唔 到 啊 ,你 講 啲 嘢 太 深 啊 」噉 樣 。

以 :好 混淆 ,係 啊 。 我 見到 有 啲 講 廣東話 ,或者 學 廣東話 學到 咁 上下 嘅 人 呢 ,都 走 嚟 聽 ,之後 就 話 :「啊 ,好似 返返到 去 一 開始 學 廣東話 嘅 時候 ,即係 好似 又 聽 得明 啲 字 ,但 係 又 聽 唔明 係 講緊 乜嘢 」噉 樣 。

苗 :係 啊 ,咁 就 解釋 下 做 緊 咩 啦 。 咁 呢 一個 係 一個 完全 係 電腦 gen 出 嚟 嘅 一集 啦 。 噉 點樣 gen 呢 ,就 係 用 一個 叫做 n-gram 嘅 …… 嘅 嘢 啦 。 噉 呢 個 嘢 係 ……如果 有人 聽過 複製 陳雲 呢 ,咁 係 一個 類似 嘅 嘢 嚟 嘅 。 咁 佢 就 係 ……

靳 :複製 陳雲 真 係 好 正 。

苗 :噉 類似 搜集 咗 陳雲 喺 Facebook 上面 嘅 所有 嘅 post 啦 ,噉 擺落 一個 文件 度 ,然 之後 呢 ,就 再 去 用 呢啲 統計 ,咁 樣 就 睇下 每 一串 字 ,究竟 出現 咗 幾多次 呢 ? 咁 就 計返 …… 類似 計返 一個 機率 出 嚟 。 咁 再 用 呢 一個 咁 樣 嘅 機率 呢 ,就 再 去 重新 生成 一 啲 字 出 嚟 囉 。 咁 就 可以 生成 到 一 啲 …… 一 啲 新 嘅 陳雲 文章 出 嚟 啦 , 咁 就 係 …… 所以 就 叫做 複製 陳雲 。 咁 我 哋 呢 一個 呢 ,就 差唔多 嘅 概念 啦 。 咁 就 ……

靳 :我 哋 複製 嘅 唔 係 陳雲 啦 。

苗 :係 喇 。 咁 我 哋 複製 嘅 呢 ,就 係 我 哋 之前 咁 多集 嘅 逐字 稿 啦 。 噉 以色列 好 辛苦 咁 打 咗 好多好多 咁 嘅 字 啦 。 呢啲 ……有 幾多 字 啊 ? 係 咪 ……

以 :十七萬 字 。

苗 :十七萬 字 喇 ,係 喇 。 好多好多 嘅 字 啦 。

靳 :嘩 ,獨力 嘅 十七萬 字 。

苗 : 係 啊 , 粒粒皆辛苦 啊 。

靳 : 真 係 。

苗 :……嘅 十七萬 字 。 咁 呢 啲 咁多 字 呢 ,我哋 就 三個 三個 字 ,咁樣 為 一個 單位 啦 。 咁 就 去 統計 每 三個 字 ,即係 究竟 數起 上嚟 有 幾多個 呢 ? 然 之後 再 ……我 哋 再數 嘞 。 噉 我 就 嘗試 解釋 下 呢 一個 n-gram 呢 個 嘢 係 點樣 運作 啦 。 即 係 用 一個 n-gram 嘅 叫做 language model 啦 , 即 係 一個 語言 模型 , 去 生成 一篇 嘢 出 嚟 , 係 點樣 嘅 呢 ? 咁 我 就 首先 解釋 下 咩 叫做 language model 啦 。 咁 佢 嘅 作用 呢 ,就 係 根據 一句 嘢 ,你 之前 見到 嘅 字 呢 ,就 推測 下 一個 字 係 乜嘢 。 咁 而 n-gram 呢 ,就 係 其中 一種 language model 喇 。 咁 呢 個 係 一個 比較簡單 嘅 language model , 即 係 可能 你 讀 一 啲 比較 入門 嘅 電腦 語言學 嘅 課程 呢 , 都 會 介紹 呢 樣 嘢 嘅 。 咁 譬如 我 哋 個 稿 裏面 呢 ,有 一句 嘢 係 「今日 天氣 好好 」咁 樣 啦 。 咁 我 哋 就 三個 、三個 字 咁 樣 去 統計 ,究竟 「今日 天 」跟住 「日 天氣 」……

以 :「天氣 好 」

苗 : 係 喇 , 係 喇 。 咁 呢 幾個 字 ,究竟 出現 咗 幾 多次 啦 。 咁 一路 一路 一路 咁 樣去 統計 。 咁 如果 呢 ……因為 好 難 去 解釋 ,冇 visual 係 好 難解 釋 嘅 ,呢 樣 嘢 。

以 :我 哋 手語 都 做到 啦 !

靳 :ok 嘅 !

苗 :係 嘞 。 噉 你 數 咗 咁 多 呢 一 啲 三個 、三個 字 之後 呢 ,咁 你 就 去 再 將 佢 變成 一個 機率 啦 。 咁 點樣 變 呢 ? 就 係 睇 下 頭 兩個 字 。 如果 頭 兩個 字 係 一樣 嘅 話 呢 ,就 當 係 同一 group 啦 。 假設 即 係 篇 文 裏面 有 「 今日 我 」、「 今日 你 」、「 今日 去 」 咁 樣 , 有 三組 唔 同 嘅 字 , 譬如 「 今日 我 」 出現 咗 九十 次 , 跟 住 「 今日 你 」 呢 , 出現 咗 五次 ,「 今日 佢 」 出現 咗 五次 。 咁 嘅 話 呢 ,就 係 你 將 呢 幾個 數字 加埋 ,咁 就 係 一百 啦 。 咁 你 就 將 嗰 個 數 目 呢 ,就 除 返 一百 。 例如 「 今日 我 」 呢 , 咁 就 係 九十 除 一百 啦 , 咁 就 係 0.9 嘞 。 咁 呢 個 數字 表達 緊 啲 咩 呢 ? 就係話 ,只要 你 頭 兩個 字 係 「今日 」嘅 話 呢 ,後面 一個 字 係 「我 」嗰 個 機率 ,就 有 0.9 嘞 ,即係 90% 喇 。 咁 而 其他 字 呢 ,就 係 分別 係 5% 啦 。 即係 呢 個 例子 只 係 得 三個 可能性 ,咁 就 冇 其他 可能性 㗎 喇 喎 。 即係 「今日 」之後 呢 ,你 淨係 可以 講 「我 」、「你 」同埋 「佢 」。 咁 呢 一個 就 係 n-gram model 嘅 一個 唔 好處 啦 ,就 係 你好 難 去 …… 你好 難 去 模擬 一 啲 好 複雜 嘅 語言 。 一 啲 你 嗰 個 source 裏面 冇 嘅 嘢 囉 。 即係 一定 要 出現 過 ,你 先 可以 有 囉 。 咁 除非 你 係 有 做 咗 其他 smoothing 啊 ,類似 咁 樣 嘅 嘢 呢 ,咁 你 先 可以 即 係 解決 到 呢 個 問題 啦 ,叫做 。 噉 但 係 我 哋 就 用 咗 一個 好 簡單 好 簡單 嘅 一個 模型 ,咁 就 去 整 啲 字 出 嚟 。 咁 所以 你 見到 呢 ,聽到 嗰 啲 字 ,如果 大家 係 比較 忠實 少 少 嘅 聽 眾 呢 ,就 會 聽得出 ,係 我 哋 之前 講 過 嘅 嘢 嚟 ,全部 都 係 我 哋 之前 講 過 嘅 嘢 嚟 嘅 。

靳 :可能 可以 搵到 係 邊 一集 講 。

苗 :係 啊 ,係 啊 。

以 :可以 ……係 ,可以 估下 、揾 返出 嚟 。 日光 之下 無 新事 。

苗 :可能 成句 係 新 嘅 。 但係呢 ,如果 你 係 每 三個 、三個 字 咁樣 睇 呢 ,係 會 喺 我哋 以前 嘅 稿度 出現 過 嘅 。 係 喇 ,咁 呢 個 就 係 我 哋 做 咗 嘅 嘢 。 咁 所以 你 哋 見到 …… 你 見到 有 啲 九 唔 搭 八 ,但 係 又 好似 有少少 make sense 咁 樣 ,咁 就 因為 我 哋 就 揀 咗 三個 字 呢 一個 咁 樣 嘅 window 啦 ,就 聽 落 去 會 比較 有少少 合理 ,但 係 又 唔 知 …… 好似 唔 知 講 乜 噉 樣 。

以 : 你 係 點樣 決定 咗 揀 三個 字 㗎 ?

苗 :三個 字 ,其實 係 一個 ……其實 都 係 一個 choice 嚟 嘅 啫 。 因為 好多 時 ,如果 英文 嘅 話 呢 ,一 啲 真 係 會 用 呢啲 language model 嘅 人 呢 ,就 通常 最盡 係 去 到 5-gram 嘅 啫 ,最盡 係 五個 字 嘅 啫 。 咁 因為 再 多 字 呢 ,你 有 一個 ……你所需要嘅 輸入 嗰啲 字 呢 ,係 好多 好多 好多 嘅 。 即係 你好 少會 有 一 啲 好 嘅 數據 囉 。 如果 你 有 ……你 係 用 五個 、五個 字 。 如果 你 用 …… 淨 係 用 一個 字 , 即 係 叫 所謂 unigram ,你 就 用 一個 字 。 咁 即係 其實 你 係 計緊 成篇文 有 幾多個 字 囉 ,即係 幾多個 某一個 字 囉 。 即係 譬如 有 一百個 「我 」字 ,有 十個 「佢 」字 咁樣 ,咁 呢啲 呢啲 囉 。 但係 如果 你 嗰 個 n 越 大 啊 ,你 係 bigram 、trigram 、4-gram ,一路 越 嚟 越 大 嘅 話 呢 ,你 嗰 啲 資料 就 越 嚟 越 少 囉 。 咁 所以 你 係 要 喺 嗰 個 n 同埋 你 有 嘅 輸入 資料 嗰 個 大 細 ,做 一個 平衡 。 噉 3 係 一個 好 常見 嘅 數 囉 ,就 係 。 通常 trigram 都 係 就算 係 英文 同 中文 都 係 …… 都 係 成日 出現 。

以 :哦 ,噉 假如 你 轉 咗 做 4 嘅 話 ,會 有 咩 唔 同 呢 ? 有 咩 後果 呢 ?

苗 :係 喇 。 4嘅 話 呢 ,就 即 係 咩 呢 ? 就 即 係 你 要 估下 一個 字 係 咩 呢 ,你 就 要 睇 頭 三個 字 。 你 要 睇 前 三個 字 係 乜嘢 ,你 先 可以 決定 到 第四 ,你 先 有 第四個 字 嗰 個 機率 囉 。 如果 你 嗰 個 n 越 細 呢 ,你 就 淨 係 睇 前面 更加 少 嘅 字 。 如果 你 係 bigram 呢 ,你 淨 係 根據 前 一個 字 去 推測 下 一個 字 。 即係 有 少少 似 譬如 你 打字 呢 ,如果 你 打 一 啲 比較 舊 嘅 輸入法 啦 ,佢 係 會 逐個 逐個 字 咁樣 去 類似 suggest 畀 你 :「哦 ,下 一個 字 打 咩 好 啊 ? 」咁 樣 㗎 嘛 。 手機 好多 時 都 會 囉 。

以 :「舊 嘅 輸入法 」。

苗 :係 喇 。 即係 咁 嗰啲 就係 類似 一個 叫做 bigram 嘅 model ,咁 就 係 根據 前 一個 字 ,直接 推測 下 一個 字 。 所以 你 不斷 㩒㩒㩒㩒 中間 呢 ,你 㩒 佢 推測 啲 字 呢 ,你 打出 嚟 嗰 句 嘢 ,其實 都 係 唔 係 好 make sense 㗎 ,都 係 冇 乜 意思 㗎 。

靳 :冇 乜 意思 。

以 :哦 ,嗱 ,咁 我 哋 廣東話 呢 ,我 哋 啲 逐字 稿 呢 ,就 係 用 方塊字 做 單位 啦 。 咁 如果 換着 係 英文 啊 ,嗰 啲 拼音 語言 嘅 話 ,咁 佢 個 做法 會 有 咩 唔 同 ,即係 會 係 都 係 用 返 一個 字 元 做 單位 吖 ,定 係 用 成個 word 做 一個 單位 呢 ?

The rest of the transcript is available to Patreon members . Join at :patreon.com/rhapsodyinlingo

Learn languages from TV shows, movies, news, articles and more! Try LingQ for FREE

RiL Podcast #012 : Cloning RiLPodcast RiL|Podcast|Kloning| RiL|Podcast|Cloning| RiL Podcast #012: Cloning RiL Podcast RiL Podcast #012: Kloning av RiL Podcast RiL Podcast #012: Cloning RiLPodcast

以 :其實 我 哋 個 腦 都 係 電腦 嚟 㗎 。 att|egentligen|jag|pluralpartikel|måttsord|hjärna|också|är|dator|komma|partikel för bekräftelse in terms of|actually|I|we|measure word for people|brain|also|is|computer|come|sentence-final particle Yi: Egentligen är vår hjärna också en dator. Yi: Actually, our brains are computers. 苗 : 係 啊 , 肉腦 啊 , 我 哋 係 。 Miao: Ja, det är en kött-hjärna, det är vi. Miu: Yes, they are biological brains.

以 :我 哋 係 機械 人 。 att|jag|vi|är|maskin|människa to|I|plural marker|am|mechanical|person Yi: Vi är robotar. Yi: We are robots.

靳 :肉腦 啦 。 Jin|kött hjärna|partikel för att uttrycka bekräftelse Jin|brain meat|sentence final particle Jin: Kött hjärna då. Jin: It's meat brain.

以 :都 有 電 喺 裏面 。 med|alla|har|elektricitet|i|inne with|also|has|electricity|at|inside Yi: Det finns också elektricitet där inne. Yi: There's electricity inside.

苗 :有 。 Miao|har sprout|has Miao: Ja. Miao: Yes.

靳 : 有 有 有 。 Jin: Ja, ja, ja. Jin: Yes, yes, yes.

苗 :你 啱 。 Miao|du|rätt Miao|you|are right Miao: Du har rätt. Miu: You are right.

以 : YES! 我 唔 係 醫生 都 可以 講到 呢 個 。 YES||jag|inte|är|läkare|också|kan|prata om|detta|måttsord so|YES|I|not|am|doctor|also|can|talk about|this|thing Yi: JA! Jag är inte läkare men jag kan ändå prata om det här. Yi: YES! Even though I'm not a doctor, I can still talk about this.

[jingle ] jingel jingle [jingel] [jingle]

以 :歡迎 返到 嚟 《 絮言 . 狂想 》 第十二 集 啊 。 till|välkommen|tillbaka|hit|prat|galenskap|tolfte|avsnitt|partikel by|welcome|back|here|monologue|fantasy|twelfth|episode|ah Yi: Välkomna tillbaka till avsnitt tolv av "Samtal och Fantasi". Yi: Welcome back to Episode 12 of 'Whispers and Fantasies'. 我 係 以色列 。 jag|är|Israel I|am|Israel 私はイスラエルです。 Jag är i Israel. I am in Israel.

苗 :我 係 三秒 。 Miao|jag|är|tre sekunder Miao|I|am|three seconds Miao: Jag är tre sekunder. Miao: I am three seconds.

靳 :我 係 靳尼 啊 。 Jin|jag|är|Jin Ni|partikel Jin|I|am|Jin Ni|particle Jin: Jag är Jin Ni. Jin: I am Jin Ni.

以 :噉 我 諗 呢 ,大家 一 開始 聽 呢 一集 嘅 時候 呢 ,都 應該 最 緊張 嘅 就 係 ,到底 上 一集 搞 乜 鬼 呢 ? så|då|jag|tänker|detta|alla|en|började|lyssna|detta|avsnitt|possessivpartikel|tidpunkt|detta|alla|borde|mest|nervösa|possessivpartikel|just|är|egentligen|förra|avsnitt|gjorde|vad|skämt|detta in that case|then|I|think|this|everyone|one|start|listening|this|episode|possessive particle|time|this|all|should|most|anxious|possessive particle|just|is|after all|previous|episode|do|what|ghost|this だから:あなたがこのエピソードを最初に聞いたとき、あなたは最も緊張しているべきだと思います、あなたは最後のエピソードで何をしましたか? Yi: Så här tänker jag, när alla först hör det här avsnittet, borde det mest spännande vara, vad hände egentligen i förra avsnittet? Yi: So I think this, when everyone first listens to this episode, the most tense thing should be, what the hell happened in the last episode? 噉 …… 噉 唔 知 大家 有 冇 睇 返 我 哋 後來 Facebook 嗰 個 更新 啦 , 噉 就 話 , 哦 , 其實 就 係 愚人節 嘅 一個 笑話 嚟 嘅 。 ねえ...Facebookの更新に気付いたかどうかはわかりませんが、実際にはエイプリルフールのジョークだと言っておきましょう。 Så ... så vet jag inte om ni har sett vår uppdatering på Facebook senare, det var faktiskt ett skämt för aprilskämt. So... I don't know if everyone has seen our later Facebook update, which said, oh, actually it was a joke for April Fool's Day. 噉 當然 我 哋 呢 一個 嘅 笑話 ,都 非常 非常之 同 語言 有 關係 啦 。 så|självklart|jag|vi|detta|ett|possessivpartikel|skämt|också|mycket|extremt|med|språk|har|relation|slutpartikel then|of course|I|we|this|one|possessive particle|joke|also|very|extremely|with|language|have|relationship|final particle もちろん、私たちのジョークは言語に非常に関連しています。 Så klart är vårt skämt också väldigt, väldigt relaterat till språk. Of course, this joke of ours is very much related to language. 我哋 都 精心 佈置 咗 好耐 嘅 。 vi|alla|noggrant|dekorerade|partikel för avslutad handling|länge|possessiv partikel we|also|meticulously|arranged|past tense marker|a long time|possessive particle 丁寧に丁寧にアレンジしました。 Vi har också planerat detta noggrant under en lång tid. We have been carefully planning it for a long time. 但係 我哋 而家 講下 先 啦 ,點解 會 有 呢 一個 玩 愚人節 嘅 諗頭 嘅 呢 ? men|vi|nu|prata lite|först|partikel för att mjuka upp uttalande|varför|skulle|ha|detta|en|spela|aprilskämt|partikel för att indikera besittning|idé|partikel för att indikera besittning|detta but|we|now|talk|first|particle|why|will|have|this|one|play|April Fools' Day|possessive particle|idea|particle|question particle しかし、最初にそれについて話しましょう、エイプリルフールをプレイするというアイデアはどうですか? Men nu pratar vi om varför vi kom på denna idé för att spela ett aprilskämt? But let's talk about why we had this idea of playing an April Fool's joke.

苗 : 噉 呢 , 呢 個 愚人節 呢 , 就 好多 地方 都 有 個 習俗 啦 , 就 係 尤其 是 係 一 啲 科技 公司 啦 , 咁 佢 哋 就 好多 時會 喺 愚人節 度 推出 一 啲 搞笑 嘅 嘢 啦 , 或者 係 …… 唔 一定 係 搞笑 , 或者 唔 一定 係 呃 人 嘅 , 有時 係 一 啲 比較 …… 比較 好玩 嘅 一 啲 嘢 啦 。 ミャオ:ええと、エイプリルフールには多くの場所、特にテクノロジー会社に習慣があり、エイプリルフールに面白いものをリリースすることがよくあります。それは...必ずしも面白いとは限りません。必然的に人間、時にはそれは比較です...楽しいこと。 Miao: Så, detta, detta aprilskämt, så finns det många ställen som har en tradition, särskilt i vissa teknikföretag, så de brukar ofta släppa något roligt på aprilskämt, eller det behöver inte nödvändigtvis vara roligt, eller nödvändigtvis lura folk, ibland är det något som är mer... mer underhållande. Miu: So, this year, on April Fool's Day, there are many places that have this custom, especially in some tech companies. They often release some funny things on April Fool's Day, or sometimes... it doesn't have to be funny, or it doesn't have to be a prank; sometimes it's just something a bit more... a bit more fun. 譬如 Google 呢 ,即係 往年 啦 ,咁 今年 同埋 上年 都 冇 做到 啦 。 till exempel|Google|frågepartikel|det vill säga|tidigare år|avslutande partikel|så|i år|och|förra året|också|inte|gjort|avslutande partikel for example|Google|question particle|that is|previous year|final particle|then|this year|and|last year|both|not|achieved|final particle たとえば、グーグル、つまり前年なので、今年と前年はそれを行うことができませんでした。 Till exempel Google, det vill säga tidigare år, men i år och förra året gjorde de inget. For example, Google, in previous years, well, they didn't do it this year and last year.

以 :唉 。 med|åh to use|sigh Yi: Suck. Yi: Sigh.

苗 :咁 但 係 往年 呢 , Google 啊 、其他 公司 啊 、 Amazon 啊 嗰 啲 …… 嗰 啲 公司 呢 ,都 會 去 做 一 啲 得意 嘢 啦 。 Miao|så|||tidigare år|partikel för att indikera fråga|Google|partikel för att indikera bekräftelse|andra|företag|partikel för att indikera bekräftelse|Amazon|partikel för att indikera bekräftelse|de|partikel för plural|de|partikel för plural|företag|partikel för att indikera fråga|alla|kommer|att|göra|en|partikel för plural|intressanta|saker|partikel för att indikera avslutning Miao|then|||previous years|particle indicating a question|Google|particle indicating exclamation|other|companies|particle indicating exclamation|Amazon|particle indicating exclamation|those|plural marker|those|plural marker|companies|particle indicating a question|all|would|go|do|one|plural marker|interesting|things|particle indicating completion Miao: Men tidigare år, Google, andra företag, Amazon och sådana... de företagen brukade göra något kul. Miu: But in previous years, Google, other companies, Amazon, those companies would do some interesting things. 譬如 有 一次 係 咩 …… 咩 Google Gnome 呀 , 係 咪 啊 ? Till exempel, det var en gång vad ... vad Google Gnome, eller hur? For example, there was a time when... what was it... Google Gnome, right? 有個 類似 Amazon Echo 咁 嘅 物體 , 咁 就 係 一個 地 精 形狀 嘅 , 噉 就 係 …… 就 係 你 可以 擺 喺 個 …… 擺 喺 間 屋 裏面 啊 , 定 係 擺 喺 個 花園 度 , 咁 樣 就 可以 幫 你 解答 問題 噉 樣 , 嗰 啲 奇怪 嘢 囉 。 アマゾンエコーのようなものがあるので、それはゴブリンの形をしたものなので、それは...あなたがそれを置くことができるように...部屋に、それは庭になければなりません、そしてそれはあなたがあなたに答えるのを手伝うのは奇妙です質問。 Det var en liknande sak som Amazon Echo, som var en liten gnomformad enhet, som du kunde ställa i ... ställa i ditt hus, eller i trädgården, och den kunde hjälpa dig att svara på frågor, sådana konstiga saker. There was an object similar to Amazon Echo, which was in the shape of a garden gnome, and you could place it in your house or in the garden, and it could help you answer questions and those strange things.

以 :我 記得 好似 2014 年 呢 ,佢 喺 Google Maps 上面 整 咗 個 搵 寵物 小精靈 嘅 遊戲 囉 。 till|jag|minns|som|år|här|han|på|Google|Maps|ovan|skapade|en partikel som indikerar avslutad handling|ett|hitta|husdjur|Pokémon|possessiv partikel|spel|avslutande partikel as|I|remember|like|year|particle indicating past action|he|at|Google|Maps|on|created|past tense marker|classifier|finding|pet|Pokémon|possessive particle|game|particle indicating certainty Jag minns att det var 2014, då de skapade ett spel för att hitta Pokémon på Google Maps. I remember it was around 2014, when they created a game to find Pokémon on Google Maps.

靳 :啊 ,係 啊 。 Jin|ah|yes|ah Ja, precis. Right, yes.

以 :之後 呢 個 就 後來 變成 咗 Pokémon Go 囉 ,係 啊 。 för|efter|frågepartikel|måttsord|då|senare|blev|fullbordad handling|Pokémon|Go|avslutande partikel|är|uttryck för förståelse in terms of|afterwards|question particle|measure word|then|later|became|past tense marker|||particle indicating a change|is|ah particle Så här: efter det blev det Pokémon Go, ja. So, after that, it became Pokémon Go, right?

苗 :哦 。 Miao|åh Miao|oh Miao: Åh. Miao: Oh.

以 :嗰 陣 時 我 冇 玩 。 med|den|tid|när|jag|inte|spela at|that|time|when|I|didn't|play Så här: då spelade jag inte. So: At that time, I didn't play. 係 啦 , 好衰 啦 , 因為 疫情 關係 而 取消 咗 愚人節 , 連 苦中作樂 都 冇 。 Ja, det var dåligt, för på grund av pandemin ställdes aprilskämt in, inte ens något att skratta åt. Yeah, it was really bad, because of the pandemic, April Fool's Day was canceled, and there was no way to find joy in the misery.

苗 :係 啊 。 Miao|ja|partikel Miao|yes|particle Miao: Ja. Miu: Yes.

以 :咁 於是 呢 ,都 係 因為 我 哋 幾個 係 比較 鐘意 睇 科技 嘢 嘅 人 啦 ,所以 就 決定 就 學 佢 玩 下 呢啲 嘢 。 med|så|då|partikel|också|är|för att|jag|vi|några|är|ganska|gillar|titta|teknologi|saker|partikel|människor|partikel|så|då|bestämde|att|lära|han|spela|lite|dessa|partikel using|then|so|question particle|also|is|because|I|we|a few|are|relatively|like|watching|technology|things|possessive particle|people|final particle|so|then|decided|then|to learn|he|to play|a little|these|things Yi: Så, eftersom vi några är ganska förtjusta i att titta på teknikgrejer, så bestämde vi oss för att lära oss att spela med dessa grejer. Yi: So, because we are a few people who prefer to watch technology stuff, we decided to learn how to play with these things. 咁 我 哋 呢 一個 笑話 ,係 介乎 整蠱 同埋 笑話 之間 ,我 諗 。 så|jag|vi|detta|ett|skämt|är|mellan|practical joke|och|skämt|mellan|jag|tänker then|I|we|this|a|joke|is|between|prank|and|joke|between|I|think Så, det här skämtet vi har, ligger mellan att vara ett skämt och att vara ett spratt, tror jag. So, this joke of ours is between a prank and a joke, I think. 咁 希望 唔 會 整蠱 得 大家 太 緊要 啦 。 så|hoppas|inte|kommer|störa|få|alla|för|allvarligt|partikel then|hope|not|will|disturb|able|everyone|too|serious|sentence-final particle Så jag hoppas att det inte kommer att vara för mycket för att störa alla. I hope it won't prank everyone too much.

苗 :點樣 整 蠱 啊 ? Miao|how|make|curse|question particle Miao: Hur ska man göra för att lura någon? Miu: How to mess with it? 即係 聽 完 之後 :「咦 ? betyder|höra|klart|efter|eh that means|hear|finished|after|huh Det vill säga, efter att ha hört detta: "Hmm? So after listening: "Huh? 點解 咁 垃圾 嘅 ,呢 集 ? varför|så|skräp|partikel|denna|episod why|so|garbage|possessive particle|this|episode Varför är det här så skräpigt, det här avsnittet? Why is this episode so trash? 」噉 樣 ,「完全 唔 知 噏 乜 啊 ! så|utseende|helt|inte|vet|vad|något|partikel like this|appearance|completely|not|know|what|anything|particle " Sådär, "Jag har helt ingen aning om vad jag pratar om!" " Like that, "I have no idea what it's talking about!" 」靳 :「點解 聽 唔 明 嘅 ,呢 集 ? Jin|varför|lyssna|inte|förstå|partikel|detta|avsnitt Jin|why|listening|not|understand|question particle|this|episode " Jin: " Varför förstår jag inte det här avsnittet?" "Jin: "Why can't I understand this episode?" 」咁 樣 ,「我 科勞 唔 到 啊 ,你 講 啲 嘢 太 深 啊 」噉 樣 。 så|utseende|jag|kan|inte|förstå|partikel|du|pratar|lite|saker|för|djupa|partikel|så|utseende like this|appearance|I|study|not|able to|particle|you|speak|some|things|too|deep|particle|like this|appearance " Så här: " Jag kan inte hänga med, du pratar för djupt. " "Then, "I can't grasp it, you're speaking too deeply."

以 :好 混淆 ,係 啊 。 med|mycket|förvirrande|är|partikel to|very|confusing|is|particle " Yi: Det är väldigt förvirrande, ja. " Yi: It's very confusing, yes. 我 見到 有 啲 講 廣東話 ,或者 學 廣東話 學到 咁 上下 嘅 人 呢 ,都 走 嚟 聽 ,之後 就 話 :「啊 ,好似 返返到 去 一 開始 學 廣東話 嘅 時候 ,即係 好似 又 聽 得明 啲 字 ,但 係 又 聽 唔明 係 講緊 乜嘢 」噉 樣 。 jag|såg|har|lite|prata|kantonesiska|eller|lära|kantonesiska|lärt|så|upp och ner|partikel|människor|frågepartikel|också|gå|hit|lyssna|efteråt|då|sa|ah|som|tillbaka till|till|en|början|lära|kantonesiska|partikel|tid|det vill säga|som|igen|lyssna|förstått|lite|ord|men|är|igen|lyssna|inte|förstått|är|pratar om|vad|så I|saw|have|some|speak|Cantonese|or|learn|Cantonese|learned|so|up and down|possessive particle|people|question particle|all|come|here|listen|afterwards|then|said|ah|seems|returned to|to|one|beginning|learning|Cantonese|possessive particle|time|that is|seems|again|listening|understanding|some|words|but|is|again|listening|not understanding|is|talking about|what|like|manner 広東語を話している人や広東語を学んだ人を見て、みんな歩いて聞いて、「ああ、広東語を最初に学んだ時のことだと思います。言葉が聞こえてきそうです。はっきりとは言えますが、言葉がはっきり聞こえません。」 " Jag ser att det finns några som pratar kantonesiska, eller som lär sig kantonesiska, som kommer hit för att lyssna, och sedan säger de: " Ah, det känns som att jag är tillbaka i början av att lära mig kantonesiska, det är som att jag kan förstå vissa ord, men jag förstår inte vad som sägs. " I see some people who speak Cantonese or are learning Cantonese come to listen, and then they say: "Ah, it feels like going back to when I first started learning Cantonese, like I can understand some words, but I still don't understand what is being said."

苗 :係 啊 ,咁 就 解釋 下 做 緊 咩 啦 。 Miu|yes|particle|then|just|explain|a little|doing|ongoing|what|particle ミャオ:いいえ、それがどれほどきついか説明させてください。 Miao: Ja, så förklara vad vi gör. Miu: Yes, so let me explain what we are doing. 咁 呢 一個 係 一個 完全 係 電腦 gen 出 嚟 嘅 一集 啦 。 så|detta|en|är|en|helt|är|dator|generera|ut|komma|partikel|avsnitt|partikel then|this|one|is|one|completely|is|computer|generate|out|come|possessive particle|episode|final particle つまり、これは完全にコンピューター世代のエピソードです。 Så detta är ett avsnitt som helt och hållet är genererat av datorn. So this one is a completely computer-generated episode. 噉 點樣 gen 呢 ,就 係 用 一個 叫做 n-gram 嘅 …… 嘅 嘢 啦 。 like this|how|generate|question particle|then|is|use|a|called|||possessive particle|possessive particle|thing|final particle n-gramと呼ばれるものを使用するgenを見てみましょう。 Så hur genererar man det? Det görs med något som kallas n-gram... How it is generated is by using something called n-gram... 噉 呢 個 嘢 係 ……如果 有人 聽過 複製 陳雲 呢 ,咁 係 一個 類似 嘅 嘢 嚟 嘅 。 så|den|ett|sak|är|om|någon|har hört|kopiera|Chen Yun|den|då|är|en|liknande|partikel|sak|komma|partikel then|this|measure word|thing|is|if|someone|has heard of|copying|Chan Yun|this|then|is|a|similar|possessive particle|thing|come|possessive particle So this thing is... If anyone has heard of copying Chen Yun, this is a similar thing. ここに物語があります...誰かが陳雲をコピーすることを聞いたことがあるなら、それは同様の物語です。 咁 佢 就 係 …… så|han|då|är then|he|just|is だからそれはただ... Så han är ... So, he is...

靳 :複製 陳雲 真 係 好 正 。 Jin|kopiera|Chen Yun|verkligen|är|mycket|bra Jin|copy|Chan Wan|really|is|very|good Jing: Att kopiera Chen Yun är verkligen bra. Jin: Copying Chan Yun is really great.

苗 :噉 類似 搜集 咗 陳雲 喺 Facebook 上面 嘅 所有 嘅 post 啦 ,噉 擺落 一個 文件 度 ,然 之後 呢 ,就 再 去 用 呢啲 統計 ,咁 樣 就 睇下 每 一串 字 ,究竟 出現 咗 幾多次 呢 ? Miao|så|liknande|samla|partikel för avslutad handling|Chen Yun|på|Facebook|ovan|possessiv partikel|alla|possessiv partikel|inlägg|partikel för avslutad handling|så|lägga|ett|dokument|platspartikel|sedan|efter|detta|då|igen|gå|använda|dessa|statistik|så|sätt|då|kolla|varje|en sträng|tecken|egentligen|förekomma|partikel för avslutad handling|hur många gånger|detta Miao|then|similar|collect|past tense marker|Chan Wan|at|Facebook|on|possessive particle|all|possessive particle|posts|sentence-final particle|then|put into|a|document|locative particle|then|after|this|then|again|go|use|these|statistics|then|way|then|see|every|string|word|actually|appear|past tense marker|how many times|this Miao:これは、Chen YunのFacebookですべての投稿を収集し、ファイルに入れてから、この統計を再度使用するのと似ています。これにより、単語の各文字列が何回表示されるかを確認できます。 Miao: Så det är som att samla alla inlägg från Chen Yun på Facebook, och sedan lägga dem i ett dokument, och sedan använda dessa statistik för att se hur många gånger varje sträng faktiskt förekommer? Miao: So it's like collecting all of Chan Yun's posts on Facebook, then putting them into a document, and afterwards, using these statistics to see how many times each string appears? 咁 就 計返 …… 類似 計返 一個 機率 出 嚟 。 så|då|räkna tillbaka|liknande|räkna tillbaka|en|sannolikhet|ut|komma then|just|calculate|similar|calculate|one|probability|come|out だからカウントバック...出てくるチャンスをカウントバックするのと同じです。 Så man räknar ... liknande som att räkna ut en sannolikhet. Then you can calculate... it's like calculating a probability. 咁 再 用 呢 一個 咁 樣 嘅 機率 呢 ,就 再 去 重新 生成 一 啲 字 出 嚟 囉 。 så|igen|använda|detta|ett|så|utseende|partikel|sannolikhet|detta|då|igen|gå|om|generera|ett|pluralpartikel|ord|ut|komma|partikel then|again|use|this|one|so|appearance|possessive particle|probability|this|then|again|go|re|generate|a|some|words|out|come|sentence-final particle もう一度そのチャンスを利用して、単語の再生に行きましょう。 Så, med den här typen av sannolikhet, kan vi åter generera några ord. So, using this kind of probability again, we can regenerate some words. 咁 就 可以 生成 到 一 啲 …… 一 啲 新 嘅 陳雲 文章 出 嚟 啦 , 咁 就 係 …… 所以 就 叫做 複製 陳雲 。 Så kan vi generera några... några nya Chen Yun-artiklar, så det kallas... så det kallas att kopiera Chen Yun. Then we can generate some... some new articles by Chan Yun, so that's why it's called copying Chan Yun. 咁 我 哋 呢 一個 呢 ,就 差唔多 嘅 概念 啦 。 så|jag|vi|denna|en|partikel|just|nästan|possessiv partikel|koncept|partikel then|we|plural marker|this|one|question particle|just|similar|possessive particle|concept|final particle Så, det här konceptet är nästan detsamma. So our concept here is almost the same. 咁 就 …… så|då then|just Så... So...

靳 :我 哋 複製 嘅 唔 係 陳雲 啦 。 Jin|jag|plural marker|kopierade|possessive particle|inte|är|Chen Yun|sentence-final particle Jin|we|plural marker|copied|possessive particle|not|is|Chan Wan|sentence-final particle Jin: Vi kopierar inte Chen Yun. Jin: What we copied is not Chen Yun.

苗 :係 喇 。 Miao|är|partikel Miao|yes|particle indicating completed action Miao: Ja. Miao: That's right. 咁 我 哋 複製 嘅 呢 ,就 係 我 哋 之前 咁 多集 嘅 逐字 稿 啦 。 så|jag|vi|kopierade|partikel|detta|just|är|jag|vi|tidigare|så|många avsnitt|partikel|ord för ord|manus|partikel then|we|plural marker|copy|possessive particle|this|just|is|we|plural marker|before|so|many episodes|possessive particle|verbatim|script|final particle Så det vi kopierar är våra tidigare så många avsnitt av ord för ord. So what we copied is the verbatim script from all the previous episodes. 噉 以色列 好 辛苦 咁 打 咗 好多好多 咁 嘅 字 啦 。 så|Israel|mycket|svårt|så|skriva|har skrivit|väldigt många|så|av|tecken|partikel then|Israel|very|hard|so|hit|past tense marker|many many|such|possessive particle|words|final particle Så Israel har kämpat hårt för att skriva så många sådana ord. Israel has worked very hard to write so many words. 呢啲 ……有 幾多 字 啊 ? dessa|har|hur många|tecken|frågepartikel these|have|how many|characters|question particle Det här ... hur många ord är det? How many words are there in this...? 係 咪 …… Är det inte ... Isn't it...?

以 :十七萬 字 。 med|170000|tecken with|170000|characters Alltså: sjutton tusen ord. It's: 170,000 words.

苗 :十七萬 字 喇 ,係 喇 。 Miao|170000|ord|partikel|är|partikel Miao|170000|words|particle|is|particle Miao: sjutton tusen ord, ja. Miao: It's 170,000 words, yes. 好多好多 嘅 字 啦 。 mycket mycket|partikel|ord|partikel very very much|possessive particle|words|sentence-final particle Många, många ord. There are a lot of words.

靳 :嘩 ,獨力 嘅 十七萬 字 。 Jin|wow|by oneself|possessive particle|170000|characters Jin|wow|by oneself|possessive particle|170000|characters Jin: Wow, sjutton tusen ord på egen hand. Jin: Wow, that's 170,000 words all by yourself.

苗 : 係 啊 , 粒粒皆辛苦 啊 。 Miao: Ja, varje ord är en kamp. Miu: Yes, every single one is hard work.

靳 : 真 係 。 Jin|| Jin|| Jin: Verkligen. Jin: That's true.

苗 :……嘅 十七萬 字 。 Miao|possessive particle|170000|characters Miao|possessive particle|170000|characters Miao: ...... sjutton tusen tecken. Miao: ...... a total of 170,000 characters. 咁 呢 啲 咁多 字 呢 ,我哋 就 三個 三個 字 ,咁樣 為 一個 單位 啦 。 så|detta|pluralpartikel|så många|tecken|detta|vi|bara|tre|tre|tecken|så|som|en|enhet|avslutande partikel then|this|plural marker|so many|characters|this|we|just|three|three|characters|like this|as|one|unit|final particle キャラクターが多すぎて3人しかいないのでユニットです。 Så dessa så många tecken, vi tar tre och tre tecken, så blir det en enhet. So for these many characters, we will group them in sets of three. 咁 就 去 統計 每 三個 字 ,即係 究竟 數起 上嚟 有 幾多個 呢 ? så|då|gå|räkna|varje|tre|ord|alltså|är|egentligen|räkna|upp|komma|ha then|just|go|count|every|three|characters|that is|after all|counting|up|have|how many|question particle では、3語ごとに数えましょう。つまり、いくつあるのでしょうか。 Så vi går och räknar varje tre tecken, det vill säga hur många det blir? Then we will count every three characters, that is, how many sets there are in total? 然 之後 再 ……我 哋 再數 嘞 。 sedan|efter|igen|jag|plural marker|räkna igen|partikel för avslutning then|after|again|we|plural marker|count again|past tense marker そして...もう一度数えましょう。 Och sedan räknar vi igen. After that, we will count again. 噉 我 就 嘗試 解釋 下 呢 一個 n-gram 呢 個 嘢 係 點樣 運作 啦 。 så|jag|då|försöker|förklara|lite|detta|en|||detta|partikel|sak|är|hur|fungerar|avslutande partikel then|I|will|try|explain|a little|this|one|||this|classifier|thing|is|how|works|sentence-final particle それでは、このn-gramシステムがどのように機能するかを説明してみましょう。 Så jag ska försöka förklara hur en n-gram fungerar. So, I will try to explain how this n-gram thing works. 即 係 用 一個 n-gram 嘅 叫做 language model 啦 , 即 係 一個 語言 模型 , 去 生成 一篇 嘢 出 嚟 , 係 點樣 嘅 呢 ? つまり、n-gramは言語モデル、つまり言語モデルと呼ばれ、記事を生成するのですが、どのようなものですか? Det vill säga att använda en n-gram som kallas språkmodell, för att generera en text, hur fungerar det? That is, using something called an n-gram language model to generate a piece of text, how does it work? 咁 我 就 首先 解釋 下 咩 叫做 language model 啦 。 så|jag|då|först|förklara|lite|vad|kallas|||partikel then|I|then|first|explain|a little|what|is called|||sentence-final particle それでは、最初に言語モデルと呼ばれるものについて説明しましょう。 Så jag ska först förklara vad en språkmodell är. First, let me explain what a language model is. 咁 佢 嘅 作用 呢 ,就 係 根據 一句 嘢 ,你 之前 見到 嘅 字 呢 ,就 推測 下 一個 字 係 乜嘢 。 så|han|possessivpartikel|funktion|frågepartikel|då|är|baserat på|en mening|sak|du|tidigare|såg|possessivpartikel|tecken|frågepartikel|då|gissa|nästa|ett|tecken|är|vad then|he|possessive particle|function|question particle|just|is|based on|one sentence|thing|you|previously|saw|possessive particle|character|question particle|just|infer|next|one|character|is|what これの機能は、あなたが前に見た単語に基づいて次の単語が何であるかを推測することです。 Dess funktion är att baserat på en mening, gissa vilket ord som kommer härnäst utifrån de ord du tidigare har sett. Its function is to predict what a word is based on the words you have seen before in a sentence. 咁 而 n-gram 呢 ,就 係 其中 一種 language model 喇 。 så|och|||frågepartikel|då|är|bland|en typ av|språk|modell|partikel then|and|||question particle|just|is|among|one type of|language|model|final particle ええと、n-gramは言語モデルの1つです。 Så n-gram är en typ av språkmodell. So, n-gram is one type of language model. 咁 呢 個 係 一個 比較簡單 嘅 language model , 即 係 可能 你 讀 一 啲 比較 入門 嘅 電腦 語言學 嘅 課程 呢 , 都 會 介紹 呢 樣 嘢 嘅 。 これは比較的単純な言語モデルです。つまり、比較的入門的なコンピュータ言語学のコースを読むと、それを紹介します。 Detta är en ganska enkel språkmodell, vilket innebär att om du läser en grundkurs i datalingvistik, kommer du att bli introducerad till detta. This is a relatively simple language model, which you might encounter in introductory computer linguistics courses. 咁 譬如 我 哋 個 稿 裏面 呢 ,有 一句 嘢 係 「今日 天氣 好好 」咁 樣 啦 。 så|till exempel|jag|pluralpartikel|possessivpartikel|manus|inuti|partikel för att indikera plats|har|en mening|sak|är|idag|väder|mycket bra|så|utseende|partikel för att indikera avslutning then|for example|I|we|the|draft|inside|particle|has|one sentence|thing|is|today|weather|very good|like that|appearance|particle たとえば、私たちの原稿の1つに、「今日は天気がいい」という文があります。 Till exempel, i vårt manus finns det en mening som säger "Idag är vädret riktigt bra". For example, in our script, there is a sentence that says "The weather is nice today.". 咁 我 哋 就 三個 、三個 字 咁 樣 去 統計 ,究竟 「今日 天 」跟住 「日 天氣 」…… så|jag|vi|bara|tre|tre|ord|så|sätta|räkna|egentligen|idag|dag|följer|sol|väder| then|we|plural marker|just|three|three|words|like this|way|to|count|after all|today|sky|following|sun|weather それでは、「今日の日」と「今日の天気」という3、3語を頼りにしましょう... Så vi statistiserar tre och tre ord, vad "Idag vädret" följs av... So we count three words at a time, to see how "Today the" follows "the weather"...

以 :「天氣 好 」 med|väder|bra using|weather|good Med: "Vädret är bra" For example: "The weather is good."

苗 : 係 喇 , 係 喇 。 Miao: Ja, ja. Miao: Yes, yes. 咁 呢 幾個 字 ,究竟 出現 咗 幾 多次 啦 。 så|dessa|några|tecken|egentligen|förekomma|partikel för fullbordad handling|hur många|gånger|partikel för att bekräfta then|this|few|characters|exactly|appear|past tense marker|how|many times|final particle これらの単語は何回表示されますか? Så hur många gånger har dessa få ord dykt upp? So how many times did these few words actually appear? 咁 一路 一路 一路 咁 樣去 統計 。 så|hela vägen|hela vägen|hela vägen|så|ser ut|statistik then|all the way|all the way|all the way|then|how to go|statistics Så vi fortsätter att räkna. So let's continue to count like this. 咁 如果 呢 ……因為 好 難 去 解釋 ,冇 visual 係 好 難解 釋 嘅 ,呢 樣 嘢 。 then|if|this|because|very|difficult|to|explain|without|visual|is|very|difficult to understand|explain|particle|this|thing|thing Så om detta... eftersom det är väldigt svårt att förklara, utan visuell hjälp är det svårt att förklara den här saken. So if this... because it's very difficult to explain, without visuals it's really hard to explain this.

以 :我 哋 手語 都 做到 啦 ! med|jag|vi|teckenspråk|också|kan göra|partikel för att uttrycka avslutning eller bekräftelse in terms of|I|we|sign language|also|can do|sentence final particle Till exempel: Vi kan också göra det med teckenspråk! For example: we can do it in sign language!

靳 :ok 嘅 ! Jin|okej|partikel Jin|okay|particle indicating possession or affirmation Jin: Okej! Jin: That's okay!

苗 :係 嘞 。 Miao|är|partikel Miao|is|a particle indicating completed action Miao: Ja. Miao: Yes. 噉 你 數 咗 咁 多 呢 一 啲 三個 、三個 字 之後 呢 ,咁 你 就 去 再 將 佢 變成 一個 機率 啦 。 then|you|count|past tense marker|so|many|question particle|one|measure word for small amounts|three|three|characters|after|question particle|then|you|then|go|again|to make|it|become|one|probability|final particle キャラクターの数、1、3、3を数えたら、それをチャンスに変えることができます。 Så, när du har räknat så många av dessa tre bokstäver, då kan du gå vidare och omvandla dem till en sannolikhet. So, after you count so many of these three-character words, you will then convert them into a probability. 咁 點樣 變 呢 ? så|hur|förändra|detta then|how|change|question particle Hur gör man det? So how do you convert them? 就 係 睇 下 頭 兩個 字 。 Det handlar om att titta på de två första bokstäverna. You look at the first two characters. 如果 頭 兩個 字 係 一樣 嘅 話 呢 ,就 當 係 同一 group 啦 。 om|första|två|tecken|är|lika|partikel|talar|detta|då|betrakta|vara|samma|grupp|partikel if|first|two|characters|are|the same|possessive particle|speaking|this|then|treat|as|same|group|sentence-final particle Om de två första bokstäverna är lika, då räknas de som samma grupp. If the first two characters are the same, then consider them as the same group. 假設 即 係 篇 文 裏面 有 「 今日 我 」、「 今日 你 」、「 今日 去 」 咁 樣 , 有 三組 唔 同 嘅 字 , 譬如 「 今日 我 」 出現 咗 九十 次 , 跟 住 「 今日 你 」 呢 , 出現 咗 五次 ,「 今日 佢 」 出現 咗 五次 。 Anta att i texten finns det "Idag jag", "Idag du", "Idag går" och så vidare, det finns tre olika grupper av ord, till exempel "Idag jag" förekommer nittio gånger, följt av "Idag du" som förekommer fem gånger, och "Idag han" som också förekommer fem gånger. Assuming that in the text there are "Today I", "Today you", "Today he/she" and so on, there are three different sets of words, for example, "Today I" appears ninety times, then "Today you" appears five times, and "Today he/she" appears five times. 咁 嘅 話 呢 ,就 係 你 將 呢 幾個 數字 加埋 ,咁 就 係 一百 啦 。 så|partikel för beskrivning|tal|detta|då|är|du|kommer att|detta|några|siffror|addera|så|då|är|ett hundra|partikel för bekräftelse then|possessive particle|saying|this|then|is|you|will|this|several|numbers|add together|then|then|is|one hundred|final particle Om så är fallet, så lägger du ihop dessa siffror, och då blir det hundra. In that case, you add these numbers together, and that makes one hundred. 咁 你 就 將 嗰 個 數 目 呢 ,就 除 返 一百 。 så|du|då|ska|det|måttsord|tal|nummer|frågepartikel|då|dela|tillbaka|hundra then|you|will|take|that|measure word|number|question|particle|then|divide|back|one hundred Då tar du det numret och delar det med hundra. Then you take that number and divide it by one hundred. 例如 「 今日 我 」 呢 , 咁 就 係 九十 除 一百 啦 , 咁 就 係 0.9 嘞 。 Till exempel "Idag jag", så blir det nittio delat med hundra, vilket blir 0.9. For example, for "Today I", that would be ninety divided by one hundred, which is 0.9. 咁 呢 個 數字 表達 緊 啲 咩 呢 ? så|den|ett|siffra|uttrycker|just nu|lite|vad|den then|this|measure word|number|expresses|currently|some|what|question particle Vad betyder den här siffran? So what does this number represent? 就係話 ,只要 你 頭 兩個 字 係 「今日 」嘅 話 呢 ,後面 一個 字 係 「我 」嗰 個 機率 ,就 有 0.9 嘞 ,即係 90% 喇 。 det betyder|så länge som|du|första|två|ord|är|idag|possessivpartikel|tal|här|efter|ett|ord|är|jag|den|partikel för räknande|sannolikhet|då|har|partikel för bekräftelse|det betyder|partikel för avslutning that means|as long as|you|first|two|characters|are|today|possessive particle|statement|particle|behind|one|character|is|I|that|particle|probability|then|has|particle|that is|particle Det betyder att så länge de två första orden är "idag", så är sannolikheten för att det tredje ordet är "jag" 0,9, vilket är 90%. It means that as long as your first two words are 'today', the probability of the next word being 'I' is 0.9, which is 90%. 咁 而 其他 字 呢 ,就 係 分別 係 5% 啦 。 så|och|andra|tecken|frågepartikel|då|är|skillnad|är|avslutande partikel then|and|other|words|question particle|then|are|difference|is|final particle Och de andra orden har en sannolikhet på 5%. As for the other words, they each have a 5% chance. 即係 呢 個 例子 只 係 得 三個 可能性 ,咁 就 冇 其他 可能性 㗎 喇 喎 。 det betyder|detta|klassikerpartikel|exempel|bara|är|har|tre|möjligheter|så|då|har inte|andra|möjligheter|partikel|partikel|partikel that means|this|measure word|example|only|is|has|three|possibilities|then|then|has no|other|possibilities|particle|particle|particle Det betyder att det här exemplet bara har tre möjligheter, så det finns inga andra möjligheter. So in this example, there are only three possibilities, and there are no other possibilities. 即係 「今日 」之後 呢 ,你 淨係 可以 講 「我 」、「你 」同埋 「佢 」。 that is|today|after|particle indicating a question|you|only|can|say|I|you|and|he/she Det betyder att efter "idag" kan du bara säga "jag", "du" och "han/hon". That is, after 'today', you can only say 'I', 'you', and 'he/she'. 咁 呢 一個 就 係 n-gram model 嘅 一個 唔 好處 啦 ,就 係 你好 難 去 …… 你好 難 去 模擬 一 啲 好 複雜 嘅 語言 。 så|detta|en|bara|är|||modell|av|en|inte|fördel|partikel|bara|är|du är|svårt att|du|svårt att|simulera|en|partikel|mycket|komplex|av|språk|| then|this|one|just|is|||model|possessive particle|one|not|advantage|sentence-final particle|just|is|you very|difficult|to|you very|difficult|to|simulate|one|some|very|complex|possessive particle|language Det här är en nackdel med n-gram-modellen, att det är väldigt svårt att... det är väldigt svårt att simulera ett språk som är väldigt komplext. So this is a disadvantage of the n-gram model, which is that it's very difficult to... it's very difficult to simulate some complex languages. 一 啲 你 嗰 個 source 裏面 冇 嘅 嘢 囉 。 ett|lite|du|den|partikel|källa|inuti|inte har|possessiv partikel|sak|partikel a|little|you|that|measure word|source|inside|not have|possessive particle|thing|sentence-final particle Något som inte finns i din källa. Some things that are not present in your source. 即係 一定 要 出現 過 ,你 先 可以 有 囉 。 det betyder|absolut|att|dyka upp|tidigare|du|först|kan|ha|partikel för att indikera förändring that means|definitely|must|appear|past|you|only|can|have|particle indicating certainty Det måste ha förekommit tidigare för att du ska kunna ha det. That means it must have appeared before for you to have it. 咁 除非 你 係 有 做 咗 其他 smoothing 啊 ,類似 咁 樣 嘅 嘢 呢 ,咁 你 先 可以 即 係 解決 到 呢 個 問題 啦 ,叫做 。 så|om inte|du|är|har|gjort|perfekt aspektpartikel|andra|utjämning|partikel|liknande|så|utseende|possessivpartikel|sak|partikel|så|du|först|kan|direkt|vara|lösa|till|detta|partikel|problem|partikel|kallas then|unless|you|are|have|done|past tense marker|other|smoothing|particle|similar|like this|kind|possessive particle|thing|particle|then|you|first|can|immediately|be|solve|to|this|measure word|problem|particle|called Så om du har gjort någon annan smoothing, liknande saker, då kan du lösa det här problemet. So unless you have done some other smoothing, something like that, then you can solve this problem. 噉 但 係 我 哋 就 用 咗 一個 好 簡單 好 簡單 嘅 一個 模型 ,咁 就 去 整 啲 字 出 嚟 。 så|||||bara|||en|mycket|enkel|||partikel|en|modell|så|bara|gå|skapa|partikel|ord|| like this|||||then|||a|very|simple|||possessive particle|a|model|then|just|go|create|plural marker|characters|| Men vi använde en väldigt enkel, väldigt enkel modell för att generera text. But we used a very simple, very simple model to generate some words. 咁 所以 你 見到 呢 ,聽到 嗰 啲 字 ,如果 大家 係 比較 忠實 少 少 嘅 聽 眾 呢 ,就 會 聽得出 ,係 我 哋 之前 講 過 嘅 嘢 嚟 ,全部 都 係 我 哋 之前 講 過 嘅 嘢 嚟 嘅 。 så|därför|du|ser|här|hör|det|pluralpartikel|ord|om|alla|är|relativt|trogna|lite|mindre|partikel|||här|då|kommer|höra|är|jag|vi|tidigare|||partikel|saker|komma|allt|alla|är|jag|vi|tidigare|||partikel|saker|komma|partikel so|therefore|you|see|this|hear|that|plural marker|words|if|everyone|are|relatively|faithful|a little|less|possessive particle|||this|then|will|be able to hear|is|||previously|||possessive particle|things|come|all|all|are|||previously|||possessive particle|things|come|possessive particle Så om du hör de här orden, om alla är lite mer trogna lyssnare, så kommer de att höra att det är saker vi har pratat om tidigare, allt är saker vi har pratat om tidigare. So you see, if you listen to those words, if everyone is a bit more faithful as an audience, you will be able to hear that it is what we talked about before, all of it is what we talked about before.

靳 :可能 可以 搵到 係 邊 一集 講 。 Jin|kanske|kan|hitta|till|är|vilken|avsnitt Jin|possibly|can|find|is|which|episode|talked Jin: Kanske kan vi hitta vilken episod det handlar om. Jin: Maybe we can find out which episode it was discussed.

苗 :係 啊 ,係 啊 。 Miu|yes|particle|yes|particle Miao: Ja, ja. Miu: Yes, yes.

以 :可以 ……係 ,可以 估下 、揾 返出 嚟 。 med|kan|vara|kan|gissa|hitta|ut|komma to use|can|is|can|guess|find|out|come Yi: Man kan... ja, man kan gissa, och få fram det igen. Yi: It can... yes, you can guess and find it out. 日光 之下 無 新事 。 solljus|under|ingen|nya saker sunlight|under|no|new thing Inget nytt under solen. There is nothing new under the sun.

苗 :可能 成句 係 新 嘅 。 Miao|possibly|complete sentence|is|new|possessive particle Miao: Kanske hela meningen är ny. Miu: Maybe the whole sentence is new. 但係呢 ,如果 你 係 每 三個 、三個 字 咁樣 睇 呢 ,係 會 喺 我哋 以前 嘅 稿度 出現 過 嘅 。 men om detta|om|du|är|varje|tre|tre|ord|så|ser|detta|är|kommer|i|vi|tidigare|possessivpartikel|manus|dyka upp|tidigare|possessivpartikel but if|if|you|are|every|three|three|characters|like this|read|this|will|will|at|we|previously|possessive particle|draft|appear|past tense marker|possessive particle Men om du ser på det här, om du ser på varje tre, tre ord, så har det dykt upp i våra tidigare manus. However, if you look at it in groups of three words, it will appear in our previous drafts. 係 喇 ,咁 呢 個 就 係 我 哋 做 咗 嘅 嘢 。 ja|partikel som indikerar avslutning av en handling|så|detta|måttsord|just|är|jag|vi|göra|partikel som indikerar fullbordad handling|possessiv partikel|sak is|particle indicating completed action|then|this|classifier for objects|just|is|I|we|do|past tense marker|possessive particle|thing Ja, så det här är vad vi har gjort. Yes, so this is what we have done. 咁 所以 你 哋 見到 …… 你 見到 有 啲 九 唔 搭 八 ,但 係 又 好似 有少少 make sense 咁 樣 ,咁 就 因為 我 哋 就 揀 咗 三個 字 呢 一個 咁 樣 嘅 window 啦 ,就 聽 落 去 會 比較 有少少 合理 ,但 係 又 唔 知 …… 好似 唔 知 講 乜 噉 樣 。 then|so|you|plural marker|saw|you|saw|have|some|nine|not|matching|eight|but|is|again|seems|a little|||like that|appearance|then|just|because|I|plural marker|just|chose|past tense marker|three|characters|this|one|like that|appearance|possessive particle|window|sentence-final particle|just|listening|down|to|will|relatively|a little|reasonable|but|is|again|not|know|seems|not|know|speaking|what|like|appearance Så ni ser ... ni ser att det finns några som inte riktigt hänger ihop, men det verkar ändå ha lite mening, och det beror på att vi har valt tre ord som ett sådant fönster, så det låter lite mer rimligt, men man vet inte ... det verkar som om man inte vet vad man pratar om. So you see... you see some things that don't quite match, but they seem to make a little sense, and that's because we chose this three-word window, so it sounds a bit more reasonable, but then again... it seems like we don't really know what to say.

以 : 你 係 點樣 決定 咗 揀 三個 字 㗎 ? Till exempel: Hur bestämde du dig för att välja tre ord? For example: how did you decide to choose three words?

苗 :三個 字 ,其實 係 一個 ……其實 都 係 一個 choice 嚟 嘅 啫 。 Miao|tre|tecken|egentligen|är|ett|egentligen|också|är|ett|val|komma|partikel|bara Miao|three|characters|actually|is|one|actually|also|is|one|choice|coming|possessive particle|only Miao: Tre bokstäver, egentligen är det ett... egentligen är det bara ett val. Miu: Three characters, actually it's one... it's actually just a choice. 因為 好多 時 ,如果 英文 嘅 話 呢 ,一 啲 真 係 會 用 呢啲 language model 嘅 人 呢 ,就 通常 最盡 係 去 到 5-gram 嘅 啫 ,最盡 係 五個 字 嘅 啫 。 eftersom|många|gånger|om|engelska|possessivpartikel|tal|detta|en|några|verkligen|är|kommer att|använda|dessa|språk|modell|possessivpartikel|människor|detta|då|vanligtvis|högst|är|gå|till|5-gram|possessivpartikel|bara|högst|är|fem|ord|possessivpartikel|bara because|many|times|if|English|possessive particle|speaking|this|one|some|really|are|will|use|these|language|models|possessive particle|people|this|then|usually|at most|are|go|to|5-gram|possessive particle|only|at most|are|five|words|possessive particle|only För många gånger, om vi pratar engelska, så är det faktiskt de som verkligen använder dessa språkmodeller, de brukar vanligtvis bara gå upp till 5-gram, det vill säga högst fem bokstäver. Because many times, if it's in English, those who really use these language models usually only go up to 5-gram, at most five characters. 咁 因為 再 多 字 呢 ,你 有 一個 ……你所需要嘅 輸入 嗰啲 字 呢 ,係 好多 好多 好多 嘅 。 så|eftersom|igen|fler|tecken|frågepartikel|du|har|en|de som du behöver|inmatning|de|tecken|frågepartikel|är|många|många|många|partikel then|because|again|more|characters|question particle|you|have|a|you need|input|those|characters|question particle|are|many|many|many|possessive particle Så eftersom det är fler bokstäver, har du en... de bokstäver du behöver som indata är väldigt, väldigt många. So because more characters mean you have a... the input characters you need are a lot, a lot, a lot. 即係 你好 少會 有 一 啲 好 嘅 數據 囉 。 det betyder|hej|lite|har|ett|partikel för plural|bra|possessiv partikel|data|partikel för att indikera förändring that means|hello|rarely|have|one|some|good|possessive particle|data|sentence-final particle Det betyder att du sällan har bra data. That means you rarely have good data. 如果 你 有 ……你 係 用 五個 、五個 字 。 om|du|har|du|är|använda|fem|fem|ord if|you|have|you|are|using|five|five|words Om du har ... så använder du fem, fem ord. If you have... you are using five, five words. 如果 你 用 …… 淨 係 用 一個 字 , 即 係 叫 所謂 unigram ,你 就 用 一個 字 。 om|du|använder|bara|är|använda|ett|ord|det vill säga|är|kallas|så kallad|unigram|du|då|använder|ett|ord if|you|use|||use|one|character|||called|so-called|unigram|you|then|use|one|character Om du använder ... bara ett ord, så kallas det unigram, då använder du ett ord. If you use... only one word, that is called unigram, you just use one word. 咁 即係 其實 你 係 計緊 成篇文 有 幾多個 字 囉 ,即係 幾多個 某一個 字 囉 。 then|that means|actually|you|are|counting|the whole text|has|how many|characters|particle|that means|how many|a certain|character|particle Det betyder att du faktiskt räknar hur många ord det finns i hela texten, det vill säga hur många av ett visst ord. So actually you are counting how many words are in the entire text, that is, how many of a certain word. 即係 譬如 有 一百個 「我 」字 ,有 十個 「佢 」字 咁樣 ,咁 呢啲 呢啲 囉 。 på det sättet|till exempel|har|ett hundra|Jag|tecken|har|ett tio|han/hon|tecken|på det sättet|så|detta|detta|partikel that is|for example|there are|one hundred|||there are|ten|||like this|then|these|these|particle indicating finality or confirmation Till exempel, om det finns hundra "jag" ord, och tio "han" ord, så är det så. For example, if there are one hundred 'I' words, and ten 'he' words, that's it. 但係 如果 你 嗰 個 n 越 大 啊 ,你 係 bigram 、trigram 、4-gram ,一路 越 嚟 越 大 嘅 話 呢 ,你 嗰 啲 資料 就 越 嚟 越 少 囉 。 men|om|du|det|klasspartikel|n|mer|stor|partikel|du|är|bigram|trigram|4-gram|hela tiden|mer|komma|mer|stor|partikel|tal|partikel|du|det|partikel|data|då|mer|komma|mer|lite|partikel but|if|you|that|measure word|n|the more|large|particle|you|are|bigram|trigram|4-gram|continuously|the more|coming|the more|large|particle|speaking|particle|you|that|plural marker|data|then|the more|coming|the more|few|particle Men om ditt n blir större, som i bigram, trigram, 4-gram, ju större det blir, desto mindre data har du. But if your n is larger, like in bigram, trigram, 4-gram, as it gets larger, the amount of data you have becomes less. 咁 所以 你 係 要 喺 嗰 個 n 同埋 你 有 嘅 輸入 資料 嗰 個 大 細 ,做 一個 平衡 。 så|därför|du|är|måste|i|det|partikel|n|och|du|har|partikel|input|data|det|partikel|stor|liten|göra|en|balans so|therefore|you|are|need|at|that|measure word|n|and|you|have|possessive particle|input|data|that|measure word|large|small|do|a|balance Så du måste balansera mellan det n och storleken på de indata du har. So you need to find a balance between the size of n and the amount of input data you have. 噉 3 係 一個 好 常見 嘅 數 囉 ,就 係 。 så|är|en|mycket|vanlig|partikel|siffra|partikel|bara|är like this|is|a|very|common|possessive particle|number|sentence-final particle|just|is はい、3が非常に一般的な数字だとしましょう。 Så 3 är ett mycket vanligt tal. So 3 is a very common number. 通常 trigram 都 係 就算 係 英文 同 中文 都 係 …… 都 係 成日 出現 。 通常、トライグラムは英語と中国語の両方で書かれています...それらはすべて毎日表示されます。 Vanligtvis förekommer trigram, oavsett om det är engelska eller kinesiska, hela tiden. Usually, trigrams appear frequently in both English and Chinese.

以 :哦 ,噉 假如 你 轉 咗 做 4 嘅 話 ,會 有 咩 唔 同 呢 ? om|åh|så|om|du|byter|partikel för avslutad handling|bli|partikel för besittning|talar|kommer|ha|vad|inte|skillnad|frågepartikel if|oh|then|suppose|you|change|past tense marker|do|possessive particle|speaking|will|have|what|not|same|question particle テイク:ああ、4に切り替えた場合の違いは何ですか? Så: åh, om du byter till 4, vad skulle vara annorlunda? So, if you change to 4, what will be different? 有 咩 後果 呢 ? ha|vad|konsekvenser|frågepartikel have|what|consequences|question particle Vilka konsekvenser skulle det ha? What are the consequences?

苗 :係 喇 。 Miao|är|partikel Miao|yes|particle indicating completed action Ja, precis. Yes. 4嘅 話 呢 ,就 即 係 咩 呢 ? partikel för besittning|säga|frågepartikel|just|||vad|frågepartikel 4|say|question particle|then|||what|question particle Vad innebär det att vara 4? What does it mean to be 4? 就 即 係 你 要 估下 一個 字 係 咩 呢 ,你 就 要 睇 頭 三個 字 。 då|genast|är|du|måste|gissa|ett|ord|är|vad|frågepartikel|du|då|måste|titta|första|tre|ord then|immediately|is|you|need|guess|one|word|is|what|question particle|you|then|need|look|first|three|characters Det är som att du måste gissa vilket ord det är, så du måste titta på de tre första bokstäverna. So basically, you need to guess what a word is, and you have to look at the first three characters. 你 要 睇 前 三個 字 係 乜嘢 ,你 先 可以 決定 到 第四 ,你 先 有 第四個 字 嗰 個 機率 囉 。 du|måste|läsa|första|tre|tecken|är|vad|du|först|kan|bestämma|till|fjärde|du|först|har|fjärde|tecken|den|partikel|sannolikhet|partikel you|need|to see|first|three|characters|are|what|you|first|can|decide|on|fourth|you|first|have|fourth|character|that|measure word|probability|particle Du måste se vad de tre första bokstäverna är, så att du kan bestämma den fjärde, så att du har en chans på den fjärde bokstaven. You need to see what the first three characters are, and then you can decide on the fourth; that's how you get the probability of the fourth character. 如果 你 嗰 個 n 越 細 呢 ,你 就 淨 係 睇 前面 更加 少 嘅 字 。 om|du|det|måttsord|n|mer|liten|frågepartikel|du|då|bara|är|läsa|framför|ännu|färre|partikel|tecken if|you|that|measure word|n|the more|small|question particle|you|then|only|is|read|in front|even more|fewer|possessive particle|characters Om ditt n är mindre, så tittar du bara på ännu färre bokstäver i början. If your n is smaller, then you only look at even fewer characters in the front. 如果 你 係 bigram 呢 ,你 淨 係 根據 前 一個 字 去 推測 下 一個 字 。 om|du|är|bigram|här|du|bara|är|baserat på|tidigare|ett|tecken|att|förutsäga|nästa|ett|tecken if|you|are|bigram|particle indicating a question|you|only|are|based on|previous|one|character|to|predict|next|one|character Om du är i bigram, så baserar du bara på det föregående ordet för att förutsäga nästa ord. If you are using bigram, then you only predict the next character based on the previous character. 即係 有 少少 似 譬如 你 打字 呢 ,如果 你 打 一 啲 比較 舊 嘅 輸入法 啦 ,佢 係 會 逐個 逐個 字 咁樣 去 類似 suggest 畀 你 :「哦 ,下 一個 字 打 咩 好 啊 ? alltså|har|lite|liknande|till exempel|du|skriver|frågepartikel|om|du|skriver|ett|partikel för plural|relativt|gammal|partikel för besittning|inmatningsmetod|partikel för uppmaning|han|är|kommer att|en i taget|en i taget|tecken|så|gå|liknande|föreslå|till|du|åh|nästa|ett|tecken|skriva|vad|bra|partikel för eftertryck that is|has|a little|similar|for example|you|typing|question particle|if|you|input|one|measure word for things|relatively|old|possessive particle|input method|final particle|it|is|will|one by one|one by one|character|like this|to|similar|suggest|to give|you|oh|next|one|character|input|what|good|ah Det är lite som när du skriver, om du använder en gammal inmatningsmetod, så kommer den att föreslå ord för dig ett i taget: "Åh, vilket ord ska jag skriva härnäst?" That is, it's a bit like when you type, if you use an older input method, it will suggest each character to you one by one: "Oh, what should the next character be?" 」咁 樣 㗎 嘛 。 så|utseende|partikel|partikel like this|appearance|question particle|emphasis particle Så är det ju. That's how it is. 手機 好多 時 都 會 囉 。 mobil|mycket|tid|alltid|kan|partikel för att indikera förändring mobile phone|many|time|all|will|sentence-final particle Många gånger gör telefoner det. Many times, mobile phones will do this.

以 :「舊 嘅 輸入法 」。 med|gammal|possessivt partiklar|inmatningsmetod using|old|possessive particle|input method Till exempel: "gammal inmatningsmetod". For example: "old input method."

苗 :係 喇 。 Miao|är|partikel Miao|is|a particle indicating completed action Miao: Ja. Miu: Yes. 即係 咁 嗰啲 就係 類似 一個 叫做 bigram 嘅 model ,咁 就 係 根據 前 一個 字 ,直接 推測 下 一個 字 。 det betyder|så|de|är|liknande|en|som kallas|bigram|partikel|modell|så|då|är|baserat på|tidigare|en|tecken|direkt|förutsäga|nästa|en|tecken that is|then|those|are|similar|one|called|bigram|possessive particle|model|then|just|is|based on|previous|one|character|directly|predicting|next|one|character Det är som de där som liknar en modell som kallas bigram, som baseras på det föregående tecknet för att direkt förutsäga nästa tecken. That is, those are similar to a model called bigram, which predicts the next word based on the previous word. 所以 你 不斷 㩒㩒㩒㩒 中間 呢 ,你 㩒 佢 推測 啲 字 呢 ,你 打出 嚟 嗰 句 嘢 ,其實 都 係 唔 係 好 make sense 㗎 ,都 係 冇 乜 意思 㗎 。 så|du|konstant|trycka|mitt|frågepartikel|du|trycka|han|gissa|pluralpartikel|ord|frågepartikel|du|skriva ut|komma ut|den|mening|saken|egentligen|också|är|inte|är|bra|||partikel|också|är|inte ha|något|mening|partikel so|you|continuously|tapping|in the middle|question particle|you|tap|he|guessing|plural particle|words|question particle|you|typed out|coming|that|sentence|thing|actually|also|is|not|is|very|||particle|also|is|not have|any|meaning|particle Så du trycker hela tiden mitt i, du trycker för att förutsäga tecknen, det du skriver ut är faktiskt inte särskilt meningsfullt, det har inte mycket betydelse. So, if you keep clicking in between, and you click to predict the words, the sentence you type out actually doesn't make much sense, it doesn't really mean anything.

靳 :冇 乜 意思 。 Jin|har inte|vad|mening Jin|not have|what|meaning Jin: Det har inte mycket betydelse. Gan: Doesn't mean much.

以 :哦 ,嗱 ,咁 我 哋 廣東話 呢 ,我 哋 啲 逐字 稿 呢 ,就 係 用 方塊字 做 單位 啦 。 för|åh|tja|så|jag|oss|kantonesiska|partikel för att indikera nuvarande situation|jag|oss|pluralpartikel|ord för ord|manus|partikel för att indikera nuvarande situation|bara|är|använda|kinesiska tecken|göra|enhet|partikel för att mjuka upp uttal to use|oh|well|then|I|plural marker|Cantonese|question particle|I|plural marker|plural marker|word-for-word|script|question particle|just|is|using|square characters|as|unit|final particle Så: åh, tja, så på vårt kantonesiska, våra transkriptioner, de använder kvadratiska tecken som enhet. So, in Cantonese, our transcripts are based on using square characters as units. 咁 如果 換着 係 英文 啊 ,嗰 啲 拼音 語言 嘅 話 ,咁 佢 個 做法 會 有 咩 唔 同 ,即係 會 係 都 係 用 返 一個 字 元 做 單位 吖 ,定 係 用 成個 word 做 一個 單位 呢 ? then|if|changing|is|English|ah|that|plural marker|pinyin|language|possessive particle|speech|then|it|measure word|method|will|have|what|not|different|that is|will|is|also|is|use|back|one|character|unit|as|unit|ah|or|is|use|whole|word|as|one|unit|question particle Så om vi byter till engelska, de där fonetiska språken, hur skulle deras metod skilja sig? Använder de också enskilda tecken som enhet, eller använder de hela ord som en enhet? If we switch to English, for those phonetic languages, what would be the difference in their approach? Would they also use a character as a unit, or would they use an entire word as a unit?

The rest of the transcript is available to Patreon members . Join at :patreon.com/rhapsodyinlingo Rest|av|av|transkript|transkript|är|tillgänglig|för|Patreon|medlemmar|Gå med|på||| The|rest|of|the|transcript|is|available|to|Patreon|members|Join|at||| Resten av transkriptionen är tillgänglig för Patreon-medlemmar. Gå med på: patreon.com/rhapsodyinlingo The rest of the transcript is available to Patreon members. Join at: patreon.com/rhapsodyinlingo

ai_request(all=184 err=0.00%) translation(all=147 err=0.68%) cwt(all=2081 err=20.33%) sv:AFkKFwvL en:AFkKFwvL openai.2025-02-07 SENT_CWT:AFkKFwvL=5.65 PAR_TRANS:gpt-4o-mini=5.5 SENT_CWT:AFkKFwvL=6.03 PAR_TRANS:gpt-4o-mini=4.9