跳至主要内容

ybs 字幕

解決斷句問題

有使用過 Youtube 自動生成字幕的用戶都知道,自動生成字幕一直存在斷句的問題。這些字幕沒有標點符號,不同的句子會連在一起,並在某個時間點斷開(如下圖的主字幕)。由於 Youtube 的字幕翻譯是根據這些斷開的句子逐行翻譯的,這導致翻譯質素很糟糕。

13

我們使用機器學習修復這些字幕,重新組合這些斷開的句子,這可使翻譯質素大大提高。

14

生成速度

由於 ybs 字幕是基於現有的字幕生成的,這使生成速度非常快。

freecodecamp 的 19 小時教學影片為例,我們只需要 30 秒 即可生成全部字幕。

Melanie Nakagawa, Chief Sustainability Officer at Microsoft 這部 48 分鐘的影片為例,ybs 需時 12 秒,whisper 需時 3 分鐘 22 秒(使用 RTX 4090)

支援語言

ybs 字幕已支援自動生成字幕的全部語言。

AI 修復

由於 ybs 字幕是基於自動生成字幕生成的,Youtube 使用的語音識別技術將直接影響到 ybs 字幕的質素,某些語言錯誤率較低,例如英語,某些則頻繁出現錯誤,例如日語。現時我們提供的解決方案是使用 AI 修復這些字幕,它可替我們修復一些比較明顯的錯誤,例如語法錯誤或詞彙缺失,但也可能改變句子的結構和用詞。