ybs 字幕
解決斷句問題
有使用過 Youtube 自動生成字幕的用戶都知道,自動生成字幕一直存在斷句的問題。這些字幕沒有標點符號,不同的句子會連在一起,並在某個時間點斷開(如下圖的主字幕)。由於 Youtube 的字幕翻譯是根據這些斷開的句子逐行翻譯的,這導致翻譯質素很糟糕。
我們使用機器學習修復這些字幕,重新組合這些斷開的句子,這可使翻譯質素大大提高。
生成速度
由於 ybs 字幕是基於現有的字幕生成的,這使生成速度非常快。
以 freecodecamp 的 19 小時教學影片為例,我們只需要 30 秒 即可生成全部字幕。
以 Melanie Nakagawa, Chief Sustainability Officer at Microsoft 這部 48 分鐘的影片為例,ybs 需時 12 秒,whisper 需時 3 分鐘 22 秒(使用 RTX 4090)
支援語言
ybs 字幕支援自動生成字幕的大部分語言,如有其他語言需求,歡迎聯繫我們。
- 英語
- 德語
- 法語
- 西班牙語
- 意大利語
- 荷蘭語
- 葡萄牙語
- 日語
- 韓語
- 阿拉伯語
- 希伯來語
- 印地語
- 印尼語
- 俄語
- 土耳其語
- 烏克蘭語
- 越南語
AI 修復
由於 ybs 字幕是基於自動生成字幕生成的,Youtube 使用的語音識別技術將直接影響到 ybs 字幕的質素,某些語言錯誤率較低,例如英語,某些則頻繁出現錯誤,例如日語。現時我們提供的解決方案是使用 AI 修復這些字幕,它可替我們修復一些比較明顯的錯誤,例如語法錯誤或詞彙缺失,但也可能改變句子的結構和用詞。