ybs 字幕
解決斷句問題
有使用過 Youtube 自動生成字幕的用戶都知道,自動生成字幕一直存在斷句的問題。這些字幕沒有標點符號,不同的句子會連在一起,並在某個時間點斷開(如下圖的主字幕)。由於 Youtube 的字幕翻譯是根據這些斷開的句子逐行翻譯的,這導致翻譯質素很糟糕。
我們使用機器學習修復這些字幕,重新組合這些斷開的句子,這可使翻譯質素大大提高。
生成速度
由於 ybs 字幕是基於現有的字幕生成的,這使生成速度非常快。
以 freecodecamp 的 19 小時教學影片為例,我們只需要 30 秒 即可生成全部字幕。
以 Melanie Nakagawa, Chief Sustainability Officer at Microsoft 這部 48 分鐘的影片為例,ybs 需時 12 秒,whisper 需時 3 分鐘 22 秒(使用 RTX 4090)
支援語言
ybs 字幕已支援自動生成字幕的全部語言。
- 阿拉伯語 https://www.youtube.com/@AlArabiya
- 孟加拉語 https://www.youtube.com/@republicbangla
- 保加利亞語 https://www.youtube.com/@bTVMediaGroup
- 捷克語 https://www.youtube.com/@tvnovaofficial
- 丹麥語 https://www.youtube.com/@p3essensen
- 荷蘭語 https://www.youtube.com/@nosop3
- 英語 https://www.youtube.com/@ABCNews
- 法語 https://www.youtube.com/@FRANCE24
- 波斯語 https://www.youtube.com/@afintltv
- 他加祿語/菲律賓語 https://www.youtube.com/@GMARegionalTV
- 芬蘭語 https://www.youtube.com/@psverkkomedia
- 德語 https://www.youtube.com/@WELTVideoTV
- 希臘語 https://www.youtube.com/@SKAIgr
- 古吉拉特語 https://www.youtube.com/@News18Gujarati
- 希伯來語 https://www.youtube.com/@now14
- 印地語 https://www.youtube.com/@knh9443
- 匈牙利語 https://www.youtube.com/watch?v=fOpIfaBprDU
- 印尼語 https://www.youtube.com/@tvOneNews
- 義大利語 https://www.youtube.com/@euronewsit
- 日語 https://www.youtube.com/@ntv_news
- 坎納達語 https://www.youtube.com/@tv9kannada
- 韓語 https://www.youtube.com/@MBCNEWS11
- 拉脫維亞語 https://www.youtube.com/c/LTVZiņudienests
- 立陶宛語 https://www.youtube.com/@LRTinklas
- 馬拉雅拉姆語 https://www.youtube.com/@24OnLive
- 馬拉地語 https://www.youtube.com/@24OnLive
- 挪威語 https://www.youtube.com/@tvnorge
- 波蘭語 https://www.youtube.com/@Telewizja_Republika
- 葡萄牙語 https://www.youtube.com/@euronewspt
- 旁遮普語 https://www.youtube.com/@TheKhalasTv
- 羅馬尼亞語 https://www.youtube.com/@StirileProTV
- 俄語 https://www.youtube.com/@ictv
- 斯洛伐克語 https://www.youtube.com/@Aktuality_sk
- 西班牙語 https://www.youtube.com/@Aktuality_sk
- 瑞典語 https://www.youtube.com/@SVTHumor_
- 泰米爾語 https://www.youtube.com/@thanthitv
- 泰盧固語 https://www.youtube.com/@ETVAndhraPradesh
- 泰語 https://www.youtube.com/@ThaiPBS
- 土耳其語 https://www.youtube.com/@TürkçeHaber
- 烏克蘭語 https://www.youtube.com/@tsn
- 越南語 https://www.youtube.com/@antvtruyenhinhcongannhandan
AI 修復
由於 ybs 字幕是基於自動生成字幕生成的,Youtube 使用的語音識別技術將直接影響到 ybs 字幕的質素,某些語言錯誤率較低,例如英語,某些則頻繁出現錯誤,例如日語。現時我們提供的解決方案是使用 AI 修復這些字幕,它可替我們修復一些比較明顯的錯誤,例如語法錯誤或詞彙缺失,但也可能改變句子的結構和用詞。