AI創作大時代:在Colab虛擬主機上執行autotranslate語音轉文字專案,不用升級自己的電腦(平板)即可享有Whisper and ChatGPT 近10倍速的效能!
之前曾經介紹過「AI創作大時代:比 Google、剪映中文字幕正確性更高,且中英混雜、專有名詞與錯別字都更少的 OpenAI WhisperDesktop 影片語音轉字幕值得推薦」這個在自己電腦上執行AI語音辨識的應用程式,不過,他必須仰賴你自己電腦有比較強大的顯示卡以及運算效能,才能夠得到比較順暢的辨識結果。
※也可以考慮使用 Vocol.ai (每個使用者都有 200 分鐘的逐字稿點數與 2000 分鐘生成摘要、重點的點數。)或是 Good Tape (不需要註冊帳號即可使用5分鐘,目前完全免費,註冊帳號後每個月有 90 分鐘免費額度可以使用,轉換完成會透過 Email 通知),只要上傳錄音檔或影片,一樣能快速產生逐字稿,甚至是內容摘要、區分主要發言者與其他與會的內容。
這一次要跟大家介紹的是在Colab虛擬主機上所執行的程式,你可以不用擔心你的電腦效能,在平板上也都可以使用喔!,只要在Google的Colab網站上註冊帳號,即可在免費方案中,取得如下圖的虛擬主機規格。
目前有發現部份學校Google教育帳號,因管理者的限制,無法註冊Colab,請您改用個人Google帳號就可以正常使用囉!
Colab上虛擬主機執行的速度相當快速,目前我自己執行過最長的時間是近三個小時的線上課錄影影片,約20分鐘就能執行完畢。
一、autotranslate 掛載在 GitHub 的開源工具
autotranslate是一個免費開源工具,支援許多網路上的影片服務,只需要在Colab上將虛擬機器執行,並載入相關的程式後,就可以將影片網址貼上,進行文字轉換,目前支援語言有:en(英文)、zh(中文)、ja(日文)、fr(法文) 和 de(德文) 五個。
此外,如果你的檔案有隱私上的問題,可以放在自己的雲端硬碟上,取得共享網址後,同樣可以進行語音辨識的工作。
二、開啟Colab上的autotranslate.ipynb,執行虛擬主機
※如果您有需要執行多個影片的語音辨識,以下的步驟1~4只需執行一次,從第二段影片開始,只要把新的影片網址貼上,再執行語音辨識就可以囉!
1.執行Check GPU type
2.執行Install libraries
※ 20231217 補充:
現在多增加一個「Import libraries for Python」的執行步驟
3.執行Optional: Save data in Google Drive
此項目可自行決定是否執行,如果有執行,需要授權它可以存取Google雲端硬碟的權限,它可以直接讀取雲端硬碟上的檔案,也會將轉譯後的字幕檔儲存在Google雲端硬碟上,預設的路徑在Colab Notebooks / Videos Transcription and Translation。
※ 20240620 更新
4.執行Model selection
5.執行Video selection
目前autotranslate支援兩種方式,一種是影片的網址,來自Youtube或是雲端硬碟上已設為共享的影片或是聲音檔案,第二種方式,則需要先在前面的第3步驟授權存取您的雲端硬碟,就可以直接指定雲端硬碟上的私人檔案進行語音辨識!
這邊比較建議的是第一種方式,相對比較簡單,只需要貼上網址即可執行。
※ Youtube 網址不能使用播放清單中的共享網址,建議使用如下透過「分享」所取得的短址,才不會出現辨識上的問題喔!
6.執行Run the model,開始進行語音辨識
7.執行Merge words/segments to sentences
由於作者在合併文字和片段時,會自動在每個詞語後面加上一個空格,反而在後續要匯入影片中使用時,格式上會覺得比較冗長,因此不建議在這裏執行它。
※ 20231217 更新
在這次的更新中,已經修正上述合併文字後的問題,執行的結果如下圖,可以減少一些文字段落的數量。
如果您在前面的第3步驟有授權存取您的雲端硬碟,執行完此步驟後,將會自動產生一個 *.srt 的字幕檔,儲存在雲端硬碟的 Colab Notebooks / Videos Transcription and Translation 目錄下。
三、使用Nikse雲端字幕編輯服務轉換成標準字幕格式SRT
※ 如果您已經授權 Colab 存取 Google 雲端硬碟的權限,以下的動作就可以不用執行囉!
1.複製所有辨識的文字,並儲存在一個純文字檔案中
請你先回到剛才步驟6所辨識出來的語音文字,在辨識文字上按右鍵/全選或是Ctrl + A將所有文字選取並複製。
接下來請建立一個空白的文字檔案,將剛才的文字貼入,並按下Ctrl + S儲存。
2.開啟Nikse雲端字幕編輯服務,並轉換成SRT字幕檔案
取得SRC字幕檔案後,就可以再拿到Vrew、威力導演、CapCut等影片編輯軟體中使用,因為是經由AI辨識後的內容,不論是在口語化或是中英夾雜、專有名詞的正確率,絕大多數都可以達到90%,甚至是95%以上,真的可以省下非常多校稿整理的時間!😊
3.如果只需要純文字內容,不需時間區間,Nikse雲端字幕編輯也可以下載為TXT純文字檔案
四、請ChatGPT將字幕加上標點符號,以方便轉換成文章閱讀,並整理出重點
1.請你將以下的影片字幕加上適當的標點符號,以方便當成文章閱讀
2.請你幫我用300個字以內摘要這篇文章的重點,每個重點加上一個粗體的標題,後面接這個重點的說明
五、如何操作autotranslate虛擬主機、Subtitle轉字幕與ChatGPT整理教學影片
※ 教學資料總整理:
- 跟著 Webduino 一起 Smart 學習 https://sites.google.com/view/cfp-webduino-smart/
- Sweet Home 3D 教學總整理:https://sites.google.com/view/sweethome3d-tw/
- OBS Studio 虛擬攝影棚教學總整理:https://sites.google.com/view/obs-tw
- 翻轉教學「現形記」教學總整理:https://sites.google.com/view/teachers-tools/
- 啟芳出版:(高職商業與管理群) 數位科技應用下冊
※ Youtube 直播與研習記錄:
- 1120819 中彰投創客基地「活用 Notion 筆記規劃,做好全方位個人知識管理(基礎+進階)」研習記錄
- 1120808、0809 金門縣 「用1Know任務闖關,進行班級經營與翻轉學習」與「用1Know、OHA雲端教室輕鬆進行班級經營與翻轉學習」研習記錄
- 1120810 屏東縣資訊教育資源中心 「Sweet Home 3D免費開源室內設計」研習記錄
- 1120610 中彰投創客基地:「mmhmm 虛擬攝影棚 + Vrew 字幕編輯,讓錄片影製更生動有趣! (線上)」研習記錄
- 1120606 中彰投創客基地「AI人工智慧 Chat GPT 的應用(線上)」研習記錄
- 1120509、1120531(忙碌五月天)中彰投創客基地與屏東縣資網中心兩場次「用Google Earth關心地球大小事」研習記錄
- 1120513、0514、0520、0521、0527、0528 (忙碌五月天)花蓮縣教育局六場次「用1Know、OHA雲端教室輕鬆進行班級經營與翻轉學習」研習記錄
- 1120330、0331 高雄醫學大學 mmhmm 虛擬攝影棚與 Vrew 字幕剪輯、屏東潮洲科技中心 Sweet Home 3D 研習記錄
- 1111206 TCN南投創客基地:OBS與mmhmm虛擬攝影棚應用線上研習直播影片(111年最後一場線上研習)
- 1111125、1202 銘傳大學:mmhmm 虛擬攝影棚 + Vrew 字幕編輯,讓教材錄影更生動有趣!研習記錄
- 1111129 高雄市立福誠高中:OBS 虛擬攝影棚 + Vrew 字幕編輯,讓教材錄影更生動有趣!研習記錄
- 1111019、1026、1102、1123 修平科技大學:混成教學 快速上手應用研習記錄
- 屏東縣資教中心111年「OBS虛擬攝影棚應用」研習直播影片,六小時介紹完整 OBS 教學情境、如何加入即時字幕與 mmhhmm 另類虛擬攝影棚!
- 1110826、0906 跟著「OHA雲端教室」開學去!(您線上線下、混合式教學的好幫手) !線上研習直播影片
- 1110816 屏東縣資訊教育資源中心:Canva 教育版在教材製作與互動簡報的應用!線上研習直播影片
- 1110815 木柵高工「OHA雲端教室 + 1Know 翻轉學習平台」您線上線下、混合(複合)式教學的好幫手!線上研習直播影片
- 1110512 「用1Know任務闖關,進行班級經營與翻轉學習」線上研習直播影片
- 1110527 屏東縣資教中心111年「線上線下混合式教學互動」研習直播影片,內容主要介紹 HiTeach CC免費跨平台雲端服務、Pear Deck投影片互動提問
- 1110624、0625 台中創客基地:Webduino Smart 線上基礎課程!線上研習直播影片
- 1111116 田尾國中:Webduino 智慧植栽應用研習記錄
- 1111015 花蓮高商:Webduino 物聯網實務與應用講座研習記錄
- 1111012、1109 雲林四湖南光國小:Canva 教育版在教材製作與互動簡報的應用研習記錄
- 1110915、0922 臺南高商:Canva 教育版在教材製作與互動簡報的應用研習記錄
- 1110914、 0921 花蓮中正國小:Canva 教育版在主題簡報與畢業微影片的應用研習
- 1110916 臺中市資訊輔導團:Canva 教育版在影片剪輯的應用研習記錄
- 1110712、0714、0716 南投創客基地:Webduino 賓果遊戲雷切盒!線上研習直播影片
※ 延伸閱讀:
- AI創作大時代:告別點陣圖尺寸與解析度問題,放大到A3、全開,一張圖就能搞定!
- AI創作大時代:KTV 影片字幕效果怎麼做?(新的作法)
- AI創作大時代:Microsoft Desinger、Canva 單獨使用或聯手合作,都能快速製作簡報封面與背景圖
- AI創作大時代:用 AI 生成元宵燈謎題目,在 Web:Bit 模擬器一起玩遊戲!
- AI創作大時代:比 Google、剪映中文字幕正確性更高,且中英混雜、專有名詞與錯別字都更少的 OpenAI WhisperDesktop 影片語音轉字幕值得推薦
- AI創作大時代:Vrew 跨足 AI 創作,推出「圖文成片」與「文字轉圖片」功能全攻略
- AI創作大時代:用 ChatGPT 快速搜集關鍵字產生文字雲圖案再配合 Photopea 與 Pexels 免費圖庫進行創作
- AI創作大時代:ChatGPT 已經成為最佳故事、劇本創作助手
- 我們與AI的距離:Canva 正式推出「Text to Image文字轉圖片」、剪映也推出「圖文成片」,AI浪潮一波接一波!
- 我們與AI的距離:Windows 11 將語音輸入帶入 PC、筆電,也支援標點符號,學習輸入法的時代正式終結!
- 我們與AI的距離:Animate your family photos 只要一張人臉照片就能「真的動起來」,並下載成 MP4 影片!
- 我們與AI的距離:AutoSub-AHK 比 pyTranscriber 更有彈性且支援批次轉換的 AutoSub 圖形介面工具,快速產生影片、錄音檔的文字字幕!(Windows)
- 我們與AI的距離:Moises ai 聰明去除人聲、分離音樂、樂器音軌,不再傻傻分不清了!
- 我們與AI的距離:Google 即時語音辨識應用面面觀,標點符號自動輸入也 OK!
- 我們與AI的距離:免費開源 pyTranscriber 透過 Google 雲端語音自動辨識,超快速產生影片、錄音檔的文字字幕!(Windows、MAC、Linux)
- 學習輸入法的時代已經過去,語音輸入當道,Google 文件與 SpeechNotes 語音輸入,讓您「用講的嘛會通」!
- Google 文件與 SpeechNotes 線上語音辨識也能協助產生演講影音字幕、會議記錄的文字建檔工作,省時又省力!
- Remove Image Background 免費雲端 AI 服務,不囉嗦!5 秒鐘自動完成人物去背(摳圖)!
- 善用雲端服務提升工作效率:AI 圖片無失真放大 16 倍,PhotoShop 請退下!
留言