AI創作大時代:比 Google、剪映中文字幕正確性更高,且中英混雜、專有名詞與錯別字都更少的 OpenAI WhisperDesktop 影片語音轉字幕值得推薦
OpenAI 除了火紅的 ChaptGPT 與 DALL-E 兩項產品外,另一個也是以大型語言模型為基礎的 Whisper 語音辨識,其正確率比起已達八、九成的 Google、剪映等語音辨識更高,不只一般口語化的語音內容,對於中英混雜、專有名詞的辨識率提高許多。 這對於需要幫影片上字幕、訪談記錄,或是進行會議記錄的工作來說,真的又是一大節省時間的利器。 OpenAI Whisper 官方網站: https://openai.com/research/whisper 這次要分享的是以 Whisper 語音辨識技術為核心的 WhisperDesktop 開源免費軟體,除了更高準確率的辨識外,更重要的是你的資料完全是在自己的電腦上處理,沒有上傳到 Google 或是剪映的伺服器上,不會有重要資料外洩或資安上的問題! 一、從 Github 下載 WhisperDesktop 您可以從以下 WhisperDesktop 的 Github 查看此專案的內容與目前釋出的版本,現在最新的是 1.11 版。它支援影片與聲音檔案的語音辨識,MP4、MP3 檔案都沒問題喔! WhisperDesktop 專案: https://github.com/Const-me/Whisper/ WhisperDesktop 版本資訊與下載程式: https://github.com/Const-me/Whisper/releases 下載壓縮檔後,請將裏面的三個檔案解壓縮,放到一個資料夾中。 二、下載語音識別 AI 模型檔(model) 接著需要前往 Hugging Face 下載 Whisper AI 模型檔,這邊可能要依據您自己電腦的效能,選擇適合的模型檔案,愈大的模型檔案可以取得更好的文字品質,但執行所需要時間就會長一些。 下載完成後,請將檔案放到剛才 WhisperDesktop 資料夾中。 Whisper AI 模型下載 三、第一次執行 WhisperDesktop 的設定 第一次執行 WhisperDesktop 程式時,需要設定 Whisper AI 模型檔的位置,這個動作只需要設定一次即會自動記住。 轉換完成後就可以看到如下圖的訊息:原始媒體時間、轉換時間與轉換速度 ※ 如果想要更換 Whisper AI 模型檔怎麼辦 如果您原先使用 ggml-medium.bin...