發表文章

目前顯示的是 4月, 2023的文章

AI創作大時代:比 Google、剪映中文字幕正確性更高,且中英混雜、專有名詞與錯別字都更少的 OpenAI WhisperDesktop 影片語音轉字幕值得推薦

圖片
OpenAI 除了火紅的 ChaptGPT 與 DALL-E 兩項產品外,另一個也是以大型語言模型為基礎的 Whisper 語音辨識,其正確率比起已達八、九成的 Google、剪映等語音辨識更高,不只一般口語化的語音內容,對於中英混雜、專有名詞的辨識率提高許多。 這對於需要幫影片上字幕、訪談記錄,或是進行會議記錄的工作來說,真的又是一大節省時間的利器。 OpenAI Whisper 官方網站: https://openai.com/research/whisper 這次要分享的是以 Whisper 語音辨識技術為核心的 WhisperDesktop 開源免費軟體,除了更高準確率的辨識外,更重要的是你的資料完全是在自己的電腦上處理,沒有上傳到 Google 或是剪映的伺服器上,不會有重要資料外洩或資安上的問題! 一、從 Github 下載 WhisperDesktop 您可以從以下 WhisperDesktop 的 Github 查看此專案的內容與目前釋出的版本,現在最新的是 1.11 版。它支援影片與聲音檔案的語音辨識,MP4、MP3 檔案都沒問題喔! WhisperDesktop 專案: https://github.com/Const-me/Whisper/ WhisperDesktop 版本資訊與下載程式: https://github.com/Const-me/Whisper/releases 下載壓縮檔後,請將裏面的三個檔案解壓縮,放到一個資料夾中。 二、下載語音識別 AI 模型檔(model) 接著需要前往 Hugging Face 下載 Whisper AI 模型檔,這邊可能要依據您自己電腦的效能,選擇適合的模型檔案,愈大的模型檔案可以取得更好的文字品質,但執行所需要時間就會長一些。 下載完成後,請將檔案放到剛才 WhisperDesktop 資料夾中。 Whisper AI 模型下載 三、第一次執行 WhisperDesktop 的設定 第一次執行 WhisperDesktop 程式時,需要設定 Whisper AI 模型檔的位置,這個動作只需要設定一次即會自動記住。 轉換完成後就可以看到如下圖的訊息:原始媒體時間、轉換時間與轉換速度 ※ 如果想要更換 Whisper AI 模型檔怎麼辦 如果您原先使用 ggml-medium.bin...

AI創作大時代:Vrew 跨足 AI 創作,推出「圖文成片」與「文字轉圖片」功能全攻略

圖片
AI 生成工具的應用愈來愈厲害,除了文字、語音、圖像,現在使用 AI 進行影片的創作也成為主流趨勢,之前曾介紹過剪映推出的「圖文成片」功能,這次 Vrew 也推出「圖文成片」與「文字轉圖片」的功能,可以設定色調、風格,還可以直接在大綱文字欄位中使用 AI 協助撰寫,提供更多的可能性! 我們與AI的距離:Canva 正式推出「Text to Image文字轉圖片」、剪映也推出「圖文成片」,AI浪潮一波接一波! 一、關於 Vrew Vrew 已經推出五年了,它可以讓語音為主的影片剪輯,變成像文書處理、簡報軟體一樣,輕鬆剪輯並產生單一字幕或雙語字幕,它一直不斷持續精進,每隔一段時間就會有令人雀躍的新功能,如果你還不清楚 Vrew 到底是什麼,可以參考以下的介紹文章與研習錄影影片: Vrew 官方中文網站: https://vrew.voyagerx.com/zh-TW Vrew 中文線上體驗版(可以體驗約60~70%的功能,但無法輸出與儲存專案檔): https://vrew.voyagerx.com/zh-TW/try/index.html 1111125、1202 銘傳大學:mmhmm 虛擬攝影棚 + Vrew 字幕編輯,讓教材錄影更生動有趣!研習記錄 Vrew 最佳年度教學影片製作創新獎項非它莫屬,以語音字幕為核心的新創剪輯,教學影片產出效率大躍進!(上) Vrew 最佳年度教學影片製作創新獎項非它莫屬,以語音字幕為核心的新創剪輯,教學影片產出效率大躍進!(下) 二、透過文字製作影片的 AI 圖文生片功能 只要從「檔案 / 新項目」就可以找到這個功能。 步驟1:輸入影片大綱 但是 Vrew 的圖文生片功能,不只是單純的輸入文字與大綱,還結合了 ChatGPT 這樣 AI 生成式的互動,可以依據提供的劇本大綱或是內容,由 AI 繼續撰寫。 此外,也可以設定是否加入背景音樂、生成 AI 語音、生成圖像,以及影片的色調、風格和視訊類型,並指定視訊長寬比例。 ps.如果不核選 AI 自動生成圖像,Vrew 會自動選擇免費圖庫生成影片內容。 步驟2:選擇配音員 目前國語(台灣)共有8個聲音可以選擇,每個配音員也都可以調整音量、速度與聲音高低。 步驟3:生成影片 接下來就是等待一小段時間就能看到 AI 圖文成片的結果囉...