AI創作大時代:可以完美生成中文的Adobe Firefly與AnyText多語言視覺文字生成

目前AI生成圖片在處理文字的部份,主要還是以英文為主,例如Canva的抓取文字功能,不只可以辨識影像中的文字,還能自動設定與它相似的字體與樣式。




微軟的Bing Image Creator、Google Bard平台還能在Prompt提示詞中指定書寫英文與數字。

※目前Google Bard對話中只能用英文提示詞方式,才能在對話中生成影像,Bing Image Creator則可以直接用中文提示詞,且對於中文的理解能力非常好。





針對中文文字的影像生成,現在僅有「Adobe Firefly」與「AnyText多語言視覺文字生成」這兩個可以完美處理中文,其餘的AI平台幾乎都沒辦法處理,只能透過後續的影像編輯軟體以影像合成的方式製作。




一、Adobe Firefly輕鬆建立多國語言文字素材

Adobe Firefly是Adobe在AI領域的重要工具,加上它也是影像合成工具的領頭羊,所以在Firefly上不只能透過文字建立影像、生成填色,文字效果是它與其它AI平台很大不同的特色,且支援多國語言文字,讓AI生成的文字素材,可以再拿到其它影像合成工具中應用。









二、AnyText多語言視覺文字生成,更精準控制文字生成效果

AnyText多語言視覺文字生成是由阿里巴巴所釋出的開源方案,它支援中、英、日、韓四種語言文字,不僅字型可以模擬正確,2D、3D文字的呈現都可以,且具有文字編輯功能,可以修改原有圖片中的文字並完美融合。

目前主要有兩種使用AnyText多語言視覺文字生成的方式:

由於HuggingFace網站流量很大,如果在尖峰時間,生成等待的時間會比較久,此時也可以用Google Colab的方式來製作,雖然第一次執行開機的環境建置需要等待比較久的時間,但是它不僅個人專屬,沒有點數、流量的限制,執行後可以使用72小時喔!






在Parameters(參數)選項中,可以設定每次生成的圖片數量、影像的寬度與高度等參數。

※目前影像寬度與高度的最大值是768像素。




1. 貼心的中文、英文範例

如果不大了解該如何設定,可以直接從下方選按中文或是英文的範例,即可把提示詞、生成位置等自動帶入相關欄位,只要按下「Run運行」就可以開始囉!





2. 第一種方式:Text Generation(文字生成)

在提示詞中使用半型雙引號放入要生成的文字內容,以下是三種生成位置的畫面:手繪、拖框、隨機









2. 第二種方式:Text Editing(文字編輯)

Text Editing(文字編輯)可以直接上傳圖檔,指定要修改的區域,AI將依照原圖上的字體、大小,生成指定的文字,若輸入空白文字,也可以將該區域原有內容抹除。

在提示詞中使用半型雙引號放入要生成的文字內容,可以是一個字串或是將每個字獨立用半型雙引號輸入,中間以空格間隔。

  • “欣欣向龍”→參考圖只要塗上一條線即可
  • “欣” “欣” “向” “龍”→參考圖需要塗抹四個獨立區域

※圖檔的寬度與高度必須是64的倍數,如128、512、1024才能順利生成!












三、Adobe Firefly與AnyText多語言視覺文字生成教學影片








※ 教學資料總整理:


※ Youtube 直播與研習記錄:


※ 延伸閱讀:



留言