清華系“倉頡”來了!大模型造字7天交付超40套,客戶成本大降80%
大模型如何落地?怎么落地?成為今年科技領域的頭號主題。
在一個不為大多數人所知道的造字賽道中,這家清華創(chuàng)業(yè)公司——「圖形起源」悄然實現商業(yè)變現:
幫助字體公司降低80%成本,提速10倍以上。Canva可畫上最受歡迎的前100套中文字體,大部分都是用他們的算法生成的。
這個賽道足夠小也確實剛需,設計公司、字體公司苦版權費用久矣。
而他們憑借原本積累的圖形學與AI的技術優(yōu)勢,實現了人工所不能及的效率和精度。
來看看他們是如何發(fā)現以及靠AI造字來賺錢的。
靠AI造字賺錢,提速10倍以上
首先來了解一下什么是字體生產?
傳統(tǒng)的字體生產流程,往往需要設計師用手寫的方式來完成整套字體的制作,(一套字體最多近3萬字)并且在初稿完成后,還需要人工團隊進行逐字校對。
因為純人工操作,這樣一套流程下來不僅周期長,往往需要一個季度。對于字體公司來說,這是一筆不小的成本支出。
與此同時,也正因為人工,單個字體字形質量風格等細節(jié)上不好把控。
對于設計公司來說,制作過程中的高成本,也導致了商用版權字體采買費用的高昂。
正是在同客戶交流時,圖形起源團隊發(fā)現了這一行業(yè)痛點,耗時數月打造了一套字體生產線。
這不是簡單應用一個大模型就能直接生成的。字體設計最大的區(qū)別在于它是矢量圖,可以無限放大而不失真。而目前AI生成的圖通常是位圖,有像素限制。
如何讓AI生成矢量圖,理解字體的錨點和矢量曲線的含義,成為核心的技術難點。
創(chuàng)始人史海天分享了他們的解決思路,整個流程分為四個階段:
首先,用一個傳統(tǒng)的Diffusion模型會生成位圖;
其次,用第二個超分辨率模型,把字體位圖的分辨率提到最高;
然后,用一種獨特的算法,讓AI能夠理解什么是“好的矢量設計”,設計第三個模型,以這種“好“的審美作為優(yōu)化目標,用訓練后的模型把位圖轉化成矢量圖;
最后,訓練一個專門檢查錯別字和字形結構的模型。
除此之外,他們還計劃開發(fā)筆畫拆分模型。
基于這樣的模型,他們能實現人類所不能達到高效和高質量。
比如基于AI超分技術和AI矢量化,像各種筆畫、偏旁部首的邊緣細節(jié)處理,能禁得起任意放大維度,設計師能在海報等場景中使用。
客戶只需要完成前199個字的操作,AI就能在兩天內訓練并生成數萬字。并且也不限于簡體,像繁體字、生僻字,日文韓文拉丁這樣的多語種也OK。
在準確率上,簡單字形(筆畫<15)單次生成的平均生成錯字率小于1%,復雜字形(筆畫≥15)單次生成的平均生成錯字率小于5%,已經遠高于人工審校的準確度。
現在他們還打造了一個SaaS平臺,整個交付過程都可以在線上進行??蛻裟茈S時查看進度,或自己完成全部生產過程,不用圖形起源的人工干預。
據透露,目前他們已經生成了346套字體,累計4680244個字。
來自圖形起源
圖形起源成立于2020年底,是由當時清華大學車輛學院畢業(yè)生史海天,讀碩士休學時候創(chuàng)辦。
在此之前,他們主要做3D創(chuàng)作引擎,并完成了三輪融資,受到像五源資本、真格基金等機構的青睞。當時他們的愿景是,希望在未來建立一個大眾化的3D內容創(chuàng)作工具,以及一個普通人愿意在其中生活的社交世界。
不過現在史海天回憶當時沒有找到很好的變現場景,如今大模型的到來,帶給他們全新的機遇。
當時他們花了很長時間和資金來驗證這件事情。史海天透露,他們當時訓了兩個大模型,一個用來識別,一個用來生成,訓練目標是AI生成的字體讓AI分辨不出。
不過這個行業(yè)的優(yōu)點在于,字體數據是比較全的,比如一套字能喂給AI一半字,讓AI可以生成剩下一半字。
最后他們也實現了交付級別的生成效果,目前一周能完成超過40套字體的交付,相當于效率提升了幾百倍。
目前公司主要有兩個主營業(yè)務。
中文字庫擴寫,也就是客戶給參考字體文件,圖形起源AI先進行一波學習,然后生成風格統(tǒng)一的字形。
整個流程都是在SaaS平臺上進行,平臺上支持人工校對、二次學習、批量生成、人工二次篩選等工作,以進一步降低生成字體的錯字率。
跨語種風格遷移。顧名思義,就是根據任意語種任意字體,來生成同種風格的任意語種任意字形。
目前他們能夠穩(wěn)定生成中日韓拉丁字母、希臘字母、西里爾字母,常見符號數字等,并且已經在小米應用商店有售賣。
而像藏文、阿拉伯文等小語種文字還在內測階段。
最后想說,雖然現在看各個大廠都在卷生產力場景,市場很卷。但是具體到各個細分場景下,大企業(yè)也許就沒有那么多的資金精力去投入。
那些場景看上去需求有限,但確實同樣也是強剛需,也能實現商業(yè)變現。比如字體,比如排版。
對于創(chuàng)業(yè)公司來說,就是個不錯的切入點。圖形起源就是一個。
如今大模型應用如火如荼,到底還是看能不能解決實際問題。這條真理已經是再明確不過了。