劍指AIGS:第四范式發(fā)布式說(shuō)大模型,以生成式AI重構(gòu)企業(yè)軟件
原創(chuàng)ChatGPT熱席卷全球,帶起了對(duì)于大模型的探索風(fēng)潮。今年四月,國(guó)內(nèi)各大廠商紛紛推出了各大模型。
日前,第四范式首次向公眾展示其大模型產(chǎn)品“式說(shuō)3.0”,并首次提出AIGS戰(zhàn)略(AI-Generated Software):以生成式AI重構(gòu)企業(yè)軟件。
式說(shuō)將定位為基于多模態(tài)大模型的新型開(kāi)發(fā)平臺(tái),提升企業(yè)軟件的體驗(yàn)和開(kāi)發(fā)效率,實(shí)現(xiàn)“AIGS”。那么具體什么是AIGS,為何定位于AIGS,如何實(shí)現(xiàn)AIGS,第四范式在媒體開(kāi)發(fā)日上給予了全面的解答。
瞄準(zhǔn)AIGS:改造整個(gè)軟件產(chǎn)業(yè),助力業(yè)務(wù)價(jià)值實(shí)現(xiàn)質(zhì)的飛躍
第四范式創(chuàng)始人兼CEO戴文淵認(rèn)為,目前B端軟件極為復(fù)雜的交互體驗(yàn),以及復(fù)雜性帶來(lái)的極低開(kāi)發(fā)效率,恰恰為生成式AI留下了足夠大的重構(gòu)和改造空間。
在戴文淵看來(lái),過(guò)去十幾年,C端的軟件產(chǎn)品已經(jīng)被打磨到了較高的水準(zhǔn),差不多逼近用戶(hù)體驗(yàn)的上限。相較來(lái)說(shuō),B端的軟件產(chǎn)品往往動(dòng)輒十幾層菜單,很難通過(guò)自然語(yǔ)言的方式去調(diào)用企業(yè)軟件的功能。
“現(xiàn)在當(dāng)我們有更強(qiáng)的語(yǔ)義理解和生成能力,再加上GPT任務(wù)翻譯、任務(wù)分發(fā)和推理的能力,就可以通過(guò)更好的交互方式實(shí)現(xiàn)功能的調(diào)用,不再需要找到某個(gè)位于十幾級(jí)的菜單目錄之下的功能?!?/span>
如果能用新型的語(yǔ)音或?qū)υ?huà)的方式實(shí)現(xiàn)交互,對(duì)B端企業(yè)軟件的用戶(hù)體驗(yàn)無(wú)疑可以實(shí)現(xiàn)一個(gè)顛覆式的提升。
再者,原先B端企業(yè)軟件都是高度定制化的,基于菜單式的開(kāi)發(fā),基本每次一個(gè)功能升級(jí),又要產(chǎn)品經(jīng)理畫(huà)界面,設(shè)計(jì)、開(kāi)發(fā)等,至少是月級(jí)別的開(kāi)發(fā)時(shí)間。而由于新的交互形式的出現(xiàn),以前是功能和執(zhí)行邏輯被編排在軟件界面,現(xiàn)在功能和邏輯被改寫(xiě)在數(shù)據(jù)、API和內(nèi)容層面,進(jìn)化成了天級(jí)別的開(kāi)發(fā)效率。
“就像ChatGPT不再是一個(gè)復(fù)雜的菜單和一堆的功能,只需要一個(gè)對(duì)話(huà)框就能做很多事情。并且它背后每天都在迭代,但你感受不到它的界面發(fā)生了什么變化。以前軟件是在界面層面的升級(jí),未來(lái)是在數(shù)據(jù)層面的升級(jí)。”
第四范式之所以提出AIGS戰(zhàn)略,正是基于這一預(yù)判:大模型能夠帶來(lái)用戶(hù)體驗(yàn)的提升,開(kāi)發(fā)效率的提升,所以一定會(huì)形成軟件行業(yè)的飛躍。大模型是新的生產(chǎn)力,以大模型基礎(chǔ)設(shè)施為先導(dǎo)項(xiàng)目,改造整個(gè)軟件產(chǎn)業(yè),整個(gè)行業(yè)的業(yè)務(wù)價(jià)值、商業(yè)模式都會(huì)得到飛躍。
開(kāi)放日當(dāng)天,第四范式現(xiàn)場(chǎng)拔網(wǎng)線(xiàn),展示了式說(shuō)大模型的圖片理解、劇本寫(xiě)作、畫(huà)圖、寫(xiě)代碼等能力。
實(shí)現(xiàn)AIGS:Copilot+思維鏈CoT能力,形成領(lǐng)域軟件交互新范式
在戴文淵看來(lái),要做到AIGS,大模型未必需要是知識(shí)廣博、十項(xiàng)全能冠軍的通才,更重要的在于模型具備Copilot(副駕艙),和思維鏈CoT(chain of thoughts,多步推理)的能力。
“要去改造企業(yè)軟件,大模型不能只有語(yǔ)言能力。式說(shuō)2.0就加入了多模態(tài)和Copilot,因?yàn)楹芏嗥髽I(yè)軟件里的數(shù)據(jù)是多模態(tài)的,而Copilot能把人的指令翻譯成要調(diào)用后臺(tái)的哪個(gè)API。”
據(jù)悉,式說(shuō)2.0的時(shí)候,員工可以通過(guò)語(yǔ)音、圖像、表格、視頻等多模態(tài)方式向式說(shuō)發(fā)起詢(xún)問(wèn)或下達(dá)指令,式說(shuō)理解之后,聯(lián)網(wǎng)企業(yè)軟件調(diào)出有關(guān)功能,并以所需要的形式輸出答案。
不過(guò)員工用企業(yè)軟件時(shí)也會(huì)面臨復(fù)雜任務(wù),需要人按照順序執(zhí)行一個(gè)個(gè)功能。
戴文淵以圖像處理軟件進(jìn)行了具體說(shuō)明:如果你要調(diào)亮度、對(duì)比度,這是功能。但如果是將人物P瘦一點(diǎn),它就不是一個(gè)單一功能能實(shí)現(xiàn)的了。這背后需要人按照經(jīng)驗(yàn),執(zhí)行軟件的一個(gè)個(gè)的功能才能實(shí)現(xiàn)。
“人接收到復(fù)雜的工作,會(huì)在大腦里推理出一步步要執(zhí)行的子任務(wù),然后再按步驟去執(zhí)行。換成機(jī)器,如果對(duì)于同一個(gè)工作,機(jī)器在過(guò)去見(jiàn)到過(guò)足夠多的人(累積數(shù)據(jù))通過(guò)一二三四步把這個(gè)工作完成了,它已經(jīng)可以這個(gè)套路總結(jié)出來(lái),就形成了思維鏈?!?/span>
因此,式說(shuō)3.0強(qiáng)調(diào)的是Copilot加上思維鏈CoT,具有更強(qiáng)的推理能力,在學(xué)習(xí)大量數(shù)據(jù)和“攻略”后,能形成中間的邏輯推理步驟,從而做到拆分并執(zhí)行復(fù)雜工作。
總結(jié)來(lái)說(shuō),第四范式將AIGS的路徑總結(jié)為三個(gè)階段:
第一階段,Copilot調(diào)動(dòng)不同的信息、數(shù)據(jù)、應(yīng)用,作為助手完成用戶(hù)的指令。相當(dāng)于在所有企業(yè)級(jí)軟件系統(tǒng)里,配備一個(gè)指揮官。指揮官聽(tīng)用戶(hù)的指揮,比如“把照片亮度調(diào)亮20%”。
第二階段,Copilot+基于企業(yè)規(guī)則的“知識(shí)庫(kù)”,AI能夠參照規(guī)則做復(fù)雜工作,進(jìn)一步豐富了“對(duì)話(huà)框”的能力。比如AI查詢(xún)了“人像美化”知識(shí)庫(kù)后,能執(zhí)行把照片修好看的步驟。
第三階段,Copilot+CoT(思維鏈)。軟件系統(tǒng)的使用行為最終會(huì)被大模型學(xué)會(huì),形成AI針對(duì)這個(gè)領(lǐng)域的思維鏈,意味著“把照片處理得更好看”這種復(fù)雜指令,AI能自動(dòng)地按照步驟完成。
第四范式的AIGS戰(zhàn)略,就是指基于式說(shuō)大模型背后的Copilot+COT能力,把企業(yè)軟件改造成新型的交互范式,并在新型交互上不斷地學(xué)習(xí)軟件的使用過(guò)程,形成領(lǐng)域軟件的“思維鏈”。
在式說(shuō)3.0發(fā)布現(xiàn)場(chǎng),來(lái)自金融、航空制造、醫(yī)療等行業(yè)的客戶(hù)代表出席并做了產(chǎn)品的live demo演示。ChatGPT出現(xiàn)的短短兩個(gè)月內(nèi),眾多企業(yè)與合作伙伴已經(jīng)與范式在生成式AI方面開(kāi)展了深度合作。式說(shuō)作為基于大模型的新型開(kāi)發(fā)平臺(tái),期待與更多合作伙伴與企業(yè)客戶(hù)及一起,探索以生成式AI重構(gòu)企業(yè)軟件的機(jī)會(huì),共同提升企業(yè)軟件的易用性和生產(chǎn)力。