什么是好的GenAI 產(chǎn)品?哪些以LLM技術(shù)為支持的產(chǎn)品值得開(kāi)發(fā)? 原創(chuàng)
最近幾天,我參加了公司組織的幾次產(chǎn)品討論會(huì),主要議題是是否值得開(kāi)發(fā)以大型語(yǔ)言模型(LLM)技術(shù)為核心的產(chǎn)品。目前市場(chǎng)上一些基于LLM的產(chǎn)品未能達(dá)到預(yù)期的盈利水平,這讓大家對(duì)LLM的商業(yè)潛力產(chǎn)生了疑慮,并在多次討論會(huì)上探討未來(lái)的發(fā)展方向。
不可否認(rèn)的是,人工智能初創(chuàng)企業(yè)的競(jìng)爭(zhēng)非常激烈,尤其是在大型語(yǔ)言模型的推動(dòng)下,許多初創(chuàng)公司如雨后春筍般涌現(xiàn)。然而,盡管這一領(lǐng)域有著明顯的發(fā)展趨勢(shì),只有少數(shù)生成型人工智能初創(chuàng)公司已經(jīng)進(jìn)入了發(fā)展的中期階段,許多公司仍處于早期階段,甚至還未獲得風(fēng)險(xiǎn)投資的支持。
那么,什么樣的生成型人工智能產(chǎn)品值得開(kāi)發(fā)呢?這個(gè)問(wèn)題非常廣泛。雖然我不是一名創(chuàng)業(yè)者,也無(wú)法提供具體的市場(chǎng)案例作答,但基于我在行業(yè)中的經(jīng)驗(yàn),可以就這個(gè)話題隨便聊一聊。同時(shí),也歡迎大家在評(píng)論區(qū)或者群里分享各自公司的實(shí)踐經(jīng)驗(yàn)和觀點(diǎn),以豐富我們對(duì)于這一問(wèn)題的理解。
具有高質(zhì)量標(biāo)準(zhǔn)或昂貴的質(zhì)量監(jiān)測(cè)的LLM應(yīng)用可能會(huì)失敗
LLM 的推理結(jié)果不可預(yù)測(cè)且難以評(píng)估,即使用戶最初對(duì)產(chǎn)品評(píng)分很高,不同的用戶群(或在不同情境下的相同用戶)可能會(huì)對(duì)產(chǎn)品評(píng)價(jià)大不相同。此外,隨著知識(shí)庫(kù)的擴(kuò)展,結(jié)果可能會(huì)在先前足夠好的情況下惡化。即使切換到所謂的“更高質(zhì)量”的LLM,這種惡化也可能發(fā)生。
如果一個(gè)產(chǎn)品的表現(xiàn)需要人來(lái)監(jiān)控,但我們又無(wú)法通過(guò)現(xiàn)有的方法來(lái)有效預(yù)防錯(cuò)誤,那么這個(gè)產(chǎn)品可能會(huì)失敗。尤其是大語(yǔ)言模型(LLM),很難找到可以被信任來(lái)監(jiān)控自己輸出質(zhì)量的情況。
其實(shí),這個(gè)問(wèn)題歸根結(jié)底是看用戶能不能接受錯(cuò)誤:
- 如果用戶對(duì)錯(cuò)誤的容忍度很高,或者說(shuō)結(jié)果的質(zhì)量遠(yuǎn)遠(yuǎn)超過(guò)用戶能接受的最低標(biāo)準(zhǔn),那么可以用模型自帶的評(píng)估方法,甚至可以不需要監(jiān)控。在這種情況下,用大語(yǔ)言模型來(lái)做應(yīng)用是沒(méi)問(wèn)題的。但在一些對(duì)錯(cuò)誤非常敏感的領(lǐng)域,比如1%的錯(cuò)誤率都無(wú)法接受的地方,用大語(yǔ)言模型就不合適了。
- 即使在一些情況下,產(chǎn)品的盈利能力足夠高,能覆蓋修復(fù)錯(cuò)誤所需的人力成本,那么用大語(yǔ)言模型也是合理的。
- 還有一種中間情況:用戶對(duì)錯(cuò)誤的容忍度和當(dāng)前應(yīng)用程序的性能差不多。這種情況下,還是需要人來(lái)干預(yù),但這部分工作應(yīng)該由用戶來(lái)完成,而不是開(kāi)發(fā)公司的員工。
總的來(lái)說(shuō),是否使用大語(yǔ)言模型,主要看用戶對(duì)錯(cuò)誤的容忍度以及修復(fù)錯(cuò)誤的成本是否劃算。
一個(gè)“完整”的LLM驅(qū)動(dòng)產(chǎn)品應(yīng)該是什么樣子的?
想象一下,你在使用一款你特別喜歡的應(yīng)用,比如你用來(lái)記錄生活點(diǎn)滴的日記軟件,或者那個(gè)幫你管理日程的工具。現(xiàn)在,有一種新技術(shù),叫做大型語(yǔ)言模型(LLM),它的聰明之處能夠讓這些應(yīng)用變得更加智能,但關(guān)鍵是要巧妙地融合它們,讓你幾乎感覺(jué)不到新技術(shù)的加入。
杰弗里·摩爾在他的書(shū)《跨越鴻溝》中提到,真正能夠贏得大眾喜愛(ài)的產(chǎn)品,是那些能完全滿足用戶需求的“整體產(chǎn)品”。這意味著,而不是只提供一個(gè)基礎(chǔ)的工具或平臺(tái),成功的應(yīng)用會(huì)結(jié)合LLM等技術(shù),提供一個(gè)無(wú)需用戶自己去拼湊的完整解決方案。
以個(gè)人知識(shí)管理(PKM)工具為例,它們通常是給那些喜歡自定義和整合各種插件的技術(shù)愛(ài)好者用的。但如果這些工具能夠通過(guò)整合人工智能,比如自動(dòng)為你的文章或視頻生成創(chuàng)意建議,它們就可以吸引更廣泛的用戶群體,比如內(nèi)容創(chuàng)作者和博主。
目前,一些用戶可能?chē)L試通過(guò)整合如TextCortex或NotebookLM這樣的通用人工智能工具到他們的PKM系統(tǒng)中來(lái)實(shí)現(xiàn)這一點(diǎn),但這種方法通常比較繁瑣,并不能提供一個(gè)無(wú)縫的使用體驗(yàn)。
真正的挑戰(zhàn)在于,如何讓這些智能功能自然融入到應(yīng)用中,讓用戶不需要學(xué)習(xí)新的操作就能從中受益。比如,在教育應(yīng)用中,學(xué)生可能只需點(diǎn)擊一個(gè)“下一步”按鈕就能接收到人工智能生成的個(gè)性化內(nèi)容,而無(wú)需意識(shí)到背后的技術(shù)復(fù)雜性。
簡(jiǎn)單來(lái)說(shuō),讓LLM技術(shù)無(wú)縫整合到用戶熟悉的工具中,提高易用性和產(chǎn)品完整性,是將產(chǎn)品從早期采用者推向大眾市場(chǎng)的關(guān)鍵。而那些看起來(lái)很有技術(shù)含量但用戶體驗(yàn)不佳的AI集成,比如一個(gè)與應(yīng)用幾乎無(wú)關(guān)的獨(dú)立聊天助手,很難成為產(chǎn)品選擇的決定性因素。
新一代GenAI 產(chǎn)品更適合 B2B2C 而非B2C
在我看來(lái),以LLM作為其核心功能推出新的B2C產(chǎn)品面臨著重重障礙。以下是其中的兩個(gè)關(guān)鍵原因:
- 數(shù)據(jù)和隱私:LLM需要高質(zhì)量的數(shù)據(jù)才能提供有意義的結(jié)果。在B2C背景下,這帶來(lái)了重大挑戰(zhàn)。使用客戶數(shù)據(jù)引發(fā)了許多B2C客戶的隱私擔(dān)憂。另一選項(xiàng)是使用開(kāi)發(fā)者提供的數(shù)據(jù),這需要一個(gè)龐大、多樣的數(shù)據(jù)集來(lái)滿足各種用戶需求。這大大增加了產(chǎn)品開(kāi)發(fā)成本和復(fù)雜性。
- 巨頭科技公司的無(wú)法逾越的優(yōu)勢(shì):像Meta、Google和Apple等科技巨頭在B2C市場(chǎng)擁有幾乎無(wú)法逾越的優(yōu)勢(shì)。即使它們比創(chuàng)業(yè)公司晚些時(shí)候以LLM為動(dòng)力的產(chǎn)品進(jìn)入某個(gè)利基市場(chǎng),它們數(shù)億的現(xiàn)有用戶群體都提供了巨大的優(yōu)勢(shì),它們的平臺(tái)是用戶已經(jīng)花費(fèi)他們數(shù)字生活的地方。即使進(jìn)行了大量的營(yíng)銷(xiāo)投資,創(chuàng)業(yè)公司也無(wú)法與這種規(guī)模匹敵。
在B2B2C模型中,一個(gè)設(shè)計(jì)良好的應(yīng)用可以大幅緩解許多挑戰(zhàn),尤其是為其他公司,特別是中小企業(yè),提供快速開(kāi)發(fā)端到端B2C市場(chǎng)產(chǎn)品的能力。這種模型的優(yōu)勢(shì)包括:
- 數(shù)據(jù)和隱私:在B2B2C模型中,高質(zhì)量的數(shù)據(jù)可以來(lái)源于B2B客戶,而不是直接來(lái)自個(gè)別的B2C客戶。這意味著,與直接收集B2C用戶數(shù)據(jù)相比,企業(yè)(B2B客戶)有更強(qiáng)的動(dòng)力和能力來(lái)解決數(shù)據(jù)隱私問(wèn)題。
- 利用現(xiàn)有客戶群:每個(gè)B2B客戶通常已經(jīng)擁有自己的客戶群體。通過(guò)LLM驅(qū)動(dòng)的產(chǎn)品,這些B2B企業(yè)可以提高其從現(xiàn)有客戶群體中獲利的能力,或者降低提供服務(wù)的成本。
如何克服用戶對(duì)調(diào)整其習(xí)慣以適應(yīng)新技術(shù)的自然抵觸情緒
LLM 聽(tīng)起來(lái)很高大上,但我們需要面對(duì)現(xiàn)實(shí):并不是每個(gè)人都能立刻從自己的舒適區(qū)邁出步伐,投入到全新的科技潮流中。
首先,談到這些新興的人工智能應(yīng)用,它們承諾為我們帶來(lái)全新的用戶體驗(yàn),仿佛賦予我們一把開(kāi)啟新世界大門(mén)的鑰匙。然而,問(wèn)題在于,大多數(shù)人對(duì)于改變自己的習(xí)慣,即使是微小的改變,都會(huì)感到不適,無(wú)論他們是否意識(shí)到這一點(diǎn)。
許多這些應(yīng)用都基于所謂的“對(duì)話式用戶體驗(yàn)設(shè)計(jì)”,聽(tīng)起來(lái)很高級(jí),但實(shí)際上,這意味著用戶需要花費(fèi)更多時(shí)間輸入文字或進(jìn)行語(yǔ)音交流,與應(yīng)用“對(duì)話”。對(duì)于習(xí)慣于簡(jiǎn)單點(diǎn)擊幾下屏幕就能完成任務(wù)的人來(lái)說(shuō),這確實(shí)是一個(gè)挑戰(zhàn)。
此外,為了讓基于LLM的應(yīng)用更好地理解我們的需求,我們往往需要與它們進(jìn)行多次對(duì)話,這個(gè)過(guò)程有時(shí)相當(dāng)費(fèi)勁。對(duì)于那些更喜歡動(dòng)手操作而不愿意花時(shí)間閱讀和輸入的人來(lái)說(shuō),會(huì)感覺(jué)很繁瑣。
因此,如果這些新的人工智能應(yīng)用希望真正吸引用戶,它們需要提供的不僅僅是節(jié)省一點(diǎn)時(shí)間。我們談?wù)摰氖且环N質(zhì)的飛躍,類(lèi)似于讓一個(gè)普通演講者變成一個(gè)有影響力的領(lǐng)袖。這種級(jí)別的改變才具有足夠的吸引力。
簡(jiǎn)單來(lái)說(shuō),如果一個(gè)應(yīng)用只能讓我們節(jié)省10%到20%的時(shí)間,對(duì)于大多數(shù)人來(lái)說(shuō),這可能還不夠吸引力。畢竟,人們總是對(duì)改變現(xiàn)狀有所抵觸。我們需要的是一種能夠真正讓人驚艷、讓我們成為更好的自己的技術(shù)革新。
總結(jié)
使用LLM的產(chǎn)品可能面臨輸出質(zhì)量挑戰(zhàn),并不可避免地遇到質(zhì)量評(píng)估方面的困難,解決或繞過(guò)這些問(wèn)題的可行性與用戶的錯(cuò)誤容忍度密切相關(guān)。
對(duì)于已經(jīng)成熟的產(chǎn)品,通過(guò)LLM集成增加產(chǎn)品價(jià)值,同時(shí)保持熟悉的用戶體驗(yàn)是有益的。盡管如此,保持傳統(tǒng)用戶體驗(yàn)并非總是可行的,也不一定對(duì)新穎的產(chǎn)品有必要。由LLM驅(qū)動(dòng)的應(yīng)用程序可能具有“聊天界面”,挑戰(zhàn)用戶改變他們的習(xí)慣。在這種情況下:
- AI必須為用戶提供變革性的好處
- 產(chǎn)品應(yīng)該遵循B2B或B2B2C模式,而不是B2C。在這種情況下,B2B客戶成為GenAI功能的主要用戶,因?yàn)樗麄兗?lì)他們的團(tuán)隊(duì)提高盈利能力
本文轉(zhuǎn)載自公眾號(hào)AI 博物院 作者:longyunfeigu
原文鏈接:??https://mp.weixin.qq.com/s/PL9tsIHmctdjSY1EIVPWCg??
