自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

哪些基于 LLMs 的產(chǎn)品值得開(kāi)發(fā)?從用戶體驗(yàn)和市場(chǎng)接受度的角度探討 原創(chuàng) 精華

發(fā)布于 2024-7-17 10:54
瀏覽
0收藏

編者按:在大語(yǔ)言模型(LLMs)相關(guān)技術(shù)高速發(fā)展的今天,哪些基于 LLMs 的產(chǎn)品真正值得我們投入精力開(kāi)發(fā)?如何從用戶體驗(yàn)和市場(chǎng)接受度的角度評(píng)估這些產(chǎn)品的潛力?

今天為大家分享的這篇文章,作者的核心觀點(diǎn)是:優(yōu)秀的產(chǎn)品應(yīng)該將 GenAI 無(wú)縫集成到現(xiàn)有工作流中,引入 AI 不僅要能為用戶提供高價(jià)值、變革性的體驗(yàn),同時(shí)還需兼顧用戶的使用習(xí)慣,最好不要增加用戶的學(xué)習(xí)成本。

正如本文所強(qiáng)調(diào)的,在追求技術(shù)創(chuàng)新的同時(shí),我們不應(yīng)忘記用戶的實(shí)際需求和使用習(xí)慣。本文所介紹的內(nèi)容為我們對(duì) GenAI 產(chǎn)品的思考提供了新的視角,提醒我們?cè)诋a(chǎn)品的設(shè)計(jì)、開(kāi)發(fā)過(guò)程中應(yīng)始終將用戶體驗(yàn)置于核心位置。

我們相信,隨著 AI 技術(shù)的不斷進(jìn)步,未來(lái)會(huì)涌現(xiàn)出更多創(chuàng)新應(yīng)用場(chǎng)景。但無(wú)論技術(shù)如何發(fā)展,以用戶為中心的產(chǎn)品理念始終是成功的關(guān)鍵,也應(yīng)當(dāng)是產(chǎn)品的初心。

?

作者 | Alexey Evdokimov

編譯 | 岳揚(yáng)

?

目錄

01 What You Will Find Below

02 質(zhì)量標(biāo)準(zhǔn)高或質(zhì)量監(jiān)控成本高的應(yīng)用可能會(huì)失敗 ??

03 專業(yè)型 Copilots 正成為市場(chǎng)寵兒?

04 僅僅能略微帶來(lái)便利的 LLMs App 是行不通的??

05 將 LLMs “巧妙”整合入原有工作流的 Apps 更受市場(chǎng)歡迎 ?

06 集成 GenAI 的產(chǎn)品更適合于 B2B2C 而非 B2C

07 Summary

?

最近我一直在思考,在我腦海中涌現(xiàn)出的眾多生成式 AI 產(chǎn)品構(gòu)想中,哪些是值得我們深入探索的。為此,我初步設(shè)計(jì)了多個(gè)不同版本的 prompts ,向 ChatGPT 詢問(wèn)有關(guān)當(dāng)前 AI 產(chǎn)品(涵蓋消費(fèi)者端 B2C 及企業(yè)端 B2B)成功與失敗的根本原因。

這是我從 GPT-4o 獲得的模型響應(yīng)\[1\](點(diǎn)擊題注鏈接可以查看)。我認(rèn)為在多個(gè)版本 prompts 的回答中,這一個(gè)最為出色。如果 GPT-4o 的回答已經(jīng)讓你足夠滿意了,那么你可以隨時(shí)選擇跳過(guò)后續(xù)內(nèi)容。;-)

?

哪些基于 LLMs 的產(chǎn)品值得開(kāi)發(fā)?從用戶體驗(yàn)和市場(chǎng)接受度的角度探討-AI.x社區(qū)

哪些基于 LLMs 的產(chǎn)品值得開(kāi)發(fā)?從用戶體驗(yàn)和市場(chǎng)接受度的角度探討-AI.x社區(qū)

查看完整答案:??https://chatgpt.com/share/a08c7c15-726b-4dd8-b96b-395b80a96edd??

然而,這種膚淺的回答并未觸及生成式 AI 的獨(dú)到之處。原因很簡(jiǎn)單:這是一個(gè)新興領(lǐng)域,GPT-4o 訓(xùn)練數(shù)據(jù)中關(guān)于 GenAI 產(chǎn)品成功要素的信息尚不充分。

在這種情況下,可能不如直接使用 Google 搜索來(lái)得快捷和全面。以下是我認(rèn)為最具吸引力的深度內(nèi)容:

  • Aniket Deosthali 所著的《Winning the AI Products Arms Race》\[2\]中,作者不僅深入分析了基于 GPT 的產(chǎn)品,也從不同角度對(duì)傳統(tǒng) AI 產(chǎn)品進(jìn)行了全面、深入地探討。他基于 “Consideration x Context” 框架提出的 “AI Survival Curve”,尤為引人注目。
  • 哪些 AI 產(chǎn)品創(chuàng)意(AI product ideas)值得我們?nèi)ヌ剿髂??\[3\]本文著重探討了如何根據(jù)技術(shù)可行性選擇可能成功的 GenAI 產(chǎn)品創(chuàng)意。我特別喜歡他們對(duì) AI performance 的明確定義,這也是他們分析的基礎(chǔ)。高性能(High performance)無(wú)疑是通往成功的關(guān)鍵。

這兩篇文章都強(qiáng)調(diào),數(shù)據(jù)質(zhì)量不佳(即缺乏充分、優(yōu)質(zhì)的上下文信息)是導(dǎo)致眾多 AI 項(xiàng)目“折戟沉沙”的關(guān)鍵原因之一。 毫無(wú)疑問(wèn),“向大語(yǔ)言模型輸入的數(shù)據(jù)越優(yōu)質(zhì),模型產(chǎn)生的響應(yīng)結(jié)果就越出色”。然而,在實(shí)際應(yīng)用中,許多目標(biāo)任務(wù)的處理與解決并不依賴于海量數(shù)據(jù);很多時(shí)候,僅需一條簡(jiǎn)潔的提示詞和一份精煉的文檔,生成式 AI 就能高效、高質(zhì)量地完成工作

與傳統(tǒng)的人工智能相比,GPT 系列模型的預(yù)訓(xùn)練特性,無(wú)疑是一種巨大的優(yōu)勢(shì) —— 傳統(tǒng)人工智能往往受限于必須對(duì)每類具體任務(wù)進(jìn)行訓(xùn)練。我們需要充分利用這一優(yōu)勢(shì)。

哪些基于 LLMs 的產(chǎn)品值得開(kāi)發(fā)?從用戶體驗(yàn)和市場(chǎng)接受度的角度探討-AI.x社區(qū)

01 What You Will Find Below

我提供了另外一種不同的視角,探討哪些基于 LLM 技術(shù)的產(chǎn)品具有開(kāi)發(fā)價(jià)值。

  • 本文的預(yù)設(shè)條件為:如前文所述,許多產(chǎn)品構(gòu)想即便在缺乏大量?jī)?yōu)質(zhì)數(shù)據(jù)的情況下也能付諸實(shí)踐。
  • 此外,我沒(méi)有將那些可能制約產(chǎn)品質(zhì)量的技術(shù)約束??納入考量范圍。

本文的重點(diǎn)集中于用戶的行為模式(user behavior) 之上。在分析過(guò)程中,本文將著重于挖掘 LLM 產(chǎn)品的獨(dú)特之處,而非泛泛討論創(chuàng)新產(chǎn)品普遍遵循的規(guī)律。

“哪些生成式人工智能(GenAI)產(chǎn)品值得我們投入精力開(kāi)發(fā)?”這個(gè)問(wèn)題非常寬泛,即便我們將那些使用了其他技術(shù)但沒(méi)有使用大語(yǔ)言模型(LLMs)的產(chǎn)品,如語(yǔ)音轉(zhuǎn)文本(TTS)、文本轉(zhuǎn)語(yǔ)音(STT)、diffusion transformers 等排除在外也是如此。因此,

  • 我決定將這個(gè)問(wèn)題的解答分為兩部分。第一部分聚焦于用戶對(duì)產(chǎn)品的態(tài)度,即市場(chǎng)接受度,相關(guān)內(nèi)容在本文中詳述。后續(xù)將要發(fā)表的第二部分內(nèi)容,會(huì)深入探討針對(duì)產(chǎn)品創(chuàng)意的商業(yè)分析(business analysis of product ideas),特別是競(jìng)爭(zhēng)態(tài)勢(shì)方面(competition aspects)。
  • 在撰寫(xiě)這兩篇文章的過(guò)程中,我僅著眼于兩種商業(yè)模式:直接面向消費(fèi)者(B2C)與通過(guò)企業(yè)間接服務(wù)消費(fèi)者(B2B2C)。這也就意味著,我并未涉及企業(yè)間交易(B2B)的產(chǎn)品或是企業(yè)內(nèi)部的研發(fā)成果;因?yàn)檫@些產(chǎn)品往往更多地受制于企業(yè)自身的需求和政策導(dǎo)向,而非終端用戶的實(shí)際需求,這類產(chǎn)品能否在市場(chǎng)上立足,取決于另一套迥異的標(biāo)準(zhǔn)體系。

本文將探討基于 LLMs 的軟件產(chǎn)品(面向終端用戶的 APP)的一系列相關(guān)議題:

  • GenAI App 的成功程度,與用戶能接受的錯(cuò)誤范圍有何種聯(lián)系?
  • 專業(yè)的 AI copilot 需要哪些獨(dú)特功能,才能在與 ChatGPT 這類熱門(mén) AI chatbots 的競(jìng)爭(zhēng)中脫穎而出?
  • 我們?cè)鯓硬拍芟脩裘鎸?duì)新技術(shù)時(shí)的習(xí)慣性抵觸心理,促使他們主動(dòng)擁抱變化?
  • 一個(gè)由 LLMs 驅(qū)動(dòng)的“全面(whole)”產(chǎn)品應(yīng)具備哪些要素?
  • 除了產(chǎn)品本身的完整性(completeness),GenAI 產(chǎn)品要實(shí)現(xiàn)市場(chǎng)突破,還需考慮哪些重要因素?

接下來(lái),我們將剖析兩類可能遭遇滑鐵盧**的應(yīng)用??,以及兩類有望經(jīng)受市場(chǎng)考驗(yàn)的應(yīng)用?。

02 質(zhì)量標(biāo)準(zhǔn)高或質(zhì)量監(jiān)控成本高的應(yīng)用可能會(huì)失敗 ??

LLM 的推理結(jié)果不可預(yù)測(cè)且難以評(píng)估:

哪些基于 LLMs 的產(chǎn)品值得開(kāi)發(fā)?從用戶體驗(yàn)和市場(chǎng)接受度的角度探討-AI.x社區(qū)

??點(diǎn)擊查看完整版PPT??

即便產(chǎn)品初期受到用戶好評(píng),但不同用戶群體或同一用戶在不同情況下,對(duì)產(chǎn)品的評(píng)價(jià)可能天差地別。更重要的是,隨著知識(shí)庫(kù)的不斷擴(kuò)充,原先表現(xiàn)良好的場(chǎng)景也可能出現(xiàn)效果下滑的情況。即使切換到所謂“更高質(zhì)量”的 LLMs,也可能因此出現(xiàn)性能下降。

因此,持續(xù)監(jiān)控基于 LLMs 的應(yīng)用的性能質(zhì)量,是確保其成功的關(guān)鍵所在。

若一款產(chǎn)品無(wú)法讓人可以有效監(jiān)督其性能表現(xiàn),而僅憑模型的自我評(píng)估又不能夠避免出錯(cuò),那這款產(chǎn)品很可能難以在市場(chǎng)上立足。 (實(shí)際上,很難找到能放手讓 LLMs 去評(píng)估自己輸出質(zhì)量的實(shí)際案例。)

歸根結(jié)底,這種情況取決于用戶對(duì)產(chǎn)品出現(xiàn)錯(cuò)誤的容忍程度:

  • 當(dāng) LLM App 的輸出質(zhì)量遠(yuǎn)超用戶所能容忍的程度時(shí),使用模型本身或另一套模型來(lái)進(jìn)行評(píng)估,或是干脆放棄對(duì)其進(jìn)行監(jiān)控,都是可行策略。
  • 在那些對(duì)錯(cuò)誤零容忍的領(lǐng)域(比如出現(xiàn)1%的錯(cuò)誤率都不可被接受的產(chǎn)品),開(kāi)發(fā)基于 LLMs 的應(yīng)用似乎沒(méi)有太多意義。然而,即便考慮到修復(fù) LLM 出現(xiàn)的錯(cuò)誤所需的人力成本,只要產(chǎn)品能夠盈利,那么使用 LLM 依然是個(gè)較為劃算的選擇。
  • 還有一種折中的情況:用戶對(duì)產(chǎn)品錯(cuò)誤的容忍度與當(dāng)前產(chǎn)品的實(shí)際表現(xiàn)大致相等。這時(shí),雖然仍需人工干預(yù),但出手干預(yù)的應(yīng)當(dāng)是終端用戶,而非產(chǎn)品所在公司的員工。下一章節(jié)將專門(mén)探討這一主題。

03 專業(yè)型 Copilots 正成為市場(chǎng)寵兒?

大語(yǔ)言模型缺乏系統(tǒng)性思維能力,在全面把握復(fù)雜上下文時(shí)存在局限。它們往往在處理罕見(jiàn)、超出數(shù)據(jù)訓(xùn)練范疇或系統(tǒng)設(shè)定之外的情況時(shí)捉襟見(jiàn)肘。因此,LLMs 的輸出結(jié)果需要進(jìn)行人工復(fù)查(參照前文討論過(guò)的模型評(píng)估機(jī)制)。理想情況下,產(chǎn)品使用者應(yīng)擔(dān)當(dāng)起人工評(píng)估者(human evaluators)。

不過(guò),要讓這一模式奏效,用戶對(duì)輸出質(zhì)量的預(yù)期必須合理,不能抱有不切實(shí)際的期望。終端用戶應(yīng)當(dāng)把 AI 視為助理伙伴(assistant),而非必須無(wú)條件提供優(yōu)質(zhì)服務(wù)的外部供應(yīng)商(external provider)。

基于這些考慮,市場(chǎng)開(kāi)始擁抱 “AI copilots” 這一理念。盡管有些人可能傾向于將 “AI copilots” 簡(jiǎn)單等同于一般的 “AI assistants” ,但在我看來(lái)\[4\], “AI copilots” 實(shí)則是 “AI assistants” 家族中的進(jìn)階成員。它們的作用遠(yuǎn)不止于提供信息(inform)和給出建議(advise),還能在其設(shè)計(jì)的產(chǎn)品中,獨(dú)立完成一系列復(fù)雜操作。

大多數(shù) “AI copilots” 的功能都非常豐富,它們大多嵌入于多功能產(chǎn)品(multi-purpose products)中,與其說(shuō)是一款單一的應(yīng)用程序(applications),這些產(chǎn)品更像是一個(gè)開(kāi)放平臺(tái)(platforms)。舉個(gè)例子???♀???,Github 是一款所有程序員的“平臺(tái)(platform)”,而 Microsoft Office 365 則是服務(wù)于所有辦公室職員(office workers)及知識(shí)工作者(knowledge professionals)的“平臺(tái)”,兩者均配備了 “AI copilots”。同時(shí),諸如 Windows 和 iOS 這樣的操作系統(tǒng)也在嘗試引入“AI copilots” 。

哪些基于 LLMs 的產(chǎn)品值得開(kāi)發(fā)?從用戶體驗(yàn)和市場(chǎng)接受度的角度探討-AI.x社區(qū)

AI Copilot. Image created by the author with ??Recraft.ai??

盡管 “AI copilots” 市場(chǎng)看似已經(jīng)非常飽和,但我堅(jiān)信仍有足夠的空間讓創(chuàng)新產(chǎn)品嶄露頭角。不過(guò),初創(chuàng)公司所開(kāi)發(fā)的 “AI copilots” 不應(yīng)盲目追求與 GitHub Copilot X 或 Shopify Sidekick 等行業(yè)巨頭一樣以多功能為目標(biāo)。

真正的機(jī)遇在那些專注于特定垂直領(lǐng)域的 “AI copilots”,它們能夠比任何通用型(general-purpose) “AI assistant” 更高效地為專業(yè)人士提供幫助。 雖然實(shí)現(xiàn)這一目標(biāo)絕非易事,但值得一試。

試想一下,專門(mén)為培訓(xùn)講師(如培訓(xùn)專家(experts)和課程開(kāi)發(fā)者(course creators))打造的 “AI copilots”。這樣的工具應(yīng)比 ChatGPT 更勝一籌,不僅能夠提升課程質(zhì)量,還能大幅減少所需的工作量:

  • 應(yīng)當(dāng)體現(xiàn)培訓(xùn)講師(trainer)獨(dú)有的專業(yè)素養(yǎng)(expertise)與教學(xué)風(fēng)格(teaching style)。
  • 當(dāng)其目標(biāo)不再局限于課程策劃(session planning),而是涵蓋學(xué)習(xí)資料(learning materials)與學(xué)生作業(yè)(student assignments)時(shí),“AI copilots” 應(yīng)具備生成多種形式的內(nèi)容的能力,而不僅僅限于文本形式。
  • 為了實(shí)現(xiàn)工作流程的真正簡(jiǎn)化,終端用戶不應(yīng)局限于復(fù)制粘貼 “AI copilots” 的輸出結(jié)果。反之,“AI copilots” 需與 LMS(Learning Management Systems)、即時(shí)通訊軟件(messengers)或其他課程發(fā)布工具(course delivery tools)無(wú)縫對(duì)接,提供“一站式”的解決方案。

若想在競(jìng)爭(zhēng)中勝過(guò)那些在自家已有平臺(tái)內(nèi)嵌入通用 AI 助手(universal AI assistants)的科技巨頭,專有領(lǐng)域的 “AI copilots” 必須為其目標(biāo)用戶群體提供價(jià)值更高的體驗(yàn)。其具備的優(yōu)勢(shì)(benefits)不應(yīng)只是微小的、逐步的增加(incremental),而應(yīng)該是具有重大影響、能夠帶來(lái)根本性變化的(transformative)。

下文將闡述為什么會(huì)有這樣的觀點(diǎn)。

04 僅僅能略微帶來(lái)便利的 LLMs App 是行不通的??

盡管基于生成式 AI 的 App 聲稱能帶來(lái)耳目一新的用戶體驗(yàn),但是我們卻不能忽視一個(gè)事實(shí):多數(shù)用戶往往不愿改變自己的使用習(xí)慣,無(wú)論這種抗拒是有意識(shí)的還是來(lái)自于潛意識(shí)。 在我看來(lái),“conversational UX design” 所帶來(lái)的好處被過(guò)分吹捧,而依托大語(yǔ)言模型實(shí)現(xiàn)的“個(gè)性化(personalization)”與“貼合用戶需求(adaptation to user needs)”,其表現(xiàn)可能讓人難以預(yù)料,有時(shí)甚至還會(huì)讓人感到厭煩。

想象一下??在目前眾多由 LLMs 驅(qū)動(dòng)的應(yīng)用場(chǎng)景中,用戶需要輸入文字或語(yǔ)音指令(text or voice commands),進(jìn)而可能經(jīng)常陷入漫長(zhǎng)的對(duì)話交流。這種基于聊天的交互模式(chat-based interface)雖然很新穎,但對(duì)于那些習(xí)慣于動(dòng)動(dòng)鼠標(biāo)??點(diǎn)擊操作的普通用戶而言,無(wú)疑構(gòu)成了一定的學(xué)習(xí)門(mén)檻。 語(yǔ)音交互(voice chat)看似彌補(bǔ)了部分不足,但在不少用戶看來(lái),它甚至比文本聊天更加難以掌握。

還存在另一個(gè)障礙,要獲取優(yōu)質(zhì)的大語(yǔ)言模型輸出結(jié)果,往往需要多次迭代優(yōu)化。這并不純粹歸咎于模型本身的不完善,而是由于用戶在逐步細(xì)化自身需求時(shí),自然而然地產(chǎn)生了迭代需求。 為了理解為什么會(huì)出現(xiàn)這個(gè)問(wèn)題,不妨比較一下傳統(tǒng)工作流與新興工作流的差異:

  • 傳統(tǒng)模式(沒(méi)有 AI assistant 協(xié)助):終端用戶能夠立刻將靈感或新要求納入工作草稿(draft)中,因?yàn)閷?duì)作者來(lái)說(shuō),定位及編輯特定部分的操作相當(dāng)便捷。
  • 新型的“人機(jī)協(xié)作”模式:每出現(xiàn)一個(gè)新需求(new requirement),都會(huì)觸發(fā)整個(gè)工作草稿的全面更新,且改動(dòng)部分隨機(jī)分布、不可預(yù)知,不易追蹤。這種轉(zhuǎn)變可能會(huì)令用戶感到不適,因?yàn)橄啾扔脩粲H自動(dòng)手創(chuàng)作,這樣會(huì)被迫投入更多精力在閱讀與校對(duì)之上。毫無(wú)疑問(wèn),對(duì)多數(shù)寫(xiě)作者而言,創(chuàng)造的樂(lè)趣遠(yuǎn)勝過(guò)閱讀的體驗(yàn)。

面對(duì)這些難題,新興的 AI 應(yīng)用要想贏得大眾的認(rèn)可,就必須展現(xiàn)出令人難以抗拒的優(yōu)勢(shì)。

如果只是節(jié)省了10%-30% 的工作時(shí)間,那遠(yuǎn)遠(yuǎn)不足以吸引用戶去嘗試使用該應(yīng)用。這是因?yàn)槿藗儍?nèi)心深處對(duì)于打破固有習(xí)慣有著天然的抵觸。要克服這種惰性,這款應(yīng)用帶來(lái)的效率提升必須是顛覆性的 —— 不應(yīng)只是“小打小鬧”般的工作效率提升,而需要成倍地減少工作量。

更重要的是,最好不能僅僅是單純地節(jié)省時(shí)間。試想一下,如果有一款應(yīng)用能夠幫助用戶蛻變成他們心中向往的模樣。比如,借助基于 AI 技術(shù)的應(yīng)用,就能讓一個(gè)演講能力平平之人,一躍成為具有深遠(yuǎn)影響力的思想領(lǐng)袖。

05 將 LLMs “巧妙”整合入原有工作流的 Apps 更受市場(chǎng)歡迎 ?

真正成功、有效的 Apps 能夠?qū)⒋笳Z(yǔ)言模型與其它功能完美結(jié)合,形成一個(gè)“完整的產(chǎn)品(whole product)”。該理念最早由杰弗里 · 摩爾(Geoffrey Moore)在其著作《Crossing the Chasm》\[5\]中提出并廣為流傳。他認(rèn)為唯有那些能夠從頭到尾(end-to-end)全流程滿足用戶需求的產(chǎn)品,才能快速贏得廣大主流用戶(mainstream users (the majority))的青睞。而那些僅僅提供核心功能的產(chǎn)品,亦即所謂的“通用產(chǎn)品(generic products)”,往往只能吸引那些喜歡自行搭建解決方案的創(chuàng)新者(innovators)和“早鳥(niǎo)”(early adopters)。

哪些基于 LLMs 的產(chǎn)品值得開(kāi)發(fā)?從用戶體驗(yàn)和市場(chǎng)接受度的角度探討-AI.x社區(qū)

Image source: ??thinkinsights.net??

打造智能化的“whole product”(譯者注:根據(jù)前文所述,是指將大語(yǔ)言模型與其它功能完美結(jié)合的產(chǎn)品)往往需要巧妙地采取 ‘smart’ (智能)方法來(lái)整合 AI 技術(shù)。這不僅意味著要在單一應(yīng)用中無(wú)縫融合 LLMs 的各項(xiàng)功能,還應(yīng)在不同應(yīng)用間建立數(shù)據(jù)傳輸通道。

以個(gè)人知識(shí)管理(PKM)工具為例,如 Obsidian,這些往往都是專為“老鳥(niǎo)”設(shè)計(jì)的 “core products” (譯者注:如前文所述,僅僅提供核心功能的產(chǎn)品,亦即所謂的“通用產(chǎn)品(generic products)”),這類產(chǎn)品用戶熱衷于自己動(dòng)手,通過(guò)各種插件(plugins)和集成其他組件、系統(tǒng)(integrations)來(lái)個(gè)性化滿足自己的使用需求。

然而,個(gè)人知識(shí)管理系統(tǒng)(PKM)的潛力遠(yuǎn)不止于此,這類產(chǎn)品的用戶是那些需要經(jīng)常創(chuàng)作新內(nèi)容的內(nèi)容創(chuàng)作者和博主,即便靈感枯竭,他們也必須保持持續(xù)的內(nèi)容產(chǎn)出。針對(duì)這一用戶群體,PKM 若能整合 AI-driven 的功能,便能蛻變?yōu)橐粋€(gè) “whole product”。想象一下??,一款智能系統(tǒng)(intelligent system)能夠深入分析個(gè)人知識(shí)庫(kù)(personal knowledge base),主動(dòng)為用戶提供文章、視頻或社交媒體帖子等內(nèi)容的創(chuàng)作靈感或內(nèi)容主題建議。更進(jìn)一步,這款工具還能與我們協(xié)同工作,共同打磨出高質(zhì)量的產(chǎn)品。

當(dāng)然,有些用戶也可以通過(guò)將自身知識(shí)庫(kù)與諸如 TextCortex 和 NotebookLM 等通用 AI 解決方案集成,實(shí)現(xiàn)類似的效果。不過(guò),這種自己動(dòng)手的方案(DIY approach)在功能完整性上還是有所欠缺。

這類解決方案往往看起來(lái)有些麻煩:一方面,我們得在一個(gè)地方向知識(shí)庫(kù)中添加“知識(shí)(knowledge)”;另一方面,卻要在另一個(gè)平臺(tái)上進(jìn)行分析、挖掘有價(jià)值的知識(shí)。

此外,這類配置操作往往需要依賴文本搜索(text queries) —— 這無(wú)疑是一項(xiàng)既費(fèi)時(shí)又高度消耗腦力的操作。反之,一個(gè)精心設(shè)計(jì)的 PKM 應(yīng)用,只需用戶輕點(diǎn)按鈕、遵循預(yù)定計(jì)劃或是依據(jù)特定事件就能激發(fā)高價(jià)值內(nèi)容的挖掘。這種用戶體驗(yàn)設(shè)計(jì)(UX design)大大減少了用戶的腦力消耗。

因此,在技術(shù)產(chǎn)品從對(duì)新技術(shù)持開(kāi)放態(tài)度,愿意承擔(dān)風(fēng)險(xiǎn)的“早鳥(niǎo)”向主流市場(chǎng)用戶(mainstream market)推廣的過(guò)程中,產(chǎn)品的簡(jiǎn)單、易用和功能完整程度是首要考慮因素。將 LLMs 的能力融入到用戶已熟知并信賴的產(chǎn)品之中,就能夠滿足這些條件。

然而,并非所有的集成解決方案(integrated solution)都行得通。在我看來(lái),最成功的“smart” AI 解決方案,都是那些能夠完美融入現(xiàn)有工作流的方案,終端用戶無(wú)需任何多余操作就能享受 AI 帶來(lái)的便利。也就是說(shuō),無(wú)需增加新按鈕,也不必新增選項(xiàng)欄 —— 集成 AI 只是為了增強(qiáng)用戶的現(xiàn)有體驗(yàn)。

  1. 以某一個(gè)教育應(yīng)用(educational app)為例,用戶僅需點(diǎn)擊熟悉的“Next(下一步)”按鈕,就可以繼續(xù)學(xué)習(xí)下一個(gè)話題或完成下一項(xiàng)作業(yè)。這一操作的底層邏輯,可能會(huì)觸發(fā) AI 生成的個(gè)性化學(xué)習(xí)內(nèi)容或?qū)W習(xí)作業(yè),而這一切都在悄無(wú)聲息中進(jìn)行。學(xué)生們可能根本不會(huì)注意到這一點(diǎn),但他們很可能對(duì)學(xué)習(xí)內(nèi)容能如此貼合個(gè)人需求而感到滿意。
  2. 相比之下,在目前市場(chǎng)上普遍存在這種 AI 集成模式:在應(yīng)用界面的一角突然跳出一個(gè)獨(dú)立的聊天機(jī)器人(chat assistant),與主要應(yīng)用功能幾乎無(wú)關(guān)。這種功能看似有用,但并不能構(gòu)成競(jìng)爭(zhēng)優(yōu)勢(shì),換句話說(shuō),它難以成為影響用戶堅(jiān)定選擇使用某款產(chǎn)品的關(guān)鍵因素。
  3. 再舉一個(gè)例子,從用戶接受程度來(lái)看,這種方案仍然不夠理想,相較于前兩種情況,這種解決方案比第二種好,但還是比第一種差。通常,基于 AI 的功能是通過(guò)在用戶熟悉的菜單欄中加入新選項(xiàng)的方式集成到現(xiàn)有應(yīng)用的。這絕非最佳解決方案,因?yàn)?strong>用戶往往對(duì)陌生選項(xiàng)持謹(jǐn)慎態(tài)度,因此這類解決方案的普及率依然停留在 20%-40% 之間。

哪些基于 LLMs 的產(chǎn)品值得開(kāi)發(fā)?從用戶體驗(yàn)和市場(chǎng)接受度的角度探討-AI.x社區(qū)

第三種解決方案示例:Notion 菜單欄中的 AI actions 選項(xiàng)

06 集成 GenAI 的產(chǎn)品更適合于 B2B2C 而非 B2C

現(xiàn)在我們來(lái)看看另一種情況,即沒(méi)有現(xiàn)有的盈利產(chǎn)品作為基礎(chǔ),而是從零開(kāi)始,試圖通過(guò)整合 LLM 技術(shù)來(lái)提升產(chǎn)品能力。依我之見(jiàn),如果想要推出一款以 LLMs 為核心功能的全新 B2C 產(chǎn)品,將會(huì)面臨重重困難。下面,我們將探討其中的兩大核心問(wèn)題:

  • 數(shù)據(jù)安全與用戶隱私問(wèn)題。為了保證產(chǎn)品的好用、易用,LLM 技術(shù)需要高質(zhì)量數(shù)據(jù)的支持。然而,在 B2C 領(lǐng)域,這卻成了一個(gè)棘手難題。直接使用用戶數(shù)據(jù)可能會(huì)引發(fā)許多消費(fèi)者對(duì)個(gè)人隱私的擔(dān)憂??。另一種途徑是依賴開(kāi)發(fā)人員提供的數(shù)據(jù),但這需要構(gòu)建一個(gè)龐大而全面的數(shù)據(jù)集,才能滿足各類用戶的多元化需求。無(wú)疑會(huì)大幅增加產(chǎn)品開(kāi)發(fā)費(fèi)用,并使產(chǎn)品開(kāi)發(fā)過(guò)程變得更為復(fù)雜。
  • 大型科技巨頭處于難以超越的領(lǐng)先地位。諸如 Meta、Google 和 Apple 這樣的科技巨擘,在 B2C 市場(chǎng)上占據(jù)著幾乎不可撼動(dòng)的地位。在某些 LLM 能夠賦能的產(chǎn)品領(lǐng)域,即便這些巨頭比初創(chuàng)企業(yè)晚一步進(jìn)入某些細(xì)分市場(chǎng),憑借其數(shù)以億計(jì)的現(xiàn)有用戶基礎(chǔ),依然能享有巨大的“先發(fā)”優(yōu)勢(shì)。此外,它們的產(chǎn)品正是用戶日常數(shù)字化生活的中心地帶,這種用戶規(guī)模上的優(yōu)勢(shì),是任何初創(chuàng)公司即便砸下重金進(jìn)行市場(chǎng)營(yíng)銷也難以企及的。

在經(jīng)過(guò)精心設(shè)計(jì)的 B2B2C 應(yīng)用中,上述挑戰(zhàn)被大大緩解,這類應(yīng)用的目標(biāo)是助力其他企業(yè)(特別是中小型企業(yè)(SMBs))迅速為 B2C 市場(chǎng)開(kāi)發(fā)出真正有價(jià)值的 end-to-end 產(chǎn)品:

  • 數(shù)據(jù)安全與用戶隱私問(wèn)題的解決。在 B2B2C 模式中,優(yōu)質(zhì)數(shù)據(jù)來(lái)源不再是單個(gè)的 B2C 模式的消費(fèi)者,而是轉(zhuǎn)向了 B2B 模式的客戶群體。這些企業(yè)出于自身利益考量,有更大的動(dòng)力去妥善處理用戶隱私問(wèn)題,這一點(diǎn)我們將在后續(xù)進(jìn)一步探討。
  • 利用現(xiàn)有客戶群的競(jìng)爭(zhēng)策略。在理想狀態(tài)下,每個(gè) B2B 模式的客戶都已擁有自己穩(wěn)定的客戶群體。此時(shí),融入 LLMs 技術(shù)的 B2B2C 產(chǎn)品便能夠幫助這些 B2B 模式的客戶,或是增加從其客戶身上獲得的收益,或是減少服務(wù)交付過(guò)程中的成本開(kāi)銷

不過(guò),基于私有部署 LLMs 的 B2B 產(chǎn)品同樣能有效規(guī)避上述這些問(wèn)題。不過(guò),關(guān)于 B2B 解決方案的詳細(xì)討論,不在本文討論范圍之內(nèi)。

此外,一款 B2C 產(chǎn)品要想取得成功,就必須擁有龐大的用戶群體,因此不應(yīng)該要求用戶具備特定的技能資質(zhì)或很高的產(chǎn)品使用積極性。 這恰恰與基于 LLMs 的應(yīng)用程序的典型弱點(diǎn)相悖,這類應(yīng)用往往會(huì)給用戶帶來(lái)不熟悉且復(fù)雜的體驗(yàn)(如第 4 節(jié)所述)。

當(dāng)用戶具有相對(duì)較高的產(chǎn)品使用積極性時(shí),上述弱點(diǎn)就更容易被克服。但在 B2C 領(lǐng)域,這種情況通常只適用于約 10%-20% 的用戶 —— 那些創(chuàng)新者(innovators)和“早鳥(niǎo)”(early adopters),這使得該類產(chǎn)品在市場(chǎng)大受歡迎顯得不太可能(在第 5 節(jié)對(duì)此情況進(jìn)行了探討)。

相反,在 B2B2C 模式中,更多潛在用戶表現(xiàn)出高度的積極性,因?yàn)閷?duì)他們而言,這不僅關(guān)乎如何“增效”,還關(guān)系到產(chǎn)品的利潤(rùn)增長(zhǎng)。

順便說(shuō)一下,雖然 B2B 模式的客戶可以直接與 LLMs 進(jìn)行交互,但他們服務(wù)的終端用戶仍然可以享受和以前一樣流暢自然的產(chǎn)品使用體驗(yàn),無(wú)需直接面對(duì)復(fù)雜、上手麻煩的 LLMs。

07 Summary

集成 LLMs 技術(shù)的產(chǎn)品可能在輸出質(zhì)量(output quality)上面臨重重挑戰(zhàn),且無(wú)可避免地會(huì)在質(zhì)量評(píng)估上遭遇困境(可回顧本文第 2 節(jié)介紹的內(nèi)容)。能否有效應(yīng)對(duì)或規(guī)避這些問(wèn)題,與用戶的錯(cuò)誤容忍度(error tolerance)密切相關(guān)。特別是 “AI copilots” 的使用者往往具有較高的錯(cuò)誤容忍度,因此針對(duì)這類系統(tǒng)進(jìn)行大量研發(fā)投資是完全合理的(內(nèi)容詳情請(qǐng)參見(jiàn)本文第 3 節(jié))。

對(duì)于那些已確立市場(chǎng)地位的產(chǎn)品開(kāi)發(fā)者而言,通過(guò)整合 LLMs 技術(shù)來(lái)增強(qiáng)產(chǎn)品價(jià)值,同時(shí)兼顧用戶的使用習(xí)慣,是一種更為明智的選擇。 這種策略有助于產(chǎn)品集成 AI 后順利“跨越鴻溝(cross the chasm)”,并贏得更多用戶的青睞(若想深入了解這一概念,請(qǐng)閱讀本文第 5 節(jié))。

哪些基于 LLMs 的產(chǎn)品值得開(kāi)發(fā)?從用戶體驗(yàn)和市場(chǎng)接受度的角度探討-AI.x社區(qū)

然而,遵循用戶已經(jīng)習(xí)慣的交互模式、布局、流程等傳統(tǒng)產(chǎn)品設(shè)計(jì)理念并非始終可行,對(duì)于創(chuàng)新產(chǎn)品(novel products)而言,這也未必是硬性要求。 由 LLM 深度賦能(LLM-powered)的應(yīng)用程序,很可能會(huì)使用“對(duì)話式的產(chǎn)品界面”,要求用戶改變他們的使用習(xí)慣。在這種情況下:

  • 人工智能應(yīng)當(dāng)為用戶提供顛覆性的價(jià)值(transformative benefits)(詳見(jiàn)本文第 4 節(jié)),或者
  • 產(chǎn)品應(yīng)遵循 B2B 或 B2B2C 的商業(yè)模式,而非傳統(tǒng)的 B2C 模式。在此種情況下,B2B 模式的客戶將轉(zhuǎn)變成為 GenAI 功能的核心用戶,因?yàn)樗麄冇袆?dòng)力提升團(tuán)隊(duì)的工作效率,進(jìn)一步提高盈利能力(詳情請(qǐng)閱讀本文第 6 節(jié))。

誠(chéng)然,要在短短一篇文章里全面介紹所有影響產(chǎn)品成敗的關(guān)鍵因素,即便是限定在某一技術(shù)領(lǐng)域(LLM)和兩種商業(yè)模式(B2C與B2B2C)的范圍內(nèi),也是難以做到的。

Thanks for reading!

Hope you have enjoyed and learned new things from this blog!


Alexey Evdokimov

AI pragmatist with background in Research (PhD), Education, Software Development and Product Management. I use GenAI for refining my pieces, not for ideation ;)

??https://medium.com/@alexeye42??

END

參考資料

[1]??https://chatgpt.com/share/a08c7c15-726b-4dd8-b96b-395b80a96edd??

[2]??https://www.reforge.com/blog/ai-products-arms-race#the-ai-survival-curve-where-lucrative-opportunities-live-93801b235d73??

[3]??https://www.visma.com/blog/which-ai-product-ideas-are-worth-exploring/??

[4]??https://www.blobr.io/post/ai-chat-ai-assistant-ai-copilot-ai-sidekick-guide-ai-definition??

[5]??https://www.blinkist.com/en/books/crossing-the-chasm-en??

原文鏈接:

??https://ai.gopubby.com/what-llm-powered-products-are-worth-developing-ux-and-adoption-perspectives-d9efcf444d50??


?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦