企業(yè)中最常用的十種GenAI工具
從AI聊天機器人和虛擬助手,到音頻和視頻生成器,這些都是當(dāng)今最前沿的GenAI工具。
自O(shè)penAI于2022年推出ChatGPT以來,GenAI已大規(guī)模進入企業(yè)領(lǐng)域。根據(jù)Precedence Research的數(shù)據(jù),2024年全球GenAI市場規(guī)模已超過250億美元,并預(yù)計到2033年將達到驚人的8030億美元。同時,賓夕法尼亞大學(xué)沃頓商學(xué)院的沃頓AI和分析倡議組織(AI at Wharton)與咨詢公司GBK Collective的一項針對高層決策者的研究發(fā)現(xiàn),2024年擁有1000名或更多員工的企業(yè)在GenAI上的投資平均比2023年高出了一倍以上。
然而,德勤最近的一項調(diào)查顯示,盡管大多數(shù)董事級至高管級的受訪者在使用或?qū)嵤〨enAI計劃方面有經(jīng)驗,并計劃在下一個財政年度增加其整體AI支出,但他們的態(tài)度較為謹(jǐn)慎,預(yù)計在未來幾個月內(nèi),只有30%或更少的GenAI實驗?zāi)軌蛉嫱茝V,這反映了他們手頭可用的工具狀況。因此,鑒于當(dāng)前的獲取和采用環(huán)境,以下是當(dāng)前企業(yè)中最常用的10種GenAI工具。
ChatGPT
ChatGPT是OpenAI推出的一款聊天機器人應(yīng)用程序,它建立在生成式預(yù)訓(xùn)練轉(zhuǎn)換器(GPT)模型之上。自2022年推出以來,它已成為企業(yè)中最常用的GenAI工具,沃頓商學(xué)院最近的調(diào)查顯示,62%的受訪者表示他們目前正在使用它,28%的受訪者表示他們目前尚未使用但正在評估或測試它。
ChatGPT的優(yōu)勢在于自然語言的理解和生成,使其成為應(yīng)對復(fù)雜語言挑戰(zhàn)的優(yōu)秀工具,包括自動化和改進客戶服務(wù)、通過處理重復(fù)性查詢來簡化運營、生成報告、起草電子郵件以及創(chuàng)建產(chǎn)品描述等。
與所有GenAI一樣,ChatGPT的準(zhǔn)確性可能會有所不同,而且它無法理解情緒,這可能會在某些情況下引發(fā)問題。因此,可能需要人類監(jiān)督和干預(yù)。
Microsoft Copilot
Microsoft Copilot是嵌入在Microsoft 365中的一款對話聊天界面,旨在增強Word、Excel、PowerPoint、Outlook和Teams等應(yīng)用程序的生產(chǎn)力。它于2023年推出,利用OpenAI的GPT-4基礎(chǔ)大型語言模型(LLM),是第二大常用的GenAI工具。根據(jù)沃頓商學(xué)院的調(diào)查,52%的受訪者表示他們的企業(yè)目前正在使用Copilot,35%的受訪者表示他們正在評估或測試它。
Copilot的強項在于它與Microsoft 365環(huán)境中員工全天使用的生產(chǎn)力應(yīng)用程序的集成。它遵循企業(yè)已有的安全、合規(guī)和隱私政策,并可作為現(xiàn)有Microsoft許可證的附加組件提供。其用途包括:
? 在Word中起草文檔和摘要文本
? 根據(jù)Excel中現(xiàn)有數(shù)據(jù)生成圖表
? 在PowerPoint中創(chuàng)建大綱和設(shè)計幻燈片
? 管理Outlook收件箱、摘要電子郵件線程和起草回復(fù)
? 匯總Teams會議的關(guān)鍵點并創(chuàng)建待辦事項
? 利用Power BI通過自然語言查詢創(chuàng)建報告和可視化內(nèi)容
與ChatGPT一樣,Copilot的準(zhǔn)確性并非完美。例如,在總結(jié)內(nèi)容時,它可能會遺漏要點或忽略關(guān)鍵細(xì)節(jié)。同樣,即使在使用品牌材料、文案和圖像時,其輸出也不一定符合品牌標(biāo)準(zhǔn)。用戶需要關(guān)注其輸出。
Google Gemini
Google Gemini(前身為Bard)是一款基于Google的Gemini多模態(tài)AI模型構(gòu)建的對話聊天機器人。沃頓商學(xué)院的調(diào)查顯示,40%的受訪者表示他們目前正在使用Gemini,39%的受訪者表示他們正在評估或測試它。
與ChatGPT和Microsoft Copilot相比,Gemini在2023年推出時,在多模態(tài)功能方面處于領(lǐng)先地位——除了文本之外,它還能夠處理和生成圖像、音頻和視頻。Gemini與Gmail、Docs和Slides等Google Workspace工具集成。
Gemini的潛在用途包括:
? 根據(jù)Smart Email Composer的提示起草電子郵件
? 根據(jù)提示在Google Slides中創(chuàng)建幻燈片演示文稿
? 通過Spreadsheet Analyzer在Google Sheets中識別趨勢、異常值和相關(guān)性
? 為Google Meet視頻會議生成背景插圖并模擬專業(yè)照明,甚至改善音頻體驗
Gemini與Google Workspace的集成使其成為在使用Workspace的環(huán)境中出類拔萃的工具,但在此類環(huán)境之外,其效用有限,因為它在Google的安全環(huán)境中運行。與ChatGPT和Copilot一樣,準(zhǔn)確性可能是一個問題,因此建議對人類監(jiān)督其輸出。
Meta AI
Meta AI是Meta為其消息和社交媒體應(yīng)用程序(包括Facebook、Instagram、WhatsApp和Messenger)打造的多模態(tài)AI虛擬助手。與Gemini一樣,沃頓商學(xué)院的調(diào)查顯示,40%的受訪者表示他們目前正在使用Meta AI,36%的受訪者表示他們正在評估或測試它。
Meta AI由Meta的Llama大型語言模型(LLM)提供支持,用戶可以利用它在公司的應(yīng)用程序中提供建議、回答問題、編輯圖像和提供翻譯。企業(yè)可以使用Meta AI來設(shè)置虛擬助手,這些助手可以:
? 自動化客戶互動,包括回答問題和提供個性化建議
? 在Meta的應(yīng)用程序內(nèi)促進交易
? 分析數(shù)據(jù),以幫助企業(yè)創(chuàng)建有針對性的營銷活動
Meta AI已經(jīng)與許多客戶在線花費大量時間的應(yīng)用程序集成,但訪問客戶數(shù)據(jù)可能存在隱私和道德問題。
Dall-E 3
GenAI不僅僅關(guān)乎聊天機器人和虛擬助手。同樣來自O(shè)penAI的DALL-E 3專注于根據(jù)文本描述生成視覺內(nèi)容,沃頓商學(xué)院的調(diào)查顯示,30%的受訪者表示他們目前正在使用DALL-E 3,35%的受訪者表示他們正在評估或測試它。OpenAI于2021年推出了原始的DALL-E模型,而DALL-E 3深度學(xué)習(xí)模型則利用計算機視覺和自然語言處理來創(chuàng)建視覺內(nèi)容。其潛在商業(yè)用途包括產(chǎn)品構(gòu)思、應(yīng)用程序原型設(shè)計、標(biāo)志設(shè)計、為社交媒體帖子和教育材料創(chuàng)建圖像和視頻等。
在AI圖像生成器中,DALL-E 3的強項在于它與ChatGPT的集成,但許多用戶表示,它在逼真度方面存在困難,具有一種獨特的風(fēng)格,使得很容易識別出模型生成的圖像。
RunwayML Gen-1和Gen-2
Runway利用文本、圖像和視頻輸入(包括由其他GenAI工具生成的內(nèi)容)來生成視頻,沃頓商學(xué)院的調(diào)查顯示,25%的受訪者表示他們目前正在使用Gen-1和Gen-2,31%的受訪者表示他們正在評估或測試這些模型。
2023年發(fā)布的Gen-2模型擴展了Gen-1模型的功能,允許創(chuàng)建長達18秒的視頻。用戶可以指導(dǎo)相機的移動以定制內(nèi)容,并將片段拼接在一起以創(chuàng)建更長的視頻。除此之外,企業(yè)還可以使用該工具來制作靜態(tài)資產(chǎn)的動畫、視覺效果和故事板。
Runway的某些功能學(xué)習(xí)曲線較陡峭,而且可能會占用大量資源。
Stable Diffusion
Stable Diffusion是Stability AI于2022年推出的一款深度學(xué)習(xí)模型,它可以根據(jù)文本和圖像提示生成高分辨率、逼真的圖像。它還可以創(chuàng)建視頻和動畫,沃頓商學(xué)院的調(diào)查顯示,24%的受訪者表示他們目前正在使用Stable Diffusion,33%的受訪者表示他們正在評估或測試它。
Stable Diffusion基于一種潛在擴散模型,該模型所需的處理能力遠(yuǎn)低于一些競爭對手,因此它能夠在配備消費級GPU的臺式機和筆記本電腦上運行,而不局限于云服務(wù)。
Stable Diffusion的潛在商業(yè)用途包括醫(yī)學(xué)成像、為目錄生成視覺內(nèi)容、設(shè)計數(shù)字原型、創(chuàng)建概念藝術(shù)和故事板,以及圖像編輯(包括色彩校正和降噪)。
Midjourney
Midjourney是一款根據(jù)自然語言提示生成圖像的工具。自2022年推出公開測試版以來,沃頓商學(xué)院的調(diào)查顯示,23%的受訪者表示他們目前正在使用Midjourney,32%的受訪者表示他們正在評估或測試它。
可以通過Discord通信平臺或該工具的官方網(wǎng)站訪問Midjourney。
通過Midjourney商業(yè)許可證創(chuàng)建的圖像可用于商業(yè)用途,但除非經(jīng)過人類的重大改造,否則不能享有版權(quán)。因此,未經(jīng)人類藝術(shù)家改造的Midjourney創(chuàng)建的圖像被視為公共領(lǐng)域。
Perplexity
Perplexity是Perplexity AI于2022年推出的一款基于AI的搜索引擎,它利用大型語言模型(LLMs)處理查詢并綜合響應(yīng),沃頓商學(xué)院的調(diào)查顯示,21%的受訪者表示他們目前正在使用Perplexity,33%的受訪者表示他們正在評估或測試它。
Perplexity建立在Microsoft Azure之上。免費版本利用OpenAI的GPT-3.5大型語言模型,但付費用戶可以選擇自己的模型。其用途包括:
? 內(nèi)部搜索,用于同時在網(wǎng)絡(luò)和內(nèi)部文檔中搜索內(nèi)容
? 金融,包括實時股票報價、價格跟蹤、行業(yè)同行比較和基本財務(wù)分析工具
? Perplexity Assistant,一款適用于Android設(shè)備的基于AI的搜索助手
Claude
Claude是Anthropic于2023年推出的一款對話式AI聊天機器人,沃頓商學(xué)院的調(diào)查顯示,19%的受訪者表示他們目前正在使用Claude,34%的受訪者表示他們正在評估或測試它。
Claude遵循Anthropic開發(fā)的憲法AI(CAI)原則,這是一種訓(xùn)練AI系統(tǒng)的方法,旨在解決透明度、安全性和無需依賴人類反饋即可做出決策方面的擔(dān)憂。CAI旨在為Claude設(shè)定道德界限,使其能夠拒絕回答可能造成傷害的查詢。
Claude是ChatGPT等其他通用產(chǎn)品的替代品,企業(yè)可以利用它來自動化和改進客戶服務(wù)、通過處理重復(fù)性查詢來簡化運營、生成報告、起草電子郵件以及創(chuàng)建產(chǎn)品描述。
Claude以其回復(fù)的清晰度而聞名,但也有冗長的傾向。