游戲中的生成式 AI 革命
AI改變游戲,這項工作的變革性不僅在于它節(jié)省了時間和金錢,同時也提供了質(zhì)量——從而打破了經(jīng)典的“成本、質(zhì)量或速度只能有兩個”的三角關(guān)系。藝術(shù)家們現(xiàn)在只需要幾個小時就可以創(chuàng)作出高質(zhì)量的圖像,否則手工生成這些圖像需要數(shù)周時間,真正具有變革性的是:
- 任何人只要能學(xué)習(xí)一些簡單的工具,就可以獲得這種創(chuàng)造力;
- 這些工具可以以高度迭代的方式創(chuàng)建無限數(shù)量的變化;
- 一旦訓(xùn)練完畢,該過程是實時的——幾乎可以立即獲得結(jié)果。
自出現(xiàn)3D以來,還沒有一種技術(shù)對游戲具有如此革命性的影響,花點時間與游戲開發(fā)者交談,他們便會感受到興奮和驚奇。那么這項技術(shù)將走向何方呢?它將如何改變游戲?首先,讓我們回顧一下什么是生成式AI?
什么是生成式人工智能
生成式 AI 是機器學(xué)習(xí)的一種,計算機可以根據(jù)用戶的提示生成原創(chuàng)的新內(nèi)容。今天,文本和圖像是這項技術(shù)最成熟的應(yīng)用,但實際上每個創(chuàng)意領(lǐng)域都在進行研究,從動畫到音效,再到音樂,甚至創(chuàng)造具有完全充實個性的虛擬角色。
當(dāng)然,人工智能在游戲中并不新鮮。即使是早期的游戲,如雅達利的《Pong》,也有電腦控制的對手來挑戰(zhàn)玩家,然而,這些虛擬敵人并沒有像我們今天所知道的那樣運行人工智能。它們只是游戲設(shè)計師編寫的腳本程序。他們模擬了一個人工智能對手,但他們無法學(xué)習(xí),他們只能按照建造他們的程序來運行。
現(xiàn)在的不同之處在于可用的計算能力,這要歸功于更快的微處理器和云。有了這種能力,就可以構(gòu)建大型神經(jīng)網(wǎng)絡(luò)來識別高度復(fù)雜領(lǐng)域中的模式和表征。
這篇博文分為兩部分:
第一部分是我們對游戲生成 AI 領(lǐng)域的觀察和預(yù)測。
第二部分是我們的市場地圖的空間,概述了各個細分市場并識別每個細分市場中的關(guān)鍵領(lǐng)域。
第一部分——觀察和預(yù)測
假設(shè)
首先,讓我們探討一下這篇博文其余部分的一些假設(shè):
1. 在通用人工智能方面進行的研究將繼續(xù)增長,創(chuàng)造出更有效的技術(shù)
考慮一下arXiv 檔案中每月發(fā)表的關(guān)于機器學(xué)習(xí)或人工智能的學(xué)術(shù)論文數(shù)量圖表:
如您所見,論文數(shù)量呈指數(shù)級增長,絲毫沒有放緩的跡象。這僅包括已發(fā)表的論文——許多研究甚至從未發(fā)表過,直接用于開源模型或產(chǎn)品研發(fā)。其結(jié)果是興趣和創(chuàng)新的爆炸式增長。
2. 在所有娛樂中,游戲?qū)⑹苌扇斯ぶ悄艿挠绊懽畲?/strong>
就涉及的資產(chǎn)類型(2D 藝術(shù)、3D 藝術(shù)、音效、音樂、對話等)的數(shù)量而言,游戲是最復(fù)雜的娛樂形式。游戲也是最具互動性的,非常強調(diào)實時體驗。這為新游戲開發(fā)者創(chuàng)造了一個巨大的進入障礙,同時也為制作一款現(xiàn)代的、排行榜首的游戲付出了高昂的成本。它還為生成式 AI 的顛覆創(chuàng)造了巨大的機會。
以《荒野大鏢局2》為例,它是有史以來最昂貴的游戲之一,制作成本接近 5 億美元。原因很容易理解——它擁有市場上所有游戲中最美麗、最真實的虛擬世界之一。這款游戲花了將近 8 年的時間打造,擁有超過 1,000 個可玩的角色(每個角色都有自己的個性、藝術(shù)作品和配音演員),在這個近 30 平方英里的游戲世界里,有超過 100多個任務(wù)分布在 6 個章節(jié)中,并且由 100 多位音樂家創(chuàng)作的近 60 小時的音樂。這個游戲的一切都很重要。
現(xiàn)在將 《荒野大鏢局2》與《飛行模擬器》進行比較,后者不僅大,而且非常龐大。微軟飛行模擬器允許玩家在1.97 億平方英里的地球上飛行。微軟是如何打造如此龐大的游戲的?答案是通過讓人工智能來做,微軟與blackshark.ai合作,訓(xùn)練人工智能從 2D 衛(wèi)星圖像生成逼真的 3D 世界。
這是一個不使用AI就不可能制作的游戲的例子,此外,從這些模型可以隨著時間的推移不斷改進。例如,他們可以增強“高速公路立交橋”模型,重新運行整個構(gòu)建過程,使得整個星球上的所有高速公路立交橋都得到了改善。
3.游戲制作中涉及的每一項資產(chǎn)都會有一個生成式AI模型
到目前為止,像 Stable Diffusion 或 MidJourney 這樣的 2D 圖像生成器已經(jīng)獲得了生成式 AI 的大部分流行內(nèi)容,因為它們可以生成引人注目的圖像。但事實上,游戲中涉及的所有資產(chǎn)都已經(jīng)有了生成AI模型,從 3D 模型到角色動畫,再到對話和音樂。這篇博文的后半部分包括一份市場地圖,重點介紹了一些專注于每種類型內(nèi)容的公司。
4.內(nèi)容價格將大幅下降,在某些情況下甚至可能會降為零
在與正在嘗試將生成式 AI 集成到他們的生產(chǎn)流程中的游戲開發(fā)人員交談時,最令人興奮的是時間和成本的大幅減少。一位開發(fā)人員告訴我們,他們?yōu)閱蝹€圖像生成概念藝術(shù)的時間從開始到完成已從 3 周減少到一個小時:減少了 120 比 1。我們相信在整個生產(chǎn)流程中也可能實現(xiàn)類似的節(jié)省。
需要明確的是,藝術(shù)家沒有被取代的危險。這確實意味著藝術(shù)家不再需要自己完成所有工作:他們現(xiàn)在可以設(shè)定最初的創(chuàng)意方向,然后將大部分耗時和技術(shù)執(zhí)行交給人工智能。在這方面,他們就像手繪動畫早期的cel畫家一樣,熟練的“墨水師”畫出動畫的輪廓,然后大批低成本的“畫家”大軍會完成耗時的繪畫工作。畫出動畫的cel,填充線條。這是游戲創(chuàng)造的“自動完成”。
5.我們還處于這場革命的初級階段,很多實踐還需要完善
盡管最近有這么多激動人心的事情,但我們?nèi)蕴幱谄鹋芫€上。在我們弄清楚如何將這項新技術(shù)用于游戲的過程中,還有大量的工作要做,并且將為迅速進入這一新領(lǐng)域的公司創(chuàng)造巨大的機會。
預(yù)測
基于這些假設(shè),以下是對游戲行業(yè)如何轉(zhuǎn)變的一些預(yù)測:
1. 學(xué)習(xí)如何有效地使用生成式人工智能將成為一種有市場價值的技能
我們已經(jīng)看到一些實驗者比其他人更有效地使用生成式人工智能。要充分利用這項新技術(shù),需要使用各種工具和技術(shù),并了解如何在它們之間靈活轉(zhuǎn)換。我們預(yù)測這將成為一種有市場的技能,它將結(jié)合藝術(shù)家的創(chuàng)意愿景與程序員的技術(shù)技能。
克里斯·安德森 (Chris Anderson) 有句名言:“每一次富足都會造成新的稀缺?!?nbsp;隨著內(nèi)容變得豐富,我們相信最短缺的是知道如何使用 AI 工具最有效地協(xié)作和工作的藝術(shù)家。
例如,使用生成式 AI 用于制作藝術(shù)品面臨著特殊的挑戰(zhàn),包括:
一致性, 對于任何生產(chǎn)資產(chǎn),您都需要能夠在以后對資產(chǎn)進行更改或編輯。對于AI 工具,這意味著需要能夠使用相同的提示重現(xiàn)資產(chǎn),這樣您就可以進行更改。這可能會很棘手,因為相同的提示可能會產(chǎn)生截然不同的結(jié)果。
風(fēng)格, 對于特定游戲中的所有藝術(shù)來說,保持一致的風(fēng)格是很重要的——這意味著您的工具需要與您的特定風(fēng)格相結(jié)合。
2. 降低門檻將導(dǎo)致更多的冒險精神和創(chuàng)造性探索
我們可能很快就會進入游戲開發(fā)的新“黃金時代”,在這個時代,較低的進入門檻會導(dǎo)致更多創(chuàng)新性和創(chuàng)造性的游戲。不僅因為較低的制作成本導(dǎo)致較低的風(fēng)險,還因為這些工具開啟了更廣泛的受眾創(chuàng)造高質(zhì)量內(nèi)容的能力,這導(dǎo)致下一個預(yù)測......
3. 人工智能輔助的“微游戲工作室”興起
借助生成式 AI 工具和服務(wù),我們將開始看到只有 1 或 2 名員工的“微型工作室”制作出更多可行的商業(yè)游戲。成立小型獨立游戲工作室的想法并不新鮮——熱門游戲Among Us是由只有 5 名員工的 Innersloth 工作室開發(fā)的,這將導(dǎo)致這些小型工作室可以開發(fā)的游戲的規(guī)模和規(guī)模將會增長。
4.每年發(fā)行的游戲數(shù)量增加
Unity 和 Roblox 的成功表明,提供強大的創(chuàng)意工具可以打造更多游戲。生成式 AI 將進一步降低門檻,創(chuàng)造更多的游戲。該行業(yè)已經(jīng)受到曝光挑戰(zhàn)的困擾——僅去年一年就有超過10,000 款游戲被添加到 Steam上——這將給曝光帶來更大的壓力。然而,我們還將看到……
5. 在生成式 AI出現(xiàn)之前,我們不可能創(chuàng)造出新的游戲類型
如果沒有生成式 AI,我們將看不到有新的游戲類型出現(xiàn),我們已經(jīng)討論過微軟的飛行模擬器,但還會出現(xiàn)一些全新的類型,它們依賴于新內(nèi)容的實時生成。
以Spellbrush的《Arrowmancer》為例,這是一款以 AI 創(chuàng)建的角色為特色的扮演游戲,它提供了幾乎無限的新玩法。
我們還知道另一家游戲開發(fā)商正在使用AI 讓玩家創(chuàng)建自己的游戲內(nèi)頭像。之前他們有一個手繪的頭像的集合,玩家可以混合搭配這些圖像來創(chuàng)建他們的頭像——現(xiàn)在他們已經(jīng)完全拋棄了這一點,只是根據(jù)玩家的描述來生成頭像圖像。讓玩家通過 AI 生成內(nèi)容比讓玩家從零開始上傳自己的內(nèi)容更安全,因為AI可以被訓(xùn)練以避免創(chuàng)造出令人反感的內(nèi)容,同時仍然給玩家提供更大的歸屬感。
6. 價值將歸于行業(yè)特定的人工智能工具,而不僅僅是基礎(chǔ)模型
圍繞穩(wěn)定擴散( Stable Diffusion) 和 Midjourney 等基礎(chǔ)模型的興奮和熱議正在產(chǎn)生令人瞠目結(jié)舌的估值,但新研究的持續(xù)涌入確保了隨著新技術(shù)的改進,新模型將會出現(xiàn)和消失??紤] 3 種流行的生成式 AI 模型的網(wǎng)站搜索流量:Dall-E、Midjourney 和Stable Diffusion,每個新模型都會成為人們關(guān)注的焦點。
另一種方法可能是構(gòu)建與行業(yè)一致的工具套件,專注于特定行業(yè)的生成 AI 需求,深入了解特定受眾,并充分集成到現(xiàn)有的生產(chǎn)流程中(例如 Unity 或 Unreal 游戲)。
一個很好的例子是Runway,它通過AI輔助工具(如視頻編輯、綠幕移除、修復(fù)和運動跟蹤)來滿足視頻創(chuàng)作者的需求。像這樣的工具可以建立特定的受眾并從中盈利,并隨著時間的推移添加新的模型。我們還沒有看到像 Runway 這樣的游戲套件出現(xiàn),但我們知道這是一個積極發(fā)展的空間。
7.法律挑戰(zhàn)接踵而至
所有這些生成式 AI 模型的共同點是,它們都是使用海量內(nèi)容數(shù)據(jù)集進行訓(xùn)練的,這些數(shù)據(jù)集通常是通過抓取互聯(lián)網(wǎng)本身創(chuàng)建的。例如,穩(wěn)定擴散(Stable Diffusion) 接受了超過 50 億個從網(wǎng)絡(luò)上抓取的圖像/標題對上進行訓(xùn)練的。
目前,這些模型聲稱在“合理使用”版權(quán)原則下運作,但這一論點尚未在法庭上得到明確檢驗。很明顯,法律挑戰(zhàn)即將到來,這可能會改變生成人工智能的格局。
大型工作室可能會通過建立基于他們擁有明確權(quán)利和所有權(quán)的內(nèi)部內(nèi)容的專有模型來尋求競爭優(yōu)勢。例如,微軟在這方面的地位尤其有利,它目前擁有23 個第一方工作室,在收購 Activision后還有 7個。
8. 節(jié)目不會像藝術(shù)內(nèi)容那樣受到嚴重破壞——至少現(xiàn)在還沒有
軟件工程是游戲開發(fā)的另一項主要成本,但正如我們 a16z Enterprise 團隊的同事在他們最近的博客文章《Art Isn’t Dead》中分享的那樣,藝術(shù)并沒有死,它只是機器生成的,使用 AI 模型生成代碼需要更多測試和驗證,因此與生成創(chuàng)意資產(chǎn)相比,它對生產(chǎn)力的提升較小。像 Copilot 這樣的編碼工具可能會為工程師提供適度的性能提升,但不會產(chǎn)生同樣的影響……至少在短期內(nèi)不會。
建議
基于這些預(yù)測,我們提出以下建議:
1. 現(xiàn)在開始探索生成式 AI
要想搞清楚如何充分利用即將到來的生成式AI革命的力量,還需要一段時間。現(xiàn)在開始的公司以后會有優(yōu)勢。我們知道有幾家工作室正在進行內(nèi)部實驗項目,以探索這些技術(shù)如何影響制作。
2.尋找市場地圖上的機會
我們的市場地圖的某些部分已經(jīng)非常擁擠了,例如動畫或語音和對話,但其他領(lǐng)域則非常開放。我們鼓勵對這一領(lǐng)域感興趣的企業(yè)家將精力集中在尚未探索的領(lǐng)域,例如“游戲跑道”。
第二部分——市場地圖
市場現(xiàn)狀
我們已經(jīng)創(chuàng)建了一個市場地圖,以捕捉我們在每個類別中發(fā)現(xiàn)的公司列表,我們在這些類別中看到生成 AI 影響游戲。這篇博文詳細介紹了這些類別,更詳細得解釋了它,并重點介紹了每個類別中最令人興奮的公司。
二維圖像
從文本提示生成二維圖像已經(jīng)是生成式人工智能應(yīng)用最廣泛的領(lǐng)域之一。像Midjourney 、Stable Diffusion和Dall-E 2等工具可以從文本生成高質(zhì)量的 2D 圖像,并且已經(jīng)在游戲生命周期的多個階段進入游戲制作。
概念藝術(shù)
生成式 AI 工具擅長“構(gòu)思”或幫助游戲設(shè)計師等非藝術(shù)家快速探索概念和想法以生成概念圖,這是制作過程的關(guān)鍵部分。例如,一個工作室(保持匿名)正在使用其中的幾個工具來從根本上加快他們的概念藝術(shù)過程,只需要一天就可以創(chuàng)建一張圖像,而以前需要長達 3 周的時間。
首先,他們的游戲設(shè)計師使用Midjourney 探索不同的想法并生成他們覺得鼓舞人心的圖像。
這些被移交給專業(yè)的概念藝術(shù)家,他將它們組裝在一起,并在結(jié)果上繪畫以創(chuàng)建一個單一的連貫圖像 - 然后將其輸入到 Stable Diffusion 中以創(chuàng)建一系列變體。
他們討論這些變化,選擇一個,手動繪制一些編輯——然后重復(fù)這個過程,直到他們對結(jié)果滿意為止。
在那個階段,最后一次將此圖像傳回Stable Diffusion 以“升級”它以創(chuàng)建最終的藝術(shù)作品。
二維制作藝術(shù)
一些工作室已經(jīng)在嘗試使用相同的工具來制作游戲中的藝術(shù)品。例如,Albert Bozesan提供了一個關(guān)于使用穩(wěn)定擴散去創(chuàng)造游戲內(nèi)2D資產(chǎn)的教程。
3D作品
3D 資產(chǎn)是所有現(xiàn)代游戲以及即將到來的元宇宙的基石。虛擬世界或游戲關(guān)卡本質(zhì)上只是 3D 資產(chǎn)的集合,經(jīng)過放置和修改以填充環(huán)境。然而,創(chuàng)建 3D 資產(chǎn)比創(chuàng)建 2D 圖像更復(fù)雜,并且涉及多個步驟,包括創(chuàng)建 3D 模型和添加紋理和效果。對于動畫角色,它還涉及創(chuàng)建內(nèi)部“骨架”,然后在該骨架之上創(chuàng)建動畫。
我們看到幾家不同的初創(chuàng)公司都在追逐這個 3D 資產(chǎn)創(chuàng)建過程的每個階段,包括模型創(chuàng)建、角色動畫和關(guān)卡構(gòu)建。然而,這個問題還沒有解決——還沒有一個解決方案可以完全集成到生產(chǎn)環(huán)境中。
3D資產(chǎn)
試圖解決 3D 模型創(chuàng)建問題的初創(chuàng)公司包括Kaedim、Mirage和Hypothetic。一些大的公司也在關(guān)注這個問題,包括 Nvidia 的Get3D和 Autodesk 的ClipForge。Kaedim 和 Get3d 專注于圖像到 3D;ClipForge 和 Mirage 專注于文本到 3D,而 Hypothetic 對文本到 3D 搜索以及圖像到 3D 都感興趣。
3D 紋理
3D 模型的逼真度取決于應(yīng)用于網(wǎng)格的紋理或材料。決定將哪種長滿苔蘚、風(fēng)化的石頭紋理應(yīng)用于中世紀城堡模型可以完全改變場景的外觀和感覺。紋理包含關(guān)于光如何對材料做出反應(yīng)的元數(shù)據(jù)(即粗糙度、光澤度等)。允許藝術(shù)家根據(jù)文本或圖像提示輕松生成紋理對于提高創(chuàng)作過程中的迭代速度具有非常的的價值。包括BariumAI、Ponzu和ArmorLab在內(nèi)的幾個團隊正在尋求這個機會。
動畫
制作優(yōu)秀的動畫是游戲創(chuàng)建過程中最耗時、最昂貴且最需要技巧的部分之一。一種降低成本,并創(chuàng)造更真實動畫的方法是使用動作捕捉,您可以讓演員或舞者穿上動作捕捉服,并記錄他們在配備特殊儀器的動作捕捉舞臺上的移動。
我們現(xiàn)在看到了可以直接從視頻中捕捉動畫的生成式 AI 模型。這是更有效的,因為它不再需要昂貴的動作捕捉裝置,還因為這意味著您可以從現(xiàn)有視頻中捕捉動畫。這些模型的另一個令人興奮的方面是,它們還可以用于對現(xiàn)有動畫應(yīng)用過濾器,例如讓它們看起來喝醉了、老了或開心了。進入這一領(lǐng)域的公司包括Kinetix、DeepMotion、RADiCAL、Move Ai和Plask。
關(guān)卡設(shè)計和世界建設(shè)
游戲創(chuàng)作中最耗時的環(huán)節(jié)之一是構(gòu)建游戲世界,生成式 AI 應(yīng)該非常適合這項任務(wù)。像《我的世界》、《無人深空》和《暗黑破壞神》等游戲便以使用程序技術(shù)生成關(guān)卡而聞名,其中關(guān)卡是隨機創(chuàng)建的,每次都不同,但遵循關(guān)卡設(shè)計師制定的規(guī)則。新的虛幻5游戲引擎的一大賣點是其用于開放世界設(shè)計的程序工具集,例如植被放置。
我們已經(jīng)看到該領(lǐng)域的一些創(chuàng)新,例如Promethean、MLXAR或 Meta 的Builder Bot,我們認為生成技術(shù)在很大程度上取代程序技術(shù)只是時間問題。該領(lǐng)域的學(xué)術(shù)研究已經(jīng)有一段時間了,包括《我的世界》的生成技術(shù)或《毀滅戰(zhàn)士》的關(guān)卡設(shè)計。
期待用于關(guān)卡設(shè)計的生成式 AI 工具的另一個令人信服的理由是因為它能夠創(chuàng)建不同風(fēng)格的關(guān)卡和世界。你可以想象使用工具去創(chuàng)造一個20世紀20年代的紐約,對比反烏托邦的《銀翼殺手》式的未來,對比托爾金式的幻想世界。
以下概念是由 Midjourney 使用提示生成的,“一個游戲級別……風(fēng)格”
音頻
聲音和音樂是游戲體驗的重要組成部分。我們開始看到公司使用 生成式AI 來生成音頻,以補充圖形方面已經(jīng)發(fā)生的工作。
聲音效果
音效對于AI 來說是一個有吸引力的開放領(lǐng)域。已有學(xué)術(shù)論文探索使用 AI 在電影中生成“foley”(例如腳步聲)的想法,但游戲中的商業(yè)產(chǎn)品還很少。
我們認為這只是時間問題,因為游戲的交互性使其成為生成式 AI 的明顯應(yīng)用,既可以在制作過程中創(chuàng)建靜態(tài)音效(“星球大戰(zhàn)風(fēng)格的激光槍聲”),又可以在運行時創(chuàng)造實時交互式音效。
就像為玩家角色生成腳步聲一樣簡單,大多數(shù)游戲通過包含少量預(yù)先錄制的腳步聲來解決這個問題:在草地上行走、在礫石上行走、在草地上奔跑、在礫石上奔跑等。生成和管理這些聲音很繁瑣,并且在運行時聽起來重復(fù)且不真實。
一個更好的方法是為foley音效創(chuàng)建一個實時的生成 AI 模型,它可以動態(tài)生成適當(dāng)?shù)囊粜?,每次都略有不同,對游戲中的參?shù)(如地面、角色重量、步態(tài)、鞋類等)做出響應(yīng)
音樂
音樂一直是游戲的一大挑戰(zhàn)。這很重要,因為它可以像在電影或電視中一樣幫助設(shè)定情感基調(diào),但由于游戲可能持續(xù)數(shù)百甚至數(shù)千小時,所以它很快就會變得重復(fù)或令人討厭。此外,由于游戲的互動性,音樂可能很難在任何時候屏幕上發(fā)生的事情精準匹配。
二十多年來,自適應(yīng)音樂一直是游戲音頻領(lǐng)域的一個主題,這可以追溯到微軟用于創(chuàng)建互動音樂的“ DirectMusic ”系統(tǒng)。DirectMusic 從未被廣泛采用,這在很大程度上是由于這種格式的創(chuàng)作難度。只有少數(shù)游戲,如 Monolith 的《無人永生》,創(chuàng)造了真正的互動樂譜。
現(xiàn)在我們看到許多公司試圖創(chuàng)建 AI 生成的音樂,例如Soundful、Musico、Harmonai、Infinite Album和Aiva。雖然今天的一些工具,如Open AI 的Jukebox,是高度計算密集型的,不能實時運行,但大多數(shù)工具都可以在初始模型構(gòu)建后實時運行。
語音和對話
有很多公司試圖為游戲中的角色創(chuàng)造逼真的聲音??紤]到試圖通過語音合成為計算機發(fā)聲的悠久歷史,這并不奇怪。公司包括Sonantic、Coqui、Replica Studios、Resemble.ai、Readspeaker.ai等等。
使用生成式 AI 進行語音有多種優(yōu)勢,這在一定程度上解釋了為什么這個領(lǐng)域如此擁擠。
即時生成對話:通常游戲中的語音是由配音演員預(yù)先錄制的,但這些僅限于預(yù)先錄制的錄音語音。通過生成式 AI 對話,角色可以說任何話——這意味著他們可以對玩家的行為做出充分的反應(yīng)。結(jié)合更智能的 NPC AI 模型(不在本博客的范圍內(nèi),但現(xiàn)在是一個同樣令人興奮的創(chuàng)新領(lǐng)域),完全響應(yīng)玩家的游戲的前景即將到來。
角色扮演:許多玩家想扮演與他們在現(xiàn)實世界中的身份幾乎沒有相似之處的奇幻角色。然而,一旦玩家用自己的聲音說話,這種幻想就會破滅。使用與玩家頭像相匹配的生成聲音可以保持這種錯覺。
控制。生成語音時,您可以控制聲音的細微差別,如音色、音調(diào)變化、情感共鳴、音素長度、重音等。
本土化:允許將對話翻譯成任何語言并以相同的聲音說出來。像Deepdub這樣的公司專門專注于這個細分市場。
NPC 或玩家角色
許多初創(chuàng)公司正在考慮使用生成式 AI來創(chuàng)建可以與之互動的可信角色,部分原因是這是一個在游戲之外具有如此廣泛適用性的市場,例如虛擬助理或接待員。
創(chuàng)造可信角色的努力可以追溯到 AI 研究的開端。事實上,經(jīng)典的人工智能“圖靈測試”的定義是,人類應(yīng)該無法區(qū)分與人工智能和人類的聊天對話。
目前,有數(shù)百家公司在構(gòu)建通用聊天機器人,其中許多由類似 GPT-3 的語言模型提供支持。少數(shù)人專門嘗試構(gòu)建以娛樂為目的的聊天機器人,例如試圖構(gòu)建虛擬朋友的Replika和Anima 。正如電影《她》中探討的那樣,與虛擬女友約會的概念可能比您想象的更接近。
我們現(xiàn)在看到了這些聊天機器人平臺的下一次迭代,例如Charisma.ai、Convai.com或Inworld.ai,旨在通過情感和代理,以及允許創(chuàng)造者賦予這些角色目標的工具,全面渲染3D角色。如果他們要融入游戲或在推動情節(jié)發(fā)展方面有一個敘事位置,而不是純粹的門面裝飾,這一點就很重要。
一體化平臺
Runwayml.com是最成功的生成式 AI 工具之一,因為它在一個軟件包中匯集了廣泛的創(chuàng)作者工具套件。目前還沒有提供電子游戲服務(wù)的平臺,我們認為這是一個被忽視的機會。我們很樂意投資一個具有以下特點的解決方案:
涵蓋整個生產(chǎn)過程的全套人工智能生成工具。(代碼、資源生成、紋理、音頻、描述等)
與 Unreal 和 Unity 等流行游戲引擎緊密集成。
旨在適應(yīng)典型的游戲制作流程。
結(jié)論
對于游戲創(chuàng)作者來說,這是一個不可思議的時刻!部分歸功于這篇博文中描述的工具,生成構(gòu)建游戲所需的內(nèi)容從未如此簡單——即使您的游戲與整個星球一樣大!
甚至有一天可以想象一款完整的個性化游戲,它完全根據(jù)玩家的需求專為玩家打造。這在科幻小說中出現(xiàn)了很長時間——比如《安德的游戲》中的“AI 心理游戲”,或者《星際迷航》中的全息甲板。但是隨著這篇博文中描述的工具發(fā)展得如此之快,不難想象這一現(xiàn)實指日可待。
本文轉(zhuǎn)載自??MoPaaS魔泊云??,作者:James Gwertzman ????
