大模型App騰訊元寶上線!混元再升級,打造可隨身攜帶的全能AI助理
5 月 30 日,騰訊宣布旗下混元大模型全面升級,基于混元大模型的App“騰訊元寶”正式上線,蘋果及安卓應用商店均可下載。
相比此前測試階段的混元小程序版本,面向工作效率場景,騰訊元寶提供了AI搜索、AI總結(jié)、AI寫作等核心能力;面向日常生活場景,元寶的玩法也更加豐富,提供了多個特色AI應用,并新增了創(chuàng)建個人智能體等玩法。
“騰訊做大模型不爭一時之先?!彬v訊云副總裁、騰訊混元大模型負責人劉煜宏表示:“過去的一年,我們持續(xù)推進騰訊混元大模型的能力爬坡,在豐富、海量的業(yè)務場景中打磨技術(shù),同時洞察用戶的真實需求,希望騰訊元寶可以成為用戶生活中的好伙伴、好幫手,最終服務于每個普通人的生活。”
當前,大模型仍在快速發(fā)展期,從模型能力到應用落地存在較大“時延”。數(shù)據(jù)顯示,當前人們使用大模型相關產(chǎn)品時,有超過 65%的需求,集中在工作/學習效率場景,但相關的AI產(chǎn)品解決方案尚不成熟。
針對效率場景的三大核心需求:信息獲取、處理和生產(chǎn),騰訊元寶均進行了產(chǎn)品化探索。在AI 搜索方面,騰訊元寶接入了微信搜一搜、搜狗搜索等搜索引擎,并通過AI搜索增強,提升時新類和知識類問題效果,比傳統(tǒng)搜索更有效率;同時,內(nèi)容覆蓋微信公眾號等騰訊生態(tài)內(nèi)容及互聯(lián)網(wǎng)權(quán)威信源,答案準確性更高;此外,元寶還會提供所引用的參考資料,并給出相關推薦,方便快速溯源及延伸閱讀。
在AI總結(jié)方面,元寶可上傳最多10個PDF、word、txt等多種格式的文檔,并能夠一次性解析多個微信公眾號鏈接、網(wǎng)址,支持256K的原生窗口上下文,相當于一本《三國演義》,或是英文原版的《哈利波特》全集。無論是希望快速了解一本書或是一個新領域,還是處理復雜繁冗的報告、文獻,元寶都能幫上忙。
在AI寫作方面,元寶不僅支持多輪問答,還能夠?qū)υ挼膬?nèi)容整理成報告,按照要求進行結(jié)構(gòu)化輸出,大大提升信息從獲取到處理再到生產(chǎn)的效率。
除了滿足效率需要,騰訊元寶在日常生活場景,也提供了豐富的應用及玩法?!鞍l(fā)現(xiàn)”欄目全面升級,上線了百變AI頭像、口語陪練、超能翻譯官等多個特色應用,均免費開放。只需一張照片,用戶就可以在百變AI頭像里體驗多種風格;超能翻譯官能夠識別 15 種主流語言,翻譯文本、圖片與文件,還支持中英文同聲傳譯;口語陪練則像一位專屬私人外教,在陪練的同時給到口語改善建議,幫助用戶學習與提升。
同時,元寶也支持用戶根據(jù)個性化需求,快速創(chuàng)建個人專屬的智能體,賦予角色設定,或讓AI自動生成智能體相關信息,并復刻自己的音色。結(jié)合騰訊生態(tài)場景,元寶還將于近期推出騰訊新聞哥、《慶余年》主題等特色智能體。
中國科學院大數(shù)據(jù)專家李猛表示:“騰訊元寶是一款功能強大、易于使用的AI助手產(chǎn)品,為用戶帶來了便利和高效的智能體驗。能夠理解自然語言,并提供智能化的回答和建議,這在很多場景下為用戶節(jié)省了大量時間和精力?!?/span>
除在元寶上提供自定義智能體外,騰訊混元也在積極布局智能體生態(tài),面向開發(fā)者和企業(yè)推出了一站式智能體創(chuàng)作與分發(fā)平臺騰訊元器。目前,騰訊元器已經(jīng)全量面向用戶開放。
騰訊元器提供豐富的官方插件和知識庫,支持用戶低門檻創(chuàng)建定制化的智能體,可一鍵分發(fā)至騰訊元寶、微信客服、QQ、騰訊云等騰訊生態(tài)渠道,并將于 6 月支持分發(fā)至微信公眾號和小程序,混元模型資源全部免費。同時,元器也支持用戶以API形式將智能體分發(fā)至各類場景,免費token額度從此前的100萬提升至1個億。
騰訊元寶產(chǎn)品能力升級的背后,是混元底層模型的持續(xù)迭代。
自 2023 年 9 月首次亮相以來,騰訊混元大模型的參數(shù)規(guī)模已從千億升級至萬億,預訓練語料從萬億升級至7 萬億tokens,并率先升級為多專家模型結(jié)構(gòu)(MoE),整體性能相比Dense 版本提升超50%。除不斷提升通用大模型能力外,騰訊混元也支持角色扮演、FunctionCall、代碼生成等領域能力,數(shù)理能力提升 50 %。
在多模態(tài)方面,騰訊混元文生圖大模型是業(yè)內(nèi)首個中文原生DiT架構(gòu)模型,采用了Sora、Stable Diffusion 3等行業(yè)頂尖產(chǎn)品的同款架構(gòu),生成效果相比上代提升超 20%。目前,該模型已經(jīng)全面開源,在Github獲得 2000+star,相關能力也全面融入騰訊元寶。
此外,騰訊混元大模型在視頻、3D生成等方面也持續(xù)探索,目前已經(jīng)支持16s視頻生成,單圖僅需30秒即可生成3D模型,相關能力也將于后續(xù)在元寶中上線。
目前,騰訊內(nèi)部有超 600 個業(yè)務及場景都已經(jīng)接入騰訊混元,騰訊廣告、微信讀書、騰訊會議、騰訊文檔、騰訊客服等,都已經(jīng)基于混元實現(xiàn)了智能化升級。騰訊廣泛的應用場景,也進一步反哺了大模型能力的提升。
據(jù)了解,為了滿足開發(fā)者及企業(yè)客戶對于通用模型能力的需求,騰訊混元大模型已通過騰訊云對外開放,可通過API調(diào)用,也可以作為基底模型,為不同產(chǎn)業(yè)場景構(gòu)建專屬應用。