央視《對話》直擊百度吳甜談大模型產業(yè)落地?
2024年,關于大模型的討論從未停歇,國內大模型市場進入到新階段,大模型落地情況到底如何?AI+應用有哪些新場景、新變化?近日,百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜做客CCTV-2《對話》節(jié)目,從技術發(fā)展及產業(yè)實踐角度分享了當前以大模型為代表的人工智能技術發(fā)展及產業(yè)應用的最新進展。
當下,人工智能的技術和應用受到了全球關注。在節(jié)目上,中國科學院院士何積豐、開源鴻蒙項目群技術指導委員會主席、上海交通大學特聘教授陳海波與百度、騰訊、Minimax企業(yè)代表圍繞AI技術發(fā)展與產業(yè)落地等話題展開討論。
百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜做客CCTV-2《對話》節(jié)目
從大模型技術來看,吳甜認為,模型的幻覺與創(chuàng)造力一體兩面,在創(chuàng)意需求高的場景下,大模型強大的創(chuàng)造力無疑是優(yōu)勢;但在與行業(yè)實際問題相結合時,則需模型展現(xiàn)出更強的穩(wěn)定性和準確性,以確??梢越鉀Q任務問題。技術上,抑制模型產生幻覺,主要有兩方面:一方面是優(yōu)化基礎模型,力求從根本上降低幻覺出現(xiàn)的頻次及其嚴重度;另一方面,在模型應用中,通過引入檢索增強、智能體等技術或機制,有效提升模型對事實的遵循。
根據(jù)中國信通院《全球數(shù)字經濟白皮書(2024年)》,目前全球人工智能大模型共1328個,中國占比達到36%。隨著技術的快速演進,大模型發(fā)展日新月異,已經從去年的“百模大戰(zhàn)”,到了當下“拼落地”“拼應用”的階段。對此,吳甜指出,從增速角度來說,大模型應用場景在非??焖俚匕l(fā)展,她現(xiàn)場分享了一組數(shù)據(jù),百度文心大模型日調用量超過15億,對比今年5月2億的日調用量,半年時間達到了原來的7.5倍,對比一年前5千萬的日調用量,達到了30倍。
此外,公開數(shù)據(jù)顯示,目前飛槳文心開發(fā)者數(shù)量已達1808萬,服務了43萬家企業(yè),創(chuàng)建了101萬個模型。從數(shù)據(jù)的規(guī)模上來說,可以看到文心大模型發(fā)展增速很快,展現(xiàn)了廣泛的應用潛力。
吳甜進一步表示,盡管大模型應用已經初具規(guī)模,但最后真的落地到各個場景,仍需要進一步地開發(fā)與完善。從發(fā)展階段上來說,大量場景還處于量變的積累階段。這個過程中,我們觀察到,AI技術和大模型的使用方式,正在從個別場景點的提效,逐步擴展到業(yè)務流程的改進和優(yōu)化。當這種由點及線、由線及面、由面及體的系統(tǒng)性過程得以實現(xiàn)后,質變就會到來。
那么,大模型落地產業(yè)到底是“最后一公里”還是“最后一百公里”?吳甜認為,這取決于行業(yè)自身的數(shù)字化根基及業(yè)務面向數(shù)字化的的抽象程度。例如,互聯(lián)網行業(yè)產品應用與AI技術收益貼合緊密,或許半公里即達;金融等行業(yè)數(shù)字化基礎較高,主要需解決系統(tǒng)對接與部署,可以稱為一公里。相比之下,農業(yè)等行業(yè)的數(shù)字化基礎相對薄一些,需要解決的問題更為復雜和多樣,其大規(guī)模落地可能是幾十公里到百公里的距離。
在探討人工智能賦能千行百業(yè)所面臨的挑戰(zhàn)時,吳甜剖析了當前存在的兩大主要難題。她表示,一方面,需要挖掘具體的、基于真實場景的真實需求。過去幾年,盡管人工智能與各類場景結合的應用層出不窮,但較多未觸及到場景中的關鍵問題。這些應用,還未能發(fā)揮出人工智能深度使用的最大價值。為破解這一難題,百度設立了AICA人才培養(yǎng)項目,并已經持續(xù)6年,今年進行到第八期。該項目的核心目標,就是培養(yǎng)既懂業(yè)務又精通AI技術的人才,幫助他們能更好地結合AI技術解決場景問題。另一方面,專業(yè)數(shù)據(jù)的缺乏也是人工智能深入應用目前的重要制約因素。重點是那些能體現(xiàn)業(yè)務邏輯理解的數(shù)據(jù),這些數(shù)據(jù)在自然數(shù)據(jù)中稀缺,卻對提升模型在真實場景中完成復雜任務的能力極為關鍵,是行業(yè)應用真正所需要的。建設這些數(shù)據(jù),需要社會各界一起努力,為人工智能的廣泛應用提供支撐。
此外,算力問題也是人工智能中不可忽視的一環(huán)。吳甜坦言,隨著模型規(guī)模的擴大,算力需求也隨之激增。要更有效利用大規(guī)模算力,需集約化建設并優(yōu)化調度,提高使用率。百度通過深度學習平臺飛槳和文心大模型的聯(lián)合優(yōu)化,訓練效率提升5.1倍,推理效率提升125倍,并將繼續(xù)優(yōu)化。同時,算力應多元化,尤其在大量推理和場景化訓練中,這有助于降低成本、提高效率。百度持續(xù)積極開展硬件統(tǒng)一適配工作,飛槳已支持超過60個芯片系列,為算力的多元化提供了有力保障。
當下,國內大模型市場從“百模大戰(zhàn)”到“大浪淘沙”,從拼參數(shù)到拼落地、拼應用的新階段,各行各業(yè)都在依據(jù)自有的場景和特有經驗、規(guī)范、數(shù)據(jù)等進行大模型落地的產業(yè)實踐,形成了龐大的應用生態(tài)。
有分析認為,2025年大模型將進一步發(fā)展,其理解、生成和交互能力將達到新高度,各行業(yè)也將加速與大模型的應用與融合。預計到2025年,大模型應用將加速滲透到多個垂直行業(yè),形成更加成熟的行業(yè)解決方案。大模型將對社會、經濟和技術領域帶來更加深刻的變革。