打工人遇見大模型:外面的世界已經這樣辦公了嗎?
在辦公場景中,制作 PPT 是最常見的工作之一。工作匯報、產品發(fā)布、活動策劃、專業(yè)講座等都需要使用 PPT。
傳統的 PPT 制作過程枯燥瑣碎,耗費時間、精力。特別是將 word 格式的報告文檔轉換成 PPT,要花費大量時間閱讀文檔內容、梳理要點,還要精心排版、調整字體圖片等等,并且改動 word 文檔 PPT 就要重新梳理調整。
有沒有一種可能,做 PPT 這件事可以自動化?
在大模型的加持下,百度文庫做到了。百度文庫在接入文心一言后已從「文檔搜索工具」全面重構成「一站式智能文檔平臺」,涵蓋 PPT 智能生成、文檔智能生成、智能編輯、智能輔助閱讀等多個功能。
例如,對下面這篇文章,上傳 word 文檔,AI 就能根據文檔內容迅速生成一份直接可用的 PPT。
早在今年 3 月,百度文庫就宣布接入「文心一言」,并開啟用戶內測。8 月 31 日,百度文心一言正式向公眾開放,作為行業(yè)首個「一站式智能文檔平臺」,百度文庫的「PPT 智能生成」等文檔創(chuàng)作功能在開放首日就迎來超 200 萬人次體驗。
為了收獲「一站式」的智能創(chuàng)作體驗,我們對百度文庫新上線的 AI 功能進行了全面的測試。
PPT 智能生成
最近幾年,制作 PPT 越來越卷,各種 PPT 神器受到大家追捧。但這些制作工具需要按其要求使用,有時甚至會把 PPT 的制作復雜化。
為了把制作 PPT 簡單化、自動化,百度文庫文檔助手推出了兩種 PPT 智能生成功能:一句話直接生成 PPT 和上傳 word 生成 PPT。
輸入主題直接生成 PPT
隨著生成式 AI 取得進展,行業(yè)內出現了一些 AI 生成 PPT 的工具,其中大部分工具的主要功能就是輸入主題生成 PPT,例如 Gamma。
為了衡量百度文庫的生成效果,我們用「生成一個關于恐龍的歷史的 PPT」這句話,對 Gamma 和百度文庫進行了測試和對比。
Gamma 首先生成了一個內容大綱,但最終生成的 PPT 只有 7 頁,沒有目錄的展示頁:
且 PPT 內容簡單,排版格式也比較單調:
Gamma 輸入主題生成 PPT 效果示例。
同樣的語句,百度文庫首先也是生成內容大綱,但是比較詳細,包含兩級內容要點:
最終百度文庫生成的 PPT 共 24 頁,從恐龍的特征、演化到恐龍研究的概況,內容豐富完備,排版多樣美觀,幾乎可以直接使用,生成效果和實用價值遠超 Gamma 等 PPT 工具。
百度文庫「輸入主題直接生成 PPT」效果示例。
上傳 word 生成 PPT
相比于輸入主題生成 PPT,將 word 文檔轉換成 PPT 難度更大。
一方面,解析一句話是模型根據話題進行擴展;而解析一篇文章需要從文章本身的主次結構出發(fā),分析全文的重點要點、行文邏輯、內容風格,對文章進行充分的理解和解構,才能生成合乎文章邏輯、完整豐富的 PPT。
另一方面,word 文章的質量往往是參差不齊的。有的文章內容非常簡單,需要 AI 模型在生成 PPT 的過程中加以豐富;有的文章內容復雜、專業(yè),需要 AI 模型提煉總結,可能還會用到大模型的知識儲備。這對大模型的能力提出了更高的要求。
此外,PPT 中通常需要一些配圖,輸入主題生成 PPT 只需根據主題找到合適的圖片;而根據 word 生成 PPT,配圖要符合文章主題、段落大意,還要與文章風格適配等等,限制較多。
為了測試百度文庫將 word 文檔轉換成 PPT 的能力,我們上傳了一篇題為《智能家居技術的前沿發(fā)展》的文章:
《智能家居技術的前沿發(fā)展》word 文檔部分截圖。
百度文庫的文檔助手還是先根據 word 文檔的內容生成了一份詳細的大綱:
點擊「生成 PPT」,選擇模板后生成了一份 36 頁的 PPT:
總體上講,這份 PPT 內容豐富、排版美觀,整體帶有與文章相符的科技感。人工制作這樣一份 PPT 可能至少要花費數十分鐘,但 AI 加持的百度文庫只用了大約 30 秒。
具體來說,PPT 在 word 文檔的基礎上擴展了很多內容。以「智能照明」為例,word 文檔中的內容只有短短數行文字:
word 文檔中關于「智能照明」的全部內容。
而在百度文庫生成的 PPT 中,「智能照明」部分首先介紹了智能照明控制系統和智能照明器具,其次闡述了智能照明市場的規(guī)模和發(fā)展趨勢,然后指出智能照明系統的優(yōu)勢和不足,最后展望了智能照明技術的發(fā)展趨勢和面臨的挑戰(zhàn)。
我們發(fā)現,百度文庫生成的 PPT 中包含了很多 word 文檔以外的信息。這就需要百度文庫借助「文心一言」大模型,對 word 文檔的內容進行深入解析,并生成知識型內容。此外,PPT 中的配圖也很符合 word 文章的主題 —— 智能家居,這也需要利用大模型強大的理解能力。
生成帶有圖表的 PPT
數據圖表是 PPT 中常見的一種內容形式,它能夠對相關成果進行量化展示,直觀清晰。為了測試百度文庫能否生成含有數據圖表的 PPT,我們在文檔助手的對話框中輸入需求:「生成一份 A 智能家居公司的財報分析 PPT」。
文檔助手還是先生成一份 PPT 大綱,值得注意的是,大綱中不僅有財務數據及分析的內容,還有公司的基本介紹和行業(yè)的趨勢展望。這說明文檔助手了解財報分析 PPT 的常見用途是什么,并且知道財報分析需要哪些專業(yè)數據,例如利潤、資產、現金流、總營收等等。
在生成的 PPT 中,文檔助手為不同的財務數據生成了不同類型的數據圖表,包括柱狀圖、折線圖、數據表格等,并且每張圖表均有文字解讀。
例如,總資產詳情數據頁面包含一張總資產柱狀圖、一張總資產同比增長率的數據表和一段對總資產變化情況的分析文本。其中,同比增長率是根據總資產數據計算得來。在人工制作財報分析 PPT 時,同比增長率等數據需要單獨計算再添加到 PPT 中,而百度文庫的文檔助手借助 AI 大模型直接生成了全部數據。
如果我們需要對文檔助手生成的 PPT 加以修改,也可以直接讓文檔助手幫忙操作,例如修改 PPT 的主題色:
如此一來,制作一份 PPT,從需求到成稿大約只需幾分鐘,辦公效率提升的不是一點半點。
動動嘴生成 PPT
最后,我們發(fā)現上述所有功能在百度文庫 app 上均可使用,并且還有一個額外的功能:動動嘴就能生成 PPT,即在移動端百度文庫 app 上我們可以直接語音輸入需求,文檔助手就能完成生成 PPT 的任務。
例如,我們語音描述需求:「生成一個介紹玫瑰花的 PPT」,百度文庫 app 生成 PPT 的全過程如下視頻所示:
文檔智能生成
有了 word 文檔,AI 可以生成 PPT,而 word 文檔也可以直接 AI 生成。
我們知道,大語言模型最擅長的任務之一就是文本生成,AI 輔助文本創(chuàng)作也是當前大模型最常見的應用方向之一,特別是在辦公場景中有著廣泛的應用前景。
作為一站式智能文檔平臺,百度文庫已經上線「生成大綱」、「頭腦風暴」等多個面向文本的功能,在百度文庫中新建文檔就可以直接使用這些 AI 功能。
AI 幫你寫
為了測試從頭開始創(chuàng)作文本的能力,我們用百度文庫擬了一份「編輯招聘文案」。
如下圖所示,智能生成的結果符合招聘文案格式要求,包括公司簡介、職位描述、崗位要求、福利待遇、應聘方式、公司地址幾個方面,并根據「編輯」這個具體的崗位展開介紹職位描述和崗位要求。只需根據具體情況調整部分信息就可以實際使用。
然后我們又測試了百度文庫的英文寫作能力,用中文輸入需求:「寫一篇英文作文,題目是《秋》」。百度文庫生成的文章從秋天的景象寫到秋天人們的行為活動,行文流暢、詞匯豐富。
寫大綱
與招聘文案、電子郵件等辦公文本不同,撰寫知識型介紹文章往往需要搜集資料、寫大綱等前期準備工作。百度文庫作為一個收錄大量知識型文檔的平臺,在 AI 寫大綱這個功能可以根據用戶提供的主題迅速列出文章的大綱框架。
例如,我們用「茶」這個主題測試了百度文庫的「寫大綱」功能,生成的大綱框架中包括茶的歷史、分類、制作、品鑒、文化、未來幾大部分,每部分又細分出幾個小節(jié)。
頭腦風暴
除了擬大綱和寫作,在實際的工作生活中,文本創(chuàng)作最關鍵的一步是尋找思路?;谖男囊谎源竽P偷纳赡芰桶俣任膸熵S富的文檔儲備,「頭腦風暴」這個功能可以為用戶迅速找到多個角度。
例如,以「洗發(fā)水產品營銷方案」為例,「頭腦風暴」功能迅速給出了「品牌故事」、「目標市場分析」、「產品特點」、「價格策略」等多個思路。
當然,這些功能也可以在文檔助手中直接使用,例如在對話框中直接輸入需求:「幫我寫一篇產品促銷活動策劃方案」,文檔助手的生成結果如下圖所示:
整個文案共包括目標市場分析、促銷目的和目標、促銷策略制定、促銷活動內容、促銷執(zhí)行方案、促銷預算和資源需求、促銷效果評估和總結七個部分,覆蓋了活動策劃的各個方面。
值得注意的是,百度文庫生成的文本質量很高,完備且詳細,這源于百度文庫超大規(guī)模的高質量文檔資源。多年來,百度文庫收錄內容總量已突破 12 億,這讓百度文庫文檔助手在智能文本編輯方面具有獨特的優(yōu)勢。
在實際工作中,活動策劃、工作報告等文案撰寫是極為常見的日常工作。人工完成這些工作可能需要數天時間,而百度文庫的文檔助手可以又快又好地完成這些任務??磥恚灰M可能詳細地描述寫作需求,我們就可以用 AI 輔助完成很多工作任務,工作效率將呈數量級提升。
智能編輯
相比于從頭開始創(chuàng)作文本,大模型在編輯文本方面并不擅長。這是因為大模型的生成是比較隨機的、生成文本長短不一,而文本編輯要求對文本做出準確、細致的調整,并且往往有字數限制。
當前,大模型在表述完整性和嚴格字數限制之間,很難做到平衡。模型在訓練過程中學習到的知識會影響其輸出的字數,而大模型本身輸出內容的多樣性要求,可能會導致輸出不穩(wěn)定。因此,將大模型應用于文本編輯具備一定的挑戰(zhàn)性。
我們發(fā)現百度文庫目前已經上線多個智能編輯功能,克服了一些技術難點。在百度文庫中編輯文檔時,選中文檔中的段落就會自動彈出「AI 智能編輯」按鈕,點擊會出現一個 AI 編輯文本的功能菜單,可以對文本進行潤色、修訂、總結、縮寫、擴寫、改變語氣等。
我們嘗試對一段文本進行 AI 潤色,結果如下圖所示,一段文本被豐富成兩段,文字描述更加細膩:
為了測試 AI 文本修訂功能,我們對原文稍作修改,使其含有語病,句子不通順,然后選擇「詞匯 & 語法修訂」功能,百度文庫 AI 修訂的結果如下圖所示:
我們還在百度文庫中選擇了一篇自動駕駛相關的文章來測試縮寫和擴寫功能,旨在評估智能編輯對于專業(yè)性較強的文章效果如何。
如下圖所示,選擇縮寫功能后,百度文庫把兩段文字縮寫成了一段,并且清楚闡述了原文中重要的概念和因果關系。
在擴寫方面,我們發(fā)現擴寫后的內容添加了「自動駕駛汽車通過激光雷達、攝像頭、超聲波傳感器等設備獲取周圍環(huán)境的信息」等專業(yè)表述,這是百度文庫根據自動駕駛發(fā)展現狀延伸擴展的,這說明百度文庫已經掌握了一些知識,能夠對專業(yè)性較強的內容進行智能編輯。
百度文庫能夠借助 AI 完成多種文本編輯任務,這說明其已經熟練掌握文本的語法、語義和語言風格等。在實際的文本編寫工作中,這樣的輔助編輯工具會為我們節(jié)省大量時間和精力。
此外,我們還發(fā)現文檔助手可以根據文本內容生成數據圖表:選中含有數據的段落,右側文檔助手就會自動彈出「生成圖表」的選項。該功能不僅可以生成數據圖表,還會根據文章內容和數據情況作出解析。
例如,我們用一篇《公司財務報表分析案例》中一段涉及銷售利潤率的段落測試了該功能。結果如下圖所示,文檔助手生成了一張銷售利潤率柱狀圖,并給出了原因分析、解決方案、洞察和建議等等。
智能輔助閱讀
在辦公場景中,大模型的長文總結能力也具有很多實際用途,例如查閱參考資料、提煉會議記錄、速讀合同條款等等。
作為一個月活躍用戶超過 1 億的平臺,在百度文庫上,以前我們搜索資料通常是用搜索關鍵詞的方法,找到資料后,我們需要粗略查看文獻目錄和內容,以找到所需信息。
現在,百度文庫可以借助文心一言大模型為其收錄的文檔生成簡短的摘要,讓用戶能夠迅速了解文檔內容,做到智能輔助閱讀,節(jié)省辦公時間。這讓上億用戶在百度文庫查閱資料更加方便迅速,成為 AI 學習辦公的「原住民」。
例如,我們讓文檔助手總結百度文庫中一篇題為《人工智能的發(fā)展及應用》的長文:
還可以根據文檔內容回答相關問題。例如根據該文章回答:「人工智能是何時提出的?」文檔助手可以給出正確的回答,并且會指出參照的文章依據是什么。
總結文檔內容、回答相關問題等功能也適用于 PDF 文檔。例如,在閱讀一篇關于多智能體強化學習的基礎和應用的萬字長文時,直接選擇右側文檔助手中的「幫我總結文檔大意」,AI 就迅速給出了一份文檔內容總結,這樣只需幾秒我們就能大體了解一篇萬字長文的內容。
以秒計時的全新辦公模式
今年,生成式 AI 掀起了一場生產工具變革浪潮。大模型從最初的生成效果驚艷,到開始探索應用方向,再到現在有了一些較為成熟的應用,大模型已經從技術走向落地。文心一言加持的百度文庫就是一個很好的例子。
以前,word 文檔、PPT、搜索工具在辦公場景中各司其職,辦公往往需要跨平臺。雖然內容有很大的相關性,但編寫 word 文檔和制作 PPT 是兩項單獨的工作,并且每個工作都需要花費較多的時間來完成,例如編寫文檔就需要搜索資料、構建大綱、撰寫文章、潤色編輯等步驟。
現在,只需要一句話,百度文庫就能生成完備詳盡的文檔內容,上傳文檔就能直接生成 PPT,整個過程可能只需要幾分鐘。從這個角度看,百度文庫解決了「辦公跨平臺」這個長期存在的痛點,「一站式」辦公成為現實。
那么,百度文庫可以給日常工作帶來哪些具體的益處呢?
從工作效率上講,百度文庫生成 PPT 大約需要 30 秒,創(chuàng)作文檔約 15 秒,總結萬字長文只需 10 秒。其中任何一項任務,人工完成的時間至少是數十分鐘,有時甚至需要數天時間。我們可以用節(jié)省出來的時間完成更有創(chuàng)新性的工作,制作 PPT 等相對程式化的工作交給 AI 來完成,讓辦公效率呈數量級提升。
從生成質量上看,百度文庫生成的內容質量非常高,邏輯清晰、內容豐富,往往只需要人們根據實際情況對生成內容進行調整就可以直接使用。這也是百度文庫作為「一站式智能文檔創(chuàng)作平臺」可以實際應用的重要原因。全面上線僅一個月的時間,百度文庫 AI 新功能的累計用戶已超過千萬,累計生成內容超 2000 萬,累計生成 PPT 超 200 萬。
從使用場景看,以前我們辦公通常是依賴于 PC 端,時空條件有所限制?,F在,使用百度文庫 app,在移動端僅用非常簡單的操作就能完成編寫文檔、制作 PPT 等任務,打破了辦公場景在時間和空間上的限制。
實際上,自大模型嶄露頭角以來,行業(yè)內一直在努力提升大模型的性能,以使其能夠投入實際應用。百度文庫能成為行業(yè)首個一站式智能文檔創(chuàng)作平臺,來源于三個關鍵因素。
首先,文心一言大模型基于非常精細的數據訓練出了強大的理解能力、生成能力和邏輯能力,這幾方面的能力會讓其加持的百度文庫能夠精準理解用戶需求、生成內容邏輯清晰、豐富合理。
其次,百度文庫本身具有 12 億高質量文檔,這是百度文庫重構的內容優(yōu)勢。這些文檔也是文心一言大模型的重要訓練數據之一,百度文庫和文心一言相輔相成。
第三,百度文庫自身的研發(fā)團隊多年來一直在算法開發(fā)、應用落地等層面努力探索。這為百度文庫重構為「一站式智能文檔創(chuàng)作平臺」提供了技術保障。
文心一言問世不過幾個月的時間,百度文庫已經攻克了多個技術難點,未來還將持續(xù)迭代升級。
「我們給自己定的黃金標準就是最可用和最便捷」,百度副總裁、互娛和垂類平臺負責人王穎說道。
我們期待看到百度文庫上線更多智能創(chuàng)作功能,也期待看到大模型為生產力帶來進一步的提升。