自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<pre id="xygbn"></pre>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

利用人工智能對文本內(nèi)容進(jìn)行自動(dòng)摘要

原創(chuàng) 精選

作者：汪昊 2024-04-10 08:40:18

文本自動(dòng)摘要，對于閱讀長篇幅的文本，比如博士畢業(yè)論文、咨詢報(bào)告、審計(jì)報(bào)告等內(nèi)容，非常有幫助。對于趕時(shí)間的當(dāng)代人來說，文本自動(dòng)摘要無疑是隨身辦公的文書利器。希望通過本文，廣大的互聯(lián)網(wǎng)從業(yè)者能夠有所收獲。

想了解更多AIGC的內(nèi)容，請?jiān)L問：

51CTO AI.x社區(qū)

http://www.scjtxx.cn/aigc/

隨著互聯(lián)網(wǎng)上各種 UGC 越來越多，各種原創(chuàng)性的長文本內(nèi)容也不斷地涌現(xiàn)出來。例如，在人工智能領(lǐng)域的三大頂會(huì)之一的 ICML，許多論文的長度都達(dá)到了二三十頁。因此，如何快速的從長文本中提取出有用的信息，成為困擾許多包括科研人員在內(nèi)的互聯(lián)網(wǎng)網(wǎng)民的難題。

在 2012 年結(jié)束的人工智能領(lǐng)域頂會(huì) AAAI 2012 上，來自中國浙江大學(xué)的研究團(tuán)隊(duì)，發(fā)表了一篇題為 Document Summarization Based on Data Reconstruction 的論文。該篇論文提出了 DSDR 算法，描述了如何利用貪心算法進(jìn)行文本摘要提取的方法。論文下載地址在這里：Document Summarization Based on Data Reconstruction (nju.edu.cn)。下面我們介紹一下他們的方法。

所謂的文本自動(dòng)摘要問題，本質(zhì)上就是從原始的長文本中抽取一個(gè)文本的子集合，使得利用這個(gè)子集合的線性組合能盡可能的恢復(fù)出原始文本。我們按照如下方式定義文本自動(dòng)摘要問題：

其中， f 是線性組合摘要句子之后的轉(zhuǎn)換函數(shù)。X 是摘要生成的句子，a 是線性組合的系數(shù)，而 v 是原始文本，也就是輸入數(shù)據(jù)。

首先，f 可以是線性組合，也就是：

因此，文本自動(dòng)摘要問題轉(zhuǎn)換成為了下述問題：

上述損失函數(shù)公式，等價(jià)于下面的公式：

利用貪心算法，我們設(shè)計(jì)了如下?lián)p失函數(shù)：

整個(gè)算法的偽代碼流程如下所示：

在上面介紹的算法中，線性組合的系數(shù) a 有可能是負(fù)數(shù)，為了保證 a 非負(fù)，我們重構(gòu)了算法的損失函數(shù)：

經(jīng)過重新設(shè)計(jì)之后，算法的偽代碼如下：

通過對比實(shí)驗(yàn)，我們發(fā)現(xiàn)新設(shè)計(jì)的算法，取得了優(yōu)異的實(shí)驗(yàn)結(jié)果：

文本自動(dòng)摘要，對于閱讀長篇幅的文本，比如博士畢業(yè)論文、咨詢報(bào)告、審計(jì)報(bào)告等內(nèi)容，非常有幫助。對于趕時(shí)間的當(dāng)代人來說，文本自動(dòng)摘要無疑是隨身辦公的文書利器。希望通過本文，廣大的互聯(lián)網(wǎng)從業(yè)者能夠有所收獲。

作者介紹

汪昊，前 Funplus 人工智能實(shí)驗(yàn)室負(fù)責(zé)人。曾在 ThoughtWorks, 豆瓣，百度，新浪，網(wǎng)易等公司有超過 13 年的技術(shù)研發(fā)和技術(shù)高管經(jīng)驗(yàn)。先后在科技公司上線過 10 余款成功的商業(yè)產(chǎn)品。擔(dān)任過創(chuàng)業(yè)公司的 CTO和技術(shù)副總裁。精通數(shù)據(jù)挖掘、計(jì)算機(jī)圖形學(xué)和數(shù)字博物館領(lǐng)域的技術(shù)、技術(shù)管理和技術(shù)變現(xiàn)等內(nèi)容。在國際學(xué)術(shù)會(huì)議和期刊如 IEEE TVCG 和 IEEE / ACM ASONAM 上發(fā)表論文 39 篇，獲得最佳論文獎(jiǎng) 1 次（IEEE SMI 2008）和最佳論文報(bào)告獎(jiǎng) 4 次（ICBDT 2020 / IEEE ICISCAE 2021 / AIBT 2023 / ICSIM 2024）。

想了解更多AIGC的內(nèi)容，請?jiān)L問：

51CTO AI.x社區(qū)

http://www.scjtxx.cn/aigc/

責(zé)任編輯：姜華來源： 51CTO內(nèi)容精選

文本自動(dòng)摘要人工智能貪心算法

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<sub id="ghokb"></sub>

<cite id="ghokb"></cite><cite id="ghokb"></cite><center id="ghokb"><i id="ghokb"></i></center>