為什么顛覆性研究越來(lái)越少了?科學(xué)家從4500萬(wàn)篇論文中得到答案 | Nature封面
文章作者認(rèn)為,盡管近幾十年來(lái)創(chuàng)新和科學(xué)研究呈爆炸式增長(zhǎng),但是,知識(shí)的增加并未帶來(lái)重大進(jìn)展。
通過(guò)分析過(guò)去60年來(lái)4500萬(wàn)篇論文及390萬(wàn)項(xiàng)專利數(shù)據(jù),作者發(fā)現(xiàn),這些研究對(duì)現(xiàn)有科技的顛覆性越來(lái)越少。
他們進(jìn)一步指出,此種現(xiàn)象可能預(yù)示著——科學(xué)技術(shù)的性質(zhì)發(fā)生了根本轉(zhuǎn)變。
目前,該觀點(diǎn)及內(nèi)容已被經(jīng)濟(jì)學(xué)人、福布斯等主流媒體介紹,推特、Reddit及Hacker News上亦有不少關(guān)注。
所以,這個(gè)結(jié)論是怎么得出的?
答案還得從研究本身里找。
如何判斷論文開拓性?
研究主要通過(guò)兩類方法,來(lái)衡量論文創(chuàng)新程度的變化。
第一種方法是根據(jù)論文引用情況判斷。
這種方法會(huì)將新研究分成兩類。
一類在現(xiàn)有理論基礎(chǔ)上實(shí)現(xiàn)突破,本質(zhì)上鞏固了已有研究理論(Consolidation);另一類則是顛覆已有理論,本質(zhì)上是開拓性的新工作(Destabilization)。
舉個(gè)栗子??,DNA雙螺旋結(jié)構(gòu)和密度泛函理論(DFT,Density Functional Theory)都獲得了諾貝爾獎(jiǎng)。
如果按上面的方式進(jìn)行分類,DNA雙螺旋結(jié)構(gòu)顯然是顛覆性的研究,因?yàn)樗穸松锝鐧?quán)威鮑林的“三螺旋結(jié)構(gòu)”研究。
但密度泛函理論,卻是建立在之前研究的基礎(chǔ)上提出來(lái)的,與DNA雙螺旋結(jié)構(gòu)的開拓性程度并不相同。
如何判斷一篇論文更具開拓性?
作者們采用了一種叫CD指數(shù)的方法(CD index)。
如下圖,黑色代表目前待判斷的研究,白色代表前人的研究,灰色是后來(lái)的新研究,CD指數(shù)范圍在±1之間。
如果一篇論文(黑色)是基于已有研究做出改進(jìn),那么新研究(灰色)在引用這篇論文時(shí),肯定也會(huì)引用前人的研究(白色),CD指數(shù)為負(fù):
反之,這篇論文顛覆了之前的研究,那么新研究都會(huì)以這篇論文為基底,而不會(huì)再去引用之前的研究,CD指數(shù)為正:
所以,雖然DNA雙螺旋結(jié)構(gòu)和密度泛函理論的論文引用量都非常大,但它們的CD指數(shù)卻分別是0.62和-0.22。下面這張圖顯示了論文和專利CD指數(shù)的分布:
第二種方法,則是通過(guò)論文中的詞匯多樣性來(lái)判斷。
一方面觀察論文中出現(xiàn)新詞的情況。
注意,這里的造新詞并非老詞新造(給已有的定義換個(gè)說(shuō)法),而是新出現(xiàn)的、在后來(lái)的論文內(nèi)容和標(biāo)題中會(huì)重復(fù)使用的詞匯。
另一方面統(tǒng)計(jì)與“創(chuàng)造”相關(guān)的動(dòng)詞數(shù)量。
例如,與創(chuàng)造、發(fā)現(xiàn)相關(guān)的動(dòng)詞通常包括produce、form、prepare和make,類似的還包括determine、report以及measure等。
與之相反,偏向改進(jìn)、優(yōu)化乃至應(yīng)用一類的動(dòng)詞,則包括improve、enhance、increase,以及use和include等等。
作者們采用這兩種方法,分別計(jì)算了4500萬(wàn)篇論文和390萬(wàn)項(xiàng)專利的CD指數(shù)和詞匯多樣性。
仍然有新突破出現(xiàn)
具體來(lái)說(shuō),研究得出的結(jié)論如下。
先看創(chuàng)新性隨年份的變化。如下圖,從1945年到2010年間,左側(cè)各年份論文平均CD5指數(shù)(統(tǒng)計(jì)時(shí)間范圍為論文發(fā)表后5年)有明顯下降。不同領(lǐng)域降幅略有不同,社科為91.9%,物理為100%。
技術(shù)專利創(chuàng)新性也呈下降趨勢(shì)。根據(jù)美國(guó)國(guó)家經(jīng)濟(jì)研究所(NBER)數(shù)據(jù),從1980年到2010年間,計(jì)算機(jī)與通信領(lǐng)域CD5降幅達(dá)93.5%,藥物與醫(yī)療領(lǐng)域降幅為96.4%。
從“語(yǔ)言措辭”變化中也能看到相關(guān)跡象。
在1945-2010年論文中,其內(nèi)容所使用的獨(dú)特詞匯及新造詞匯均呈下降態(tài)勢(shì)。
有意思的是,措辭上50年前后論文中“創(chuàng)新性”的相關(guān)動(dòng)詞的出現(xiàn)頻率也更占主導(dǎo),排在前面的高頻動(dòng)詞包括:產(chǎn)出、報(bào)告、確定、測(cè)量……
與之對(duì)應(yīng),2010年論文,排在前列的高頻動(dòng)詞為:基于、改善、聯(lián)系、增強(qiáng)……
上述動(dòng)詞同既有科學(xué)發(fā)現(xiàn)成果的“聯(lián)系意味”更強(qiáng)。
同樣的情況,也發(fā)生在專利內(nèi)容統(tǒng)計(jì)中。
△ 1950年及2010年論文每百個(gè)動(dòng)詞中的高頻詞統(tǒng)計(jì)
但值得明確的是,盡管論文創(chuàng)新性的比例在下降,但從絕對(duì)數(shù)量看,創(chuàng)新成果產(chǎn)出量趨于穩(wěn)定。
如下圖所示,左側(cè)針對(duì)1950-2010論文統(tǒng)計(jì),右側(cè)針對(duì)1980-2010專利數(shù)量,不同顏色的線條,代表了不同CD5指數(shù)區(qū)間。
能看出,盡管藍(lán)色線條隨年份變化快速上升,但該部分代表創(chuàng)新性較弱的論文及專利數(shù)。相對(duì)而言,高創(chuàng)新性的論文及專利,絕對(duì)數(shù)量趨于平穩(wěn):
數(shù)據(jù)統(tǒng)計(jì)外,本文作者也列舉了一些近年重大突破,諸如引力波、新冠疫苗。
他們指出,整體的創(chuàng)新性下降并不能讓我們忽視許多高創(chuàng)新性的研究成果及發(fā)明。
那么,是什么導(dǎo)致了整體創(chuàng)新性的下降?
研究者推測(cè),該趨勢(shì)與各研究領(lǐng)域的知識(shí)增長(zhǎng)相關(guān)。
為此,他們統(tǒng)計(jì)了數(shù)十年論文及專利的引用多樣性、自引均值、被引作品平均年份。
結(jié)果顯示,無(wú)論論文還是專利,幾十年來(lái)引用多樣性在下降,自引均值上升,且引文中平均發(fā)表年份也在增加。
通過(guò)上述統(tǒng)計(jì)結(jié)果,研究者推斷,科學(xué)家與發(fā)明家們更多依賴熟悉的現(xiàn)有知識(shí)技術(shù),且這些知識(shí)高度同源。
這可能導(dǎo)致創(chuàng)新性成果的不足。
目前,這項(xiàng)研究引來(lái)了不少相關(guān)從業(yè)者及科技愛(ài)好者的關(guān)注。
一位生物醫(yī)學(xué)家認(rèn)為這毫不驚訝,并表示研究?jī)?nèi)容挺有意思。
還有網(wǎng)友認(rèn)為,資本也是導(dǎo)致上述現(xiàn)象的一大因素。
他補(bǔ)充道,在過(guò)去50年中,更多資金從產(chǎn)出顛覆變化的基礎(chǔ)研究,轉(zhuǎn)向收益直接可見的應(yīng)用研究。
對(duì)此,你怎么看?
論文地址:???https://www.nature.com/articles/s41586-022-05543-x??
參考鏈接:???https://pubsonline.informs.org/doi/epdf/10.1287/mnsc.2015.2366??