自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

你的代碼糟粕比精華要多得多

開發(fā) 后端 前端
新的研究發(fā)現(xiàn),一個(gè)程序的核心功能僅在于一小部分封裝的代碼。

新的研究發(fā)現(xiàn),一個(gè)程序的核心功能僅在于一小部分封裝的代碼。

如果你是一個(gè)軟件開發(fā)人員,有人問你,你寫的代碼中有多少是真正在實(shí)現(xiàn)實(shí)際功能的,有多少是填充物、無價(jià)值的或者只是因?yàn)閷?shí)際運(yùn)行編程語言所需要的? 95%? 75%? 50%?都不是!新的研究發(fā)現(xiàn),只有大約5%的代碼是真正在提供核心功能。

研究人員認(rèn)為,就像自然語言一樣,一些——甚至可能是絕大多數(shù)——寫下的代碼其實(shí)對于功能是不起作用的?!秙talks of wheat》一文的作者認(rèn)為,只有一部分代碼代表了功能的語義核心,我們稱之為精華,而其他的則是糟粕。

[[143386]]

該作者表示,一個(gè)功能的核心可以被封裝于一個(gè)小型的關(guān)鍵字集合中,這被稱為“minimum distinguishing subset” (“最小的區(qū)別化子集”)或MINSET。我們可以通過將方法分解為詞素(即,通過空格或標(biāo)點(diǎn)符號(hào)分隔代碼),丟棄那些對函數(shù)行為不重要 的內(nèi)容,同時(shí)把剩下的映射到關(guān)鍵字中。然后將那些關(guān)鍵字導(dǎo)入到MINSET。

為了檢驗(yàn)此理論,即MINSET中的代碼只占全部代碼的一小部分,研究人員下載了1000個(gè)來自Apache、Eclipse、GitHub和 SourceForge***的Java項(xiàng)目。在合計(jì)超過10億行的Java代碼中,先剔除簡單的方法( tokens低于50)。就只剩下不到190 萬的不同方法,然后從中隨機(jī)抽取10,000條,確定它們的MINSET。研究中使用的代碼和數(shù)據(jù)可從Bitbucket下載。

以下為研究發(fā)現(xiàn)的主要結(jié)果:

  • MINSETS出奇的小。方法的平均MINSET大小為1.55個(gè)關(guān)鍵字,***值為6。

  • MINSET的大小并不隨方法規(guī)模的增加而變大。事實(shí)上,如果只看***的1000個(gè)方法,其平均和***MINSET關(guān)鍵字分別為降到1.12和4,這表明,正如作者所言:“即便是對于一些異常龐大的方法,MINSET也是一項(xiàng)既獨(dú)特又靈活有效的指標(biāo)。”

  • 大多數(shù)代碼幾乎盡是糟粕。平均來說,在一個(gè)方法中只有4.6%的獨(dú)特詞素可以位列MINSET。也就是說,95%以上的代碼都是糟粕。

不過有幾處關(guān)鍵的地方需要指出來。首先,MINSET本身是不可執(zhí)行的:它只是表征了核心功能的代碼的最小集合。剩下95%中的一些代碼(前面稱之 為糟粕)也不是無用的,因?yàn)檫€需要它們來運(yùn)行程序。其次,盡管這項(xiàng)研究僅著眼于Java代碼,不過由于語言的相似性,作者表示這些發(fā)現(xiàn)應(yīng)該也適用于其他語 言,特別是C語言和C++。

關(guān)于此項(xiàng)工作的意義?研究人員指出了MINSETs的潛在應(yīng)用:

  • 改進(jìn)代碼搜索——MINSETs可用于基于相似查詢的代碼搜索結(jié)果排名。

  • 智能IDE——具備了MINSETs索引數(shù)據(jù)庫的IDE可用于提出類似的代碼,支持自動(dòng)代碼填充,加快調(diào)試過程。

  • 備選的編程形式——MINSETs可用于支持基于關(guān)鍵字的編程,也就是說,我們可以通過一個(gè)小型的關(guān)鍵字組來創(chuàng)建可用的代碼。

 

責(zé)任編輯:王雪燕 來源: 碼農(nóng)網(wǎng)/小峰
相關(guān)推薦

2022-02-24 14:03:07

神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)計(jì)算

2019-05-30 22:27:51

云計(jì)算成本云服務(wù)

2023-05-11 13:39:39

EDA數(shù)據(jù)分析

2021-01-14 08:47:55

Linux命令行打印

2024-08-01 12:44:58

2020-10-10 19:30:25

lshwLinux設(shè)備信息

2011-11-18 16:24:07

IBM毛新生數(shù)據(jù)中心世紀(jì)互聯(lián)

2018-08-08 20:49:55

2024-10-21 11:00:00

2013-10-08 10:25:03

2022-08-17 09:56:02

Android隱私

2022-08-26 00:00:00

數(shù)據(jù)庫數(shù)據(jù)倉庫OLAP

2019-08-14 09:42:06

LinuxElasticsearKibana

2015-06-10 11:15:42

iOS開發(fā)

2014-08-05 17:09:55

2011-05-24 09:15:26

JavaC#

2023-02-26 00:00:04

ChatGPTLUIAIGC

2009-08-17 16:34:21

.NET分布式緩存Memcached

2017-01-17 10:09:22

Linux操作系統(tǒng)應(yīng)用程序

2016-03-21 10:33:01

編程浪費(fèi)時(shí)間
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)