自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

2018年排名Top 100的Java類庫——在分析了277,975份源碼之后得出的結論

開發(fā) 開發(fā)工具
時間如流水,轉眼間2018年已經(jīng)要接近尾聲了,過去的一年,可以說是瘋狂的一年。SpaceX成功發(fā)射了重型獵鷹火箭,蘋果成為首個突破一萬億美元市值的上市公司。

 時間如流水,轉眼間2018年已經(jīng)要接近尾聲了,過去的一年,可以說是瘋狂的一年。SpaceX成功發(fā)射了重型獵鷹火箭,蘋果成為***突破一萬億美元市值的上市公司。

2018年,在IT圈也發(fā)生了許多大事和喜事,SpringBoot 2發(fā)布、Java發(fā)布了10 和 11兩個版本、GitHub下嫁MicroSoft、IBM迎娶RedHat等,和往年一樣,我們分析了2018年排名Top 100的Java類庫。

目的是向你展示2018年的風云Java類庫,希望可以給正在使用Java的你一些幫助和啟示。不能說榜單中的類庫都是***的,但是至少是目前比較受歡迎的。往期榜單地址:

2017年排名Top 100的Java類庫——在分析了259,885份源碼之后得出的結論

2016年排名Top 100的Java類庫——在分析了47,251個依賴之后得出的結論

***的前20個Java類庫

 

今年,Top 100 Java類庫的排名發(fā)生了一個戲劇性的改變,榜首換人了,在此之前,JUnit已經(jīng)蟬聯(lián)了三屆冠軍。而今年,冠軍寶座被fasterXML/Jackson 占據(jù)。 而這個類庫,2016年排名第14名、2017年排名第18名。

 

Jackson是一個JSON庫,可以方便的將JSON轉化成Java的對象模型,以及把Java的對象模型轉換成一串JSON。在往年的榜單中,Jackson就是所有JSON類庫中排名最靠前的。

Jackson所依賴的jar包較少,簡單易用并且性能也要相對高些,并且Jackson社區(qū)相對比較活躍,更新速度也比較快。具有以下特點:

  • 容易使用 – jackson API提供了一個高層次外觀,以簡化常用的用例。
  • 無需創(chuàng)建映射 – API提供了默認的映射大部分對象序列化。
  • 性能高 – 快速,低內(nèi)存占用,適合大型對象圖表或系統(tǒng)。
  • 干凈的JSON – jackson創(chuàng)建一個干凈和緊湊的JSON結果,這是讓人很容易閱讀。
  • 不依賴 – 庫不需要任何其他的庫,除了JDK。
  • 開源代碼 – jackson是開源的,可以免費使用。

去年包攬前三甲的JUnit家族三大成員JUnit、JUnit Runner和junit.framework今年分別位列第三、第四和第五名。

今年排名第二名的是Apache Hadoop,是一款支持數(shù)據(jù)密集型分布式應用程序并以Apache 2.0許可協(xié)議發(fā)布的開源軟件框架。它支持在商品硬件構建的大型集群上運行的應用程序。Hadoop的框架最核心的設計就是:HDFS和MapReduce。HDFS為海量的數(shù)據(jù)提供了存儲,而MapReduce則為海量的數(shù)據(jù)提供了計算。

在我們排名前20的庫中,我們可以找到Eclipse基金會的Jetty、Apache基金會的 Shiro 、Netty以及谷歌的Guice庫等。

Jetty

Jetty是一個純粹的基于Java的網(wǎng)頁服務器和Java Servlet容器。盡管網(wǎng)頁服務器通常用來為人們呈現(xiàn)文檔,但是Jetty通常在較大的軟件框架中用于計算機與計算機之間的通信。

Shiro

Apache Shiro是一個開源安全框架,提供身份驗證、授權、密碼學和會話管理。Shiro框架直觀、易用,同時也能提供健壯的安全性。

Netty

Netty 是一個基于NIO的客戶、服務器端編程框架,使用Netty 可以確保你快速和簡單的開發(fā)出一個網(wǎng)絡應用,例如實現(xiàn)了某種協(xié)議的客戶、服務端應用。Netty相當于簡化和流線化了網(wǎng)絡應用的編程開發(fā)過程,例如:基于TCP和UDP的socket服務開發(fā)。

Guice

Guice是Google開發(fā)的一個輕量級,基于Java5(主要運用泛型與注釋特性)的依賴注入框架(IOC)。Guice非常小而且快。Guice是類型安全的,它能夠?qū)嬙旌瘮?shù),屬性,方法(包含任意個參數(shù)的任意方法,而不僅僅是setter方法)進行注入。

除此以外,前20名的榜單中,值得關注的還有開源日志組件——ch.qos.logback、專門用于代碼微基準測試的工具套件——org.openjdk.jmh、

除此之外,我們比較熟悉的apache旗下的很多常用類庫,如apache.commons.lang、org.apache.ibatis、org.apache.maven、org.apache.http.client、apache.commons.lang3等也都在前20的榜單中。

被擠出前20的Java類庫

 

為了分析榜單的變化情況,我們對比了2017年top20的類庫和今年的類庫榜單。我們發(fā)現(xiàn),除了JUnit的使用減少以外,還有些類庫排名在下降,有些甚至從前二十名被擠出。

首當其沖的是去年位列第四和第五名的Mockito和slf4j,今年被無情的甩出了前20,分別位列第23名和25名。

去年我們重點表揚的,排名第6的,幫助編寫用Java語言進行軟件測試的框架——Hamcrest 今年慘跌至第37名。

那些值得關注的后來者

 

我們在今年的結果中看到的最主要的事情是,一切都可以改變。位于榜單底部的庫可能會在接下來的一年中名列前茅。這就是為什么我們在2018年的圖表中查看了一些不太受歡迎的類庫,并在2019年對它們進行跟蹤,如:

  1. #85 org.objectweb.asm – A simple API for decomposing, modifying, and recomposing binary Java classes 
  2. #86 com.google.common.primitives – Google Guava Primitive Types 
  3. #87 com.datastax.driver – DataStax Java Driver for Apache Cassandra 
  4. #88 org.json – The data interchange format 
  5. #89 org.apache.commons.math3 – The Apache Commons Mathematics Library 
  6. #90 com.netflix.hystrix – A latency and fault tolerance library designed to isolate points of access to remote systems, services and 3rd party libraries. 

 

那些貢獻較大的組織

每年我們都會從GitHub中提取***的Java庫,然后開始處理這些數(shù)據(jù)。由于需要區(qū)分一個所有者之下的不同文件夾,所以這種處理的大部分工作都是手工完成的。這就是為什么在我們的列表中有許多com.google.common庫以及org.springframework 和org.apache等等。

今年,我們決定對***Java庫進行更廣泛的研究,看看誰是***“所有者”。我們合并了org.eclipse.XX,org.codehaus.YY,io.nedy.ZZ和類似的位于同一個組織下的類庫,然后我們整理出了下面這份榜單:

 

 

 

 

位居榜首的,就是我們都熟知的,也是在前20的榜單頻繁出現(xiàn)的apche基金會。

  • 第二名:springframework
  • 第三名:google
  • 第四名:junit
  • 第五名:eclipse

今年的這份榜單中,值得注意的是有一家來自中國的組織貢獻的類庫總數(shù)進入了前20,那就是上圖中排名第15的Alibaba。(作為一個阿里人,作者感到無比驕傲!!!)

在Top 100 Java類庫中,com.alibaba.otter排名第85。otter是一個基于數(shù)據(jù)庫增量日志解析,準實時同步到本機房或異地機房的mysql/oracle數(shù)據(jù)庫. 一個分布式數(shù)據(jù)庫同步系統(tǒng)。

Alibaba作為一家互聯(lián)網(wǎng)公司,過去得幾年在開源領域做出了很多卓越的貢獻。最近幾年,Alibaba向Apache基金會捐獻了多個重量級開源項目。如JStorm、RocketMQ、Dubbo、Weex等,相信這些項目必將在開源社區(qū)的滋養(yǎng)下成長的更加茁壯!!!

分析方法

 

我們提取數(shù)據(jù)和數(shù)字的方法與去年的方法相似。在OverOps R&D團隊的幫助下,我們主要是用了谷歌的BigQuery和GitHub的API。我們提取了前1000個存儲庫,從中提取了這些存儲庫使用的Java庫。

BigQuery 是 Google 專門面向數(shù)據(jù)分析需求設計的一種全面托管的 PB 級低成本企業(yè)數(shù)據(jù)倉庫。該服務讓開發(fā)者可以使用Google的架構來運行SQL語句對超級大的數(shù)據(jù)庫進行操作。BigQuery 可在幾秒內(nèi)掃描 1 TB 的數(shù)據(jù),在幾分鐘內(nèi)掃描 1 PB 的數(shù)據(jù)。

在從GitHub中提取的277,975個Java源文件中,我們過濾掉了Android、Arduino、重復和廢棄的repos。至此,我們只剩下28,021個Java源文件。經(jīng)過切片和分析,我們得到了***的前100名。

Talk Is Cheap ,Show You The Code

首先,我們創(chuàng)建一個倉庫表,用來存儲star數(shù)排名靠前的哪些類庫,命名為java_top_repos_filtered:

  1. SELECT 
  2.   full_name 
  3. FROM 
  4.   java_top_repos_1000 
  5. WHERE NOT ((LOWER(full_name) CONTAINS 'android'OR           (LOWER(full_name) CONTAINS 'arduino')) 
  6.       AND ((description IS nullOR           (NOT ((LOWER(description) CONTAINS 'android'OR                 (LOWER(description) CONTAINS 'arduino'OR                 (LOWER(description) CONTAINS 'deprecated')))); 

現(xiàn)在,我們有了排名靠前的類庫的名字,然后我們把他們都拉取下來:

  1. SELECT 
  2.   repo_name, 
  3.   content 
  4. FROM  [bigquery-public-data:github_repos.contents] AS contents 
  5. INNER JOIN
  6.   SELECT 
  7.     id, 
  8.     repo_name 
  9.   FROM    [bigquery-public-data:github_repos.files] AS files 
  10.   INNER JOIN 
  11.     java_top_repos_filtered AS top_repos 
  12.   ON 
  13.     files.repo_name = top_repos.full_name 
  14.   WHERE 
  15.     path LIKE '%.java'AS files_filtered 
  16. ON 
  17.   contents.id = files_filtered.id; 

至此,我們有了每個項目的源代碼,我們就要把去重后的import的語句過濾出來,然后在提取包名稱。

  1. SELECT  package, 
  2.   COUNT(*) count 
  3. FROM( //extract package name (exclude last point of data) and group with repo name (to count each package once per repo) 
  4.   SELECT 
  5.     REGEXP_EXTRACT(import_line, r' ([a-z0-9\._]*)\.') package, 
  6.     repo_name 
  7.   FROM  ( //extract only 'import' code lines from *.java files 
  8.     SELECT 
  9.       SPLIT(content, '\n') import_line, 
  10.       repo_name 
  11.     FROM 
  12.       java_relevant_data 
  13.     HAVING 
  14.       LEFT(import_line, 6) = 'import' 
  15.   ) 
  16.   GROUP BY    package, 
  17.     repo_name)GROUP BY  packageORDER BY 
  18.   count DESC

***,我們再進行一次過濾,確保沒有Android, Arduino、過時的或者Java提供的原生的類庫。

  1. SELECT  *FROM 
  2.   java_top_package_count 
  3. WHERE 
  4.   NOT ((LEFT(package, 5) = 'java.'OR       (LOWER(package) CONTAINS 'android'))ORDER BY 
  5.   count DESC

至此,你就得到了一份2017年排名Top 100的Java類庫的列表了。

***的一點想法

 

Java在過去的幾個月里經(jīng)歷了一些變化。它從6個月的發(fā)布周期開始,最近我們聽說只有OpenJDK構建版本可以自由訪問,而Java SE 8公開更新將需要生產(chǎn)使用的商業(yè)許可證。

Java的變化影響了開發(fā)人員,我們可以通過GitHub***Java庫流行程度的變化看出這一點。最近關于對Java SE更新收費的新聞可能會導致openjdk相關庫的使用增加,甚至可能會將數(shù)據(jù)轉移到企業(yè)相關庫。

【本文是51CTO專欄作者Hollis的原創(chuàng)文章,作者微信公眾號Hollis(ID:hollischuang)】

 

戳這里,看該作者更多好文

責任編輯:武曉燕 來源: 51CTO專欄
相關推薦

2020-01-13 09:25:58

JavaOracleHDFS

2019-09-10 20:09:13

2018-07-19 12:26:20

Serverless無服務器平臺

2020-08-16 08:57:39

Python IDE編程IDE

2020-07-27 09:53:22

FlutterReact NativUI庫

2021-02-19 13:10:27

人工智能機器學習工具

2018-12-04 17:47:07

OpenStack

2012-12-17 15:19:13

2020-05-20 23:35:32

物聯(lián)網(wǎng)應用物聯(lián)網(wǎng)IoT)

2018-09-17 14:04:29

AI數(shù)據(jù)科技

2011-02-25 17:26:51

Android應用

2018-01-03 18:54:55

數(shù)據(jù)庫排名DB-Engines

2017-12-04 14:50:57

數(shù)據(jù)分析可視化大數(shù)據(jù)

2019-07-26 14:12:59

瀏覽器ChromeFirefox

2019-03-22 08:12:29

智慧城市物聯(lián)網(wǎng)IoT

2018-10-19 10:45:53

中科曙光

2015-10-26 16:18:19

2018-06-02 23:54:41

數(shù)據(jù)庫PostgreSQL Oracle

2021-08-17 08:51:38

機器學習人工智能

2018-12-11 13:50:47

Java開源項目應用程序
點贊
收藏

51CTO技術棧公眾號