自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Java代碼優(yōu)化過程的實例介紹

開發(fā) 后端
通過筆者經(jīng)歷的一個項目實例,本文介紹了 Java 代碼優(yōu)化的過程,總結了優(yōu)化 Java 程序的一些最佳實踐,分析了進行優(yōu)化的方法,并解釋了性能提升的原因。從多個角度分析導致性能低的原因,并逐個進行優(yōu)化,最終使得程序的性能得到極大提升,代碼的可讀性、可擴展性更強。

衡量程序的標準

衡量一個程序是否優(yōu)質,可以從多個角度進行分析。其中,最常見的衡量標準是程序的時間復雜度、空間復雜度,以及代碼的可讀性、可擴展性。針對程序的時間復雜度和空間復雜度,想要優(yōu)化程序代碼,需要對數(shù)據(jù)結構與算法有深入的理解,并且熟悉計算機系統(tǒng)的基本概念和原理;而針對代碼的可讀性和可擴展性,想要優(yōu)化程序代碼,需要深入理解軟件架構設計,熟知并會應用合適的設計模式。

首先,如今計算機系統(tǒng)的存儲空間已經(jīng)足夠大了,達到了 TB 級別,因此相比于空間復雜度,時間復雜度是程序員首要考慮的因素。為了追求高性能,在某些頻繁操作執(zhí)行時,甚至可以考慮用空間換取時間。其次,由于受到處理器制造工藝的物理限制、成本限制,CPU 主頻的增長遇到了瓶頸,摩爾定律已漸漸失效,每隔 18 個月 CPU 主頻即翻倍的時代已經(jīng)過去了,程序員的編程方式發(fā)生了徹底的改變。在目前這個多核多處理器的時代,涌現(xiàn)了原生支持多線程的語言(如 Java)以及分布式并行計算框架(如 Hadoop)。為了使程序充分地利用多核 CPU,簡單地實現(xiàn)一個單線程的程序是遠遠不夠的,程序員需要能夠編寫出并發(fā)或者并行的多線程程序。***,大型軟件系統(tǒng)的代碼行數(shù)達到了***,如果沒有一個設計良好的軟件架構,想在已有代碼的基礎上進行開發(fā),開發(fā)代價和維護成本是無法想象的。一個設計良好的軟件應該具有可讀性和可擴展性,遵循“開閉原則”、“依賴倒置原則”、“面向接口編程”等。

項目介紹

本文將介紹筆者經(jīng)歷的一個項目中的一部分,通過這個實例剖析代碼優(yōu)化的過程。下面簡要地介紹該系統(tǒng)的相關部分。

該系統(tǒng)的開發(fā)語言為 Java,部署在共擁有 4 核 CPU 的 Linux 服務器上,相關部分主要有以下操作:通過某外部系統(tǒng) D 提供的 REST API 獲取信息,從中提取出有效的信息,并通過 JDBC 存儲到某數(shù)據(jù)庫系統(tǒng) S 中,供系統(tǒng)其他部分使用,上述操作的執(zhí)行頻率為每天一次,一般在午夜當系統(tǒng)空閑時定時執(zhí)行。為了實現(xiàn)高可用性(High Availability),外部系統(tǒng) D 部署在兩臺服務器上,因此需要分別從這兩臺服務器上獲取信息并將信息插入數(shù)據(jù)庫中,有效信息的條數(shù)達到了上千條,數(shù)據(jù)庫插入操作次數(shù)則為有效信息條數(shù)的兩倍。

圖 1. 系統(tǒng)體系結構圖

圖 1. 系統(tǒng)體系結構圖

為了快速地實現(xiàn)預期效果,在最初的實現(xiàn)中優(yōu)先考慮了功能的實現(xiàn),而未考慮系統(tǒng)性能和代碼可讀性等。系統(tǒng)大致有以下的實現(xiàn):(1)REST API 獲取信息、數(shù)據(jù)庫操作可能拋出的異常信息都被記錄到日志文件中,作為調試用;(2)共有 5 次數(shù)據(jù)庫連接操作,包括***次清空數(shù)據(jù)庫表,針對兩個外部系統(tǒng) D 各有兩次數(shù)據(jù)庫插入操作,這 5 個連接都是獨立的,用完之后即釋放;(3)所有的數(shù)據(jù)庫插入語句都是使用 java.sql.Statement 類生成的;(4)所有的數(shù)據(jù)庫插入語句,都是單條執(zhí)行的,即生成一條執(zhí)行一條;(5)整個過程都是在單個線程中執(zhí)行的,包括數(shù)據(jù)庫表清空操作,數(shù)據(jù)庫插入操作,釋放數(shù)據(jù)庫連接;(6)數(shù)據(jù)庫插入操作的 JDBC 代碼散布在代碼中。雖然這個版本的系統(tǒng)可以正常運行,達到了預期的效果,但是效率很低,從通過 REST API 獲取信息,到解析并提取有效信息,再到數(shù)據(jù)庫插入操作,總共耗時 100 秒左右。而預期的時間應該在一分鐘以內,這顯然是不符合要求的。

代碼優(yōu)化過程

筆者開始分析整個過程有哪些耗時操作,以及如何提升效率,縮短程序執(zhí)行的時間。通過 REST API 獲取信息,因為是使用外部系統(tǒng)提供的 API,所以無法在此處提升效率;取得信息之后解析出有效部分,因為是對特定格式的信息進行解析,所以也無效率提升的空間。所以,效率可以大幅度提升的空間在數(shù)據(jù)庫操作部分以及程序控制部分。下面,分條敘述對耗時操作的改進方法。

針對日志記錄的優(yōu)化

關閉日志記錄,或者更改日志輸出級別。因為從兩臺服務器的外部系統(tǒng) D 上獲取到的信息是相同的,所以數(shù)據(jù)庫插入操作會拋出異常,異常信息類似于“Attempt to insert duplicate record”,這樣的異常信息跟有效信息的條數(shù)相等,有上千條。這種情況是能預料到的,所以可以考慮關閉日志記錄,或者不關閉日志記錄而是更改日志輸出級別,只記錄嚴重級別(severe level)的錯誤信息,并將此類操作的日志級別調整為警告級別(warning level),這樣就不會記錄以上異常信息了。本項目使用的是 Java 自帶的日志記錄類,以下配置文件將日志輸出級別設置為嚴重級別。

清單 1. log.properties 設置日志輸出級別的片段

 
  1. # default file output is in user ’ s home directory.  
  2. # levels can be: SEVERE, WARNING, INFO, FINE, FINER, FINEST  
  3. java.util.logging.ConsoleHandler.level=SEVERE  
  4. javajava.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter  
  5. java.util.logging.FileHandler.append=true  

通過上述的優(yōu)化之后,性能有了大幅度的提升,從原來的 100 秒左右降到了 50 秒左右。為什么僅僅不記錄日志就能有如此大幅度的性能提升呢?查閱資料,發(fā)現(xiàn)已經(jīng)有人做了相關的研究與實驗。經(jīng)常聽到 Java 程序比 C/C++ 程序慢的言論,但是運行速度慢的真正原因是什么,估計很多人并不清楚。對于 CPU 密集型的程序(即程序中包含大量計算),Java 程序可以達到 C/C++ 程序同等級別的速度,但是對于 I/O 密集型的程序(即程序中包含大量 I/O 操作),Java 程序的速度就遠遠慢于 C/C++ 程序了,很大程度上是因為 C/C++ 程序能直接訪問底層的存儲設備。因此,不記錄日志而得到大幅度性能提升的原因是,Java 程序的 I/O 操作較慢,是一個很耗時的操作。

針對數(shù)據(jù)庫連接的優(yōu)化

共享數(shù)據(jù)庫連接。共有 5 次數(shù)據(jù)庫連接操作,每次都需重新建立數(shù)據(jù)庫連接,數(shù)據(jù)庫插入操作完成之后又立即釋放了,數(shù)據(jù)庫連接沒有被復用。為了做到共享數(shù)據(jù)庫連接,可以通過單例模式(Singleton Pattern)獲得一個相同的數(shù)據(jù)庫連接,每次數(shù)據(jù)庫連接操作都共享這個數(shù)據(jù)庫連接。這里沒有使用數(shù)據(jù)庫連接池(Database Connection Pool)是因為在程序只有少量的數(shù)據(jù)庫連接操作,只有在大量并發(fā)數(shù)據(jù)庫連接的時候才需要連接池。#p#

清單 2. 共享數(shù)據(jù)庫連接的代碼片段

  1. public class JdbcUtil {  
  2.    private static Connection con;  
  3.    // 從配置文件讀取連接數(shù)據(jù)庫的信息 
  4.    private static String driverClassName;  
  5.    private static String url;  
  6.    private static String username;  
  7.    private static String password;  
  8.    private static String currentSchema;  
  9.    private static Properties properties = new Properties();  
  10.  
  11.  static {  
  12. // driverClassName, url, username, password, currentSchema 等從配置文件讀取,代碼略去 
  13.      try {  
  14.         Class.forName(driverClassName);  
  15.        } catch (ClassNotFoundException e) {  
  16.            e.printStackTrace();  
  17.        }  
  18.        properties.setProperty("user", username);  
  19.        properties.setProperty("password", password);  
  20.        properties.setProperty("currentSchema", currentSchema);  
  21.        try {  
  22.            con = DriverManager.getConnection(url, properties);  
  23.        } catch (SQLException e) {  
  24.            e.printStackTrace();  
  25.        }  
  26.    }  
  27.    private JdbcUtil() {}  
  28. // 獲得一個單例的、共享的數(shù)據(jù)庫連接 
  29. public static Connection getConnection() {  
  30.        return con;  
  31.    }  
  32.    public static void close() throws SQLException {  
  33.        if (con != null)  
  34.            con.close();  
  35. }  
  36. }  

通過上述的優(yōu)化之后,性能有了小幅度的提升,從 50 秒左右降到了 40 秒左右。共享數(shù)據(jù)庫連接而得到的性能提升的原因是,數(shù)據(jù)庫連接是一個耗時耗資源的操作,需要同遠程計算機進行網(wǎng)絡通信,建立 TCP 連接,還需要維護連接狀態(tài)表,建立數(shù)據(jù)緩沖區(qū)。如果共享數(shù)據(jù)庫連接,則只需要進行一次數(shù)據(jù)庫連接操作,省去了多次重新建立數(shù)據(jù)庫連接的時間。

針對插入數(shù)據(jù)庫記錄的優(yōu)化 1

使用預編譯 SQL。具體做法是使用 java.sql.PreparedStatement 代替 java.sql.Statement 生成 SQL 語句。PreparedStatement 使得數(shù)據(jù)庫預先編譯好 SQL 語句,可以傳入?yún)?shù)。而 Statement 生成的 SQL 語句在每次提交時,數(shù)據(jù)庫都需進行編譯。在執(zhí)行大量類似的 SQL 語句時,可以使用 PreparedStatement 提高執(zhí)行效率。使用 PreparedStatement 的另一個好處是不需要拼接 SQL 語句,代碼的可讀性更強。通過上述的優(yōu)化之后,性能有了小幅度的提升,從 40 秒左右降到了 30~35 秒左右。

清單 3. 使用 Statement 的代碼片段

 
  1. // 需要拼接 SQL 語句,執(zhí)行效率不高,代碼可讀性不強 
  2. StringBuilder sql = new StringBuilder();  
  3. sql.append("insert into table1(column1,column2) values('");  
  4. sql.append(column1Value);  
  5. sql.append("','");  
  6. sql.append(column2Value);  
  7. sql.append("');");  
  8.  
  9. Statement st;  
  10. try {  
  11.     st = con.createStatement();  
  12.     st.executeUpdate(sql.toString());  
  13. } catch (SQLException e) {  
  14.     e.printStackTrace();  
  15. }  

清單 4. 使用 PreparedStatement 的代碼片段

 
  1. // 預編譯 SQL 語句,執(zhí)行效率高,可讀性強 
  2. String sql = “insert into table1(column1,column2) values(?,?)”;  
  3. PreparedStatement pst = con.prepareStatement(sql);  
  4. pst.setString(1,column1Value);  
  5. pst.setString(2,column2Value);  
  6. pst.execute();  

針對插入數(shù)據(jù)庫記錄的優(yōu)化 2

使用 SQL 批處理。通過 java.sql.PreparedStatement 的 addBatch 方法將 SQL 語句加入到批處理,這樣在調用 execute 方法時,就會一次性地執(zhí)行 SQL 批處理,而不是逐條執(zhí)行。通過上述的優(yōu)化之后,性能有了小幅度的提升,從 30~35 秒左右降到了 30 秒左右。

針對多線程的優(yōu)化

使用多線程實現(xiàn)并發(fā) / 并行。清空數(shù)據(jù)庫表的操作、把從 2 個外部系統(tǒng) D 取得的數(shù)據(jù)插入數(shù)據(jù)庫記錄的操作,是相互獨立的任務,可以給每個任務分配一個線程執(zhí)行。清空數(shù)據(jù)庫表的操作應該先于數(shù)據(jù)庫插入操作完成,可以通過 java.lang.Thread 類的 join 方法控制線程執(zhí)行的先后次序。在單核 CPU 時代,操作系統(tǒng)中某一時刻只有一個線程在運行,通過進程 / 線程調度,給每個線程分配一小段執(zhí)行的時間片,可以實現(xiàn)多個進程 / 線程的并發(fā)(concurrent)執(zhí)行。而在目前的多核多處理器背景下,操作系統(tǒng)中同一時刻可以有多個線程并行(parallel)執(zhí)行,大大地提高了計算速度。

清單 5. 使用多線程的代碼片段

  1. Thread t0 = new Thread(new ClearTableTask());  
  2. Thread t1 = new Thread(new StoreServersTask(ADDRESS1));  
  3. Thread t2 = new Thread(new StoreServersTask(ADDRESS2));  
  4.  
  5. try {  
  6.     t0.start();  
  7.     // 執(zhí)行完清空操作后,再進行后續(xù)操作 
  8.     t0.join();  
  9.     t1.start();  
  10.     t2.start();  
  11.     t1.join();  
  12.     t2.join();  
  13. } catch (InterruptedException e) {  
  14.     e.printStackTrace();  
  15. }  
  16.  
  17. // 斷開數(shù)據(jù)庫連接 
  18. try {  
  19.     JdbcUtil.close();  
  20. } catch (SQLException e) {  
  21.     e.printStackTrace();  
  22. }  

通過上述的優(yōu)化之后,性能有了大幅度的提升,從 30 秒左右降到了 15 秒以下,10~15 秒之間。使用多線程而得到的性能提升的原因是,系統(tǒng)部署所在的服務器是多核多處理器的,使用多線程,給每個任務分配一個線程執(zhí)行,可以充分地利用 CPU 計算資源。

筆者試著給每個任務分配兩個線程執(zhí)行,希望能使程序運行得更快,但是事與愿違,此時程序運行的時間反而比每個任務分配一個線程執(zhí)行的慢,大約 20 秒。筆者推測,這是因為線程較多(相對于 CPU 的內核數(shù)),使得 CPU 忙于線程的上下文切換,過多的線程上下文切換使得程序的性能反而不如之前。因此,要根據(jù)實際的硬件環(huán)境,給任務分配適量的線程執(zhí)行。

針對設計模式的優(yōu)化

使用 DAO 模式抽象出數(shù)據(jù)訪問層。原來的代碼中混雜著 JDBC 操作數(shù)據(jù)庫的代碼,代碼結構顯得十分凌亂。使用 DAO 模式(Data Access Object Pattern)可以抽象出數(shù)據(jù)訪問層,這樣使得程序可以獨立于不同的數(shù)據(jù)庫,即便訪問數(shù)據(jù)庫的代碼發(fā)生了改變,上層調用數(shù)據(jù)訪問的代碼無需改變。并且程序員可以擺脫單調繁瑣的數(shù)據(jù)庫代碼的編寫,專注于業(yè)務邏輯層面的代碼的開發(fā)。通過上述的優(yōu)化之后,性能并未有提升,但是代碼的可讀性、可擴展性大大地提高了。

圖 2. DAO 模式的層次結構

圖 2. DAO 模式的層次結構

清單 6. 使用 DAO 模式的代碼片段

  1. // DeviceDAO.java,定義了 DAO 抽象,上層的業(yè)務邏輯代碼引用該接口,面向接口編程 
  2. public interface DeviceDAO {  
  3.    public void add(Device device);  
  4. }  
  5.  
  6. // DeviceDAOImpl.java,DAO 實現(xiàn),具體的 SQL 語句和數(shù)據(jù)庫操作由該類實現(xiàn) 
  7. public class DeviceDAOImpl implements DeviceDAO {  
  8.    private Connection con;  
  9.    public DeviceDAOImpl() {  
  10.        // 獲得數(shù)據(jù)庫連接,代碼略去 
  11.    }  
  12. @Override  
  13. public void add(Device device) {  
  14.        // 使用 PreparedStatement 進行數(shù)據(jù)庫插入記錄操作,代碼略去 
  15.    }  
  16. }  

回顧以上代碼優(yōu)化過程:關閉日志記錄、共享數(shù)據(jù)庫連接、使用預編譯 SQL、使用 SQL 批處理、使用多線程實現(xiàn)并發(fā) / 并行、使用 DAO 模式抽象出數(shù)據(jù)訪問層,程序運行時間從最初的 100 秒左右降低到 15 秒以下,在性能上得到了很大的提升,同時也具有了更好的可讀性和可擴展性。

結束語

通過該項目實例,筆者深深地感到,想要寫出一個性能優(yōu)化、可讀性可擴展性強的程序,需要對計算機系統(tǒng)的基本概念、原理,編程語言的特性,軟件系統(tǒng)架構設計都有較深入的理解。“紙上得來終覺淺,絕知此事要躬行”,想要將這些基本理論、編程技巧融會貫通,還需要不斷地實踐,并總結心得體會。

原文鏈接:http://www.ibm.com/developerworks/cn/java/j-lo-codeoptimize/

責任編輯:陳四芳 來源: developerWorks中國
相關推薦

2010-04-07 14:01:40

Oracle存儲過程

2010-04-16 13:16:11

OracleJavaP

2010-03-31 10:22:25

Oracle10g優(yōu)化

2013-09-03 09:35:10

2011-08-22 12:01:36

SQL Server代碼優(yōu)化

2010-04-23 11:15:43

Oracle創(chuàng)建

2011-08-25 11:36:50

PreparedStaJDBC存儲過程調用

2009-12-28 11:08:34

ADO 實例

2011-07-21 13:51:38

java

2011-07-21 14:15:08

java

2010-07-27 16:14:50

2010-11-19 09:48:48

ORACLE創(chuàng)建實例

2009-07-07 09:51:49

Servlet實例

2011-07-22 13:47:23

存儲過程

2010-11-10 15:16:14

Sql Server分

2011-08-10 17:00:45

DB2數(shù)據(jù)庫存儲過程

2010-03-18 14:27:53

Java Thread

2010-11-16 14:30:32

Oracle存儲過程

2011-12-15 10:10:33

Javanio

2010-04-07 12:08:28

Oracle存儲過程
點贊
收藏

51CTO技術棧公眾號