自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Linkedin 工程師如何優(yōu)化他們的 Java 代碼

開發(fā) 后端
最近在刷各大公司的技術(shù)博客的時候,我在Linkedin的技術(shù)博客上面發(fā)現(xiàn)了一篇很不錯博文。這篇博文介紹了Linkedin信息流中間層Feed Mixer,它為Linkedin的Web主頁,大學(xué)主頁,公司主頁以及客戶端等多個分發(fā)渠道提供支撐(如下圖所示)。

最近在刷各大公司的技術(shù)博客的時候,我在Linkedin的技術(shù)博客上面發(fā)現(xiàn)了一篇很不錯博文。這篇博文介紹了Linkedin信息流中間層Feed Mixer,它為Linkedin的Web主頁,大學(xué)主頁,公司主頁以及客戶端等多個分發(fā)渠道提供支撐(如下圖所示)。

feed_mixer_1

在Feed Mixer里面用到了一個叫做SPR(念“super”)的庫。博文講的就是如何優(yōu)化SPR的java代碼。下面就是他們總結(jié)的優(yōu)化經(jīng)驗。

1. 謹慎對待Java的循環(huán)遍歷

Java中的列表遍歷可比它看起來要麻煩多了。就以下面兩段代碼為例:

A

  1. private final List<Bar> _bars; 
  2. for(Bar bar : _bars) { 
  3.     //Do important stuff 

B

  1. private final List<Bar> _bars; 
  2. for(int i = 0; i < _bars.size(); i++) { 
  3. Bar bar = _bars.get(i); 
  4. //Do important stuff 

代碼A執(zhí)行的時候 會為這個抽象列表創(chuàng)建一個迭代器,而代碼B就直接使用 get(i) 來獲取元素,相對于代碼A省去了迭代器的開銷。

實際上這里還是需要一些權(quán)衡的。代碼A使用了迭代器,保證了在獲取元素的時候的時間復(fù)雜度是 O(1)(使用了 getNext() 和 hasNext() 方法),最終的時間復(fù)雜度為 O(n) 。但是對于代碼B,循環(huán)里每次在調(diào)用 _bars.get(i) 的時候花費的時間復(fù)雜度為 O(n) (假設(shè)這個list為一個 LinkedList),那么最終代碼B整個循環(huán)的時間復(fù)雜度就是 O(n^2) (但如果代碼B里面的list是 ArrayList, 那 get(i) 方法的時間復(fù)雜度就是 O(1)了)。所以在決定使用哪一種遍歷的方式的時候,我們需要考慮列表的底層實現(xiàn),列表的平均長度以及所使用的內(nèi)存。最后因為我們需要優(yōu)化內(nèi)存,再加上 ArrayList 在大多數(shù)情況下查找的時間復(fù)雜度為 O(1) ,最后決定選擇代碼B所使用的方法。

2.在初始化的時候預(yù)估集合的大小

從Java的這篇 文檔我們可以了解到: “一個HashMap 實例有兩個影響它性能的因素:初始大小和加載因子(load factor)。 […] 當(dāng)哈希表的大小達到初始大小和加載因子的乘積的時候,哈希表會進行 rehash操作 […] 如果在一個HashMap 實例里面要存儲多個映射關(guān)系時,我們需要設(shè)置足夠大的初始化大小以便更有效地存儲映射關(guān)系而不是讓哈希表自動增長讓后rehash,造成性能瓶頸。”

在Linkedin實踐的時候,常常碰到需要遍歷一個 ArrayList 并將這些元素保存到 HashMap 里面去。將這個 HashMap 初始化預(yù)期的大小可以避免再次哈希所帶來的開銷。初始化大小可以設(shè)置為輸入的數(shù)組大小除以默認加載因子的結(jié)果值(這里取0.7):

優(yōu)化前的代碼:

  1. HashMap<String,Foo> _map; 
  2. void addObjects(List<Foo> input) 
  3.   _map = new HashMap<String, Foo>();  
  4.   for(Foo f: input) 
  5.   { 
  6.     _map.put(f.getId(), f); 
  7.   } 

優(yōu)化后的代碼

  1. HashMap<String,Foo> _map; 
  2. void addObjects(List<Foo> input) 
  3. _map = new HashMap<String, Foo>((int)Math.ceil(input.size() / 0.7));  
  4. for(Foo f: input) 
  5. _map.put(f.getId(), f); 

3. 延遲表達式的計算

在Java中,所有的方法參數(shù)會在方法調(diào)用之前,只要有方法參數(shù)是一個表達式的都會先這個表達式進行計算(從左到右)。這個規(guī)則會導(dǎo)致一些不必要的操作??紤]到下面一個場景:使用ComparisonChain比較兩個 Foo 對象。使用這樣的比較鏈條的一個好處就是在比較的過程中只要一個 compareTo 方法返回了一個非零值整個比較就結(jié)束了,避免了許多無謂的比較。例如現(xiàn)在這個場景中的要比較的對象最先考慮他們的score, 然后是 position, 最后就是 _bar 這個屬性了:

  1. public class Foo { 
  2. private float _score; 
  3. private int _position; 
  4. private Bar _bar; 
  5.    
  6. public int compareTo (Foo other) { 
  7. return ComparisonChain.start(). 
  8. compare(_score, other.getScore()). 
  9. compare(_position, other.getPosition()). 
  10. compare(_bar.toString(), other.getBar().toString()).  
  11. result; 

但是上面這種實現(xiàn)方式總是會先生成兩個 String 對象來保存 bar.toString()和other.getBar().toString() 的值,即使這兩個字符串的比較可能不需要。避免這樣的開銷,可以為Bar 對象實現(xiàn)一個 comparator:

  1. public class Foo { 
  2. private float _score; 
  3. private int _position; 
  4. private Bar _bar; 
  5. private final BarComparator BAR_COMPARATOR = new BarComparator(); 
  6.    
  7. public int compareTo (Foo other) { 
  8. return ComparisonChain.start(). 
  9. compare(_score, other.getScore()). 
  10. compare(_position, other.getPosition()). 
  11. compare(_bar, other.getBar(), BAR_COMPARATOR). 
  12. result(); 
  13. private static class BarComparator implements Comparator<Bar> { 
  14. @Override 
  15. public int compare(Bar a, Bar b) { 
  16. return a.toString().compareTo(b.toString()); 

4. 提前編譯正則表達式

字符串的操作在Java中算是開銷比較大的操作。還好Java提供了一些工具讓正則表達式盡可能地高效。動態(tài)的正則表達式在實踐中比較少見。在接下來要舉的例子中,每次調(diào)用 String.replaceAll() 都包含了一個常量模式應(yīng)用到輸入值中去。因此我們預(yù)先編譯這個模式可以節(jié)省CPU和內(nèi)存的開銷。

優(yōu)化前:

  1. private String transform(String term) { 
  2. return outputTerm = term.replaceAll(_regex, _replacement);  

優(yōu)化后:

  1. private final Pattern _pattern = Pattern.compile(_regex); 
  2. private String transform(String term) { 
  3. String outputTerm = _pattern.matcher(term).replaceAll(_replacement);  

5. 盡可能地緩存Cache it if you can

將結(jié)果保存在緩存里也是一個避免過多開銷的方法。但緩存只適用于在相同數(shù)據(jù)集撒花姑娘嗎的相同數(shù)據(jù)操作(比如對一些配置的預(yù)處理或者一些字符串處理)?,F(xiàn)在已經(jīng)有多種LRU(Least Recently Used )緩存算法實現(xiàn),但是Linkedin使用的是 Guava cache (具體原因見這里) 大致代碼如下:

  1. private final int MAX_ENTRIES = 1000
  2. private final LoadingCache<String, String> _cache; 
  3. // Initializing the cache 
  4. _cache = CacheBuilder.newBuilder().maximumSize(MAX_ENTRIES).build(new CacheLoader<String,String>() { 
  5. @Override 
  6. public String load(String key) throws Exception { 
  7. return expensiveOperationOn(key); 
  8. ); 
  9.    
  10. //Using the cache 
  11. String output = _cache.getUnchecked(input); 

6. String的intern方法有用,但是也有危險

String 的 intern 特性有時候可以代替緩存來使用。

從這篇文檔,我們可以知道:

“A pool of strings, initially empty, is maintained privately by the class String. When the intern method is invoked, if the pool already contains a string equal to this String object as determined by the equals(Object) method, then the string from the pool is returned. Otherwise, this String object is added to the pool and a reference to this String object is returned”.

這個特性跟緩存很類似,但有一個限制,你不能設(shè)置最多可容納的元素數(shù)目。因此,如果這些intern的字符串沒有限制(比如字符串代表著一些唯一的 id),那么它會讓內(nèi)存占用飛速增長。Linkedin曾經(jīng)在這上面栽過跟頭——當(dāng)時是對一些鍵值使用intern方法,線下模擬的時候一切正常,但一旦 部署上線,系統(tǒng)的內(nèi)存占用一下就升上去了(因為大量唯一的字符串被intern了)。所以最后Linkedin選擇使用 LRU 緩存,這樣可以限制最大元素數(shù)目。

最終結(jié)果

SPR的內(nèi)存占用減少了75%,進而將feed-mixer的內(nèi)存占用減少了 50% (如下圖所示)。這些優(yōu)化減少了對象的生成,進而減少了GC得頻率,整個服務(wù)的延遲就減少了25%。

MemUtil_incapacity

本文由 greenrobot 翻譯自Linkedin

責(zé)任編輯:張偉 來源: greenrobot
相關(guān)推薦

2013-06-19 09:35:32

工程師代碼

2015-05-21 10:43:36

工程師如何寫代碼

2020-03-04 10:48:06

遠程辦公安全網(wǎng)絡(luò)監(jiān)測應(yīng)用性能監(jiān)測

2022-09-14 18:23:11

工程師面試Java

2011-11-16 09:47:47

JavaScript

2024-03-19 14:38:07

工程師管理經(jīng)驗

2019-08-28 20:38:12

好代碼編寫代碼代碼質(zhì)量

2016-09-22 16:14:45

前端設(shè)計Photoshop

2021-04-22 09:00:00

軟件工程師代碼

2018-03-02 09:10:51

2015-08-26 14:18:25

Web前端工程師價值

2015-05-04 13:24:12

工程師OpenStack公有云

2012-08-13 09:35:03

設(shè)計師程序員工程師

2012-06-28 14:23:32

Web

2022-01-16 07:12:30

軟件工程師吵架開發(fā)

2022-03-14 18:14:17

NetOps網(wǎng)絡(luò)

2015-09-30 10:25:03

前端工程師

2012-10-12 10:24:43

創(chuàng)業(yè)創(chuàng)業(yè)公司招聘

2009-03-20 09:32:52

系統(tǒng)集成工程師素質(zhì)

2009-04-10 13:35:38

吳亮《JavaScript
點贊
收藏

51CTO技術(shù)棧公眾號