自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="jey6v"><track id="jey6v"></track></cite>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

架構(gòu)師日記-從代碼到設(shè)計(jì)的性能優(yōu)化指南

作者：京東云開(kāi)發(fā)者 2023-06-05 08:19:20

開(kāi)發(fā) 架構(gòu)

性能優(yōu)化是程序開(kāi)發(fā)過(guò)程中繞不過(guò)去一個(gè)課題，本文聚焦代碼和設(shè)計(jì)兩個(gè)方面，從CPU硬件到JVM容器，從緩存設(shè)計(jì)到數(shù)據(jù)預(yù)處理，全面的展現(xiàn)了性能優(yōu)化的實(shí)施方向和落地細(xì)節(jié)。

一前言

服務(wù)性能是指服務(wù)在特定條件下的響應(yīng)速度、吞吐量和資源利用率等方面的表現(xiàn)。據(jù)統(tǒng)計(jì)，性能優(yōu)化方面的精力投入，通常占軟件開(kāi)發(fā)周期的10%到25%左右，當(dāng)然這和應(yīng)用的性質(zhì)和規(guī)模有關(guān)。性能對(duì)提高用戶體驗(yàn)，保證系統(tǒng)可靠性，降低資源使用率，甚至增強(qiáng)市場(chǎng)競(jìng)爭(zhēng)力等方面，都有著很大的影響。

性能優(yōu)化是個(gè)系統(tǒng)性工程，宏觀上可分為網(wǎng)絡(luò)，服務(wù)，存儲(chǔ)幾個(gè)方向，每個(gè)方向又可以細(xì)分為架構(gòu)，設(shè)計(jì)，代碼，可用性，度量等多個(gè)子項(xiàng)。本文將重點(diǎn)從代碼和設(shè)計(jì)兩個(gè)子項(xiàng)展開(kāi)，談?wù)勀切┨嵘阅艿闹R(shí)點(diǎn)。當(dāng)然，很多性能提升策略都是有代價(jià)的，適用于某些特定場(chǎng)景，大家在學(xué)習(xí)和使用的時(shí)候，最好帶著批判的思維，決策前，做好利弊權(quán)衡。

先簡(jiǎn)單羅列一下性能優(yōu)化方向：

二代碼優(yōu)化

2.1 關(guān)聯(lián)代碼

關(guān)聯(lián)代碼優(yōu)化是通過(guò)預(yù)加載相關(guān)代碼，避免在運(yùn)行時(shí)加載目標(biāo)代碼，造成運(yùn)行時(shí)負(fù)擔(dān)。我們知道Java有兩個(gè)類加載器：Bootstrap class loader和Application class loader。Bootstrap class loader負(fù)責(zé)加載Java API中包含的核心類，而Application class loader則負(fù)責(zé)加載自定義類。關(guān)聯(lián)代碼優(yōu)化可以通過(guò)以下幾種方式來(lái)實(shí)現(xiàn)。

預(yù)加載關(guān)聯(lián)

預(yù)加載關(guān)聯(lián)類是指在程序啟動(dòng)時(shí)預(yù)先加載目標(biāo)與關(guān)聯(lián)類，以避免在運(yùn)行時(shí)加載。可以通過(guò)靜態(tài)代碼塊來(lái)實(shí)現(xiàn)預(yù)加載，如下所示：

public class MainClass {
    static {
        // 預(yù)加載MyClass，其實(shí)現(xiàn)了相關(guān)功能
        Class.forName("com.example.MyClass");
    }
    // 運(yùn)行相關(guān)功能的代碼
    // ...
}

使用線程池

線程池可以讓多個(gè)任務(wù)使用同一個(gè)線程池中的線程，從而減少線程的創(chuàng)建和銷毀成本。使用線程池時(shí)，可以在程序啟動(dòng)時(shí)創(chuàng)建線程池，并在主線程中預(yù)加載相關(guān)代碼。然后以異步方式使用線程池中的線程來(lái)執(zhí)行相關(guān)代碼，可以提高程序的性能。

使用靜態(tài)變量

可以使用靜態(tài)變量來(lái)緩存與關(guān)聯(lián)代碼有關(guān)的對(duì)象和數(shù)據(jù)。在程序啟動(dòng)時(shí)，可以預(yù)先加載關(guān)聯(lián)代碼，并將對(duì)象或數(shù)據(jù)存儲(chǔ)在靜態(tài)變量中。然后在程序運(yùn)行時(shí)使用靜態(tài)變量中緩存的對(duì)象或數(shù)據(jù)，以避免重復(fù)加載和生成。這種方式可以有效地提高程序的性能，但需要注意靜態(tài)變量的使用，確保它們?cè)诙嗑€程環(huán)境中的安全性。

2.2 緩存對(duì)齊

在介紹緩存對(duì)齊之前，需要先普及一些CPU指令執(zhí)行的相關(guān)知識(shí)。

緩存行(Cache line)：CPU讀取內(nèi)存數(shù)據(jù)時(shí)并非一次只讀一個(gè)字節(jié)，一般是會(huì)讀一段64字節(jié)（硬件決定）長(zhǎng)度的連續(xù)的內(nèi)存塊(chunks of memory)，這些塊我們稱之為緩存行。
偽共享（False Sharing）：當(dāng)運(yùn)行在兩個(gè)不同CPU上的兩個(gè)線程寫入兩個(gè)不同的變量時(shí)，如果這兩個(gè)變量恰好存儲(chǔ)在同一個(gè) CPU 緩存行中，就會(huì)發(fā)生偽共享（False Sharing）。即當(dāng)?shù)谝粋€(gè)線程修改緩存行中其中一個(gè)變量時(shí)，其他引用此緩存行變量的線程的緩存行將會(huì)無(wú)效。如果CPU需要讀取失效的緩存行，它必須等待緩存行刷新，這會(huì)導(dǎo)致性能下降。
CPU停止運(yùn)轉(zhuǎn)（stall）：當(dāng)一個(gè)核心需要等待另一個(gè)核心重新加載緩存行時(shí)（出現(xiàn)偽共享時(shí)），它無(wú)法繼續(xù)執(zhí)行下一條指令，只能停止運(yùn)轉(zhuǎn)等待，這被稱之為stall。減少偽共享也就意味著減少了stall的發(fā)生。
IPC(instructions per cycle)：它表示平均每個(gè) CPU 周期執(zhí)行的指令數(shù)量，很顯然該數(shù)值越大性能越好。可以基于IPC指標(biāo)（比如：閾值1.0）來(lái)簡(jiǎn)單判斷程序是屬于訪問(wèn)密集型還是計(jì)算密集型。Linux系統(tǒng)中可以通過(guò)tiptop命令來(lái)查看每個(gè)進(jìn)程的CPU硬件數(shù)據(jù)：

如何簡(jiǎn)單來(lái)區(qū)分訪存密集型和計(jì)算密集型程序？

1. 如果 IPC < 1.0, 很可能是 Memory stall 占主導(dǎo)，多半意味著訪存密集型。

2. 如果IPC > 1.0, 很可能是計(jì)算密集型的程序。

CPU利用率：是指系統(tǒng)中CPU處于忙碌狀態(tài)的時(shí)間與總時(shí)間的比例。忙碌狀態(tài)時(shí)間又可以進(jìn)一步拆分為指令（instruction）執(zhí)行消耗周期cycle(%INS) 和 stalled 的周期cycle(%STL)。perf 采集了10秒內(nèi)全部 CPU 的運(yùn)行狀態(tài)：

IPC計(jì)算

IPC = instructions/cycles
上圖中，可以計(jì)算出結(jié)果為：0.79
現(xiàn)代處理器一般有多條流水線（比如：4核心），運(yùn)行 perf 的那臺(tái)機(jī)器，IPC的理論值可達(dá)到4.0。
如果我們從 IPC的角度來(lái)看，這臺(tái)機(jī)器只運(yùn)行到其處理器最高速度的 19.7%（0.79 / 4.0)。

總之，通過(guò)Top命令，看到CPU使用率之后，可以進(jìn)一步分析指令執(zhí)行消耗周期和 stalled 周期，有這些更詳細(xì)的指標(biāo)之后，就能夠知道該如何更好地對(duì)應(yīng)用和系統(tǒng)進(jìn)行調(diào)優(yōu)。

緩存對(duì)齊：是通過(guò)調(diào)整數(shù)據(jù)在內(nèi)存中的分布，讓數(shù)據(jù)在被緩存時(shí)，更有利于CPU從緩存中讀取，從而避免了頻繁的內(nèi)存讀取，提高了數(shù)據(jù)訪問(wèn)的速度。

緩存填充(Padding)

減少偽共享也就意味著減少了stall的發(fā)生，其中一個(gè)手段就是通過(guò)填充(Padding)數(shù)據(jù)的形式，即在適當(dāng)?shù)木嚯x處插入一些對(duì)齊的空間來(lái)填充緩存行，從而使每個(gè)線程的修改不會(huì)臟污同一個(gè)緩存行。

/**
 * 緩存行填充測(cè)試
 *
 * @author liuhuiqing
 * @date 2023年04月28日
 */
public class FalseSharingTest {
    private static final int LOOP_NUM = 1000000000;

    public static void main(String[] args) throws InterruptedException {
        Struct struct = new Struct();
        long start = System.currentTimeMillis();
        Thread t1 = new Thread(() -> {
            for (int i = 0; i < LOOP_NUM; i++) {
                struct.x++;
            }
        });

        Thread t2 = new Thread(() -> {
            for (int i = 0; i < LOOP_NUM; i++) {
                struct.y++;
            }
        });
        t1.start();
        t2.start();
        t1.join();
        t2.join();
        System.out.println("cost time [" + (System.currentTimeMillis() - start) + "] ms");
    }

    static class Struct {
        // 共享變量
        volatile long x;
        // 一個(gè)long占用8個(gè)字節(jié)，此處定義7個(gè)填充數(shù)據(jù)，來(lái)保證業(yè)務(wù)數(shù)據(jù)x和y分布在不同的緩存行中
        long p1, p2, p3, p4, p5, p6, p7;
        // long[] paddings = new long[7];// 使用數(shù)組代替不會(huì)生效，思考一下，為什么？
        // 共享變量
        volatile long y;
    }
}

經(jīng)過(guò)本地測(cè)試，這種以空間換時(shí)間的方式，即實(shí)現(xiàn)了緩存行數(shù)據(jù)對(duì)齊的方式，在執(zhí)行效率方面，比沒(méi)有對(duì)齊之前，提高了5倍！

@Contended注解

在Java 8中，引入了@Contended注解，該注解可以用來(lái)告訴JVM對(duì)字段進(jìn)行緩存對(duì)齊（將字段放入不同的緩存行），從而提高程序的性能。使用@Contended注解時(shí)，需要在JVM啟動(dòng)時(shí)添加參數(shù)-XX:-RestrictContended，實(shí)現(xiàn)如下所示：

import sun.misc.Contended;

public class ContendedTest {

    @Contended
    volatile long a;
    @Contended
    volatile long b;

    public static void main(String[] args) throws InterruptedException {
        ContendedTest c = new ContendedTest();
        Thread thread1 = new Thread(() -> {
            for (int i = 0; i < 10000_0000L; i++) {
                c.a = i;
            }
        });

        Thread thread2 = new Thread(() -> {
            for (int i = 0; i < 10000_0000L; i++) {
                c.b = i;
            }
        });
        final long start = System.nanoTime();
        thread1.start();
        thread2.start();
        thread1.join();
        thread2.join();
        System.out.println((System.nanoTime() - start) / 100_0000);
    }
}

對(duì)齊內(nèi)存與本地變量

緩存填充是解決CPU偽共享問(wèn)題的解決方案之一，在實(shí)際應(yīng)用中，是否還有其它方案來(lái)解決這一問(wèn)題呢？答案是有的：即對(duì)齊內(nèi)存和本地變量。

對(duì)齊內(nèi)存：內(nèi)存行的大小一般為64個(gè)字節(jié)，這個(gè)大小是硬件決定的，但大多數(shù)編譯器默認(rèn)情況下都以4字節(jié)的邊界對(duì)齊，通過(guò)將變量按照內(nèi)存行的大小對(duì)齊，可以避免偽共享問(wèn)題；
本地變量：在不同線程之間使用不同的變量存儲(chǔ)數(shù)據(jù)，避免不同的線程之間共享同一塊內(nèi)存，Java中的ThreadLocal就是一種典型的實(shí)現(xiàn)方式；

2.3 分支預(yù)測(cè)

分支預(yù)測(cè)是CPU動(dòng)態(tài)執(zhí)行技術(shù)中的主要內(nèi)容，是通過(guò)猜測(cè)程序中的分支語(yǔ)句（如if-else語(yǔ)句或者循環(huán)語(yǔ)句）的執(zhí)行路徑來(lái)提高CPU執(zhí)行效率的技術(shù)。其原理是根據(jù)之前的歷史記錄和統(tǒng)計(jì)數(shù)據(jù)，預(yù)測(cè)程序下一步要執(zhí)行的指令是分支跳轉(zhuǎn)指令還是順序執(zhí)行指令，從而提前加載相關(guān)數(shù)據(jù)，減少CPU等待指令執(zhí)行的空閑時(shí)間。預(yù)測(cè)準(zhǔn)確率越高，CPU的性能提升就越高。那么如何提高預(yù)測(cè)的準(zhǔn)確率呢？

關(guān)注圈復(fù)雜度

過(guò)多的條件語(yǔ)句和嵌套的條件語(yǔ)句會(huì)導(dǎo)致分支的預(yù)測(cè)難度大幅上升，從而降低分支預(yù)測(cè)的準(zhǔn)確率和效率。一般來(lái)說(shuō)，可以通過(guò)優(yōu)化代碼邏輯結(jié)構(gòu)、減少冗余等方式來(lái)避免過(guò)多的條件語(yǔ)句和嵌套的條件語(yǔ)句。

優(yōu)先處理常用路徑

在編寫代碼時(shí)，應(yīng)該優(yōu)先處理常用路徑，以減少CPU對(duì)分支的預(yù)測(cè)，提高預(yù)測(cè)準(zhǔn)確率和效率。例如，在if-else語(yǔ)句中，應(yīng)該將常用的路徑放在if語(yǔ)句中，而將不常用的路徑放在else語(yǔ)句中。

2.4 寫時(shí)復(fù)制

Copy-On-Write (COW)是一種內(nèi)存管理機(jī)制，也被稱為寫時(shí)復(fù)制。其主要思想是在需要寫入數(shù)據(jù)時(shí)，先進(jìn)行數(shù)據(jù)拷貝，然后再進(jìn)行操作，從而避免了對(duì)數(shù)據(jù)進(jìn)行不必要的復(fù)制和操作。COW機(jī)制可以有效地降低內(nèi)存使用率，提高程序的性能。

在創(chuàng)建進(jìn)程或線程的時(shí)候，操作系統(tǒng)為其分配內(nèi)存時(shí)，不是復(fù)制一個(gè)完整的物理地址空間，而是創(chuàng)建一個(gè)指向父進(jìn)程/線程物理地址空間的虛擬地址空間，并為它們的所有頁(yè)面設(shè)置"只讀"標(biāo)志。當(dāng)子進(jìn)程/線程需要修改頁(yè)面時(shí)，會(huì)觸發(fā)一個(gè)缺頁(yè)異常，并將涉及到的頁(yè)面進(jìn)行數(shù)據(jù)的復(fù)制，并為復(fù)制的頁(yè)面重新分配內(nèi)存。子進(jìn)程/線程只能夠操作復(fù)制后的地址空間，父進(jìn)程/線程的原始內(nèi)存空間則被保留。

由于COW機(jī)制在寫入之前進(jìn)行數(shù)據(jù)拷貝，所以可以有效地避免頻繁的內(nèi)存拷貝和分配操作，降低了內(nèi)存的占用率，提高了程序的性能。并且，COW機(jī)制也避免了數(shù)據(jù)的不必要復(fù)制，從而減少了內(nèi)存的消耗和內(nèi)存碎片的產(chǎn)生，提高了系統(tǒng)中可用內(nèi)存的數(shù)量。

ArrayList類可以使用Copy-On-Write機(jī)制來(lái)提高性能。

// 初始化數(shù)組
private List<String> list = new CopyOnWriteArrayList<>();

// 向數(shù)組中添加元素
list.add("value");

需要注意的是，Copy-On-Write機(jī)制適用于讀操作比寫操作多的情況，因?yàn)樗俣▽懖僮鞯念l率較低，從而可以通過(guò)犧牲復(fù)制的開(kāi)銷來(lái)減少鎖的操作和內(nèi)存分配的消耗。

2.5 內(nèi)聯(lián)優(yōu)化

在Java中，每次調(diào)用方法都需要進(jìn)行一些額外的操作，例如創(chuàng)建堆棧幀、保存寄存器狀態(tài)等，這些額外的操作會(huì)消耗一定的時(shí)間和內(nèi)存資源。內(nèi)聯(lián)優(yōu)化是一種編譯器優(yōu)化技術(shù)，Java虛擬機(jī)通常使用即時(shí)編譯器（JIT）來(lái)進(jìn)行方法內(nèi)聯(lián)，用于提高程序的性能。內(nèi)聯(lián)優(yōu)化的目標(biāo)是將函數(shù)的調(diào)用替換成函數(shù)本身的代碼，以減少函數(shù)調(diào)用的開(kāi)銷，從而提高程序的運(yùn)行效率。

需要注意的是，方法內(nèi)聯(lián)并不是在所有情況下都能夠提高程序的運(yùn)行效率。如果方法內(nèi)聯(lián)導(dǎo)致代碼復(fù)雜度增加或者內(nèi)存占用增加，反而會(huì)降低程序的性能。因此，在使用方法內(nèi)聯(lián)時(shí)需要根據(jù)具體情況進(jìn)行權(quán)衡和優(yōu)化。

final修飾符

final修飾符可以使方法成為不可重寫的方法。因?yàn)椴豢芍貙?，所以在編譯器優(yōu)化時(shí)可以將它們的代碼嵌入到調(diào)用它們的代碼中，從而避免函數(shù)調(diào)用的開(kāi)銷。使用final修飾符可以在一定程度上提高程序的性能，但同時(shí)也減弱了代碼的可擴(kuò)展性。

限制方法長(zhǎng)度

方法的長(zhǎng)度會(huì)影響其在編譯時(shí)能否被內(nèi)聯(lián)。通常情況下，長(zhǎng)度較小的方法更容易被內(nèi)聯(lián)。因此，可以在設(shè)計(jì)中將代碼分解和重構(gòu)為更小的函數(shù)。這種方式并不是100％確保可以內(nèi)聯(lián)，但至少提高了實(shí)現(xiàn)此優(yōu)化的機(jī)會(huì)。內(nèi)聯(lián)調(diào)優(yōu)參數(shù)，如下表格：

JVM參數(shù)	默認(rèn)值 (JDK 8, Linux x86_64)	參數(shù)說(shuō)明
-XX:MaxInlineSize=<n>	35 字節(jié)碼	內(nèi)聯(lián)方法大小上限
-XX:FreqInlineSize=<n>	325 字節(jié)碼	內(nèi)聯(lián)熱方法的最大值
-XX:InlineSmallCode=<n>	1000字節(jié)的原生代碼（非分層） 2000字節(jié)的原生代碼（分層編譯）	如果最后一層的的分層編譯代碼量已經(jīng)超過(guò)這個(gè)值，就不進(jìn)行內(nèi)聯(lián)編譯
-XX:MaxInlineLevel=<n>	9	調(diào)用層級(jí)比這個(gè)值深的話，就不進(jìn)行內(nèi)聯(lián)

內(nèi)聯(lián)注解

在Java 5之后，引入了內(nèi)聯(lián)注解@inline，使用此注解可以在編譯時(shí)通知編譯器，將該方法內(nèi)聯(lián)到它的調(diào)用處。注解@inline在Java 9之后已經(jīng)被棄用，可以使用@ForceInline注釋來(lái)替代，同時(shí)設(shè)置JVM參數(shù)：

-XX:+UnlockExperimentalVMOptions -XX:+EnableJVMCI -XX:+JVMCICompiler

@ForceInline
public static int add(int a, int b) {
    return a + b;
}

2.6 編碼優(yōu)化

反射機(jī)制

Java反射在一定程度上會(huì)影響性能，因?yàn)樗枰谶\(yùn)行時(shí)進(jìn)行類型檢查轉(zhuǎn)換和方法查找，這比直接調(diào)用方法會(huì)更耗時(shí)。此外，反射也不會(huì)受到編譯器的優(yōu)化，因此可能會(huì)導(dǎo)致更慢的代碼執(zhí)行速度。

要解決這個(gè)問(wèn)題有以下幾種方式：

盡可能使用原生方法調(diào)用，而不是通過(guò)反射調(diào)用；
盡可能緩存反射調(diào)用結(jié)果，避免重復(fù)調(diào)用。例如，可以將反射結(jié)果緩存到靜態(tài)變量中，以便下次使用時(shí)直接獲取，而不必再次使用反射；
使用字節(jié)碼增強(qiáng)技術(shù)；

下面著重介紹一下反射結(jié)果緩存和字節(jié)碼增強(qiáng)兩種方案。

反射結(jié)果緩存可以大幅減少反射過(guò)程中的類型檢查，類型轉(zhuǎn)換和方法查找等動(dòng)作，是降低反射對(duì)程序執(zhí)行效率影響的一種優(yōu)化策略。

/**
 * 反射工具類
 *
 * @author liuhuiqing
 * @date 2023年5月7日
 */
public abstract class BeanUtils {
    private static final Logger LOGGER = LoggerFactory.getLogger(BeanUtils.class);
    private static final Field[] NO_FIELDS = {};
    private static final Map<Class<?>, Field[]> DECLARED_FIELDS_CACHE = new ConcurrentReferenceHashMap<Class<?>, Field[]>(256);
    private static final Map<Class<?>, Field[]> FIELDS_CACHE = new ConcurrentReferenceHashMap<Class<?>, Field[]>(256);

    /**
     * 獲取當(dāng)前類及其父類的屬性數(shù)組
     *
     * @param clazz
     * @return
     */
    public static Field[] getFields(Class<?> clazz) {
        if (clazz == null) {
            throw new IllegalArgumentException("Class must not be null");
        }
        Field[] result = FIELDS_CACHE.get(clazz);
        if (result == null) {
            Field[] fields = NO_FIELDS;
            Class<?> searchType = clazz;
            while (Object.class != searchType && searchType != null) {
                Field[] tempFields = getDeclaredFields(searchType);
                fields = mergeArray(fields, tempFields);
                searchType = searchType.getSuperclass();
            }
            result = fields;
            FIELDS_CACHE.put(clazz, (result.length == 0 ? NO_FIELDS : result));
        }
        return result;
    }

    /**
     * 獲取當(dāng)前類屬性數(shù)組(不包含父類的屬性)
     *
     * @param clazz
     * @return
     */
    public static Field[] getDeclaredFields(Class<?> clazz) {
        if (clazz == null) {
            throw new IllegalArgumentException("Class must not be null");
        }
        Field[] result = DECLARED_FIELDS_CACHE.get(clazz);
        if (result == null) {
            result = clazz.getDeclaredFields();
            DECLARED_FIELDS_CACHE.put(clazz, (result.length == 0 ? NO_FIELDS : result));
        }
        return result;
    }

    /**
     * 數(shù)組合并
     *
     * @param array1
     * @param array2
     * @param <T>
     * @return
     */
    public static <T> T[] mergeArray(final T[] array1, final T... array2) {
        if (array1 == null || array1.length < 1) {
            return array2;
        }
        if (array2 == null || array2.length < 1) {
            return array1;
        }
        Class<?> compType = array1.getClass().getComponentType();
        int newArrLength = array1.length + array2.length;
        T[] newArr = (T[]) Array.newInstance(compType, newArrLength);
        int firstArrayLen = array1.length;
        System.arraycopy(array1, 0, newArr, 0, firstArrayLen);
        try {
            System.arraycopy(array2, 0, newArr, firstArrayLen, array2.length);
        } catch (ArrayStoreException ase) {
            final Class<?> type2 = array2.getClass().getComponentType();
            if (!compType.isAssignableFrom(type2)) {
                throw new IllegalArgumentException("Cannot store " + type2.getName() + " in an array of "
                        + compType.getName(), ase);
            }
            throw ase;
        }
        return newArr;
    }
}

字節(jié)碼增強(qiáng)技術(shù)，一般使用第三方庫(kù)來(lái)實(shí)現(xiàn)，例如Javassist或Byte Buddy，在運(yùn)行時(shí)生成字節(jié)碼，從而避免使用反射。

為什么動(dòng)態(tài)字節(jié)碼生成方式相比反射也可以提高執(zhí)行效率呢？

動(dòng)態(tài)字節(jié)碼生成的方式在編譯期就已經(jīng)將類型信息確定下來(lái)，無(wú)需進(jìn)行類型檢查和轉(zhuǎn)換；
動(dòng)態(tài)字節(jié)碼生成的方式可以直接調(diào)用方法，無(wú)需查找，提高了執(zhí)行效率；
動(dòng)態(tài)字節(jié)碼生成的方式只需要在生成字節(jié)碼時(shí)獲取一次Method對(duì)象，多次調(diào)用時(shí)可以直接使用，避免了重復(fù)獲取Method對(duì)象的開(kāi)銷；

這里就不再舉例說(shuō)明了，感興趣的同學(xué)可以自行查閱資料進(jìn)行深入學(xué)習(xí)。

異常處理

有效的處理異常可以保證程序的穩(wěn)定性和可靠性。但異常的處理對(duì)性能還是有一定的影響的，這一點(diǎn)常常被人忽視。影響性能的具體表現(xiàn)為：

響應(yīng)延遲：當(dāng)異常被拋出時(shí)，Java虛擬機(jī)需要查找并執(zhí)行相應(yīng)的異常處理程序，這會(huì)導(dǎo)致一定的延遲。如果程序中存在大量的異常處理，這些延遲可能會(huì)累積，導(dǎo)致程序的整體性能下降。
內(nèi)存占用：異常處理需要在堆棧中創(chuàng)建異常對(duì)象，這些對(duì)象需要占用內(nèi)存。如果程序中存在大量的異常處理，這些異常對(duì)象可能會(huì)占用大量的內(nèi)存，導(dǎo)致程序的整體內(nèi)存占用量增加。
CPU占用：異常處理需要執(zhí)行額外的代碼，這會(huì)導(dǎo)致CPU占用率增加。如果程序中存在大量的異常處理，這些額外的代碼可能會(huì)導(dǎo)致CPU占用率過(guò)高，導(dǎo)致程序的整體性能下降。

一些基準(zhǔn)測(cè)試顯示，異常處理可能會(huì)導(dǎo)致程序的性能下降幾個(gè)百分點(diǎn)。在Java虛擬機(jī)規(guī)范中提到，在沒(méi)有異常發(fā)生的情況下，基于堆棧的方法調(diào)用可能比基于異常的方法調(diào)用快2-3倍。此外，一些實(shí)驗(yàn)表明，在異常處理程序中使用大量的try-catch語(yǔ)句，可能會(huì)導(dǎo)致性能下降10倍以上。

為避免這些問(wèn)題，在編寫代碼時(shí)謹(jǐn)慎地使用異常處理機(jī)制，并確保對(duì)異常進(jìn)行適當(dāng)?shù)挠涗浐蛨?bào)告，避免過(guò)度使用異常處理機(jī)制。

日志處理

先看以下代碼：

LOGGER.info("result:" + JsonUtil.write2JsonStr(contextAdContains) + ", logid = " + DigitThreadLocal.getLogId());

以上示例代碼中，類似的日志打印方式很常見(jiàn)，難道有什么問(wèn)題嗎？

性能問(wèn)題：每次使用+進(jìn)行字符串拼接時(shí)，都會(huì)創(chuàng)建一個(gè)新的字符串對(duì)象，這可能會(huì)導(dǎo)致內(nèi)存分配和垃圾回收的開(kāi)銷增加;
可讀性問(wèn)題：使用+進(jìn)行字符串拼接時(shí)，代碼可能會(huì)變得難以閱讀和理解，特別是在需要連接多個(gè)字符串時(shí);
如果日志級(jí)別調(diào)整到ERROR模式，我們希望日志的字符串內(nèi)容不需要進(jìn)行加工計(jì)算，但這種寫法，即使日志處于不需要打印的模式，日志內(nèi)容也進(jìn)行了無(wú)效計(jì)算；

特別實(shí)在請(qǐng)求量和日志打印量比較高的場(chǎng)景下，日志內(nèi)容的序列化和寫文件操作，對(duì)服務(wù)的耗時(shí)影響可以達(dá)到10%，甚至更多。

臨時(shí)對(duì)象

臨時(shí)對(duì)象通常是指在方法內(nèi)部創(chuàng)建的對(duì)象。大量創(chuàng)建臨時(shí)對(duì)象會(huì)導(dǎo)致Java虛擬機(jī)頻繁進(jìn)行垃圾回收，從而影響程序的性能。也會(huì)占用大量的內(nèi)存空間，從而導(dǎo)致程序崩潰或者出現(xiàn)內(nèi)存泄漏等問(wèn)題。

為了避免大量創(chuàng)建臨時(shí)對(duì)象，在編碼時(shí)，可以采取以下措施：

字符串拼接中，使用StringBuilder或StringBuffer進(jìn)行字符串拼接，避免使用連接符，每次都創(chuàng)建新的字符串對(duì)象；
在集合操作中，盡量使用批量操作，如addAll、removeAll等，避免頻繁的add、remove操作，觸發(fā)數(shù)組的擴(kuò)容或者縮容；
在正則表達(dá)式中，可以使用Pattern.compile()方法預(yù)編譯正則表達(dá)式，避免每次都創(chuàng)建新的Matcher對(duì)象；
盡量使用基本數(shù)據(jù)類型，避免使用包裝類，因?yàn)榘b類的創(chuàng)建和銷毀都會(huì)產(chǎn)生臨時(shí)對(duì)象；
盡量使用對(duì)象池的方式創(chuàng)建和管理對(duì)象，比如使用靜態(tài)工廠方法創(chuàng)建對(duì)象，避免使用new關(guān)鍵字創(chuàng)建對(duì)象，因?yàn)殪o態(tài)工廠方法可以重用對(duì)象，避免創(chuàng)建新的臨時(shí)對(duì)象；

臨時(shí)對(duì)象的生命周期應(yīng)該盡可能短，以便及時(shí)釋放內(nèi)存資源。臨時(shí)對(duì)象的生命周期過(guò)長(zhǎng)通常是由以下原因引起的：

對(duì)象未被正確地釋放：如果在方法執(zhí)行完畢后，臨時(shí)對(duì)象沒(méi)有被正確地釋放，就會(huì)導(dǎo)致內(nèi)存泄漏風(fēng)險(xiǎn)；
對(duì)象過(guò)度共享：如果臨時(shí)對(duì)象被過(guò)度共享，就可能會(huì)導(dǎo)致多個(gè)線程同時(shí)訪問(wèn)同一個(gè)對(duì)象，從而導(dǎo)致線程安全問(wèn)題和性能問(wèn)題；
對(duì)象創(chuàng)建過(guò)于頻繁：如果在方法內(nèi)部頻繁地創(chuàng)建臨時(shí)對(duì)象，就會(huì)導(dǎo)致內(nèi)存開(kāi)銷過(guò)大，可能會(huì)引起性能甚至內(nèi)存溢出問(wèn)題；

為避免臨時(shí)對(duì)象的生命周期過(guò)長(zhǎng)，建議采取以下措施：

及時(shí)釋放對(duì)象：在方法執(zhí)行完畢后，應(yīng)該及時(shí)釋放臨時(shí)對(duì)象（比如主動(dòng)將對(duì)象設(shè)置為null），以便回收內(nèi)存資源；
避免過(guò)度共享：在多線程環(huán)境下，應(yīng)該避免過(guò)度共享臨時(shí)對(duì)象，可以使用局部變量或ThreadLocal等方式來(lái)避免共享問(wèn)題；
對(duì)象池技術(shù)：使用對(duì)象池技術(shù)可以避免頻繁創(chuàng)建臨時(shí)對(duì)象，從而降低內(nèi)存開(kāi)銷。對(duì)象池可以預(yù)先創(chuàng)建一定數(shù)量的對(duì)象，并在需要時(shí)從池中獲取對(duì)象，使用完畢后再將對(duì)象放回池中；

小結(jié)

正所謂：“不積跬步，無(wú)以至千里；不積小流，無(wú)以成江海”。以上列舉的編碼細(xì)節(jié)，都會(huì)直接或間接的影響服務(wù)的執(zhí)行效率，只是影響多少的問(wèn)題。現(xiàn)實(shí)中，有時(shí)候我們不必過(guò)于苛求，但它們有一個(gè)共同的注腳：極客精神。

三設(shè)計(jì)優(yōu)化

3.1 緩存

合理使用緩存可以有效提高應(yīng)用程序的性能，縮短數(shù)據(jù)訪問(wèn)時(shí)間，降低對(duì)數(shù)據(jù)源的依賴性。緩存可以進(jìn)行多層級(jí)的設(shè)計(jì)，舉例，為了提高運(yùn)行效率，CPU就設(shè)計(jì)了L1-L3三級(jí)緩存。在應(yīng)用設(shè)計(jì)的時(shí)候，我們也可以按照業(yè)務(wù)訴求進(jìn)行層設(shè)計(jì)。常見(jiàn)的分層設(shè)計(jì)有本地緩存（L1），遠(yuǎn)程分布式緩存（L2）兩級(jí)。

本地緩存可以減少網(wǎng)絡(luò)請(qǐng)求、節(jié)約計(jì)算資源、減少高負(fù)載數(shù)據(jù)源訪問(wèn)等優(yōu)勢(shì)，進(jìn)而提高應(yīng)用程序的響應(yīng)速度和吞吐量。常見(jiàn)的本地緩存中間件有：Caffeine、Guava Cache、Ehcache。當(dāng)然你也可以在使用類似Map容器，在應(yīng)用程序中構(gòu)建自己的緩存結(jié)構(gòu)。分布式緩存相比本地緩存的優(yōu)勢(shì)是可以保證數(shù)據(jù)一致性、只保留一份數(shù)據(jù)，減少數(shù)據(jù)冗余、可以實(shí)現(xiàn)數(shù)據(jù)分片，實(shí)現(xiàn)大容量數(shù)據(jù)的存儲(chǔ)。常見(jiàn)的分布式緩存有：Redis、Memcached。

實(shí)現(xiàn)一個(gè)簡(jiǎn)單的LRU本地緩存示例如下：

/**
 * Least recently used 內(nèi)存緩存過(guò)期策略:最近最少使用
 * Title: 帶容量的<b>線程不安全的</b>最近訪問(wèn)排序的Hashmap
 * Description: 最后訪問(wèn)的元素在最后面。<br>
 * 如果要線程安全，請(qǐng)使用<pre>Collections.synchronizedMap(new LRUHashMap(123));</pre> <br>
 *
 * @author: liuhuiqing
 * @date: 20123/4/27
 */
public class LRUHashMap<K, V> extends LinkedHashMap<K, V> {

    /**
     * The Size.
     */
    private final int maxSize;

    /**
     * 初始化一個(gè)最大值, 按訪問(wèn)順序排序
     *
     * @param maxSize the max size
     */
    public LRUHashMap(int maxSize) {
        //0.75是默認(rèn)值，true表示按訪問(wèn)順序排序
        super(maxSize, 0.75f, true);
        this.maxSize = maxSize;
    }

    /**
     * 初始化一個(gè)最大值, 按指定順序排序
     *
     * @param maxSize     最大值
     * @param accessOrder true表示按訪問(wèn)順序排序，false為插入順序
     */
    public LRUHashMap(int maxSize, boolean accessOrder) {
        //0.75是默認(rèn)值，true表示按訪問(wèn)順序排序，false為插入順序
        super(maxSize, 0.75f, accessOrder);
        this.maxSize = maxSize;
    }

    @Override
    protected boolean removeEldestEntry(Map.Entry<K, V> eldest) {
        return super.size() > maxSize;
    }

}

3.2 異步

異步可以提高程序的性能和響應(yīng)能力，使其能更高效地處理大規(guī)模數(shù)據(jù)或并發(fā)請(qǐng)求。其底層原理涉及到操作系統(tǒng)的多線程、事件循環(huán)、任務(wù)隊(duì)列以及回調(diào)函數(shù)等關(guān)鍵技術(shù)，除此之外，異步的思想在應(yīng)用架構(gòu)設(shè)計(jì)方面也有廣泛的應(yīng)用。常規(guī)的多線程，消息隊(duì)列，響應(yīng)式編程等異步處理方案這里就不再展開(kāi)介紹了，這里介紹兩個(gè)大家可能容易忽視但實(shí)用技能：非阻塞IO和協(xié)程。

非阻塞IO

Java Servlet 3.0規(guī)范中引入了異步Servlet的概念，可以幫助開(kāi)發(fā)者提高應(yīng)用程序的性能和并發(fā)處理能力，其原理是非阻塞IO使用單線程同時(shí)處理多個(gè)請(qǐng)求，避免了線程切換和阻塞的開(kāi)銷，特別是在讀取大文件或者進(jìn)行復(fù)雜耗時(shí)計(jì)算場(chǎng)景時(shí)，可以避免阻塞其他請(qǐng)求的處理。Spring MVC框架中也提供了相應(yīng)的異步處理方案。

?使用Callable方式實(shí)現(xiàn)異步處理

@GetMapping("/async/callable")
public WebAsyncTask<String> asyncCallable() {
    Callable<String> callable = () -> {
        // 執(zhí)行異步操作
        return "異步任務(wù)已完成";
    };
    return new WebAsyncTask<>(10000, callable);
}

?使用DeferredResult方式實(shí)現(xiàn)異步處理

@GetMapping("/async/deferredresult")
public DeferredResult<String> asyncDeferredResult() {
    DeferredResult<String> deferredResult = new DeferredResult<>(10000L);
    // 異步處理完成后設(shè)置結(jié)果
    deferredResult.setResult("DeferredResult異步任務(wù)已完成");
    return deferredResult;
}

協(xié)程

我們知道線程的創(chuàng)建、銷毀都十分消耗系統(tǒng)資源，所以有了線程池，但這還不夠，因?yàn)榫€程的數(shù)量是有限的（千級(jí)別），線程會(huì)阻塞操作系統(tǒng)線程，無(wú)法盡可能的提高吞吐量。因?yàn)槭褂镁€程的成本很高，所以才會(huì)有了虛擬線程，它是用戶態(tài)線程，成本是相當(dāng)?shù)土?，調(diào)度也完全由用戶進(jìn)行控制（JDK 中的調(diào)度器），它同樣可以進(jìn)行阻塞，但不用阻塞操作系統(tǒng)線程，充分提高了硬件利用率，高并發(fā)也上了一個(gè)量級(jí)。

很長(zhǎng)一段時(shí)間，協(xié)程概念并非作為JVM內(nèi)置的功能，而是通過(guò)第三方庫(kù)或框架實(shí)現(xiàn)的。目前比較常用的協(xié)程實(shí)現(xiàn)庫(kù)有Quasar、Kilim等。但在Java19版本中，引入了虛擬線程（Virtual Threads ）的支持（處于Preview階段）。

虛擬線程是java.lang.Thread的一個(gè)實(shí)現(xiàn)，可以使用java.lang.Thread.Builder接口創(chuàng)建

Thread thread = Thread.ofVirtual()
     .name("Virtual Threads")
     .unstarted(runnable);

也可以通過(guò)一個(gè)線程工廠類進(jìn)行創(chuàng)建：

ThreadFactory factory = Thread.ofVirtual().factory();

虛擬線程運(yùn)行的載體必須是線程，同一個(gè)線程中可以運(yùn)行多個(gè)虛擬線程實(shí)例。

3.3 并行

并行處理的思想在大數(shù)據(jù)，多任務(wù)，流水線處理，模型訓(xùn)練等各個(gè)方面發(fā)揮著重要作用，包括前面介紹的異步（多線程，協(xié)程，消息等），也是建立在并行的基礎(chǔ)上。在應(yīng)用層面，典型的場(chǎng)景有：

分布式計(jì)算框架中的MapReduce就是采用一種分而治之的思想設(shè)計(jì)出來(lái)的，將復(fù)雜或計(jì)算量大的任務(wù)，切分成一個(gè)個(gè)小的任務(wù)，小任務(wù)分別在不同的線程或服務(wù)器上并行的執(zhí)行，最終再匯總每個(gè)小任務(wù)的結(jié)果。
邊緣計(jì)算（Edge Computing）是一種分布式計(jì)算范式，它將計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)服務(wù)的部分功能從云數(shù)據(jù)中心延伸至離數(shù)據(jù)源更近的地方，即網(wǎng)絡(luò)的邊緣。這種計(jì)算方式能夠?qū)崿F(xiàn)低延遲、節(jié)省帶寬、提高數(shù)據(jù)安全性以及實(shí)時(shí)處理與分析等優(yōu)勢(shì)。

在代碼實(shí)現(xiàn)方面，做好解耦設(shè)計(jì)，接下來(lái)就可以進(jìn)行并行設(shè)計(jì)了，比如：

多個(gè)請(qǐng)求可以通過(guò)多線程并行處理，每個(gè)請(qǐng)求的不同處理階段;
如查詢階段，可以采用協(xié)程并行執(zhí)行;
存儲(chǔ)階段，可以采用消息訂閱發(fā)布的方式進(jìn)行處理；
監(jiān)控統(tǒng)計(jì)階段，就可以采用NIO異步的方式進(jìn)行指標(biāo)數(shù)據(jù)文件的寫入；
請(qǐng)求/響應(yīng)采用非阻塞IO模式；

3.4 池化

池化就是初始預(yù)設(shè)資源，降低每次獲取資源的消耗，如創(chuàng)建線程的開(kāi)銷，獲取遠(yuǎn)程連接的開(kāi)銷等。典型的場(chǎng)景就是線程池，數(shù)據(jù)庫(kù)連接池，業(yè)務(wù)處理結(jié)果緩存池等。

以數(shù)據(jù)庫(kù)連接池為例，其本質(zhì)是一個(gè) socket 的連接。為每個(gè)請(qǐng)求打開(kāi)和維護(hù)數(shù)據(jù)庫(kù)連接，尤其是動(dòng)態(tài)數(shù)據(jù)庫(kù)驅(qū)動(dòng)的應(yīng)用程序的請(qǐng)求，既昂貴又浪費(fèi)資源。為什么這么說(shuō)呢？以MySQL數(shù)據(jù)庫(kù)建立連接（TCP協(xié)議）為例，建立連接總共分三步：

建立TCP連接，通過(guò)三次握手實(shí)現(xiàn)；
服務(wù)器發(fā)送給客戶端「握手信息」，客戶端響應(yīng)該握手消息；
客戶端「發(fā)送認(rèn)證包」，用于用戶驗(yàn)證，驗(yàn)證成功后，服務(wù)器返回OK響應(yīng)，之后開(kāi)始執(zhí)行命令；

簡(jiǎn)單粗略統(tǒng)計(jì)，完成一次數(shù)據(jù)庫(kù)連接，客戶端和服務(wù)器之間需要至少往返7次，總計(jì)平均耗時(shí)大約在200ms左右，這對(duì)于很對(duì)C端服務(wù)來(lái)說(shuō)，幾乎是不能接受的。

落實(shí)到代碼編寫層面，也可以借助這一思想來(lái)優(yōu)化我們的程序執(zhí)行性能。

公用的數(shù)據(jù)可以全局只定義一份，比如使用枚舉，static修飾的容器對(duì)象等；
根據(jù)實(shí)際情況，提前設(shè)置List，Map等容器對(duì)象的初始化容量大小，防止后面的擴(kuò)容，對(duì)性能的影響；
亨元設(shè)計(jì)模式的應(yīng)用等；

3.5 預(yù)處理

一般需要池化的內(nèi)容，都是需要預(yù)處理的，比如為了保證服務(wù)的穩(wěn)定性，線程池和數(shù)據(jù)庫(kù)連接池等需要池化的內(nèi)容在JVM容器啟動(dòng)時(shí)，處理真正請(qǐng)求之前，對(duì)這些池化內(nèi)容進(jìn)行預(yù)處理，等到真正的業(yè)務(wù)處理請(qǐng)求過(guò)來(lái)時(shí)，可以正常的快速處理。除此之外，預(yù)處理還可以體現(xiàn)在系統(tǒng)架構(gòu)層面。

為了提高響應(yīng)性能，將部分業(yè)務(wù)數(shù)據(jù)提前預(yù)加載到內(nèi)存中；
為了減輕CPU壓力，將計(jì)算邏輯提前執(zhí)行，直接將計(jì)算后的結(jié)果數(shù)據(jù)保存下來(lái)，直接供調(diào)用方使用；
為了降低網(wǎng)絡(luò)帶寬成本，將傳輸數(shù)據(jù)通過(guò)壓縮算法進(jìn)行壓縮處理，到了目標(biāo)服務(wù)，在進(jìn)行解壓，獲得原始數(shù)據(jù)；
Myibatis為了提高SQL語(yǔ)句的安全性和執(zhí)行效率，也引入了預(yù)處理的概念；

四總結(jié)

性能優(yōu)化是程序開(kāi)發(fā)過(guò)程中繞不過(guò)去一個(gè)課題，本文聚焦代碼和設(shè)計(jì)兩個(gè)方面，從CPU硬件到JVM容器，從緩存設(shè)計(jì)到數(shù)據(jù)預(yù)處理，全面的展現(xiàn)了性能優(yōu)化的實(shí)施方向和落地細(xì)節(jié)。闡述的過(guò)程沒(méi)有追求各個(gè)方向的面面俱到，但都給到了一些場(chǎng)景化案例，來(lái)輔助理解和思考，起到拋磚引玉的效果。

作者：京東零售劉慧卿
內(nèi)容來(lái)源：京東云開(kāi)發(fā)者社區(qū)

責(zé)任編輯：武曉燕來(lái)源：今日頭條

性能優(yōu)化 CPU

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<legend id="rpgyg"><track id="rpgyg"></track></legend>

<sub id="rpgyg"></sub>

<cite id="rpgyg"><track id="rpgyg"></track></cite>