自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<pre id="ckjcr"><strike id="ckjcr"></strike></pre>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

C++11 引入的 shared_ptr 智能指針性能對比 Raw 指針怎么樣？

作者：程序員阿杜 2025-02-26 01:23:02

開發(fā) 前端

自從C++11智能指針推出后，關于 shared_ptr 的使用，分為了兩派，一派認為Raw指針不應該再出現在代碼中，另外一派認為要謹慎使用 shared_ptr, 大多數時候還是要使用Raw指針更合理。

C++11引入的智能指針（std::shared_ptr、std::unique_ptr、std::weak_ptr）通過自動化資源管理，極大降低了內存泄漏和懸垂指針的風險。

自從C++11智能指針推出后，關于 shared_ptr 的使用，分為了兩派，一派認為Raw指針不應該再出現在代碼中，另外一派認為要謹慎使用 shared_ptr, 大多數時候還是要使用Raw指針更合理。

這里我們不討論者兩派誰正確，關注的是 shared_ptr 的性能。

shared_ptr 提供了很多便利，但是這種便利性并非沒有代價——尤其是 std::shared_ptr，其性能開銷在特定場景下可能成為瓶頸。

一、智能指針性能開銷的核心來源

1. 原子操作與引用計數

std::shared_ptr 的核心機制是引用計數，其實現依賴于原子操作。每次拷貝或銷毀 shared_ptr 時，引用計數（use_count）和弱引用計數（weak_count）都需要通過原子指令進行增減。

原子操作雖然保證了線程安全，但其代價顯著：　

原子指令的硬件支持：現代CPU通過鎖緩存行（Cache Line Locking）或總線鎖（Bus Locking）實現原子性。例如，x86架構的LOCK前綴指令會強制獨占緩存行，導致流水線停頓。

內存屏障（Memory Barrier）：原子操作通常伴隨內存屏障，確保多核間的數據一致性。這會抑制編譯器和CPU的指令重排優(yōu)化，增加指令周期。

示例：引用計數的原子增減　

// 偽代碼：shared_ptr拷貝構造時的原子操作
ControlBlock* ctrl = ptr.control_block;
atomic_increment(&ctrl->use_count);  // 原子遞增

2. 控制塊的內存開銷

每個 shared_ptr 實例需要維護一個控制塊（Control Block），包含：　

引用計數（use_count）
弱引用計數（weak_count）
刪除器（Deleter）
分配器（Allocator）

控制塊通常通過動態(tài)內存分配（如new）創(chuàng)建，其大小在64位系統(tǒng)下約為40字節(jié)（具體因實現而異）。頻繁創(chuàng)建 shared_ptr 會導致堆內存碎片化，同時增加緩存未命中的概率?！?/p>

3. 間接訪問與緩存局部性

shared_ptr的實際對象指針和控制塊指針通常是分離的。訪問對象時，需要先加載控制塊指針，再通過控制塊訪問對象。這種兩級間接訪問破壞了數據的空間局部性，導致CPU緩存效率降低?！?/p>

對比：原始指針 vs. shared_ptr　

// 原始指針：直接訪問
int* raw = new int(42);
int value = *raw;  // 一次內存訪問

// shared_ptr：間接訪問
std::shared_ptr<int> shared = std::make_shared<int>(42);
int value = *shared;  // 先訪問控制塊，再訪問對象（可能兩次內存訪問）

二、量化性能開銷：基準測試與分析

1. 單線程環(huán)境下的開銷

通過對比shared_ptr、unique_ptr和原始指針的操作耗時，可以直觀量化性能差異?！?/p>

測試代碼片段（使用Google Benchmark）：　

static voidBM_RawPtr(benchmark::State& state){
    for (auto _ : state) {
        int* p = newint(42);
        delete p;
    }
}
BENCHMARK(BM_RawPtr);

staticvoidBM_UniquePtr(benchmark::State& state){
    for (auto _ : state) {
        auto p = std::make_unique<int>(42);
    }
}
BENCHMARK(BM_UniquePtr);

staticvoidBM_SharedPtr(benchmark::State& state){
    for (auto _ : state) {
        auto p = std::make_shared<int>(42);
    }
}
BENCHMARK(BM_SharedPtr);

結果（x86-64, GCC 12.2, -O2優(yōu)化）：　

操作	耗時（ns/op）
Raw Pointer	15
std::unique_ptr	16
std::shared_ptr	45

結論：shared_ptr的構造/析構開銷是原始指針的3倍，主要來自控制塊分配和原子操作。　

2. 多線程環(huán)境下的爭用（Contention）

當多個線程頻繁操作同一shared_ptr時，原子操作的緩存一致性協(xié)議（如MESI）會導致嚴重的性能下降?！?/p>

測試場景：　

10個線程并發(fā)增加/減少shared_ptr的引用計數。

對比無爭用（每個線程操作獨立shared_ptr）和高爭用（所有線程操作同一shared_ptr）。

結果（AMD EPYC 7763, 64核）：　

場景	吞吐量（ops/ms）
無爭用	1,200,000
高爭用	12,000

結論：高爭用下性能下降100倍，原子操作的緩存行乒乓（Cache Line Ping-Pong）是主因。（當多個線程頻繁更新某一緩存行中的數據時，緩存系統(tǒng)可能需要不斷地將數據從一個核心的緩存同步到另一個核心的緩存，這個過程就像乒乓球一樣在緩存之間來回傳遞，導致性能降低）

三、底層機制：從C++標準到硬件架構

1. 原子操作的實現細節(jié)

C++標準要求 shared_ptr 的引用計數操作是線程安全的，因此編譯器會生成特定的原子指令。以x86-64為例：　

atomic_increment對應LOCK XADD指令。

LOCK XADD 是原子加法和交換指令。它會確保在多個處理器核心之間同步操作，避免數據競爭。
std::shared_ptr 的引用計數增加時，會使用這種指令

atomic_decrement對應LOCK SUB指令。

LOCK SUB 是帶鎖的減法指令，保證了引用計數的減少操作是原子的，防止多個線程同時修改引用計數時發(fā)生競態(tài)條件。

2. 控制塊的內存布局

典型的shared_ptr控制塊布局（以libstdc++實現為例）：　

struct ControlBlock {
    std::atomic<long> use_count;  // 8字節(jié)
    std::atomic<long> weak_count; // 8字節(jié)
    Deleter* deleter;             // 8字節(jié)
    Allocator* allocator;         // 8字節(jié)
    void* object_ptr;             // 8字節(jié)
};

總大小：40字節(jié)（64位系統(tǒng)）。若對象較小（如int），控制塊的內存開銷可能超過對象本身?！?/p>

3. 緩存局部性的影響

現代CPU的L1緩存行通常為64字節(jié)。若 shared_ptr 的控制塊和對象分散存儲，訪問對象時可能需要加載兩個不同的緩存行，導致吞吐量下降?！?/p>

優(yōu)化示例：std::make_shared將對象和控制塊分配在連續(xù)內存中，提高緩存局部性：　

auto p = std::make_shared<int>(42);  // 對象和控制塊單次分配
auto q = std::shared_ptr<int>(new int(42));  // 兩次分配（對象+控制塊）

四、實際場景中的性能問題案例

1. 游戲引擎中的實體管理

某游戲引擎使用 shared_pt r管理游戲實體（Entity），每個實體包含多個組件（Component）。在每秒60幀的更新頻率下，頻繁的 shared_ptr 拷貝導致CPU耗時增加15%。

優(yōu)化方案：　

改用std::unique_ptr + 手動生命周期管理。

使用對象池（Object Pool）減少動態(tài)分配。

2. 高頻交易系統(tǒng)的消息傳遞

一個高頻交易系統(tǒng)使用 shared_ptr 傳遞市場數據消息。在峰值負載下，原子操作的爭用導致延遲從2微秒飆升至50微秒。

優(yōu)化方案：　

改用無鎖（Lock-Free）數據結構和原始指針。

使用線程局部存儲（TLS）避免跨線程爭用。

3. 分布式系統(tǒng)的節(jié)點通信

某分布式系統(tǒng)使用 shared_ptr 管理網絡連接對象。在10,000個并發(fā)連接下，控制塊內存占用超過1GB。

優(yōu)化方案：　

使用std::weak_ptr替代非擁有性引用。

自定義刪除器復用控制塊內存。

五、優(yōu)化策略與實踐

1. 優(yōu)先使用std::unique_ptr

適用場景：獨占所有權，無需共享。

優(yōu)勢：零額外開銷，性能等同原始指針。

示例：

auto resource = std::make_unique<DatabaseConnection>();
transfer_ownership(std::move(resource));  // 顯式所有權轉移

2. 減少 shared_ptr 的拷貝

使用const&傳遞：避免不必要的引用計數增減。

void process(const std::shared_ptr<Data>& data) { /* ... */ }

移動語義：用std::move轉移所有權。

auto p1 = std::make_shared<int>(42);
auto p2 = std::move(p1);  // 無原子操作

3. 控制塊分配優(yōu)化

使用std::make_shared：合并對象和控制塊的內存分配。

auto p = std::make_shared<Object>(args);  // 推薦
auto q = std::shared_ptr<Object>(new Object(args));  // 不推薦

4. 避免多線程爭用

線程局部存儲（TLS）：為每個線程分配獨立shared_ptr。

thread_local std::shared_ptr<Cache> local_cache = create_cache();

總結

原始指針：性能更高，因為沒有引用計數和線程安全管理的開銷，但缺乏自動內存管理和線程安全，容易導致內存泄漏或多線程錯誤。

shared_ptr：提供了自動內存管理和線程安全，但有一定的性能開銷，尤其是在引用計數操作和多線程環(huán)境下。

責任編輯：武曉燕來源： CppPlayer

C++11 Raw 代碼

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<sup id="uqstm"><rt id="uqstm"></rt></sup>

<sub id="uqstm"><p id="uqstm"></p></sub>