自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

C#中大數(shù)據(jù)列表的并行處理技術(shù)詳解

作者：iamrick 2025-01-02 08:53:14

大數(shù)據(jù)

在實際應(yīng)用中，建議先進行性能測試，根據(jù)數(shù)據(jù)量大小和處理復(fù)雜度選擇合適的實現(xiàn)方式。同時要注意異常處理和資源管理，確保程序的穩(wěn)定性和可靠性。

在處理大型數(shù)據(jù)集時，單線程處理往往效率低下。通過將數(shù)據(jù)分割成多個小塊并利用多線程并行處理，我們可以顯著提高程序的性能。本文將詳細介紹幾種實現(xiàn)方式。

使用Parallel.ForEach進行并行處理

最簡單的實現(xiàn)方式是使用C#內(nèi)置的Parallel.ForEach方法。

namespace AppParallel
{
    internal class Program
    {
        static object lockObject = new object();
        static void Main(string[] args)
        {
            // 創(chuàng)建示例數(shù)據(jù)
            var largeList = Enumerable.Range(1, 1000000).ToList();

            // 設(shè)置并行選項
            var parallelOptions = new ParallelOptions
            {
                MaxDegreeOfParallelism = Environment.ProcessorCount // 使用處理器核心數(shù)量的線程
            };

            try
            {
                Parallel.ForEach(largeList, parallelOptions, (number) =>
                {
                    // 這里是對每個元素的處理邏輯
                    var result = ComplexCalculation(number);

                    // 注意：如果需要收集結(jié)果，要考慮線程安全
                    lock (lockObject)
                    {
                        // 進行線程安全的結(jié)果收集
                        Console.WriteLine(result);
                    }
                });
            }
            catch (AggregateException ae)
            {
                // 處理并行處理中的異常
                foreach (var ex in ae.InnerExceptions)
                {
                    Console.WriteLine($"Error: {ex.Message}");
                }
            }
        }
        private static int ComplexCalculation(int number)
        {
            // 模擬復(fù)雜計算
            Thread.Sleep(100);
            return number * 2;
        }

    }
}

圖片

手動分塊處理方式

有時我們需要更精細的控制，可以手動將數(shù)據(jù)分塊并分配給不同的線程。

namespace AppParallel
{
    internal class Program
    {
        static void Main(string[] args)
        {
            var largeList = Enumerable.Range(1, 1000000).ToList();
            ProcessByChunks(largeList, 1000); // 每1000個元素一個塊
        }
        public static void ProcessByChunks<T>(List<T> largeList, int chunkSize)
        {
            // 計算需要多少個分塊
            int chunksCount = (int)Math.Ceiling((double)largeList.Count / chunkSize);
            var tasks = new List<Task>();

            for (int i = 0; i < chunksCount; i++)
            {
                // 獲取當(dāng)前分塊的數(shù)據(jù)
                var chunk = largeList
                    .Skip(i * chunkSize)
                    .Take(chunkSize)
                    .ToList();

                // 創(chuàng)建新任務(wù)處理當(dāng)前分塊
                var task = Task.Run(() => ProcessChunk(chunk));
                tasks.Add(task);
            }

            // 等待所有任務(wù)完成
            Task.WaitAll(tasks.ToArray());
        }

        private static void ProcessChunk<T>(List<T> chunk)
        {
            foreach (var item in chunk)
            {
                // 處理每個元素
                ProcessItem(item);
            }
        }

        private static void ProcessItem<T>(T item)
        {
            // 具體的處理邏輯
            Console.WriteLine($"Processing item: {item} on thread: {Task.CurrentId}");
        }

    }
}

圖片

使用生產(chǎn)者-消費者模式

對于更復(fù)雜的場景，我們可以使用生產(chǎn)者-消費者模式，這樣可以更好地控制內(nèi)存使用和處理流程。

public class ProducerConsumerExample
{
    private readonly BlockingCollection<int> _queue;
    private readonly int _producerCount;
    private readonly int _consumerCount;
    private readonly CancellationTokenSource _cts;

    public ProducerConsumerExample(int queueCapacity = 1000)
    {
        _queue = new BlockingCollection<int>(queueCapacity);
        _producerCount = 1;
        _consumerCount = Environment.ProcessorCount;
        _cts = new CancellationTokenSource();
    }

    public async Task ProcessDataAsync(List<int> largeList)
    {
        // 創(chuàng)建生產(chǎn)者任務(wù)
        var producerTask = Task.Run(() => Producer(largeList));

        // 創(chuàng)建消費者任務(wù)
        var consumerTasks = Enumerable.Range(0, _consumerCount)
            .Select(_ => Task.Run(() => Consumer()))
            .ToList();

        // 等待所有生產(chǎn)者完成
        await producerTask;

        // 標(biāo)記隊列已完成
        _queue.CompleteAdding();

        // 等待所有消費者完成
        await Task.WhenAll(consumerTasks);
    }

    private void Producer(List<int> items)
    {
        try
        {
            foreach (var item in items)
            {
                if (_cts.Token.IsCancellationRequested)
                    break;

                _queue.Add(item);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Producer error: {ex.Message}");
            _cts.Cancel();
        }
    }

    private void Consumer()
    {
        try
        {
            foreach (var item in _queue.GetConsumingEnumerable())
            {
                if (_cts.Token.IsCancellationRequested)
                    break;

                // 處理數(shù)據(jù)
                ProcessItem(item);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Consumer error: {ex.Message}");
            _cts.Cancel();
        }
    }

    private void ProcessItem(int item)
    {
        // 具體的處理邏輯
        Thread.Sleep(100); // 模擬耗時操作
        Console.WriteLine($"Processed item {item} on thread {Task.CurrentId}");
    }
}

// 使用示例
static async Task Main(string[] args)
{
    var processor = new ProducerConsumerExample();
    var largeList = Enumerable.Range(1, 10000).ToList();
    await processor.ProcessDataAsync(largeList);
}

圖片

注意事項

合適的分塊大小

a.分塊不要太小，否則線程切換開銷會抵消并行處理的優(yōu)勢

b.也不要太大，否則會影響負載均衡

c.建議從1000-5000個元素每塊開始測試

異常處理

a.務(wù)必妥善處理并行處理中的異常

b.使用try-catch包裝每個任務(wù)

c.考慮使用CancellationToken來優(yōu)雅終止所有任務(wù)

資源管理

a.注意內(nèi)存使用，避免同時加載過多數(shù)據(jù)

b.合理控制線程數(shù)量，通常不超過處理器核心數(shù)的2倍

c.使用using語句管理IDisposable資源

線程安全

a.訪問共享資源時確保使用適當(dāng)?shù)耐綑C制

b.考慮使用線程安全的集合類

c.避免過度鎖定導(dǎo)致性能下降

總結(jié)

并行處理大數(shù)據(jù)列表是提高程序性能的有效方式，但需要根據(jù)具體場景選擇合適的實現(xiàn)方式。本文介紹的三種方法各有特點：

Parallel.ForEach: 適合簡單場景，實現(xiàn)簡單
手動分塊處理：提供更多控制，適合中等復(fù)雜度場景
生產(chǎn)者-消費者模式：適合復(fù)雜場景，可以更好地控制資源使用

在實際應(yīng)用中，建議先進行性能測試，根據(jù)數(shù)據(jù)量大小和處理復(fù)雜度選擇合適的實現(xiàn)方式。同時要注意異常處理和資源管理，確保程序的穩(wěn)定性和可靠性。

責(zé)任編輯：武曉燕來源：技術(shù)老小子

大數(shù)據(jù)并行處理測試

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<s id="t1tau"></s>

<sub id="t1tau"><rt id="t1tau"></rt></sub>