自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="ynkga"></cite>

<legend id="ynkga"><track id="ynkga"></track></legend>

^{<blockquote id="ynkga"></blockquote>}

<sub id="ynkga"></sub><sub id="ynkga"><s id="ynkga"></s></sub>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

并行程序VS串行程序——優(yōu)化實錄

作者：Rosting 2011-11-17 10:34:44

開發(fā) 開發(fā)工具

透過MPI寫成一個并行排序程序，但其實這是一個偽并行程序，其實質(zhì)還是一個串行程序。那么究竟該怎么對比他們呢？

　　在多核處理器、超級計算機日益普及的今天，程序員們怎能對并行程序“袖手旁觀”呢？

　　為了練手，我用MPI寫了一個并行排序程序，

　　先介紹下我的第一個版本，大概的思路是：

　　使用MPI在各個進程之間進行通信，

　　1. 進程0生成隨機數(shù)，并且講數(shù)據(jù)分段，將各段數(shù)據(jù)分配給其他進程

　　2. 其他進程收到數(shù)據(jù)段，使用冒泡排序進行，發(fā)送回進程0

　　3. 進程0收到這些數(shù)據(jù)，通過歸并排序按順序整合起來。

　　下面是這個版本代碼，

　　//MPI Hello World demo  
　　#include <mpi.h>  
　　#include <stdio.h>  
　　#include <stdlib.h>  
　　#include <time.h>  
　　#defineN 30  
　　intmain(intargc, char** argv)  
　　{  
　intprocessRank, processNum, t, data, num;  
　　intdataArr[N];  
　　intdataArrB[N];  
　　intpointer[100];  
　　intsecEnd[100];  
　　MPI_Status mpistat;  
　　MPI_Init(&argc, &argv);  
　　MPI_Comm_size(MPI_COMM_WORLD, &processNum);  
　　MPI_Comm_rank(MPI_COMM_WORLD, &processRank);  
　　printf("Yes, Sir! From process %i of %i ", processRank, processNum);  
　　if(processRank == 0)  
　　{  
　　srand(time(NULL));  
　　for(inti = 0;i <N; i++){  
　　dataArr[i] = rand()%1000;  
　}  
　　printf("Original Array: ");  
　　for(inti = 0;i< N; i++){  
　　printf("%d ", dataArr[i]);  
　　}  
　　printf(" ");  
　　puts("Distribute data to processes");  
　　for(inti = 1;i <processNum; i++){  
　　num = (N/(processNum-1));  
　if(i == processNum -1)  
　　num = N - num * (processNum -2);  
　　///distribute data to each process  
　　printf("Sending to process %d... ", i);  
　　MPI_Send(&num, 1, MPI_INT, i, 55, MPI_COMM_WORLD);  
　　MPI_Send(&dataArr[(N/(processNum-1)) * (i-1)], num, MPI_INT, i, 55, MPI_COMM_WORLD);  
　　///gather the sorted data  
　　printf("Receiving from process %d... ", i);  
　　MPI_Recv(&dataArrB[(N/(processNum-1)) * (i-1)], num, MPI_INT, i, 55, MPI_COMM_WORLD, &mpistat);  
　　///prepare for merge, set the pointers  
　　pointer[i] = (N/(processNum-1)) * (i-1);  
　　secEnd[i] = pointer[i] + N/(processNum-1);  
　　if(i == processNum-1) secEnd[i] = N;  
　　}  
　　printf("Sorted Sections Array: ");  
　　for(inti = 0;i< N; i++){  
　　printf("%d ", dataArrB[i]);  
　　}  
　　puts("");  
　　///merge the sorted sections  
　　puts("Merging...");  
　　for(inti = 0;i <N; i++){  
　　inttMin = 1;  
　　intmin = 10000;  
　　for(t = 1;t <processNum; t++){  
　　if(pointer[t] <secEnd[t] &&dataArrB[pointer[t]] <min){  
　　min = dataArrB[pointer[t]];  
　　tMin = t;  
　　}  
　　}  
　　dataArr[i] = dataArrB[pointer[tMin]];  
　　pointer[tMin]++;  
　　}  
　　///output the results  
　　printf("Final Sorted Array: ");  
　　for(inti = 0;i< N; i++){  
　　printf("%d ", dataArr[i]);  
　　}  
　　printf(" ");  
　　}  
　　else 
　　{  
　　//receieve the section  
　　MPI_Recv(&num, 1, MPI_INT, 0, 55, MPI_COMM_WORLD, &mpistat);  
　　MPI_Recv(&dataArr[0], num, MPI_INT, 0, 55, MPI_COMM_WORLD, &mpistat);  
　　printf("Received Original Array: ");  
　　for(inti = 0;i< num; i++){  
　　printf("%d ", dataArr[i]);  
　　}  
　　printf(" ");  
　　//sort this section  
　　for(inti = 0;i <num -1;i++)  
　　for(intj = num-1;j>=i+1;j--)  
　　if(dataArr[j] <dataArr[j-1]){  
　　inttmp = dataArr[j];  
　　dataArr[j]= dataArr[j-1];  
　　dataArr[j-1] = tmp;  
　　}  
　　MPI_Send(&dataArr[0], num, MPI_INT, 0, 55, MPI_COMM_WORLD);  
　　///display  
　　printf("My Sorted Section: ");  
　　for(inti = 0;i< num; i++){  
　　printf("%d ", dataArr[i]);  
　　}  
　printf(" ");  
　　}  
　　MPI_Finalize();  
　　return0;  
　　}

　　自己寫出之后當然高興，不過程序經(jīng)過高手檢查之后，提出了一些問題。

　　最要命的是這個

　　for(inti = 1;i <processNum; i++){  
　　num = (N/(processNum-1));  
　　if(i == processNum -1)  
　　num = N - num * (processNum -2);  
　　///distribute data to each process  
　　printf("Sending to process %d... ", i);  
　　MPI_Send(&num, 1, MPI_INT, i, 55, MPI_COMM_WORLD);  
　　MPI_Send(&dataArr[(N/(processNum-1)) * (i-1)], num, MPI_INT, i, 55, MPI_COMM_WORLD);  
　　///gather the sorted data  
　　printf("Receiving from process %d... ", i);  
　　MPI_Recv(&dataArrB[(N/(processNum-1)) * (i-1)], num, MPI_INT, i, 55, MPI_COMM_WORLD, &mpistat);  
　　///prepare for merge, set the pointers  
　　pointer[i] = (N/(processNum-1)) * (i-1);  
　　secEnd[i] = pointer[i] + N/(processNum-1);  
　　if(i == processNum-1) secEnd[i] = N;  
　　}

　　這段程序徹底抹殺掉了我這個并行程序的光輝形象，因為這段煞有介事的并行程序，其實是一段串行程序。

　　屏幕前的高手應該看出來了吧，同一段程序的收發(fā)，都在同一段循環(huán)中。

　　也就意味著，不同段之間的收發(fā)是一個接著一個的。也就意味著，其他每個進程各自的排序也是一個接著一個進行的，并不會如我初衷并行排序。

　　想來，這段錯誤應該是并行程序小白們常犯的錯誤，所以我也很樂于把我做過的蠢事發(fā)出來給大家分享。前車之鑒，警鐘長鳴lol

　　改正之后的這段程序是這樣的，

　　for(inti = 1;i <processNum; i++){  
　　num = (N/(processNum-1));  
　　if(i == processNum -1)  
　　num = N - num * (processNum -2);  
　　///distribute data to each process  
　　printf("Sending to process %d... ", i);  
　　MPI_Send(&num, 1, MPI_INT, i, 55, MPI_COMM_WORLD);  
　　MPI_Send(&dataArr[(N/(processNum-1)) * (i-1)], num, MPI_INT, i, 55, MPI_COMM_WORLD);  
　　}  
　　for(inti = 1;i <processNum; i++){  
　　num = (N/(processNum-1));  
　　if(i == processNum -1)  
　　num = N - num * (processNum -2);  
　　///gather the sorted data  
　　printf("Receiving from process %d... ", i);  
　　MPI_Recv(&dataArrB[(N/(processNum-1)) * (i-1)], num, MPI_INT, i, 55, MPI_COMM_WORLD, &mpistat);  
　　///prepare for merge, set the pointers  
　　pointer[i] = (N/(processNum-1)) * (i-1);  
　　secEnd[i] = pointer[i] + N/(processNum-1);  
　　if(i == processNum-1) secEnd[i] = N;  
　　}

　　同時程序的效率還可以提升，比如說把其他進程排序的算法換成快排什么的。

　　最后奉上優(yōu)化后的版本

　　//MPI Hello World demo  
　　#include <mpi.h>  
　　#include <stdio.h>  
　　#include <stdlib.h> //'qsort' is in it.  
　　#include <time.h>  
　　#include <map>  
　　#defineN 30  
　　intQuickSortCompareFun(constvoid*p1, constvoid*p2)  
　　{  
　　return*((constint*)p1) - *((constint*)p2);  
　　}  
　　intmain(intargc, char** argv)  
　　{  
　　intprocessRank, processNum, t, data, num;  
　　intdataArr[N];  
　　intdataArrB[N];  
　　intpointer[100];  
　　intsecEnd[100];  
　　MPI_Status mpistat;  
　　MPI_Init(&argc, &argv);  
　　MPI_Comm_size(MPI_COMM_WORLD, &processNum);  
　　MPI_Comm_rank(MPI_COMM_WORLD, &processRank);  
　　printf("Yes, Sir! From process %i of %i ", processRank, processNum);  
　　if(processRank == 0)  
　　{  
　　srand(time(NULL));  
　　for(inti = 0;i <N; i++){  
　　dataArr[i] = rand()%1000;  
　　}  
　　printf("Original Array: ");  
　for(inti = 0;i< N; i++){  
　　printf("%d ", dataArr[i]);  
　　}  
　　printf(" ");  
　　puts("Distribute data to processes");  
　　for(inti = 1;i <processNum; i++){  
　　num = (N/(processNum-1));  
　　if(i == processNum -1)  
　　num = N - num * (processNum -2);  
　　///distribute data to each process  
　　printf("Sending to process %d... ", i);  
　　MPI_Send(&num, 1, MPI_INT, i, 55, MPI_COMM_WORLD);  
　　MPI_Send(&dataArr[(N/(processNum-1)) * (i-1)], num, MPI_INT, i, 55, MPI_COMM_WORLD);  
　　}  
　　for(inti = 1;i <processNum; i++){  
　　num = (N/(processNum-1));  
　if(i == processNum -1)  
　　num = N - num * (processNum -2);  
　　///gather the sorted data  
　　printf("Receiving from process %d... ", i);  
　　MPI_Recv(&dataArrB[(N/(processNum-1)) * (i-1)], num, MPI_INT, i, 55, MPI_COMM_WORLD, &mpistat);  
　　///prepare for merge, set the pointers  
　　pointer[i] = (N/(processNum-1)) * (i-1);  
　　secEnd[i] = pointer[i] + N/(processNum-1);  
　　if(i == processNum-1) secEnd[i] = N;  
　　}  
　　printf("Sorted Sections Array: ");  
　　for(inti = 0;i< N; i++){  
　　printf("%d ", dataArrB[i]);  
　　}  
　　puts("");  
　　///merge the sorted sections  
　　puts("Merging...");  
　　std::map<int, int>data2rank;  
　　for(t = 1;t <processNum; t++){  
　　if(pointer[t] <secEnd[t]){  
　　data2rank.insert(std::make_pair<int, int>(dataArrB[pointer[t]], t));  
　　pointer[t]++;  
　　}  
　　}  
　　for(inti = 0;i <N; i++){  
　　intdata = data2rank.begin()->first;  
　　intrank = data2rank.begin()->second;  
　　dataArr[i] = data;  
　　data2rank.erase(data2rank.begin());  
　　if(pointer[rank] <secEnd[rank])  
　　{  
　　data2rank.insert(std::make_pair<int, int>(dataArrB[pointer[rank]], rank));  
　　pointer[rank]++;  
　　}  
　　}  
　　///output the results  
　　printf("Final Sorted Array: ");  
　　for(inti = 0;i< N; i++){  
　　printf("%d ", dataArr[i]);  
　　}  
　　printf(" ");  
　　}  
　　else 
　　{  
　　//receieve the section  
　　MPI_Recv(&num, 1, MPI_INT, 0, 55, MPI_COMM_WORLD, &mpistat);  
　　MPI_Recv(&dataArr[0], num, MPI_INT, 0, 55, MPI_COMM_WORLD, &mpistat);  
　　printf("Received Original Array: ");  
　　for(inti = 0;i< num; i++){  
　printf("%d ", dataArr[i]);  
　　}  
　　printf(" ");  
　　//sort this section  
　　qsort(dataArr, num, sizeof(int), QuickSortCompareFun);  
　　MPI_Send(&dataArr[0], num, MPI_INT, 0, 55, MPI_COMM_WORLD);  
　　///display  
　　printf("My Sorted Section: ");  
　　for(inti = 0;i< num; i++){  
　　printf("%d ", dataArr[i]);  
　　}  
　　printf(" ");  
　　}  
　　MPI_Finalize();  
　return0;

原文鏈接：http://www.cnblogs.com/rosting/archive/2011/11/16/2251892.html

【編輯推薦】

微軟發(fā)布新版Windows 7及.NET 4軟件開發(fā)工具包
詳解.NET 4.0并行計算支持歷史
詳讀.NET 4.0環(huán)境配置
詳解.NET 4.0中異常處理方面的新特性
三方面詮釋.NET 4.0的新特性

責任編輯：彭凡來源：博客園

51CTO技術(shù)棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<legend id="wdbxd"><strong id="wdbxd"></strong></legend>