自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

與Python的速度較量:C++究竟有多快?

開發(fā) 后端
Python和C++類語言之間存在許多區(qū)別,本文將通過一個(gè)十分簡(jiǎn)單的例子向你展示,與Python相比,C++究竟有多快。

本文轉(zhuǎn)載自公眾號(hào)“讀芯術(shù)”(ID:AI_Discovery)。

對(duì)于數(shù)據(jù)科學(xué)家而言,熱愛Python的理由數(shù)不勝數(shù)。但你是否也曾問過這樣的問題:Python和C或C++等更專業(yè)的低級(jí)編程語言究竟有何不同呢?我想這是很多數(shù)據(jù)科學(xué)家或者Python用戶曾經(jīng)問過或者將來會(huì)問自己的問題。

Python和C++類語言之間存在許多區(qū)別,本文將通過一個(gè)十分簡(jiǎn)單的例子向你展示,與Python相比,C++究竟有多快。

[[376429]]

為了說明這種區(qū)別,本文選擇一個(gè)簡(jiǎn)單實(shí)用而非想象虛構(gòu)的任務(wù):生成固定值為“k”的所有可能DNA k-mers。選擇該示例,是因?yàn)榕c基因組相關(guān)的許多數(shù)據(jù)處理和任務(wù)分析(例如k-mers生成)都是計(jì)算密集型的,而這同樣也是很多生物信息學(xué)領(lǐng)域的數(shù)據(jù)科學(xué)家對(duì)C++感興趣的原因。

請(qǐng)注意,本文目標(biāo)并不是以最有效的方式比較C++和Python。這兩種代碼均可采用更高效的方式和更優(yōu)化的方法編寫。本文的唯一目標(biāo),就是比較這兩種語言在使用完全相同的算法和指令時(shí)的速度。

DNA K-mers簡(jiǎn)介

DNA是一種稱為核苷酸的長(zhǎng)鏈單位。在DNA中,共有4種核苷酸類型,分別用字母A、C、G和T表示。人類(更準(zhǔn)確地說是智人)擁有核苷酸對(duì)30億個(gè)。例如,人類DNA的一小部分可能類似于:

ACTAGGGATCATGAAGATAATGTTGGTGTTTGTATGGTTTTCAGACAATT

在此示例中,如果從該字符串中選擇任意4個(gè)連續(xù)的核苷酸(即字母),它將是一個(gè)長(zhǎng)度為4的k-mer(可稱之為4-mer)。以下便是從此示例中衍生出來的一些4-mers例子:ACTA,CTAG,TAGG,AGGG,GGGA等。

難點(diǎn)挑戰(zhàn)

本文以生成所有可能的13-mers為例,從數(shù)學(xué)上講,這是一個(gè)帶有替換的排列問題。因此,共有4¹³個(gè)(67108864)可能的13-mers。下面將使用一個(gè)簡(jiǎn)單的算法在C++和Python中生成結(jié)果。

方案比較

為了方便比較C++和Python在此特定挑戰(zhàn)中的優(yōu)劣,我在兩種語言中使用了完全相同的算法。這兩種代碼均有意設(shè)計(jì)地簡(jiǎn)單而相似。同時(shí),避免使用復(fù)雜的數(shù)據(jù)結(jié)構(gòu)或第三方包或庫(kù)。第一段代碼采用Python編寫。

  1. defconvert(c): 
  2.                if (c =='A'): return'C' 
  3.                if (c =='C'): return'G' 
  4.                if (c =='G'): return'T' 
  5.                if (c =='T'): return'A' 
  6.              print("Start") 
  7.              opt ="ACGT" 
  8.             s ="" 
  9.             s_last ="" 
  10.             len_str =13 
  11.              for i inrange(len_str): 
  12.                s += opt[0] 
  13.              for i inrange(len_str): 
  14.                s_last += opt[-1] 
  15.              pos =0 
  16.             counter =1 
  17.             while (s != s_last): 
  18.                counter +=1 
  19.                # You can uncomment the next line to see all k-mers. 
  20.                # print(s) 
  21.                change_next =True 
  22.                for i inrange(len_str): 
  23.                     if (change_next): 
  24.                         if (s[i] == opt[-1]): 
  25.                             ss = s[:i] +convert(s[i]) + s[i+1:] 
  26.                             change_next =True 
  27.                         else: 
  28.                             ss = s[:i] +convert(s[i]) + s[i+1:] 
  29.                             break 
  30.              # You canuncomment the next line to see all k-mers. 
  31.             # print(s) 
  32.             print("Number ofgenerated k-mers: {}".format(counter)) 
  33.             print("Finish!") 

運(yùn)行Python代碼,生成全部13-mers共6700萬個(gè)大約需要61.23秒。為了公平比較,我注釋掉了顯示k-mers的行。如果想在生成k-mers時(shí)顯示它們,也可以取消對(duì)這兩行的注釋。注意,顯示全部k-mers耗時(shí)很長(zhǎng)。如有需要,請(qǐng)操作CTRL+C中止代碼。

現(xiàn)在,來看看C++中同樣的算法:

  1. #include<iostream> 
  2.            #include<string> 
  3.              usingnamespacestd; 
  4.              charconvert(char c) 
  5.            { 
  6.               if (c == 'A') return'C'; 
  7.               if (c == 'C') return'G'; 
  8.               if (c == 'G') return'T'; 
  9.               if (c == 'T') return'A'; 
  10.               return' '; 
  11.            } 
  12.              intmain() 
  13.            { 
  14.               cout << "Start" << endl
  15.                  string opt = "ACGT"
  16.               string s = ""
  17.               string s_last = ""
  18.               int len_str = 13
  19.               bool change_next; 
  20.                  for (int i=0; i<len_str;i++) 
  21.               { 
  22.                    s += opt[0]; 
  23.               } 
  24.                  for (int i=0; i<len_str;i++) 
  25.               { 
  26.                    s_last += opt.back(); 
  27.               } 
  28.                  int pos = 0
  29.               int counter = 1
  30.               while (s != s_last) 
  31.               {   
  32.                    counter ++; 
  33.                    // You canuncomment the next line to see all k-mers. 
  34.                    // cout << s<< endl;  
  35.                    change_next = true
  36.                    for (int i=0; i<len_str;i++) 
  37.                    { 
  38.                        if (change_next) 
  39.                        { 
  40.                            if (s[i] == opt.back()) 
  41.                            { 
  42.                                s[i] = convert(s[i]); 
  43.                                change_next = true
  44.                            } else { 
  45.                                s[i] = convert(s[i]); 
  46.                                break; 
  47.                            } 
  48.                        } 
  49.                    } 
  50.               } 
  51.                  // You can uncomment the next line tosee all k-mers. 
  52.               // cout << s << endl
  53.               cout << "Number of generated k-mers: " <<counter << endl
  54.               cout << "Finish!" << endl
  55.               return0; 
  56.            } 

編譯后,運(yùn)行C++代碼,生成全部13-mers共6700萬個(gè)大約需要2.42秒。這意味著運(yùn)行相同算法,Python用時(shí)是C++的25倍多。然后,對(duì)14-mers和15-mers重復(fù)進(jìn)行此實(shí)驗(yàn)。匯總結(jié)果如下表所示:

與Python的速度較量:C++究竟有多快?

比較生成13-、14-和15-mers的Python和C++運(yùn)行結(jié)果。

顯然,C++比Python快得多。對(duì)于大多數(shù)程序員和數(shù)據(jù)科學(xué)家而言,這是共識(shí)。但該示例表明,這種差異十分顯著。

本示例并沒有使用CPU或GPU并行化,因其必須針對(duì)相應(yīng)類型的問題(密集并行難題)進(jìn)行。此外,示例也沒有大量涉及內(nèi)存。如果將運(yùn)行結(jié)果進(jìn)行存儲(chǔ)(出于某些特定原因),那么使用內(nèi)存管理在運(yùn)行C++和Python時(shí),將產(chǎn)生更顯著的差異。

此示例和數(shù)以千計(jì)的其他事實(shí)表明,在處理大量數(shù)據(jù)或指數(shù)增長(zhǎng)的過程中,身為數(shù)據(jù)科學(xué)家,你應(yīng)該了解C++類語言。

 

責(zé)任編輯:趙寧寧 來源: 今日頭條
相關(guān)推薦

2018-10-18 09:41:41

2022-09-09 07:41:35

DatabricksSnowflake數(shù)據(jù)

2024-12-11 16:00:00

C++函數(shù)編譯器

2021-08-27 08:51:47

MyISAMInnoDB索引

2013-01-08 10:02:26

虛擬化云計(jì)算

2013-01-06 09:55:36

虛擬化云計(jì)算

2011-08-25 12:51:02

2009-03-13 08:56:31

Symbian手機(jī)OS諾基亞

2024-01-15 07:14:37

kubernetesk8sLTS

2012-07-23 10:19:08

微軟Azure云計(jì)算

2020-10-21 10:48:11

5G網(wǎng)絡(luò)技術(shù)

2021-02-23 19:29:57

智能網(wǎng)卡SmartNIC網(wǎng)絡(luò)

2023-09-07 09:46:44

程序員編程

2015-10-14 17:54:01

容器虛擬機(jī)云服務(wù)

2020-02-24 17:53:06

5G速度有多快

2012-01-11 10:14:58

HTML 5

2013-11-27 11:12:12

5G4G第五代移動(dòng)通信

2012-11-12 10:38:45

BYODVPN

2021-10-11 15:57:49

物聯(lián)網(wǎng)5G技術(shù)

2020-03-24 14:48:12

DevOps敏捷區(qū)別
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)