自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

如何把C/C++程序編譯成實用的Python模塊

新聞 前端
在Python遇到性能瓶頸時怎么辦?答案是找對應(yīng)功能的C/C++程序,把它編譯成CPython模塊,供Python調(diào)用來提高性能。

 

在Python遇到性能瓶頸時怎么辦?答案是找對應(yīng)功能的C/C++程序,把它編譯成CPython模塊,供Python調(diào)用來提高性能。

如何把C/C++程序編譯成Python模塊

比如Python中做科學(xué)計算,數(shù)據(jù)處理的Numpy模塊就是使用C語言編寫的,Numpy處理速度比Pandas快數(shù)倍。Numpy的處理速度一點都不比go語言差。

本文就是介紹如何把C/C++程序編譯成Python模塊。本文偏技術(shù),需要耐著性質(zhì)看。

Python 作為一個膠水語言,可以很方便的通過C/C++來進(jìn)行擴展,提高性能。前面我寫了一篇文章介紹如何通過Python的ctypes加載普通的.so庫。

其實,這還不算真正的用C/C++寫Python的擴展模塊。

本文將介紹如何使用C語言和C++寫Python模塊。

一、Python的C語言接口

Python語言最初是用C語言實現(xiàn)的一種腳本語言,后來被稱為CPython,是因為后來它語言實現(xiàn)的Python,比如Python實現(xiàn)的Python——PyPy,Java語言實現(xiàn)的Python——Jython,.Net實現(xiàn)的Python——IronPython。

CPython具有優(yōu)良的開放性和可擴展性,并提供了方便靈活的應(yīng)用程序接口(API),從而使得C/C++程序員能夠?qū)ython解釋器的功能進(jìn)行擴展。

Python的C語言接口很適合封裝C語言實現(xiàn)的各種函數(shù),如果要封裝C++的類,使用boost_python或者SWIG更方便和合適,還有一個類似boost_python的支持C++11的pybind11。

1 模塊封裝

假設(shè)我們有一個C函數(shù):

  1. /* 文件名:mylib.c */ 
  2. int addone(int a) { 
  3.  return a+1; 

如果想在Python解釋器中調(diào)用該函數(shù),則應(yīng)該首先將其實現(xiàn)為Python中的一個模塊,這需要編寫相應(yīng)的封裝接口,如下所示:

  1. /* wrap_mylib.c */ 
  2. #include  
  3. #include "mylib.h" 
  4. PyObject* wrap_addone(PyObject* self, PyObject* args) 
  5.  int n, result; 
  6.  if (! PyArg_ParseTuple(args, "i:fact", &n)) 
  7.  return NULL; 
  8.  result = addone(n); /*這里調(diào)用C函數(shù) */ 
  9.  return Py_BuildValue("i", result); 
  10. static PyMethodDef mylibMethods[] = 
  11.  {"addone", wrap_addone, METH_VARARGS, "Add one to N"}, 
  12.  {NULL, NULL} 
  13. }; 
  14. void initmylib() 
  15.  PyObject* m; 
  16.  m = Py_InitModule("mylib", mylibMethods); 

上面就是一個典型的Python擴展模塊,它至少應(yīng)該包含三個部分:導(dǎo)出函數(shù)、方法列表和初始化函數(shù)。

2 導(dǎo)出函數(shù)

要在Python解釋器中調(diào)用C語言中的某個函數(shù),首先要為它編寫對應(yīng)的導(dǎo)出函數(shù),上述例子中的導(dǎo)出函數(shù)為wrap_addone。在Python的C語言擴展中,所有的導(dǎo)出函數(shù)都具有相同的函數(shù)原型:

  1. PyObject* wrap_method(PyObject* self, PyObject* args); 

這個函數(shù)是Python解釋器和C函數(shù)進(jìn)行交互的接口,一般以wrap_開頭后面跟上C語言的函數(shù)名,這樣命名把導(dǎo)出函數(shù)和C語言函數(shù)對應(yīng)起來使得代碼更加清晰。它帶有兩個參數(shù):self和args。

參數(shù)self 只在C函數(shù)被實現(xiàn)為內(nèi)聯(lián)方法(built-in method)時才被用到,通常該參數(shù)的值為空(NULL)。

參數(shù)args 中包含了Python解釋器要傳遞給C函數(shù)的所有參數(shù),通常使用Python的C語言擴展接口提供的函數(shù)PyArg_ParseTuple()來獲得這些參數(shù)值。

所有的導(dǎo)出函數(shù)都返回一個PyObject指針,如果對應(yīng)的C函數(shù)沒有真正的返回值(即返回值類型為void),則應(yīng)返回一個全局的None對象(Py_None),并將其引用計數(shù)增1,如下所示:

  1. PyObject* wrap_method(PyObject *self, PyObject *args) 
  2.  Py_INCREF(Py_None); 
  3.  return Py_None; 

3 方法列表

方法列表中列出了所有可以被Python解釋器使用的方法,上述例子對應(yīng)的方法列表為:

  1. static PyMethodDef mylibMethods[] = 
  2.  {"addone", wrap_addone, METH_VARARGS, "Add one to N"}, 
  3.  {NULL, NULL} 
  4. }; 

方法列表中的每項由四個部分組成:

方法名

導(dǎo)出函數(shù)

參數(shù)傳遞方式

方法描述

方法名是從Python解釋器中調(diào)用該方法時所使用的名字。

參數(shù)傳遞方式則規(guī)定了Python向C函數(shù)傳遞參數(shù)的具體形式,可選的兩種方式是METH_VARARGS和METH_KEYWORDS,其中METH_VARARGS是參數(shù)傳遞的標(biāo)準(zhǔn)形式,它通過Python的元組在Python解釋器和C函數(shù)之間傳遞參數(shù),若采用METH_KEYWORD方式,則Python解釋器和C函數(shù)之間將通過Python的字典類型在兩者之間進(jìn)行參數(shù)傳遞。

4 初始化函數(shù)

所有的Python擴展模塊都必須要有一個初始化函數(shù),以便Python解釋器能夠?qū)δK進(jìn)行正確的初始化。Python解釋器規(guī)定所有的初始化函數(shù)的函數(shù)名都必須以init開頭,并加上模塊的名字。對于模塊mylib來說,則相應(yīng)的初始化函數(shù)為:

  1. void initmylib() 
  2.  PyObject* m; 
  3.  m = Py_InitModule("mylib", mylibMethods); 

當(dāng)Python解釋器需要導(dǎo)入該模塊時,將根據(jù)該模塊的名稱查找相應(yīng)的初始化函數(shù),一旦找到則調(diào)用該函數(shù)進(jìn)行相應(yīng)的初始化工作,初始化函數(shù)則通過調(diào)用Python的C語言擴展接口所提供的函數(shù)Py_InitModule(),來向Python解釋器注冊該模塊中所有可以用到的方法。

5 編譯鏈接

要在Python解釋器中使用C語言編寫的擴展模塊,必須將其編譯成動態(tài)鏈接庫的形式。下面以Linux為例,介紹如何將C編寫的Python擴展模塊編譯成動態(tài)鏈接庫:

  1. $ gcc -fpic -shared -o mylib.so  
  2.  -I/usr/include/python2.7  
  3.  mylib.c wrap_mylib.c 

6 在Python中調(diào)用

上面編譯生成的Python擴展模塊的動態(tài)鏈接庫,可以在Python中直接import。如下所示:

  1. veelion@gtx:~$ python 
  2. Python 2.7.12 (default, Nov 19 201606:48:10
  3. [GCC 5.4.0 20160609] on linux2 
  4. Type "help""copyright""credits" or "license" for more information. 
  5. >>> import example 
  6. >>> example.addone(7
  7. 8 
  8. >>> 
  9. >>> 

這里生成的.so動態(tài)庫和上一篇中不用Python的C語言生成的動態(tài)庫是不一樣的,從生成過程和使用方法就可以看出來,這里的動態(tài)庫使用起來感覺就是一個Python模塊,直接import就可以了。

二、用boost_python庫封裝C++類

安裝boost python庫:

  1. sudo aptitude install libboost-python-dev 

示例

下面代碼簡單實現(xiàn)了一個普通函數(shù)maxab()和一個Student類:

  1. #include  
  2. #include  
  3. int maxab(int a, int b) { return a>b?a:b; } 
  4. class Student { 
  5.  private: 
  6.  int age; 
  7.  std::string name; 
  8.  public: 
  9.  Student() {} 
  10.  Student(std::string const& _name, int _age) { name=_name; age=_age; } 
  11.  static void myrole() { std::cout << "I'm a student!" << std::endl; } 
  12.  void whoami() { std::cout << "I am " << name << std::endl; } 
  13.  bool operator==(Student const& s) const { return age == s.age; } 
  14.  bool operator!=(Student const& s) const { return age != s.age; } 
  15. }; 

使用boost.python庫封裝也很簡單,如下代碼所示:

  1. #include  
  2. #include <boost/python.hpp> 
  3. #include <boost/python/suite/indexing/vector_indexing_suite.hpp> 
  4. #include  
  5. #include "student.h" 
  6. using namespace boost::python; 
  7. BOOST_PYTHON_MODULE(student) {  
  8.  // This will enable user-defined docstrings and python signatures, 
  9.  // while disabling the C++ signatures 
  10.  scope().attr("__version__") = "1.0.0"
  11.  scope().attr("__doc__") = "a demo module to use boost_python."
  12.  docstring_options local_docstring_options(true, false, false); 
  13.  def
  14.  "maxab", &maxab, "return max of two numbers. 
  15.  );  
  16.  class_("Student""a class of student"
  17.  .def(init<>()) 
  18.  .def(init<std::string, int>()) 
  19.  // methods for Chinese word segmentation 
  20.  .def
  21.  "whoami", &Student::whoami, "method's doc string..." 
  22.  )  
  23.  .def
  24.  "myrole", &Student::myrole, "method's doc string..." 
  25.  )  
  26.  .staticmethod("myrole"); 
  27.  // 封裝STL 
  28.  class_<std::vector >("StudentVec"
  29.  .def(vector_indexing_suite<std::vector >()) 
  30.  ;  

上述代碼還是include了Python.h文件,如果不include的話,會報錯誤:

  1. wrap_python.hpp:50:23: fatal error: pyconfig.h: No such file or directory 

編譯

編譯以上代碼有兩種方式,一種是在命令行下面直接使用g++編譯:

  1. g++ -I/usr/include/python2.7 -fPIC wrap_student.cpp -lboost_python -shared -o student.so 

首先指定Python.h的路徑,如果是Python 3的話就要修改為相應(yīng)的路徑,編譯wrap_student.cpp要指定-fPIC參數(shù),鏈接(-lboost_python)生成動態(tài)庫(-shared)。生成的student.so動態(tài)庫就可以被python直接import使用了

  1. In [1]: import student 
  2. In [2]: student.maxab(25
  3. Out[2]: 5 
  4. In [3]: s = student.Student('Tom'12
  5. In [4]: s.whoami() 
  6. I am Tom 
  7. In [5]: s.myrole() 
  8. I'm a student! 

另外一直方法是用python的setuptools編寫setup.py腳本:

  1. #!/usr/bin/env python 
  2. from setuptools import setup, Extension 
  3. setup(name="student"
  4.  ext_modules=[ 
  5.  Extension("student", ["wrap_student.cpp"],  
  6.  libraries = ["boost_python"]) 
  7. ]) 

然后執(zhí)行命令編譯:

  1. python setup.py build 
  2. or 
  3. sudo python setup.py install 

三、SWIG封裝C++類

Python調(diào)用C/C++代碼的利器除了boost_python外,還有SWIG(Simplified Wrapper and Interface Generator),它是用來為腳本語言調(diào)用C和C++程序的軟件開發(fā)工具,它實際上是一個編譯器,獲取C/C++的聲明和定義,用一個殼封裝起來,以便其它腳本語言訪問這些聲明。所以,SWIG 最大的好處就是將腳本語言的開發(fā)效率和 C/C++ 的運行效率有機的結(jié)合起來。

一個雙數(shù)組Trie Tree的實現(xiàn):cedar在中文分詞、新詞發(fā)現(xiàn)等算法中可以y用于詞典的創(chuàng)建。本文以cedar的SWIG封裝實現(xiàn)來說明SWIG的使用。

0. 安裝swig

工欲善其事必先利其器,首先要安裝swig,Ubuntu安裝swig很簡單:

  1. sudo aptitude install swig 

1. 聲明和定義C/C++代碼

在cedar的swig目錄下面有cedar的C++聲明和實現(xiàn)代碼trie.h,但是這個實現(xiàn)里面沒有遍歷所有key的函數(shù)方法,所以我添加了一個實現(xiàn),首先定義一個數(shù)據(jù)結(jié)構(gòu)來定義key:

  1. // key-value pair return type for next_key() 
  2. class kv_t { 
  3.  public: 
  4.  std::string key; 
  5.  int value; 
  6. }; 

添加一個函數(shù)每次返回一個key,當(dāng)key字符串為空時表示遍歷結(jié)束,繼續(xù)調(diào)用的話就又從頭開始遍歷:

  1. // to iterate all keys 
  2. kv_t next_key() const { 
  3. static size_t from = 0, p = 0
  4. union { int i; int x; } b; 
  5. char key[256] = {0}; 
  6. kv_t kv; 
  7. if(from == 0) { 
  8. b.i = _t->begin(from, p); 
  9. }else
  10. b.i = _t->next(from, p); 
  11. if (b.i == trie_t::CEDAR_NO_PATH) { 
  12. kv.key = ""; 
  13. kv.value = 0
  14. from = 0
  15. p = 0
  16. return kv; 
  17. _t->suffix(key, p, from); 
  18. kv.key = key; 
  19. kv.value = b.x; 
  20. return kv; 

2. 編寫接口文件.i

查看cedar.i可以看到SWIG的接口文件的編寫規(guī)則:

首先在 %module 后面聲明模塊名稱,這就是Python在import時使用的模塊名稱;

在%{ … %}之間包含相關(guān)頭文件

在%include 后面可以聲明對STL的支持

最后聲明要封裝的函數(shù)和變量,也可以之間包含頭文件:%include “trie.h”

3. 封裝代碼

可以在Makefile里面看到python-bindings:

  1. python-bindings: 
  2.  swig -Wall -python -builtin -outdir python -c++ cedar.i 
  3.  mv -f cedar_wrap.cxx python 

直接make或者單獨運行上面的swig命令,就可以生成cedar.py和cedar_wrap.cxx文件。

4. 編譯生成動態(tài)庫

編譯生成的cedar_wrap.cxx使用python distutils的setup,可以參考python/setup.py的編寫。setup.py的build如下:

  1. python setup.py build 

就會在當(dāng)前目錄下面創(chuàng)建目錄build,下面生成lib.linux-x86_64-2.7/cedar.py 和 _cedar.so

四、 pybind11封裝C++

從pybind11的名字可以看出,它是用來封裝C++ 11代碼為Python模塊的庫。它的目標(biāo)和用法都是想Boost_python庫看齊,但是它又比龐大的Boost庫精簡。我知道這個庫的時間不長,也沒有具體實踐過。以前都是寫C++,然后用boost封裝。但是,感覺pybind11更簡潔,所以下一個項目可以試試它。到時候再分享使用心得給大家。

責(zé)任編輯:張燕妮 來源: 頭條科技
相關(guān)推薦

2021-08-18 08:00:00

Emscripten開發(fā)技術(shù)

2021-05-18 14:25:30

Linux運維Linux系統(tǒng)

2019-12-05 10:08:39

Python 開發(fā)編程語言

2020-05-26 13:25:00

語言編譯代碼

2025-04-02 07:40:30

2010-03-26 11:00:55

Python嵌入CC++

2010-01-15 17:18:57

C++源程序

2010-03-23 10:47:46

python代碼

2015-04-15 09:28:45

JavaScript熱門工具

2010-01-13 18:44:03

C++編譯

2010-01-28 10:33:10

C++開發(fā)程序

2010-03-26 11:00:55

Python嵌入CC++

2020-07-07 10:55:01

C++C語言代碼

2010-01-22 13:20:27

C++代碼

2010-01-20 13:29:40

C++環(huán)境

2010-01-26 15:51:06

C++變量

2010-01-21 11:23:58

C++函數(shù)調(diào)用

2009-08-14 15:07:00

C#編譯過程

2011-01-14 12:44:32

Linux PPCEclipseC

2009-12-16 10:15:58

VS2003編譯
點贊
收藏

51CTO技術(shù)棧公眾號