自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

深入Python膠水語言的本質(zhì)：從CPython到各類擴展機制

作者：piperliu 2024-12-27 08:01:07

開發(fā) 后端

Python的膠水特性不是偶然的，而是精心設(shè)計的結(jié)果。從最底層的Python/C API，到便捷的ctypes，再到現(xiàn)代化的pybind11，Python提供了完整的解決方案譜系。

在開始深入講解Python如何作為膠水語言之前，我們需要先了解Python語言本身的實現(xiàn)機制。這對于理解Python如何與C語言交互至關(guān)重要。

CPython：Python的默認實現(xiàn)

當我們談?wù)揚ython時，實際上通常指的是CPython，即用C語言實現(xiàn)的Python解釋器。這是Python的參考實現(xiàn)，也是最廣泛使用的Python解釋器。

CPython的基本架構(gòu)

CPython主要包含以下幾個部分：

Python解釋器核心
內(nèi)存管理系統(tǒng)
Python對象系統(tǒng)
Python/C API

當我們執(zhí)行一個Python程序時，大致流程是：

source code (.py文件)
    → 詞法分析
    → 語法分析
    → 生成字節(jié)碼 (.pyc文件)
    → Python虛擬機執(zhí)行字節(jié)碼

從CPython說起

要理解Python如何作為膠水語言工作，我們必須先深入了解CPython的工作機制。CPython是Python的參考實現(xiàn)，也是最廣泛使用的Python解釋器。

CPython的編譯和執(zhí)行過程

當我們運行一個Python程序時，實際發(fā)生了這些步驟：

詞法分析：

def add(a, b):
    return a + b

這段代碼首先被分解成一系列標記（tokens）：

NAME(def) NAME(add) LPAR NAME(a) COMMA NAME(b) RPAR COLON
NAME(return) NAME(a) PLUS NAME(b)

語法分析：

tokens被轉(zhuǎn)換為抽象語法樹（AST）。你可以用Python的ast模塊查看：

import ast

code = """
def add(a, b):
    return a + b
"""

tree = ast.parse(code)
print(ast.dump(tree, indent=2))

"""
Module(
  body=[
    FunctionDef(
      name='add',
      args=arguments(
        posonlyargs=[],
        args=[
          arg(arg='a'),
          arg(arg='b')],
        kwonlyargs=[],
        kw_defaults=[],
        defaults=[]),
      body=[
        Return(
          value=BinOp(
            left=Name(id='a', ctx=Load()),
            op=Add(),
            right=Name(id='b', ctx=Load())))],
      decorator_list=[])],
  type_ignores=[])
"""

生成字節(jié)碼：

AST被轉(zhuǎn)換為Python字節(jié)碼。使用dis模塊可以查看：

import dis

def add(a, b):
    return a + b

dis.dis(add)

輸出類似：

0 LOAD_FAST                0 (a)
    2 LOAD_FAST                1 (b)
    4 BINARY_ADD
    6 RETURN_VALUE

執(zhí)行字節(jié)碼：

Python虛擬機（PVM）執(zhí)行這些字節(jié)碼。這就是為什么Python是解釋型語言。

Python 虛擬機和對象系統(tǒng)

CPython的核心是其虛擬機和對象系統(tǒng)。所有Python中的數(shù)據(jù)都是對象，包括函數(shù)、類、數(shù)字等。在C層面，它們都是PyObject結(jié)構(gòu)體：

typedef struct _object {
    Py_ssize_t ob_refcnt;        /* 引用計數(shù) */
    PyTypeObject *ob_type;       /* 對象類型 */
} PyObject;

更具體的類型會擴展這個基本結(jié)構(gòu)。例如，Python的整數(shù)類型：

typedef struct {
    PyObject_HEAD                /* 包含基本的PyObject結(jié)構(gòu) */
    long ob_ival;               /* 實際的整數(shù)值 */
} PyIntObject;

Python.h：連接Python和C的橋梁

Python.h是Python C API的主要頭文件，它定義了與Python解釋器交互所需的所有接口。當我們編寫C擴展時，這個文件會：

定義所有Python類型的C表示
提供引用計數(shù)宏（Py_INCREF，Py_DECREF）
提供對象創(chuàng)建和操作函數(shù)
定義異常處理機制

一個簡單的例子：

#include <Python.h>

static PyObject* 
my_sum(PyObject *self, PyObject *args) {
    long a, b;
    
    /* 解析參數(shù) */
    if (!PyArg_ParseTuple(args, "ll", &a, &b)) {
        /* 若解析失敗，PyArg_ParseTuple已設(shè)置異常 */
        return NULL;
    }
    
    /* 檢查溢出 */
    if (a > PY_LLONG_MAX - b) {
        PyErr_SetString(PyExc_OverflowError, "result too large");
        return NULL;
    }
    
    /* 創(chuàng)建并返回結(jié)果 */
    return PyLong_FromLong(a + b);
}

在這段代碼中：

PyArg_ParseTuple 負責(zé)將Python參數(shù)轉(zhuǎn)換為C類型。
PyErr_SetString 設(shè)置Python異常。
PyLong_FromLong 將C的long轉(zhuǎn)換為Python的int對象。

這就是Python/C API的基礎(chǔ)。在下一部分中，我們將詳細討論各種擴展機制，包括ctypes的性能開銷原理，以及numpy等庫的具體實現(xiàn)細節(jié)。

Python調(diào)用C代碼的三種主要方式

Python/C API：底層但強大的方式

讓我們通過一個詳細的例子來理解Python/C API：

// example.c
#include <Python.h>

/*
 * PyObject是Python對象在C中的表示
 * 所有Python對象在C中都是PyObject指針
 */
static PyObject* add_numbers(PyObject* self, PyObject* args) {
    int a, b;
    
    // PyArg_ParseTuple解析Python傳入的參數(shù)
    // "ii"表示期望兩個整數(shù)參數(shù)
    if (!PyArg_ParseTuple(args, "ii", &a, &b)) {
        return NULL;  // 解析失敗時返回NULL，Python會拋出異常
    }
    
    // Py_BuildValue構(gòu)建Python對象并返回
    // "i"表示構(gòu)建一個整數(shù)對象
    return Py_BuildValue("i", a + b);
}

/* 
 * 方法表，定義模塊中的函數(shù)
 * 每個入口包含：{方法名, 函數(shù)指針, 參數(shù)類型標志, 文檔字符串}
 */
static PyMethodDef methods[] = {
    {"add_numbers", add_numbers, METH_VARARGS, "Add two numbers"},
    {NULL, NULL, 0, NULL}  // 使用NULL標記結(jié)束
};

/*
 * 模塊定義結(jié)構(gòu)體
 * 包含模塊的各種信息
 */
static struct PyModuleDef module = {
    PyModuleDef_HEAD_INIT,  // 必需的初始化宏
    "example",              // 模塊名
    NULL,                   // 模塊文檔
    -1,                     // 模塊狀態(tài)，-1表示模塊保持全局狀態(tài)
    methods                 // 方法表
};

/*
 * 模塊初始化函數(shù)
 * 模塊被import時調(diào)用
 */
PyMODINIT_FUNC PyInit_example(void) {
    return PyModule_Create(&module);
}

要編譯這個C擴展，我們需要創(chuàng)建setup.py：

from setuptools import setup, Extension

module = Extension('example',
                  sources=['example.c'])

setup(name='example',
      version='1.0',
      ext_modules=[module])

然后執(zhí)行：

python setup.py build_ext --inplace

ctypes：Python標準庫的橋梁

ctypes提供了一種更簡單的方式來調(diào)用C函數(shù)：

from ctypes import cdll, c_int

# 加載動態(tài)鏈接庫
lib = cdll.LoadLibrary('./libmath.so')

# 設(shè)置函數(shù)參數(shù)和返回值類型
lib.add_numbers.argtypes = [c_int, c_int]
lib.add_numbers.restype = c_int

# 調(diào)用C函數(shù)
result = lib.add_numbers(1, 2)

ctypes的優(yōu)勢在于不需要編寫C代碼，但它也有一些限制：

性能開銷較大
類型安全性較差
不支持復(fù)雜的數(shù)據(jù)結(jié)構(gòu)

ctypes的性能開銷主要來自以下幾個方面：

類型轉(zhuǎn)換開銷：

from ctypes import c_int, cdll

lib = cdll.LoadLibrary('./libmath.so')

# 每次調(diào)用都需要進行類型轉(zhuǎn)換
result = lib.add(c_int(1), c_int(2))

當我們調(diào)用C函數(shù)時，ctypes需要：

將Python對象轉(zhuǎn)換為C類型
調(diào)用C函數(shù)
將返回值轉(zhuǎn)換回Python對象

這個過程涉及多次內(nèi)存分配和復(fù)制。

函數(shù)調(diào)用開銷：

// C代碼
int add(int a, int b) {
    return a + b;
}

# Python代碼
lib.add.argtypes = [c_int, c_int]
lib.add.restype = c_int

# 每次調(diào)用都需要：
# 1. 查找函數(shù)指針
# 2. 設(shè)置參數(shù)
# 3. 調(diào)用函數(shù)
# 4. 檢查錯誤
result = lib.add(1, 2)

動態(tài)查找開銷：

ctypes需要在運行時動態(tài)查找符號，這比編譯時鏈接慢。

比較一下性能差異：

import timeit
import ctypes

# ctypes版本
lib = ctypes.CDLL('./libmath.so')
lib.add.argtypes = [ctypes.c_int, ctypes.c_int]
lib.add.restype = ctypes.c_int

def ctypes_add():
    return lib.add(1, 2)

# Python/C API版本
import example

def capi_add():
    return example.add(1, 2)

# 性能測試
print("ctypes:", timeit.timeit(ctypes_add, number=1000000))
print("C API:", timeit.timeit(capi_add, number=1000000))

通常，C API版本會比ctypes快5-10倍。

pybind11：現(xiàn)代C++的最佳選擇

pybind11通過模板元編程實現(xiàn)了優(yōu)雅的接口。讓我們看一個復(fù)雜點的例子：

#include <pybind11/pybind11.h>
#include <pybind11/stl.h>
#include <pybind11/numpy.h>

namespace py = pybind11;

class Matrix {
private:
    std::vector<double> data;
    size_t rows, cols;

public:
    Matrix(size_t r, size_t c) : rows(r), cols(c), data(r * c) {}
    
    // 支持numpy數(shù)組操作
    py::array_t<double> as_array() {
        return py::array_t<double>(
            {rows, cols}, // shape
            {cols * sizeof(double), sizeof(double)}, // strides
            data.data(), // data pointer
            py::cast(this) // owner object
        );
    }
    
    // 矩陣乘法
    Matrix dot(const Matrix& other) {
        if (cols != other.rows)
            throw std::runtime_error("Dimension mismatch");
            
        Matrix result(rows, other.cols);
        // ... 實現(xiàn)矩陣乘法 ...
        return result;
    }
};

PYBIND11_MODULE(example, m) {
    py::class_<Matrix>(m, "Matrix")
        .def(py::init<size_t, size_t>())
        .def("as_array", &Matrix::as_array)
        .def("dot", &Matrix::dot)
        .def("__repr__",
            [](const Matrix& m) {
                return "<Matrix object>";
            }
        );
}

這個例子展示了pybind11的幾個重要特性：

自動類型轉(zhuǎn)換
異常處理
numpy集成
運算符重載

實際案例分析

NumPy的實現(xiàn)機制

NumPy的核心是ndarray，它的實現(xiàn)涉及多個層次：

Python層 (numpy/__init__.py, numpy/core/__init__.py等)
    ↓
C核心層 (numpy/core/src/multiarray/*.c)
    ↓
BLAS/LAPACK (線性代數(shù)計算庫)

關(guān)鍵文件結(jié)構(gòu)：

numpy/
├── _core/
│   ├── src/
│   │   ├── multiarray/
│   │   │   ├── array_method.c     # 數(shù)組操作的C實現(xiàn)
│   │   │   └── descriptor.c       # 數(shù)據(jù)類型描述符
│   │   └── umath/
│   │       └── loops.c            # 數(shù)學(xué)運算的循環(huán)實現(xiàn)
│   └── _multiarray_umath.pyx      # Cython接口
└── setup.py                       # 構(gòu)建腳本

aiohttp的實現(xiàn)機制

aiohttp使用Cython來優(yōu)化性能關(guān)鍵部分：

aiohttp/
├── _helpers.pyx          # Cython實現(xiàn)的helpers
├── _http_parser.pyx      # HTTP解析器的Cython實現(xiàn)
├── _http_writer.pyx      # HTTP寫入器的Cython實現(xiàn)
└── setup.py

PyTorch的pybind11實現(xiàn)

PyTorch大量使用pybind11來暴露C++接口：

// torch/csrc/Module.cpp
PYBIND11_MODULE(torch._C, m) {
    py::class_<torch::Tensor>(m, "Tensor")
        .def("backward", &torch::Tensor::backward)
        .def("to", &torch::Tensor::to)
        // ... 更多方法綁定
}

總結(jié)

Python的膠水特性不是偶然的，而是精心設(shè)計的結(jié)果。從最底層的Python/C API，到便捷的ctypes，再到現(xiàn)代化的pybind11，Python提供了完整的解決方案譜系。

理解這些機制不僅有助于我們更好地使用Python，也能幫助我們在需要時正確選擇和實現(xiàn)C擴展。在實際工作中，要根據(jù)具體需求選擇合適的方案，在性能和開發(fā)效率之間找到平衡點。

責(zé)任編輯：姜華來源： Piper蛋窩

Python 膠水特性 CPython

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<thead id="37tb6"></thead>