自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<big id="smriu"><font id="smriu"><form id="smriu"></form></font></big>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

讓Python更加充分的使用Sqlite3

作者：佚名 2017-10-26 12:37:24

開發(fā) 后端

筆者最近在涉及大量數據處理的項目中頻繁使用 sqlite3。我最初的嘗試根本不涉及任何數據庫，所有的數據都將保存在內存中，包括字典查找、迭代和條件等查詢。這很好，但可以放入內存的只有那么多，并且將數據從磁盤重新生成或加載到內存是一個繁瑣又耗時的過程。

我最近在涉及大量數據處理的項目中頻繁使用 sqlite3。我最初的嘗試根本不涉及任何數據庫，所有的數據都將保存在內存中，包括字典查找、迭代和條件等查詢。這很好，但可以放入內存的只有那么多，并且將數據從磁盤重新生成或加載到內存是一個繁瑣又耗時的過程。

我決定試一試sqlite3。因為只需打開與數據庫的連接，這樣可以增加可處理的數據量，并將應用程序的加載時間減少到零。此外，我可以通過 SQL 查詢替換很多Python邏輯語句。

我想分享一些關于這次經歷的心得和發(fā)現(xiàn)。

TL;DR

使用大量操作 (又名 executemany)。
你不需要使用光標 (大部分時間)。
光標可被迭代。
使用上下文管理器。
使用編譯指示 (當它有意義)。
推遲索引創(chuàng)建。
使用占位符來插入 python 值。

1. 使用大量操作

如果你需要在數據庫中一次性插入很多行，那么你真不應該使用 execute。sqlite3 模塊提供了批量插入的方式：executemany。

而不是像這樣做：

for row in iter_data():  
connection.execute('INSERT INTO my_table VALUES (?)', row)

你可以利用這個事實，即 executemany 接受元組的生成器作為參數：

connection.executemany( 
    'INSERT INTO my_table VALUE (?)', 
    iter_data() 
)

這不僅更簡潔，而且更高效。實際上，sqlite3 在幕后利用 executemany 實現(xiàn) execute，但后者插入一行而不是多行。

我寫了一個小的基準測試，將一百萬行插入空表(數據庫在內存中)：

executemany: 1.6 秒
execute: 2.7 秒

2. 你不需要游標

一開始我經常搞混的事情就是，光標管理。在線示例和文檔中通常如下：

connection = sqlite3.connect(':memory:') 
cursor = connection.cursor() 
# Do something with cursor

但大多數情況下，你根本不需要光標，你可以直接使用連接對象。

像 execute

executemany

類似的操作可以直接在連接上調用。以下是一個證明此事的示例：

import sqlite3 
 
connection = sqlite3(':memory:') 
 
# Create a table 
connection.execute('CREATE TABLE events(ts, msg)') 
 
# Insert values 
connection.executemany( 
    'INSERT INTO events VALUES (?,?)', 
    [ 
        (1, 'foo'), 
        (2, 'bar'), 
        (3, 'baz') 
    ] 
) 
 
# Print inserted rows 
for row in connnection.execute('SELECT * FROM events'): 
    print(row)

3. 光標(Cursor)可被用于迭代

你可能經常會看到使用fetchone或fetchall來處理 SELECT 查詢結果的示例。但是我發(fā)現(xiàn)處理這些結果的最自然的方式是直接在光標上迭代：

for row in connection.execute('SELECT * FROM events'): 
    print(row)

這樣一來，只要你得到足夠的結果，你就可以終止查詢，并且不會引起資源浪費。當然，如果事先知道你需要多少結果，可以改用 LIMIT SQL語句，但Python生成器是非常方便的，可以讓你將數據生成與數據消耗分離。

4. 使用Context Managers(上下文管理器)

即使在處理SQL事務的中間，也會發(fā)生討厭的事情。為了避免手動處理回滾或提交，你可以簡單地使用連接對象作為上下文管理器。在以下示例中，我們創(chuàng)建了一個表，并錯誤地插入了重復的值：

import sqlite3 
connection = sqlite3.connect(':memory:') 
 
with connection: 
    connection.execute( 
        'CREATE TABLE events(ts, msg, PRIMARY KEY(ts, msg))') 
 
try: 
    with connection: 
        connection.executemany('INSERT INTO events VALUES (?, ?)', [ 
            (1, 'foo'), 
            (2, 'bar'), 
            (3, 'baz'), 
            (1, 'foo'), 
        ]) 
except (sqlite3.OperationalError, sqlite3.IntegrityError) as e: 
    print('Could not complete operation:', e) 
     
# No row was inserted because transaction failed 
for row in connection.execute('SELECT * FROM events'): 
    print(row) 
     
connection.close()

5. 使用Pragmas

…當它真的有用時

在你的程序中有幾個 pragma 可用于調整 sqlite3 的行為。特別地，其中一個可以改善性能的是 synchronous ：

connection.execute('PRAGMA synchronous = OFF')

你應該知道這可能是危險的。如果應用程序在事務中間意外崩潰，數據庫可能會處于不一致的狀態(tài)。所以請小心使用! 但是如果你要更快地插入很多行，那么這可能是一個選擇。

6. 推遲索引創(chuàng)建

假設你需要在數據庫上創(chuàng)建幾個索引，而你需要在插入很多行的同時創(chuàng)建索引。把索引的創(chuàng)建推遲到所有行的插入之后可以導致實質性的性能改善。

7. 使用占位符插入 Python 值

使用 Python 字符串操作將值包含到查詢中是很方便的。但是這樣做非常不安全，而 sqlite3 給你提供了更好的方法來做到這一點：

# Do not do this! 
my_timestamp = 1 
c.execute("SELECT * FROM events WHERE ts = '%s'" % my_timestamp) 
 
# Do this instead 
my_timestamp = (1,) 
c.execute('SELECT * FROM events WHERE ts = ?', my_timestamp)

此外，使用Python%s(或格式或格式的字符串常量)的字符串插值對于 executemany 來說并不是總是可行。所以在此嘗試沒有什么真正意義!

請記住，這些小技巧可能會(也可能不會)給你帶來好處，具體取決于特定的用例。你應該永遠自己去嘗試，決定是否值得這么做。

責任編輯：未麗燕來源：開源中國翻譯文章

Python sqlite3 數據庫

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營

<cite id="hc36b"></cite>

<style id="hc36b"></style>