自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

如何修復(fù)使用Python ORM工具SQLAlchemy時(shí)的常見陷阱

開發(fā) 后端
本文解釋了開發(fā)人員在使用 SQLAlchemy 時(shí)遇到的一些最重要的性能問題,以及如何解決這些問題。

[[282917]]

在使用 SQLAlchemy 時(shí),那些看似很小的選擇可能對(duì)這種對(duì)象關(guān)系映射工具包的性能產(chǎn)生重要影響。

對(duì)象關(guān)系映射Object-relational mappingORM)使應(yīng)用程序開發(fā)人員的工作更輕松,在很大程度是因?yàn)樗试S你使用你可能知道的語(yǔ)言(例如 Python)與數(shù)據(jù)庫(kù)交互,而不是使用原始 SQL 語(yǔ)句查詢。SQLAlchemy 是一個(gè) Python ORM 工具包,它提供使用 Python 訪問 SQL 數(shù)據(jù)庫(kù)的功能。它是一個(gè)成熟的 ORM 工具,增加了模型關(guān)系、強(qiáng)大的查詢構(gòu)造范式、簡(jiǎn)單的序列化等優(yōu)點(diǎn)。然而,它的易用性使得人們很容易忘記其背后發(fā)生了什么。使用 SQLAlchemy 時(shí)做出的看似很小的選擇可能產(chǎn)生非常大的性能影響。

本文解釋了開發(fā)人員在使用 SQLAlchemy 時(shí)遇到的一些最重要的性能問題,以及如何解決這些問題。

只需要計(jì)數(shù)但檢索整個(gè)結(jié)果集

有時(shí)開發(fā)人員只需要一個(gè)結(jié)果計(jì)數(shù),但是沒有使用數(shù)據(jù)庫(kù)計(jì)數(shù)功能,而是獲取了所有結(jié)果,然后使用 Python 中的 len 完成計(jì)數(shù)。

  1. count = len(User.query.filter_by(acct_active=True).all())

相反,使用 SQLAlchemy 的 count 方法將在服務(wù)器端執(zhí)行計(jì)數(shù),從而減少發(fā)送到客戶端的數(shù)據(jù)。在前面的例子中調(diào)用 all() 也會(huì)導(dǎo)致模型對(duì)象的實(shí)例化,如果有很多數(shù)據(jù),那么時(shí)間代價(jià)可能會(huì)非常昂貴。

除非還需要做其他的事情,否則只需使用 count 方法:

  1. count = User.query.filter_by(acct_active=True).count()

只需要幾列時(shí)檢索整個(gè)模型

在許多情況下,發(fā)出查詢時(shí)只需要幾列數(shù)據(jù)。SQLAlchemy 可以只獲取你想要的列,而不是返回整個(gè)模型實(shí)例。這不僅減少了發(fā)送的數(shù)據(jù)量,還避免了實(shí)例化整個(gè)對(duì)象。使用列數(shù)據(jù)的元組而不是模型可以快得多。

  1. result = User.query.all()
  2. for user in result:
  3.     print(user.name, user.email)

反之,使用 with_entities 方法只選擇所需要的內(nèi)容:

  1. result = User.query.with_entities(User.name, User.email).all()
  2. for (username, email) in result:
  3.     print(username, email)

每次循環(huán)都更新一個(gè)對(duì)象

避免使用循環(huán)來單獨(dú)更新集合。雖然數(shù)據(jù)庫(kù)可以非??斓貓?zhí)行單個(gè)更新,但應(yīng)用程序和數(shù)據(jù)庫(kù)服務(wù)器之間的往返時(shí)間將快速累加。通常,在合理的情況下爭(zhēng)取更少的查詢。

  1. for user in users_to_update:
  2.   user.acct_active = True
  3.   db.session.add(user)

改用批量更新方法:

  1. query = User.query.filter(user.id.in_([user.id for user in users_to_update]))
  2. query.update({"acct_active": True}, synchronize_session=False)

觸發(fā)級(jí)聯(lián)刪除

ORM 允許在模型關(guān)系上進(jìn)行簡(jiǎn)單的配置,但是有一些微妙的行為可能會(huì)令人吃驚。大多數(shù)數(shù)據(jù)庫(kù)通過外鍵和各種級(jí)聯(lián)選項(xiàng)維護(hù)關(guān)系完整性。SQLAlchemy 允許你使用外鍵和級(jí)聯(lián)選項(xiàng)定義模型,但是 ORM 具有自己的級(jí)聯(lián)邏輯,可以取代數(shù)據(jù)庫(kù)。

考慮以下模型:

  1. class Artist(Base):
  2.     __tablename__ = "artist"
  3.  
  4.     id = Column(Integer, primary_key=True)
  5.     songs = relationship("Song", cascade="all, delete")
  6.  
  7.  
  8. class Song(Base):
  9.     __tablename__ = "song"
  10.  
  11.     id = Column(Integer, primary_key=True)
  12.     artist_id = Column(Integer, ForeignKey("artist.id", ondelete="CASCADE"))

刪除歌手將導(dǎo)致 ORM 在 song 表上發(fā)出 delete 查詢,從而防止由于外鍵導(dǎo)致的刪除操作。這種行為可能會(huì)成為復(fù)雜關(guān)系和大量記錄的瓶頸。

請(qǐng)包含 passive_deletes 選項(xiàng),以確保讓數(shù)據(jù)庫(kù)來管理關(guān)系。但是,請(qǐng)確保你的數(shù)據(jù)庫(kù)具有此功能。例如,SQLite 默認(rèn)情況下不管理外鍵。

  1. songs = relationship("Song", cascade all, delete", passive_deletes=True)

當(dāng)要使用貪婪加載時(shí),應(yīng)使用延遲加載

延遲加載是 SQLAlchemy 處理關(guān)系的默認(rèn)方法。從上一個(gè)例子構(gòu)建來看,加載一個(gè)歌手時(shí)不會(huì)同時(shí)加載他或她的歌曲。這通常是一個(gè)好主意,但是如果總是需要加載某些關(guān)系,單獨(dú)的查詢可能會(huì)造成浪費(fèi)。

如果允許以延遲方式加載關(guān)系,像 Marshmallow 這樣流行的序列化框架可以觸發(fā)級(jí)聯(lián)查詢。

有幾種方法可以控制此行為。最簡(jiǎn)單的方法是通過 relationship 函數(shù)本身。

  1. songs = relationship("Song", lazy="joined", cascade="all, delete")

這將導(dǎo)致一個(gè)左連接被添加到任何歌手的查詢中,因此,songs 集合將立即可用。盡管有更多數(shù)據(jù)返回給客戶端,但往返次數(shù)可能會(huì)少得多。

SQLAlchemy 為無法采用這種綜合方法的情況提供了更細(xì)粒度的控制,可以使用 joinedload() 函數(shù)在每個(gè)查詢的基礎(chǔ)上切換連接的加載。

  1. from sqlalchemy.orm import joinedload
  2.  
  3. artists = Artist.query.options(joinedload(Artist.songs))
  4. print(artists.songs) # Does not incur a roundtrip to load

使用 ORM 進(jìn)行批量記錄導(dǎo)入

導(dǎo)入成千上萬(wàn)條記錄時(shí),構(gòu)建完整模型實(shí)例的開銷會(huì)成為主要瓶頸。想象一下,從一個(gè)文件中加載數(shù)千首歌曲記錄,其中每首歌曲都先被轉(zhuǎn)換為字典。

  1. for song in songs:
  2.     db.session.add(Song(`song))

相反,繞過 ORM,只使用核心的 SQLAlchemy 參數(shù)綁定功能。

  1. batch = []
  2. insert_stmt = Song.__table__.insert()
  3. for song in songs:
  4.     if len(batch) > 1000:
  5.        db.session.execute(insert_stmt, batch)
  6.        batch.clear()
  7.     batch.append(song)
  8. if batch:
  9.     db.session.execute(insert_stmt, batch)

請(qǐng)記住,此方法會(huì)自然而然地跳過你可能依賴的任何客戶端 ORM 邏輯,例如基于 Python 的列默認(rèn)值。盡管此方法比將對(duì)象加載為完整的模型實(shí)例要快,但是你的數(shù)據(jù)庫(kù)可能具有更快的批量加載方法。例如,PostgreSQL 的 COPY 命令為加載大量記錄提供了最佳性能。

過早調(diào)用提交或刷新

在很多情況下,你需要將子記錄與其父記錄相關(guān)聯(lián),反之亦然。一種顯然的方法是刷新會(huì)話,以便為有問題的記錄分配一個(gè) ID。

  1. artist = Artist(name="Bob Dylan")
  2. song = Song(title="Mr. Tambourine Man")
  3.  
  4. db.session.add(artist)
  5. db.session.flush()
  6.  
  7. song.artist_id = artist.id

對(duì)于每個(gè)請(qǐng)求,多次提交或刷新通常是不必要的,也是不可取的。數(shù)據(jù)庫(kù)刷新涉及強(qiáng)制在數(shù)據(jù)庫(kù)服務(wù)器上進(jìn)行磁盤寫入,在大多數(shù)情況下,客戶端將阻塞,直到服務(wù)器確認(rèn)已寫入數(shù)據(jù)為止。

SQLAlchemy 可以在幕后跟蹤關(guān)系和管理相關(guān)鍵。

  1. artist = Artist(name="Bob Dylan")
  2. song = Song(title="Mr. Tambourine Man")
  3.  
  4. artist.songs.append(song)

總結(jié)

我希望這一系列常見的陷阱可以幫助你避免這些問題,并使你的應(yīng)用平穩(wěn)運(yùn)行。通常,在診斷性能問題時(shí),測(cè)量是關(guān)鍵。大多數(shù)數(shù)據(jù)庫(kù)都提供性能診斷功能,可以幫助你定位問題,例如 PostgreSQL 的 pg_stat_statements 模塊。 

責(zé)任編輯:龐桂玉 來源: Linux中國(guó)
相關(guān)推薦

2016-09-23 13:34:15

PythonORMsqlalchemy

2023-05-17 10:16:04

ORM工具包SQLAlchemy

2024-06-20 13:38:03

2013-11-26 16:05:24

Linux共享內(nèi)存

2016-09-06 12:05:23

SaaSSaaS平臺(tái)SaaS服務(wù)

2009-06-16 13:48:42

Java多線程

2020-08-13 06:43:41

React前端開發(fā)

2017-01-23 08:41:43

云計(jì)算

2017-10-18 19:44:20

數(shù)據(jù)庫(kù)DatasetSQLAlchemy

2019-08-22 10:43:15

Windows 10相機(jī)修復(fù)

2009-06-08 16:48:59

虛擬化服務(wù)器虛擬化IT

2016-01-11 10:56:42

BYOD自帶設(shè)備

2011-12-25 15:37:51

ibmdw

2017-08-02 16:47:43

數(shù)據(jù)數(shù)據(jù)收集數(shù)據(jù)分析

2015-09-21 09:10:36

排查修復(fù)Windows 10

2021-02-28 13:19:42

大數(shù)據(jù)IT數(shù)據(jù)管理

2018-11-18 16:31:14

Kubernetes監(jiān)控容器

2025-03-26 05:00:00

AIprompt交互效果

2021-11-02 10:40:51

內(nèi)網(wǎng)穿透代理工具Linux

2023-12-22 16:48:00

Kubernetes容器集群
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)