量子CNN對(duì)數(shù)據(jù)集的測(cè)試準(zhǔn)確率高,但存在局限性
在10月4日公布的2022年諾貝爾獎(jiǎng)中,Alain Aspect 、John F. Clause 和 Anton Zeilinger 三位科學(xué)家憑借量子糾纏獲得物理學(xué)獎(jiǎng)項(xiàng),引起了外界對(duì)量子研究領(lǐng)域的關(guān)注和討論。
其中,以量子計(jì)算為代表的研究投資近幾年迎來(lái)顯著增加,人們開(kāi)始探索從安全、網(wǎng)絡(luò)通信等領(lǐng)域出發(fā),用量子方法來(lái)顛覆現(xiàn)有的經(jīng)典計(jì)算技術(shù)。
有研究人員認(rèn)為,量子計(jì)算的核心在于“通過(guò)計(jì)算成本更低的技術(shù)解決經(jīng)典難題”,而隨著近年來(lái)深度學(xué)習(xí)和量子計(jì)算的研究并行發(fā)展,不少研究者也開(kāi)始關(guān)注到這兩個(gè)領(lǐng)域的交叉點(diǎn):量子深度學(xué)習(xí)。
近日,Xbox 游戲工作室 Rare 洞察主管 Holly Emblem 在新的文章“Quantum Deep Learning: A Quick Guide to Quantum Convolutional Neural Networks”中,就量子深度學(xué)習(xí)的現(xiàn)有研究和應(yīng)用進(jìn)行介紹,并重點(diǎn)討論了量子卷積神經(jīng)網(wǎng)絡(luò) (QCNN)與經(jīng)典計(jì)算方法相比存在的優(yōu)勢(shì)和局限性。
1 經(jīng)典計(jì)算和量子計(jì)算的區(qū)別
首先介紹一個(gè)關(guān)于經(jīng)典計(jì)算和量子計(jì)算區(qū)別的重要概念。在經(jīng)典計(jì)算機(jī)上執(zhí)行程序時(shí),編譯器會(huì)將程序語(yǔ)句轉(zhuǎn)換為二進(jìn)制位;而在量子計(jì)算中,與經(jīng)典計(jì)算機(jī)上的位在任何時(shí)候都代表 1 或 0 的狀態(tài)不同,量子位能夠在這兩種狀態(tài)間“懸?!?,只有當(dāng)它被測(cè)量時(shí),量子比特才會(huì)崩潰到它的兩個(gè)基態(tài)之一,即 1 或 0。
這種屬性稱為疊加,在量子計(jì)算任務(wù)中有至關(guān)重要的作用。通過(guò)疊加,量子計(jì)算機(jī)可以并行執(zhí)行任務(wù),而不需要完全并行的架構(gòu)或 GPU 來(lái)執(zhí)行。其原因在于,當(dāng)每個(gè)疊加狀態(tài)對(duì)應(yīng)一個(gè)不同的值,如果對(duì)疊加狀態(tài)進(jìn)行操作,則該操作同時(shí)在所有狀態(tài)上執(zhí)行。
這里舉一個(gè)疊加量子態(tài)的例子:
量子態(tài)的疊加是指數(shù)的,a 和 b 指概率幅度,其給出了一旦執(zhí)行測(cè)量就投射到一個(gè)狀態(tài)的概率。其中,疊加量子態(tài)是通過(guò)使用量子邏輯門來(lái)創(chuàng)建的。
圖注:Ragsxl 在芬蘭埃斯波的 IQM 量子計(jì)算機(jī)
2 糾纏和貝爾態(tài)
疊加在量子物理學(xué)中十分重要,而另一個(gè)關(guān)鍵的原理則是糾纏。
糾纏指在兩個(gè)或多個(gè)粒子之間、以某種方式產(chǎn)生或引起相互作用的行為,這意味著這些粒子的量子態(tài)不再能彼此獨(dú)立地描述,即使相隔很遠(yuǎn)也是如此。當(dāng)粒子被糾纏時(shí),如果一個(gè)粒子被測(cè)量,與之糾纏的另一個(gè)粒子將立即測(cè)量為相反的狀態(tài)(這些粒子沒(méi)有局部狀態(tài))。
隨著對(duì)量子比特和糾纏的理解的發(fā)展,繼而來(lái)討論貝爾態(tài),下面展示了量子比特的最大糾纏態(tài):
|00? → β → 1 √ 2 (|00? + |11?) = |β00?,
|01? → β → 1 √ 2 (|01? + |10?) = |β01?
|10? → β → 1 √ 2 (|00? - |11?) = |β10?
|11? → β → 1 √ 2 (|01? - |10?) = |β11?
使用量子電路創(chuàng)建貝爾態(tài):
圖注:Perry 量子計(jì)算神殿的貝爾態(tài)電路
在所顯示的貝爾態(tài)電路中,其接受量子位輸入并應(yīng)用 Hadamard 門和 CNOT 門創(chuàng)來(lái)建一個(gè)糾纏的貝爾態(tài)。
目前,貝爾態(tài)已被用于開(kāi)發(fā)一系列量子計(jì)算應(yīng)用程序;其中,Hegazy、Bahaa-Eldin 和 Dakroury 就提出了貝爾態(tài)和超密集編碼可用于實(shí)現(xiàn)“無(wú)條件安全”的理論。
3 卷積神經(jīng)網(wǎng)絡(luò)和量子卷積神經(jīng)網(wǎng)絡(luò)
Fran?ois Chollet 在 Python 深度學(xué)習(xí)中指出,卷積神經(jīng)網(wǎng)絡(luò) (CNN) 在圖像分類等任務(wù)中很受歡迎,其原因在于它們能構(gòu)建模式層次結(jié)構(gòu),例如先表示線條、再表示這些線條的邊緣,這使得 CNN 能夠建立在層之間的信息上,并表示復(fù)雜的視覺(jué)數(shù)據(jù)。
CNN 具有卷積層,由過(guò)濾器組成,這些過(guò)濾器會(huì)在輸入中“滑動(dòng)”并產(chǎn)生“特征圖”,允許檢測(cè)輸入中的模式。同時(shí),CNN 可使用池化層來(lái)減小特征圖的大小,從而減少學(xué)習(xí)所需的資源。
圖注:Cecbur 展示的卷積神經(jīng)網(wǎng)絡(luò)
定義了經(jīng)典的 CNN 后,我們就可以探索量子 CNN (量子卷積神經(jīng)網(wǎng)絡(luò),QCNN)是如何利用這些傳統(tǒng)方法、并對(duì)其進(jìn)行擴(kuò)展。
Garg 和 Ramakrishnan 認(rèn)為,開(kāi)發(fā)量子神經(jīng)網(wǎng)絡(luò)的一種常見(jiàn)方法,是開(kāi)發(fā)一種“混合”方法,引入所謂的“量子卷積層”,這是一種基于隨機(jī)量子電路的變換,在經(jīng)典 CNN 中作為附加組件出現(xiàn)。
下面展示了由 Yanxuan Lü 等研究人員開(kāi)發(fā)、并在MNIST 手寫數(shù)字?jǐn)?shù)據(jù)集上進(jìn)行測(cè)試的混合 QCNN:
研究人員在論文“A Quantum Convolutional Neural Network for Image Classification”中,采用了量子電路和糾纏作為經(jīng)典模型的一部分來(lái)獲取輸入圖像,并生成預(yù)測(cè)作為輸出。
在這種方法中,QCNN 將圖像數(shù)據(jù)作為輸入,并將其編碼為量子態(tài) |x>,然后使用量子卷積和池化層對(duì)其進(jìn)行轉(zhuǎn)換來(lái)提取特征;最后,使用強(qiáng)糾纏電路的全連接層進(jìn)行分類,并通過(guò)測(cè)量得到預(yù)測(cè)。
其中,優(yōu)化是通過(guò)隨機(jī)梯度下降(SGD)處理的,可用于減少訓(xùn)練數(shù)據(jù)標(biāo)簽與 QCNN 預(yù)測(cè)標(biāo)簽之間的差異。聚焦于量子電路,量子卷積層中使用的門如下所示,其中包括了旋轉(zhuǎn)算子和 CNOT 門。
在池化層測(cè)量量子位的一個(gè)子集,所得出的結(jié)果會(huì)決定是否對(duì)其臨近的位應(yīng)用單量子位門:
全連通層由“通用單量子位門”和產(chǎn)生糾纏態(tài)的CNOT門組成,為了將 QCNN 與其他方法進(jìn)行比較,研究人員使用了帶有模擬 QCNN 的 MNIST 數(shù)據(jù)集。按照典型的方法,我們創(chuàng)建了一個(gè)訓(xùn)練/測(cè)試數(shù)據(jù)集,并開(kāi)發(fā)了一個(gè)由以下層組成的 QCNN:
- 2個(gè)量子卷積層
- 2 個(gè)量子池層
- 1個(gè)量子全連接層
該 QCNN 對(duì)數(shù)據(jù)集的測(cè)試集準(zhǔn)確率達(dá)到了 96.65%,而根據(jù) Papers with Code 的數(shù)據(jù)進(jìn)行測(cè)試后,該數(shù)據(jù)集在經(jīng)典 CNN 中的最高準(zhǔn)確度得分可達(dá)到 99.91%。
要注意的是,該實(shí)驗(yàn)只有兩類 MNIST 數(shù)據(jù)集被分類,這也就意味著將其與其他 MNIST 模型性能完全比較會(huì)存在局限性。
4 可行性評(píng)估和總結(jié)
雖然研究人員在 QCNN 開(kāi)發(fā)了方法,但目前該領(lǐng)域的一個(gè)關(guān)鍵問(wèn)題是,實(shí)現(xiàn)理論模型所需的硬件還不存在。此外,混合方法在經(jīng)典 CNN 計(jì)算中同時(shí)引入量子演化層的測(cè)試方法,也面臨著挑戰(zhàn)。
如果我們考慮量子計(jì)算的優(yōu)勢(shì)之一,是可以解決“通過(guò)計(jì)算成本更低的技術(shù)解決經(jīng)典棘手的問(wèn)題”,那么這些解決方案中的一個(gè)重要方面就在于“量子加速”。有研究人員認(rèn)為,量子機(jī)器學(xué)習(xí)與經(jīng)典實(shí)現(xiàn)相比,其優(yōu)勢(shì)在于預(yù)計(jì)量子算法可具有多項(xiàng)式、甚至指數(shù)級(jí)的加速時(shí)間。
然而,上文中展示的 QCNN 方法存在一個(gè)局限性是,當(dāng)我們需要對(duì)經(jīng)典數(shù)據(jù)和測(cè)量進(jìn)行一致解碼/編碼的算法(如 QCNN )時(shí),“量子加速”增益是有限的;而目前,關(guān)于如何設(shè)計(jì)出最好的編碼/解碼和需要最小測(cè)量的協(xié)議、使其能夠受益于“量子加速”的信息并不多。
糾纏已被證明是量子機(jī)器學(xué)習(xí)的一個(gè)重要性質(zhì),本文所提到的關(guān)于 QCNN 利用強(qiáng)糾纏電路,可以產(chǎn)生糾纏態(tài)作為其全連通層的研究,使模型能夠進(jìn)行預(yù)測(cè)。不僅如此,糾纏也在其他領(lǐng)域中被用于輔助深度學(xué)習(xí)模型,例如使用糾纏從圖像中提取重要特征,以及在數(shù)據(jù)集中使用糾纏、可能意味著模型能夠從比之前預(yù)期更小的訓(xùn)練數(shù)據(jù)集中學(xué)習(xí)等等。
本文提供了經(jīng)典深度學(xué)習(xí)方法和量子深度學(xué)習(xí)方法的比較,并討論了利用量子層(包括強(qiáng)糾纏電路)生成預(yù)測(cè)的 QCNN ,分析量子深度學(xué)習(xí)的好處和局限性,并介紹了糾纏在機(jī)器學(xué)習(xí)中更普遍的應(yīng)用,這也意味著我們可以開(kāi)始考慮量子深度學(xué)習(xí)的下一步,特別是 QCNN 在更多領(lǐng)域中的應(yīng)用。除此之外,量子硬件也在不斷進(jìn)步,PsiQuantum 等公司更是提出了開(kāi)發(fā)百萬(wàn)量子比特的量子處理器目標(biāo)。
隨著深度學(xué)習(xí)和量子計(jì)算領(lǐng)域研究的繼續(xù)進(jìn)行,我們可以期待看到量子深度學(xué)習(xí)的進(jìn)一步發(fā)展。