OpenHarmony啃論文俱樂部—淺析稀疏表示醫(yī)學圖像
本文出自ELT.ZIP團隊,ELT<=>Elite(精英),.ZIP為壓縮格式,ELT.ZIP即壓縮精英。
【本期看點】
- 讓你意想不到的 PNG 工作方式。
- 詳解 MPEG 十八代隱秘關系。
- AV1 | H.266 王座之戰(zhàn),誰才是最終贏家。
- 不妨走走未曾設想的醫(yī)學道路。
- 細胞神經網絡也可以很瘋狂。
- 懂了!原來這就是人眼視覺系統(tǒng)(HVS)。
【技術DNA】
【智慧場景】
基于稀疏表示的醫(yī)學序列圖像壓縮方法
背景
- 隨著醫(yī)學影像技術的發(fā)展,近年來,各種醫(yī)學影像設備產生了大量的醫(yī)學數字圖像。醫(yī)學數字圖像具有內容豐富、形象直觀的特點,能夠很好地輔助醫(yī)療診斷。然而,因其數據量非常龐大,會占用大量的存儲空間和傳輸帶寬,所以有必要對醫(yī)學數字圖像數據進行壓縮。
- 現有的圖像壓縮標準大都基于圖像的正交變換,其中基于離散余弦變換的JPEG壓縮標準最具代表性,JPEG算法具有優(yōu)良的壓縮性能,適用于各類圖像的壓縮。但是,JPEG算法使用固定的字典進行編碼和解碼,將其用于醫(yī)學數字圖像的壓縮時,并沒有考慮到醫(yī)學數字圖像本身的特點進一步提高壓縮性能。此外,正交變換對于圖像的表示并不是最優(yōu)的,它不能稀疏地捕捉圖像的規(guī)則性和輪廓特征,因此進一步研究圖像壓縮的突破點在于圖像的表示方面。
- 近幾年,稀疏表示成為圖像處理領域的研究熱點。稀疏表示理論表明,任何信號可以在過完備原子庫上稀疏地分解,即使用過完備原子庫中盡量少的原子的線性組合來表示原始信號。圖像在過完備原子庫上稀疏分解的結果十分簡潔,而且在直觀上也很符合人眼的視覺特性。圖像稀疏表示的優(yōu)良持性,使其成為解決醫(yī)學數字圖像壓縮問題的新途徑。
基于稀疏表示的人臉識別算法示意圖
概念
圖像表示的冗余
圖像之所能夠被壓縮,是因為圖像在表示的過程中存在冗余數據。包含重復信息或無關信息的數據稱為冗余數據,不同的圖像表示方法采用不同的數據形式也就存在不同的冗余數據。通常數字圖像在表示中存在三種主要的數據冗余,即:編碼冗余、空間和時間冗余、不相關信息。
編碼冗余:
編碼是用于表示信息實體或者事件集合的符號系統(tǒng)。每一個信息或者事件被賦予一個編 碼符號的序列,這個序列稱為碼字。一個碼字中符號的數量為該碼字的長度。編碼冗余指的就是當前表示給定信息的碼字的平均長度可以通過某種編碼策略而減少其長度。
空間和時間冗余:
該圖像中265種灰度是等概率出現的;橫向來看,沿每條線的像素是相同的,所以水平方向上的像素是最大相關的;豎向來看,因為每條線的灰度是隨機的,所以在垂直方向上相鄰像素是彼此獨立的。不能使用簡單的變長編碼來實現壓縮,但在灰度矩陣中每一行的各個數據是完全相同的,若按照傳統(tǒng)矩陣的形式來表示圖像,則存在相當大的數據冗余。這也就是圖像在空間上的冗余。圖像數據在時間上的冗余與此類似,是指在時間上,相鄰像素的相關性很大,例如序列圖像前后間有較大的相關性。
不相關信息:
一些被人類視覺系統(tǒng)忽略的或者沒有利用價值的信息,通常被稱為不相關信息,這些信息在傳統(tǒng)的表示方式中認為是冗余的。例如,圖一是由計算機生成的圖像,肉眼看上去可以認為它是由單一灰度組成的,這樣,所有像素由一個灰度值來表示,原始的 2562568 比特的灰度矩陣可用單一的8比特數值來表示,從而達到很高的壓縮比。圖二顯示的是圖一的直方圖,可以看出,實際上不是所有像素都是同一灰度的。所以上述的壓縮方式會很小程度上破壞圖像的原始質量,但是這種破壞很難被人類的視覺系統(tǒng)察覺到,也就是說圖一中極少部分像素灰度值的不一致可以被忽略,從而去除這種不相關信息帶來的冗余。
無損壓縮
圖像無損壓縮是使圖像信息沒有任何丟失的情況下,對表示圖像的數據某種編碼的方式進行編碼 來減少所需要的比特數。比較經典的無損壓縮方法有哈弗曼編碼、游程編碼、算術編碼等,對于不同的圖像,根據圖像特性,采取合適的編碼方式會取得更優(yōu)的壓縮效果。圖像無損壓縮方法對于恢復后的圖像沒有任何信息損失,也就是說重建效果極好,但是這類方法對圖像的壓縮能力有限。
有損壓縮
圖像有損壓縮是指在圖像壓縮過程中允許損失一定的信息,解壓后不能完全恢復原始圖像數據,但是所損失的部分對圖像質量影響很小,不會干擾人類對圖像內容的理解。也正是因為此,有損壓縮通常會帶來較高的圖像壓縮比。目前較成熟有損壓縮方法是基于離散余弦變換和基于小波變換的方法,其中基于離散余弦變換的壓縮方法以 JPEG 為代表,基于小波變換的壓縮方法以 JPEG2000 和多級樹集合分裂算法(Set Partitioning In Hierarchical Trees, SPIHT)為代表,這幾種算法具有優(yōu)秀的壓縮性能。 JPEG2000 由于版權與技術問題,目前尚未在實際中廣泛使用。JPEG是當今最流行的圖像壓縮算法。
字典
在信號處理領域,字典是對數據的一種高度概括,字典可以以字典原子線性組合的方式表示數據的絕大部分信息,即使這部分數據丟失了,我們仍然可以想辦法從字典中重構或近似恢復這部分數據。字典分別可以通過預定義和學習來獲得。預定義字典如DCT字典、小波字典等,構造起來簡單方便,但是對信號的適應性一般不好。學習字典一般可以從信號中學得特征,充分表示信號,被字典稀疏表示的信號可以用于許多信號處理的任務,比如壓縮感知、特征提取、圖像分類、圖像去噪、壓縮。
算法
經過多年的研究,隨著許多基于離散余弦變換和基于小波變換的圖像壓縮方法的誕生,圖像壓縮問題達到了一個重要的里程碑,同時也是個研究瓶頸。基于正交變換的圖像壓縮方法雖然能取得良好的壓縮效果,但仍然存在一些不足之處,例如正交變換不能很好地表示出圖像的輪廓,使用固定字典對醫(yī)學數字圖像壓縮不會考慮醫(yī)學圖像自身的特點,壓縮速率較慢等等。圖像稀疏表示是近幾年興起的一種新的圖像表示方法,基于稀疏表示的圖像壓縮為解決醫(yī)學數字圖象壓縮問題提供了一種新的研究思路。
醫(yī)學序列圖像特點
醫(yī)學序列圖像是指在相同的成像設備下,對同一研究對象,在不同斷層的掃描切片集合或不同時間的掃描切片集合。根據切片集合的不同來源,可分為時間序列圖像和空間序列圖像。時間序列圖像是指患者延時間軸獲得的圖像集,記錄患者在一段時間內的病患信息,例如,一位SARS病人在發(fā)病期間,每天都要拍攝胸腔CT影像,這些在時間上離散的影像,就構成了一組相同類型的醫(yī)學時間序列圖像??臻g序列圖像是指成像設備對病人某個器官的不同斷層的掃描切片,利用這些連續(xù)的掃描切片,通過三維重建技術,將人體器官以“三維”的形式真實地顯示出來,實現其三維可視化。
圖三.醫(yī)學序列圖像示例
醫(yī)學序列圖像有其自身的特點,即背景比較單一,序列中相鄰的圖像包含的大部分信息是相同的, 也就是說表示這些圖像會存在大量的重復信息,圖三展示了展示了某個病例的部分顱腦 CT 圖像序列,可以看出,這些圖像序列是漸變的,即相鄰圖像的變化很小。因此,本文提出的基于稀疏表示的醫(yī)學序列圖像壓縮方法,就是首先減少序列圖像之間的相關冗余信息,然后采用稀疏表示的方法壓縮圖像數據,從而達到圖像壓縮的目的。
基于稀疏表示的壓縮方法
從醫(yī)學序列圖像(圖三)的特點可以看出,序列中相鄰圖像存在很強的相似性,若將圖像劃分為指定大小的圖像塊,在這一系列的圖像塊中,會存在很多相似的圖像塊。
基于此,本文提出基千稀疏表示的醫(yī)學序列圖像壓縮方法,首先將一例序列圖像分塊,然后根據所有圖像塊之間的相似性,選擇一些圖像塊作為基準塊,就是說,其他的圖像塊與基準塊集合中的某一塊非常相似,可直接用該基準塊來代替。在進行相似性衡量之時,一一記錄下所有圖像塊與基準塊之間的對應關系。然后只用對基準塊集合進行稀疏分解,將基準塊集合分解得到的稀疏系數矩陣作為二次字典。
待表示的信號是稀疏表示模型中字典的某幾列的線性組合,而這里的二次字典,待表示的信號僅僅根據二次字典的某一列來重建,且不要求二次字典的過完備性。圖像壓縮過程中,由一系列的圖像塊計算相似性后,對一組互為相似的圖像塊只用考慮其中一個,并將其設為基準塊,其他的圖像塊則被認為是副本,副本不用存儲。對于所有的圖像塊,需要依次為每個圖像塊存儲與之相似的基準塊的序號,即參考索引?;鶞蕢K的序號和二次字典的列號是一一對應的,也就是說需要指明在圖像塊重建時,它是使用二次字典中哪一列的系數來重建。
此算法分為兩部分:
二次字典,字典中的每一列為稀疏系數向量,采取逐列存儲的方式,列中的數據為稀疏系數,每個系數分別存儲位置索引和幅值兩個信息;
參考索引,因為參考索引其實就是二次字典的列號,而二次字典的列數就是基準塊的數量,假設相似性計算之后得到N個基準塊,則參考索引的數據范圍是O~N-1。
壓縮流程如下:
圖四.基于稀疏表示的序列圖像壓縮流程
解壓縮流程如下:
圖五.基于稀疏表示的序列圖像解壓縮流程
所謂過完備字典即其基底一般是冗余的,也就是基元素的個數比維數要大。圖像在過完備基下的表示比完備正交基更加稀疏,圖像中的干凈部分可以利用少量的非零稀疏表示系數進行線性表示,而噪聲一般認為不具有稀疏性,因此可以根據它們之間的區(qū)別實現去除噪聲的目的。
算法測試
將上述提出的基于稀疏表示的序列圖像壓縮方法與傳統(tǒng)的基于稀疏表示的圖像壓縮方法、JPEG 壓縮方法作對比,圖六展示了這幾種不同方法的壓縮效果??梢钥闯?,本文方法的壓縮效果優(yōu)于傳統(tǒng)的基于稀疏表示的圖像壓縮方法,在低比特率時 JPEG 壓縮效果優(yōu)于本文方法,在高比特率時該方法壓縮效果優(yōu)于JPEG??紤]到醫(yī)學圖像對圖像質量要求很高,也就要求其峰值信噪比較高,基于稀疏表示序列圖像的方法在高峰值信噪比的情況下,能夠達到優(yōu)于JPEG的壓縮效果。
圖六.不同壓縮方法的壓縮效果比較
總結
本文介紹了基于稀疏表示的醫(yī)學序列圖像壓縮方法,該方法利用醫(yī)學序列圖像之間的相似性,建立了二次字典和參考索引,實驗結果表明,這種對序列圖像進行整體壓縮的方法在高峰值信噪比時其壓縮效果優(yōu)于 JPEG 壓縮標準。