群蟻算法理論與實踐全攻略
若干年前讀研的時候,學院有一個教授,專門做群蟻算法的,很厲害,偶爾了解了一點點。感覺也是生物智能的一個體現(xiàn),和遺傳算法、神經(jīng)網(wǎng)絡(luò)有異曲同工之妙。只不過當時沒有實際需求學習,所以沒去研究。最近有一個這樣的任務(wù),所以就好好把基礎(chǔ)研究了一下,驅(qū)動式學習,目標明確,所以還是比較快去接受和理解,然后寫代碼實現(xiàn)就好了。今天就帶領(lǐng)大家走近TSP問題以及群蟻算法。
1.關(guān)于旅行商(TSP)問題及衍化
旅行商問題(Traveling Saleman Problem,TSP)是車輛路徑調(diào)度問題(VRP)的特例,由于數(shù)學家已證明TSP問題是NP難題,因此,VRP也屬于NP難題。旅行商問題(TSP)又譯為旅行推銷員問題、貨郎擔問題,簡稱為TSP問題,是最基本的路線問題,該問題是在尋求單一旅行者由起點出發(fā),通過所有給定的需求點之后,***再回到原點的最小路徑成本。——旅行商問題百科
很明顯,當節(jié)點數(shù)很少時,大多數(shù)人都會想到,問題很簡單,直接窮舉就OK了,但實際問題中,節(jié)點數(shù)往往很大,變得不可能。例如:對于一個僅有16個城市的旅行商問題,如果用窮舉法來求問題的***解,需比較的可行解有:15!/2=653,837,184,000個。在1993年,使用當時的工作站用窮舉法求解此問題需時92小時。即使現(xiàn)在計算機速度快,但是面對復雜的問題,仍然不夠。這就是所謂的“組合爆炸”,指數(shù)級的增長,所以科學家逐步尋找近似算法或者啟發(fā)式算法,目的是在合理的時間范圍內(nèi)找到可接受的***解。
TSP問題解決算法的發(fā)展可以分為3個部分:
1).經(jīng)典精確算法:窮舉法、線性規(guī)劃算法、動態(tài)規(guī)劃算法、分支定界算法等運籌學中的傳統(tǒng)算法,這些算法復雜度一般都很大,只適用于求解小規(guī)模問題。
2).近似算法:當問題規(guī)模較大時,其所需的時間成級數(shù)增長,這是我們無法接受的,算法求解問題的規(guī)模受到了很大的限制,一個很自然的想法就是犧牲精確解法中的***性,去尋找一個好的時間復雜度我們可以容忍的,同時解的質(zhì)量我們可以接受的算法.基于這一思想所設(shè)計出的算法統(tǒng)稱為近似算法。如插入算法,最鄰近算法等。
3).智能算法:隨著科學技術(shù)和生產(chǎn)的不斷發(fā)展,許多實際問題不可能在合理的時間范圍內(nèi)找到全局***解,這就促使了近代***化問題求解方法的產(chǎn)生。隨著各種不同搜索機制的啟發(fā)式算法相繼出現(xiàn),如禁忌搜索、遺傳算法、模擬退火算法、人工神經(jīng)網(wǎng)絡(luò)、進化策略、進化編程、粒子群優(yōu)化算法、蟻群優(yōu)化算法和免疫計算等,掀起了研究啟發(fā)式算法的高潮。
具體每一種算法不再詳細描述,大家可以針對性的尋找相應(yīng)資料進行了解。
TSP問題在實際的生產(chǎn)生活中,更加實際環(huán)境不同,有很多衍生的經(jīng)典問題。車輛路徑調(diào)度(VRP)擴展問題是經(jīng)典VRP加入各種約束條件后而形成的。例如需求約束形成的需求隨機的車輛路徑問題(SVRP);加入時間約束得到的帶時間窗的車輛路徑題(VRPTW);加入距離約束的距離約束車輛路徑問題(DVRP);根據(jù)其它條件的不同,還有多配送中心車輛路徑問題(MDVRP)、可切分的車輛路徑問題(SDVRP);先配送再收集車輛路徑問題(VRPB)、配送收集車輛路徑問題(VRPPD);信息不完全的模糊車輛路徑問題(FVRP)[3]。
2.群蟻算法基本原理
2.1 算法綜述
對于VRP問題,求解算法大致可分為精確算法和人工智能算法兩大類。精確性算法基于嚴格的數(shù)學手段,在可以求解的情況下,解的質(zhì)量較好。但是由于算法嚴格,運算量大,特別是大規(guī)模的問題幾乎無法求解。所以其應(yīng)用只能是小規(guī)模的確定性問題,面對中小規(guī)模問題,人工智能算法在精度上不占優(yōu)勢。但規(guī)模變大時,人工智能方法基本能在可接受時間里,找到可接受的滿意解,這是精確算法難以做到的。由于的實際問題,各種約束錯綜復雜,人工智能算法顯示出了巨大的優(yōu)越性,也正因為如此,實際應(yīng)用中,人工智能算法要更廣泛。求解車輛路徑調(diào)度問題的精確算法有動態(tài)規(guī)劃法、分枝定界法等。并開始尋求所得結(jié)果可接受的啟發(fā)式算法,以處理大規(guī)模實際問題,一些其他學科的新一代優(yōu)化算法相繼出現(xiàn),如禁忌搜索算法,遺傳算法,人工神經(jīng)網(wǎng)絡(luò)算法,以及現(xiàn)在研究較多的蟻群算法等。
2.2 群蟻算法的原理
蟻群算法是受到對真實螞蟻群覓食行為研究的啟發(fā)而提出。生物學研究表明:一群相互協(xié)作的螞蟻能夠找到食物和巢穴之間的最短路徑,而單只螞蟻則不能。生物學家經(jīng)過大量細致觀察研究發(fā)現(xiàn),螞蟻個體之間的行為是相互作用相互影響的。螞蟻在運動過程中,能夠在它所經(jīng)過的路徑上留下一種稱之為信息素的物質(zhì),而此物質(zhì)恰恰是螞蟻個體之間信息傳遞交流的載體。螞蟻在運動時能夠感知這種物質(zhì),并且習慣于追蹤此物質(zhì)爬行,當然爬行過程中還會釋放信息素。一條路上的信息素蹤跡越濃,其它螞蟻將以越高的概率跟隨爬行此路徑,從而該路徑上的信息素蹤跡會被加強,因此,由大量螞蟻組成的蟻群的集體行為便表現(xiàn)出一種信息正反饋現(xiàn)象。某一路徑上走過的螞蟻越多,則后來者選擇該路徑的可能性就越大。螞蟻個體之間就是通過這種間接的通信機制實現(xiàn)協(xié)同搜索最短路徑的目標的。我們舉例簡單說明螞蟻覓食行為:

如上圖a,b,c的示意圖:
a圖是原始狀態(tài),螞蟻起始點為A,要到達E,中途有障礙物,要繞過才能到達。BC和BH是繞過障礙物的2條路徑(假設(shè)只有2條)。各個路徑的距離d已經(jīng)標定。
b圖是t=0時刻螞蟻狀態(tài),各個邊上有相等的信息素濃度,假設(shè)為15;
c圖是t=1時刻螞蟻經(jīng)過后的狀態(tài),各個邊的信息素濃度,有變化;因為大量螞蟻的選擇概率會不一樣,而選擇概率是和路徑長度相關(guān)的。所以越短路徑的濃度會越來越大,經(jīng)過此短路徑達到目的地的螞蟻也會比其他路徑多。這樣大量的螞蟻實踐之后就找到了最短路徑。所以這個過程本質(zhì)可以概括為以下幾點:
1.路徑概率選擇機制信息素蹤跡越濃的路徑,被選中的概率越大
2.信息素更新機制路徑越短,路徑上的信息素蹤跡增長得越快
3.協(xié)同工作機制螞蟻個體通過信息素進行信息交流。
從螞蟻覓食的原理可見,單個個體的行為非常簡單螞蟻只知道跟蹤信息素爬行并釋放信息素,但組合后的群體智能又非常高螞蟻群能在復雜的地理分布的清況下,輕松找到蟻穴與食物源之間的最短路徑。這種特點恰恰與元啟發(fā)算法的特點相一致,蟻群優(yōu)化算法正是受到這種生態(tài)學現(xiàn)象的啟發(fā)后加以模仿并改進而來,覓食的螞蟻由人工蟻替代,螞蟻釋放的信息素變成了人工信息素,螞蟻爬行和信息素的蒸發(fā)不再是連續(xù)不斷的,而是在離散的時空中進行。
上述例子如果不好理解,我在這里貼幾張PPT,個人感覺非常不錯,也是我找了很多資料覺得***理解的【來源是大連理工大學谷俊峰】,下載鏈接見***部。

從深層意義上來講,蟻群算法作為優(yōu)化的方法之一,屬于人工群集智能領(lǐng)域。人工群集智能,大都受自然群集智能如昆蟲群和動物群等的啟發(fā)而來。除了具有獨特的強有力的合作搜索能力外,還可以利用一系列的計算代理對問題進行分布式處理,從而大大提高搜索效率。
3.群蟻算法的基本流程
我們還是采用大連理工大學谷俊峰的PPT來說明問題,重要公式進行截圖計算和解釋,對PPT難以理解的地方進行單獨解釋:
3.1 基本數(shù)學模型
首先看看基本TSP問題的基本數(shù)學模型:

問題其實很簡單,目標函數(shù)就是各個走過路徑的總長度,注意的就是距離矩陣根據(jù)實際的問題不一樣,長度是不一樣的。
3.2 群蟻算法說明
在說明群蟻算法流程之前,我們對算法原理和幾個注意點進行描述:
1.TSP問題的人工蟻群算法中,假設(shè)m只螞蟻在圖的相鄰節(jié)點間移動,從而協(xié)作異步地得到問題的解。每只螞蟻的一步轉(zhuǎn)移概率由圖中的每條邊上的兩類參數(shù)決定:1. 信息素值也稱信息素痕跡。2.可見度,即先驗值。
2.信息素的更新方式有2種,一是揮發(fā),也就是所有路徑上的信息素以一定的比率進行減少,模擬自然蟻群的信息素隨時間揮發(fā)的過程;二是增強,給評價值“好”(有螞蟻走過)的邊增加信息素。
3.螞蟻向下一個目標的運動是通過一個隨機原則來實現(xiàn)的,也就是運用當前所在節(jié)點存儲的信息,計算出下一步可達節(jié)點的概率,并按此概率實現(xiàn)一步移動,逐此往復,越來越接近***解。
4.螞蟻在尋找過程中,或者找到一個解后,會評估該解或解的一部分的優(yōu)化程度,并把評價信息保存在相關(guān)連接的信息素中。
3.3 群蟻算法核心步驟
更加我們前面的原理和上述說明,群蟻算法的2個核心步驟是 路徑構(gòu)建 和 信息素更新。我們將重點對這2個步驟進行說明。
3.3.1 路徑構(gòu)建
每個螞蟻都隨機選擇一個城市作為其出發(fā)城市,并維護一個路徑記憶向量,用來存放該螞蟻依次經(jīng)過的城市。螞蟻在構(gòu)建路徑的每一步中,按照一個隨機比例規(guī)則選 擇下一個要到達的城市。隨機概率是按照下列公式來進行計算的:

上述公式就是計算 當前點 到 每一個可能的下一個節(jié)點 的概率。分子是 信息素強度 和 能見度 的冪乘積,而分母則是所有 分子的和值。這個剛開始是很不容易理解的,我們在***實例計算的時候,可以看得很清楚,再反過來理解公式。注意每次選擇好節(jié)點后,就要從可用節(jié)點中移除選擇的節(jié)點。
3.3.2 信息素更新
信息素更新是群蟻算法的核心。也是整個算法的核心所在。算法在初始期間有一個固定的濃度值,在每一次迭代完成之后,所有出去的螞蟻回來后,會對所走過的路線進行計算,然后更新相應(yīng)的邊的信息素濃度。很明顯,這個數(shù)值肯定是和螞蟻所走的長度有關(guān)系的,經(jīng)過一次次的迭代, 近距離的線路的濃度會很高,從而得到近似***解。那我們看看信息素更新的過程。
初始化信息素濃度C(0),如果太小,算法容易早熟,螞蟻會很快集中到一條局部***路徑上來,因為可以想想,太小C值,使得和每次揮發(fā)和增強的值都差不多,那么 隨機情況下,一些小概率的事件發(fā)生就會增加非***路徑的信息素濃度;如果C太大,信息素對搜索方向的指導性作用減低,影響算法性能。一般情況下,我們可以使用貪婪算法獲取一個路徑值Cnn,然后根據(jù)螞蟻個數(shù)來計算C(0) = m/Cnn ,m為螞蟻個數(shù)
每一輪過后,問題空間中的所有路徑上的信息素都會發(fā)生蒸發(fā),然后,所有的螞蟻根據(jù)自己構(gòu)建的路徑長度在它們本輪經(jīng)過的邊上釋放信息素,公式如下:

信息素更新的作用:
1.信息素揮發(fā)(evaporation)信息素痕跡的揮發(fā)過程是每個連接上的 信息素痕跡的濃度自動逐漸減弱的過程,這個揮發(fā)過程主要用于避 免算法過快地向局部***區(qū)域集中,有助于搜索區(qū)域的擴展。
2.信息素增強(reinforcement)增強過程是蟻群優(yōu)化算法中可選的部 分,稱為離線更新方式(還有在線更新方式)。這種方式可以實現(xiàn) 由單個螞蟻無法實現(xiàn)的集中行動?;鞠伻核惴ǖ碾x線更新方式是 在蟻群中的m只螞蟻全部完成n城市的訪問后,統(tǒng)一對殘留信息進行 更新處理。
3.3.3 迭代與停止 迭代停止的條件可以選擇合適的迭代次數(shù)后停止,輸出***路徑,也可以看是否滿足指定***條件,找到滿足的解后停止。最重要的是,我剛開始理解這個算法的時候,以為每一只螞蟻走一條邊就是一次迭代,其實是錯的。這里算法每一次迭代的意義是:每次迭代的m只螞蟻都完成了自己的路徑過程,回到原點后的整個過程。
4.群蟻算法計算實例
使用PPT中的一個案例,非常直觀,對幾個符號錯誤進行了修改,主要是計算概率的乘號,結(jié)果沒有錯誤:


過程總體還是比較簡單的,注意理解公式,然后把公式和實例結(jié)合起來看,***是拿筆自己手動畫一畫,容易理解。下面我們來看看如何編程實現(xiàn)TSP問題的群蟻算法代碼。
5.TSP問題的群蟻算法C#代碼實現(xiàn)
百度搜索相關(guān)群蟻算法的代碼,基本都是matlab的,在CSDN有一個asp.net + C#版本的實現(xiàn),不過我看了之后果斷決定重寫,封裝不夠完善,同時思路也不清楚。所以自己寫的過程,理解也更清楚了。經(jīng)過我的簡單更改,目前還說得過去吧,當然后續(xù)我還打算繼續(xù)進行研究,所以先把基本程序的過程寫下來,當然是利用了C# 的面向?qū)ο筇匦裕戳藙e人寫的 完全面向過程,理解真的很費勁。簡單說說實現(xiàn)過程和代碼吧。
5.1 群蟻算法系統(tǒng)基類
我們封裝了一個基礎(chǔ)的BaseTspAntSystem類,包括了一些基本屬性和計算過程,后續(xù)相關(guān)改進版本可以進行直接繼承。當然設(shè)計可能有缺陷,先這樣進行,碰到需求再改吧。 BaseTspAntSystem類的主要屬性如下:

基類有一個構(gòu)造函數(shù),對系統(tǒng)的初始化就是傳入基本的參數(shù),并對相關(guān)列表進行初始化,代碼如下:

核心的是求解過程,完全按照迭代次數(shù)要求進行迭代進行,過程就是概率選擇和信息素更新,我們輔助的用到了Ant螞蟻類,目的就是讓程序更加獨立和容易理解。Ant類里面有螞蟻路徑尋找過程的所有信息。下一節(jié)將進行介紹。求解過程代碼如下面,看看注釋和對比算法進行:

5.2 螞蟻功能類
根據(jù)算法的描述,m只螞蟻同時進行自己的工作和尋找路程,是一個并行的過程,因此也在單次過程中,螞蟻都是獨立的。螞蟻的每一次迭代,過程都比較清楚,尋找路徑過程,注意維護一些可用的節(jié)點列表,以及***一條路徑的處理。看看螞蟻類的主要屬性和構(gòu)造函數(shù):
Ant類的核心是尋找下一個城市節(jié)點的過程,以及循環(huán)直到所有路徑都完成。如下面代碼,是一個循環(huán)過程:

后面的GetNextCityByRandValue是一個輔助函數(shù),進行隨機概率值的選擇,確定是否選擇哪一個節(jié)點。
6.資源與參考文獻
[1].什么是NP問題.http://blog.csdn.net/yangtrees/article/details/8107563
[2].文永軍.旅行商問題的兩種智能算法[M].西安電子科技大學,2010年
[3].楊瑞臣.有時間窗和在前約束車輛路徑問題的蟻群優(yōu)化[M].西安建筑科技大學,2005.
[4].谷俊峰.智能算法-第七章:蟻群算法 PPT,大連理工大學,下載地址:http://files.cnblogs.com/files/asxinyu/%E8%9A%81%E7%BE%A4%E7%AE%97%E6%B3%95%E5%9F%BA%E6%9C%AC%E7%9F%A5%E8%AF%86.rar