避不開的算法,如何吃透?
當你使用搜索引擎(例如Google Chrome、Mozilla Firefox等)的時候,后臺發(fā)生了什么?當你詢問虛擬助手(例如Alexa、Google助手或Siri)的時候,后臺發(fā)生了什么?它們怎么會知道答案?為何它們會顯示正確答案?所有這些都要感謝算法。
每當你使用手機、計算機、筆記本電腦或計算器時,其實都在使用算法。
那么,什么是算法?
如果你想做數(shù)學運算,比如說兩個數(shù)字相乘(不使用任何電子設備),那么你需要在紙上做乘法。你按照一定的規(guī)則獲得正確的答案。你也可以使用耗時更少的方法來做計算。這就是算法。
算法是為執(zhí)行特定的任務而設計的一組指令。
有些算法很簡單,而有些則非常復雜,具體取決于你要實現(xiàn)的目標。
算法的歷史
了解歷史總是有好處,因為歷史可以幫助你更好地理解主題,并了解何時使用這些知識。
“算法”一詞源自九世紀波斯數(shù)學家Muhammad Ibn Musa Al-Khwarizmi(代數(shù)之父),拉丁語為Algoritmi。最初算法被稱為Algorismus。15世紀后期,改名為Algorithmus(源自希臘語Arithmetic)?,F(xiàn)代英語中的Algorithm一詞是于19世紀引入的。
算法在中國古代文獻中稱為“術”,最早出現(xiàn)在《周髀算經(jīng)》、《九章算術》。特別是《九章算術》,給出四則運算、最大公約數(shù)、最小公倍數(shù)、開平方根、開立方根、求素數(shù)的埃拉托斯特尼篩法,線性方程組求解的算法。三國時代的劉徽給出求圓周率的算法:劉徽割圓術。
1842年,Ada Lovelace首次編寫了計算引擎的算法,因此許多人常常稱她為世界上第一位計算機程序員。她為巴貝奇分析機(自動計算的機械計算機)編寫了求解伯努利微分方程的算法(巴貝奇分析機由計算機之父Charles Babbage開發(fā))。
1936年,Alan Turing的圖靈機首次提出了第一個以現(xiàn)代形式表示的算法。
如何表達算法?
表達算法的方法多種多樣,例如自然語言、偽代碼、流程圖、編程語言、動態(tài)圖表、控制表等等。
使用自然語言表達算法不夠清晰,因此很少用于復雜或技術算法。偽代碼、流程圖、drakon圖和控制表是表達算法的結構化方法,因為與自然語言相比,它們可以避免許多歧義。編程語言旨在以可由計算機執(zhí)行的形式表達算法。
在計算機系統(tǒng)中,算法是由軟件開發(fā)人員以他們選擇的任何編程語言編寫的邏輯。但是,在設計算法時,我們需要記住一些規(guī)則。其中包括:
- 輸入:算法至少需要一個或多個輸入值。如果沒有給出輸入,那么算法將產(chǎn)生什么輸出呢?
- 輸出:算法至少應產(chǎn)生一個輸出。如果沒有產(chǎn)生任何結果,則無需設計算法。
- 效率:算法應該保證高效利用計算和內存資源。產(chǎn)生的輸出應該又正確又快。
- 簡單性:算法不應過于復雜。
- 可擴展性:算法必須能夠在不更改核心邏輯的情況下進行擴展。
- 有限性:算法必須在有限步驟后終止。假設輸入錯誤的情況下,算法在第一步就終止,我們將永遠無法得知算法有什么問題。而且,算法也不能陷入無限循環(huán)。
- 不依賴于編程語言:算法必須與語言無關,也就是說,它必須是可以用任何一種語言都可以實現(xiàn)的簡單指令,但是無論任何語言,輸出都應當相同。
下面,我們來構建一個簡單的算法:兩個數(shù)字的加法(且滿足上述要求)。
- 第1步:開始;
- 第2步:聲明變量num1,num2和sum;
- 第3步:讀取值num1和num2;
- 第4步:將num1和num2相加,然后將值賦給sum。
- 第5步:顯示和;
- 第6步:停止。
下面,為了測試這個算法,我們使用一種編程語言來實現(xiàn)它,我選擇用Java語言來實現(xiàn),你可以任意選擇其他語言。
- public class Addition
- {
- public static void main(String[] args) {
- int num1, num2, sum;
- Scanner sc = new Scanner(System.in);
- System.out.println(“Enter First Number: “);
- num1 = sc.nextInt;
- System.out.println(“Enter Second Number: “);
- num2 = sc.nextInt;
- sc.close;
- sum = num1 + num2;
- System.out.println(“Sum of two numbers: “+sum);
- }
- }
輸出如下:
我們的算法運作良好,且滿足上述要求。
算法必須高效。算法的效率取決于時間和空間。一個好的算法占用的時間更少,占用的空間也更少,我們無法時刻兼顧兩者。如果減少時間,則則空間可能會增加,反之亦然。因此,我們必須妥協(xié)一方。算法的空間復雜度表示算法運行時占用或需要的總空間。時間復雜度是指算法花完成任務所需的操作數(shù)。以最少操作數(shù)執(zhí)行任務的算法就是最有效的算法。此外,算法花費的時間還取決于計算機的計算速度,但是在我們考慮算法的效率率時,通常不會考慮這些外部因素。衡量算法效率的一種方法是測量算法在不同輸入下找到答案所需的操作次數(shù)。
算法的種類
- 遞歸算法:通過重復將問題分解為同類的子問題而解決問題。
- 分治算法:把一個復雜的問題分成兩個或更多的相同或相似的子問題,直到最后子問題可以簡單的直接求解,原問題的解即子問題的解的合并。
- 動態(tài)規(guī)劃算法(又名動態(tài)優(yōu)化算法):記住過去的結果,以備將來使用。與分治算法相似,這種算法可以將復雜的問題分解相對簡單的子問題,然后將解決方案保存起來,以便下次需要同一個子問題解之時直接使用,而無需再次重新計算。
- 貪婪算法:在每一步選擇中都采取在當前狀態(tài)下最好或最優(yōu)(即最有利)的選擇,從而希望得出結果是最好或最優(yōu)的算法。該算法不能保證最終獲得最佳解決方案。
- 暴力算法:簡單明了,嘗試所有的可能性,直到找到滿意的解決方案為止。
- 回溯算法:嘗試分步地去解決一個問題。如果發(fā)現(xiàn)其中某一步的解決方案失敗,則后退一步或幾步,重新開始尋找解決方案。
如今,幾乎每個領域都使用算法,例如數(shù)據(jù)科學、機器學習、農(nóng)業(yè)、科學、運輸?shù)取K惴ㄊ敲總€應用程序(Google Chrome與Mozilla Firefox、Uber與Ola)最大的不同之處,例如Google Chrome和Mozilla Firefox都是搜索引擎應用程序,它們提供相同的結果,但是結果的順序有所不同,這是因為二者使用了不同的排序算法。Google的排序算法與Firefox不同。
算法無處不在,并將繼續(xù)傳播,算法讓我們的生活更加輕松,但我們還需要考慮一些問題,例如,
- 當有一天數(shù)據(jù)和預測模型統(tǒng)治世界,那么我們就會喪失人性和判斷力。
- 隨著更智能、更高效的算法逐步取代許多的人類活動,失業(yè)人數(shù)將上升。
21世紀,算法就像魔術一樣,我們可以解釋其背后的原理以及如何創(chuàng)建網(wǎng)絡等,卻無法機械地解釋為什么這些算法會產(chǎn)生特定的輸出。而這僅僅是個開始。