自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

70年前他本想逃避考試,卻影響了整個互聯(lián)網(wǎng)

人工智能 新聞
哈夫曼的一生贏得過無數(shù)榮譽與表彰,卻從未為自己任何一項發(fā)明申請過專利。

本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

誰曾想,一次學(xué)生不想?yún)⒓涌荚嚨摹叭涡浴?,后來竟影響了整個互聯(lián)網(wǎng)。

70年前MIT的一堂信息論課上,一位老師為了給學(xué)生“減壓”,擺出一道選擇題。

要么參加期末考試,要么寫篇論文改進現(xiàn)有算法,自己挑。

這位老師名叫羅伯特·范諾,他沒告訴學(xué)生們的是,這個“現(xiàn)有算法”,正是他和信息論創(chuàng)始人香農(nóng)合著的香農(nóng)-范諾編碼。而為了改進算法不足,他本人已經(jīng)投入大量時間進行研究。

(老師內(nèi)心OS:沒想到吧。)

雖然有點損,但這招還真管用。這票學(xué)生一聽“交篇論文”就不用考試,拍腦袋就決定寫論文,包括大衛(wèi)?哈夫曼。

不選不知道,一選嚇一跳。初出茅廬的哈夫曼很快意識到了老師挖的坑——這論文也太**難搞了。

這一寫,就是好幾個月,并且苦苦掙扎中,哈夫曼仍然一無所獲。

但命運,有時候就是十分奇妙。就在哈夫曼終于放棄“逃考”,準(zhǔn)備將論文筆記扔到垃圾桶中時,突然靈光一現(xiàn)!答案出現(xiàn)了!

哈夫曼放棄對已有編碼的研究,轉(zhuǎn)向新的探索,最終發(fā)現(xiàn)了基于有序頻率二叉樹編碼的方法。

他提出的這一想法,效率成功超越他老師的方法論。甚至在之后的發(fā)展中,以他命名的編碼方法——哈夫曼編碼,直接改變數(shù)據(jù)壓縮范式。

至于當(dāng)時那篇結(jié)題報告,已引用近萬次。

低效的傳統(tǒng)編碼方法

1951年,正在MIT任教的羅伯特·范諾正在思考一道信息論的難題:

如何用二進制代碼高效表示數(shù)字、字母或者其他符號?

當(dāng)時最常見、也是最直接的方法,就是為每個字符分配一個獨一無二的二進制數(shù)。

比如,字母A可能表示為01000001,!表示為 00100001,每個八位數(shù)的數(shù)字都對應(yīng)一個字符。

這樣一來代碼容易解析,但效率極低。

另外還有種優(yōu)化方法,類似于摩爾斯電碼。常用字母E僅由一個點表示,但不常見的Q需要更長且更費力的“—— —— · ——”。

這種方式,會導(dǎo)致代碼長度不一, 信息不容易被理解;而且傳輸中還需要在字符間加入間隙,否則就無法區(qū)分不同的字符組合。

范諾意識到,或許這兩種方法的優(yōu)勢可以兼并之——以不同長度的二進制代碼表示字符。進一步地,為避免代碼“重疊”,他還構(gòu)建了二叉樹。

圖片圖片

他詳盡地測試了每一種排列的可能性以獲得最大效率,最終得到了一種有效情況:

每條消息按照頻率分為兩個分支,并盡可能讓兩邊字母使用頻率基本相同。

圖片圖片

這樣,常用的字符就會在更短、密度更低的分支上。

1948年,信息論之父香農(nóng)在介紹信息理論的文章“通信數(shù)學(xué)理論”中提出了這一方法;不久之后,范諾也獨立地以技術(shù)報告形式將其發(fā)布。故而這套方法被稱作是香農(nóng)-范諾編碼

但這個方法并非總是有效。像字母出現(xiàn)概率分別為{0.35,0.17,0.17,0.16,0.15}這種情況時,就不能給出理想編碼。

范諾認(rèn)為一定存在更好壓縮策略。于是乎,這樣的重任就交到了他的學(xué)生手里。

一次靈光乍現(xiàn),一篇世紀(jì)論文

如果說,范諾教授他們的方法是從上到下構(gòu)建字符樹,并在成對的樹枝之間盡可能保持對稱。

那么哈夫曼的方法,是直接顛覆了這一過程——自下而上構(gòu)建二叉樹

他認(rèn)為,無論發(fā)生什么情況,在一段有效的代碼中,兩個最不常見的字符應(yīng)該有兩個最長的代碼

因此首先就確定兩個最不常見的字符,將它們組合在一起作為一個分支對,然后再重復(fù)該過程,再從剩余字符中與剛剛構(gòu)建的字符對中尋找最不常見的字符(對)。

圖片圖片

schoolroom為例,其中O出現(xiàn)了四次,S、C、H、L、R、M各出現(xiàn)一次。

范諾的方法,就是首先將O與另一個字母分配給左側(cè)分支,這樣一來兩邊都是5次總使用量,生成的編碼總共27位。

圖片圖片

相比之下,哈夫曼的方法,比如就從不常見的r和m開始,將其組合成一個字母對。

圖片圖片

組合完之后,現(xiàn)有字符(對)包括:O(4次)、RM(2次)以及單個字母S、C、H和L。

按照出現(xiàn)頻率劃分,重復(fù)上一操作——將兩個不常見的選項分組,然后更新數(shù)樹和頻率圖。

圖片

最終,“schoolroom”變成了 11101111110000110110000101,比Fano 自上而下的方法少了1位。 

圖片圖片

雖然1位在這里并不多,但要是當(dāng)擴展到數(shù)十億字節(jié)時候,這就是一次不小的節(jié)省。

事實上,哈夫曼的方法已經(jīng)被證明非常強大,據(jù)谷歌學(xué)術(shù)統(tǒng)計,當(dāng)年論文已經(jīng)被引用9570次。

圖片圖片

至于他老師的辦法,卻幾乎沒有再被使用過。

直至今天,幾乎所有無損壓縮方法都全部或部分使用了哈夫曼的方法,可以壓縮圖像、音頻、表格等。它支持從PNG圖像標(biāo)準(zhǔn)到無處不在的軟件PKZip 的一切。

現(xiàn)代計算機科學(xué)先驅(qū)、圖靈獎得主高德納曾這樣形容哈夫曼的成就:

在計算機科學(xué)和數(shù)據(jù)通信領(lǐng)域,哈夫曼編碼是人們一直在使用的基本思想。

后來哈夫曼再回憶起那個「靈光乍現(xiàn)」時刻,當(dāng)時他正準(zhǔn)備將論文筆記扔進垃圾桶,結(jié)果突然思想?yún)R聚,答案在腦海里出現(xiàn)了:

那是我生命中最奇特的時刻。

突然恍然大悟,猶如閃電一般。

并表示,如果他知道自己的教授范諾(Fano)曾與這個問題作過斗爭,他可能永遠(yuǎn)都不會嘗試解決這個問題,更不用說在25歲的時候就大膽去嘗試。

成就與秩序感,用數(shù)學(xué)玩藝術(shù)

哈夫曼編碼改變了數(shù)據(jù)壓縮范式,也為其贏得了眾多榮譽與獎?wù)隆?/p>

比如,1998年哈夫曼獲得 IEEE 信息理論學(xué)會頒發(fā)的技術(shù)創(chuàng)新金禧獎、1999年獲得電氣和電子工程師協(xié)會 (IEEE) 頒發(fā)的理查德·漢明獎?wù)拢≧ichard Hamming Medal)。

不過即便如此,在他一生歷程中,相比發(fā)明無損壓縮方法這件事兒,最讓他引以為傲的反而是這篇博士論文。

題目:The Synthesis of Sequential Switching Circuits。

圖片圖片

哈夫曼在MIT讀博期間,發(fā)布這篇討論時序開關(guān)電路的重要論文。在當(dāng)時,哈夫曼幾乎是首個闡述如何設(shè)計異步順序開關(guān)電路的學(xué)者,而這一理論后來也為計算機發(fā)展提供了重要邏輯支撐。

這篇論文的發(fā)布,不僅幫助他獲得富蘭克林研究所的Louis E. Levy Medal,也順理成章讓他獲得留校任職資格,教授關(guān)于開關(guān)電路的課程。

圖片圖片

在校期間,哈夫曼還提出一種革新的數(shù)學(xué)公式,可以在不丟失任何信息的情況下將一個二進制數(shù)序列轉(zhuǎn)換成另一個二進制數(shù)序列,這項研究在當(dāng)時發(fā)揮了重要作用,也為其謀得了一份重要職位。

時任貝爾實驗室研究副總裁的William O. Baker將其招納入了一個審查委員會,主要負(fù)責(zé)為國家安全局審查未來科技計劃。Baker博士曾擔(dān)任過艾森豪威爾、肯尼迪、約翰遜、尼克松和里根五位總統(tǒng)的科學(xué)顧問。

1967年已是正教授的霍夫曼選擇離開MIT,加入加利福尼亞大學(xué)圣克魯茲分校(UCSC),期間主導(dǎo)創(chuàng)立了計算機科學(xué)系,并參與學(xué)術(shù)課程開發(fā)工作,為之后計算機科學(xué)系發(fā)展奠定重要基礎(chǔ)。

數(shù)學(xué)可以說是哈夫曼畢生追求之一,以至于后來在搞藝術(shù)時,也離不開數(shù)學(xué)。

圖片圖片

70年代開始,哈夫曼對折紙產(chǎn)生濃厚興趣,同時研究數(shù)學(xué)和折紙藝術(shù),制作了上百件曲痕折紙作品,還專門發(fā)表論文分析曲痕折紙的數(shù)學(xué)性質(zhì),成為折紙數(shù)學(xué)領(lǐng)域的先驅(qū)人物。

圖片
圖片

回過頭看,哈夫曼的一生贏得過無數(shù)榮譽與表彰,卻從未為自己任何一項發(fā)明申請過專利。

最后,借用哈夫曼自己的一段話。

作為一名科學(xué)家和老師,我真的非常執(zhí)著。如果我覺得自己還沒有找到問題的最簡單解決方法,我會非常不滿意,這種不滿會一直持續(xù),直到我找到最佳方法為止。對我來說,這就是科學(xué)家的本質(zhì)。

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2021-07-12 08:53:21

互聯(lián)網(wǎng) 行業(yè)數(shù)據(jù)

2012-07-04 15:04:03

2015-07-23 10:29:19

互聯(lián)網(wǎng)20年

2015-06-17 11:01:36

互聯(lián)網(wǎng)成長變壞

2013-09-11 09:40:48

云計算googlePaaS

2019-09-09 15:35:40

互聯(lián)網(wǎng)百度微博

2015-11-25 10:11:33

2017-01-15 14:22:29

大數(shù)據(jù)數(shù)據(jù)源互聯(lián)網(wǎng)

2022-05-13 09:49:05

區(qū)塊鏈互聯(lián)網(wǎng)模型

2009-09-22 09:58:12

2015-06-24 15:35:54

2020-07-12 15:20:56

互聯(lián)網(wǎng)數(shù)據(jù)技術(shù)

2022-11-21 09:42:47

操作系統(tǒng)

2017-10-09 14:44:30

互聯(lián)網(wǎng)掃一掃網(wǎng)絡(luò)

2009-02-20 09:02:42

谷歌互聯(lián)網(wǎng)溫頓·瑟夫

2018-09-29 14:59:06

互聯(lián)網(wǎng)數(shù)據(jù)BAT

2023-10-18 16:31:51

物聯(lián)網(wǎng)互聯(lián)網(wǎng)2.0

2022-01-12 09:50:49

互聯(lián)網(wǎng)行業(yè)發(fā)展網(wǎng)絡(luò)

2009-07-01 09:13:44

Firefox 3.5瀏覽器新特性

2012-02-22 10:10:16

點贊
收藏

51CTO技術(shù)棧公眾號