什么是計算機視覺?
在電影《黑客帝國:復活》(2021年)中,主人公尼奧與電腦生成的世界“黑客帝國”戰(zhàn)斗,他的戰(zhàn)士團隊聚集在一組電腦周圍,試圖找到尼奧的搭檔崔妮蒂,她仍然被困在黑客帝國中。尼奧指著電腦屏幕上代表矩陣的綠色代碼說:“就是她,在艦橋上?!辩R頭切換到崔妮蒂騎著摩托車在橋上,她不知道自己是模擬的一部分。計算機是如何“看到”艦橋上的崔妮蒂的?這不是電影所關(guān)注的(他們需要拯救人類),但這是本文的重點。
我們在《黑客帝國:復活》中看到的被稱為“計算機視覺”。這項技術(shù)使計算機能夠“看到”并理解視覺信息。計算機視覺依靠算法和人工智能的結(jié)合來處理形狀、顏色和紋理等信息,以理解它面前的東西?!逗诳偷蹏分械碾娔X能夠通過視覺線索,比如她的頭發(fā)、面部結(jié)構(gòu)、衣服等,找到崔妮蒂,并與崔妮蒂相匹配,就像我們用同樣的線索來識別一個人一樣——即使有時我們比電腦花的時間更長!
“計算機視覺依賴于算法和人工智能的結(jié)合,來處理形狀、顏色和紋理等信息,以理解它面前的東西?!?/span>
雖然計算機能夠在幾秒鐘內(nèi)識別出母體中的崔妮蒂,但在計算機能夠正確識別她之前,還需要進行一些步驟。
1.圖像采集:計算機視覺需要視覺輸入。在電影中,我們看到尼奧和他的朋友們在黑客帝國中崔妮蒂居住的無名城市里接入了許多攝像頭和傳感器。
2.預處理:在分析開始之前,可能需要對視覺輸入進行一些調(diào)整以提高其質(zhì)量。這可以包括調(diào)整大小、降噪或取消等等。在電影中,當鏡頭開始放大到崔妮蒂騎摩托車時,我們巧妙地看到了這個過程。她的第一張照片是鳥瞰圖,但后來隨著鏡頭對準她,鏡頭變得更加聚焦。
3.特征提取:一旦視覺輸入被“清理”,算法就開始提取相關(guān)的視覺屬性,以幫助理解圖像或視頻的內(nèi)容。
4.特征表示:提取的視覺特征或?qū)傩员仨氁詸C器學習算法可以處理的方式表示。 在電影中,我們看到三位一體的視覺輸入在計算機屏幕上由一系列數(shù)字和字符表示。
5.機器學習和訓練:在這一步中,計算機將被訓練來理解基于之前輸入的新視覺輸入的特征。例如,如果計算機已經(jīng)接受了組成人類的特征(如鼻子、耳朵、手臂等)的訓練,它將知道如何識別一個新的人類。
6.識別和解釋:經(jīng)過訓練的計算機視覺系統(tǒng)現(xiàn)在可以識別新的、未見過的視覺數(shù)據(jù)。在電影中,我們看到電腦通過金色的輪廓標記了三一學院的代表。
在這一點上,你可能非常了解計算機視覺-這是偉大的!但你可能會想,這項技術(shù)只出現(xiàn)在科幻電影里嗎?答案是否定的!計算機視覺在我們的世界中有許多用途和應用。
讓我們從現(xiàn)實世界中一個非常簡單而普遍的計算機視覺例子開始。你可能正在電腦或手機上閱讀這篇文章。如果你正在使用手機,你可能必須使用密碼、個人識別碼或面部識別來解鎖。如果你使用面部識別,你就看到了計算機視覺的作用!你的前置攝像頭拍下你的面部圖像,識別出關(guān)鍵特征,然后將圖像與你在設置面部ID時注冊的保存圖像進行比較。一旦計算機視覺識別出圖像與授權(quán)用戶(您)相匹配,手機將解鎖。
現(xiàn)在,讓我們來嘗試另一個計算機視覺的例子,你可能不會每天都接觸到它,但它已經(jīng)慢慢地進入了人們的每周例行公事。你可能每周至少買一次食品雜貨。你的雜貨店有自助結(jié)賬亭嗎?當你掃描商品時,收銀臺上方通常會有一個攝像頭對著你。計算機視覺可以用來理解這些自助結(jié)賬亭的攝像頭信息,以識別和標記任何可疑行為——比如有人沒付錢就把東西放進口袋,或者焦慮地四處張望。
這是計算機視覺的第三個例子,希望你們不用和它互動太多。計算機視覺可以用于交通攝像頭,以檢測超速和闖紅燈等違規(guī)行為。然后,計算機視覺可以提取違規(guī)車輛的車牌,這樣執(zhí)法部門就可以把罰單發(fā)給合適的人。如果你曾經(jīng)得到一張超速罰單,即使事故發(fā)生時沒有警察阻止你,那就是計算機視覺在起作用。
因此,《黑客帝國:復活》對計算機視覺的探索——即使它沒有使用這個術(shù)語——植根于我們生活的現(xiàn)實。我們可以使用計算機視覺來幫助我們解鎖手機,在雜貨店里追蹤商品,或者幫助找到親人。