自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

從百度視頻看大數(shù)據(jù)與人工智能

數(shù)據(jù)庫(kù)
大數(shù)據(jù)的應(yīng)用決策可以拆解成兩種層面,第一種是利用個(gè)體數(shù)據(jù)為個(gè)體進(jìn)行決策,第二種是利用群體數(shù)據(jù)為群體進(jìn)行決策。結(jié)合的案例,看看大數(shù)據(jù)與人工智能是具體如何應(yīng)用的。

近日,了解到百度視頻在升級(jí)迭代上利用大數(shù)據(jù)做了很多事情,這讓我真實(shí)的感受到了大數(shù)據(jù)的價(jià)值。其中我將大數(shù)據(jù)的應(yīng)用決策拆解成兩種層面,***種是利用個(gè)體數(shù)據(jù)為個(gè)體進(jìn)行決策,第二種是利用群體數(shù)據(jù)為群體進(jìn)行決策。

以下,結(jié)合百度視頻已經(jīng)實(shí)現(xiàn)以及將要實(shí)現(xiàn)的案例,來(lái)看下大數(shù)據(jù)與人工智能是具體如何應(yīng)用的。

大數(shù)據(jù)個(gè)性化決策

個(gè)性化決策無(wú)疑是難度***的,因?yàn)閭€(gè)性化決策是根據(jù)用戶(hù)行為記錄來(lái)為用戶(hù)做出相應(yīng)的推薦。

百度在無(wú)線(xiàn)端有大量的產(chǎn)品,其中用戶(hù)數(shù)過(guò)億的 APP 就多達(dá) 14 款。百度內(nèi)部有專(zhuān)門(mén)的團(tuán)隊(duì),分析用戶(hù)在這些 APP 中的行為,利用算法估算用戶(hù)的年齡、性別、職業(yè)、興趣等特征。

這一技術(shù)在百度工程師那里稱(chēng)為用戶(hù)建模,這些數(shù)據(jù)來(lái)自于用戶(hù)手機(jī)里安裝的百度應(yīng)用如“百度地圖”、“百度貼吧”、“百度魔圖”外加一些使用百度開(kāi)放接口的應(yīng)用諸如“糗事百科”等等,百度是能夠通過(guò)這些數(shù)據(jù)進(jìn)而來(lái)為用戶(hù)建立動(dòng)態(tài)模型。

[[111841]]

百度視頻的個(gè)性化推送是典型的利用群體智慧來(lái)解決個(gè)體需求的例子。傳統(tǒng)的視頻 APP 通常以廣播的方式為用戶(hù)推送視頻,即每個(gè)用戶(hù)收到的消息內(nèi)容是一樣的,無(wú)法滿(mǎn)足用戶(hù)個(gè)性化的需求。百度視頻的做法是,分析用戶(hù)的歷史觀看記錄,同時(shí)結(jié)合用戶(hù)的性別、年齡、地域等特征,為用戶(hù)建立興趣模型,將用戶(hù)可能感興趣但卻未觀看過(guò)的視頻推送給用戶(hù)。

比如一個(gè)經(jīng)常上動(dòng)漫貼吧的用戶(hù),百度通過(guò)搜集大數(shù)據(jù)后判斷其是 20 歲左右的大學(xué)生,在個(gè)性化推送上就和其他人群就有所不同,可能就會(huì)推送一些大學(xué)生圈子里比較流行的動(dòng)漫以及韓劇之類(lèi)。

簡(jiǎn)而言之,用戶(hù)使用的百度系以及帶有百度接口產(chǎn)品的產(chǎn)品越多,百度就能越能為用戶(hù)建立個(gè)人模型,所有使用過(guò)的產(chǎn)品的數(shù)據(jù)會(huì)匯聚到百度云端,人工智能***再繪制出一個(gè)人的畫(huà)像,百度再根據(jù)這個(gè)畫(huà)像再為每個(gè)應(yīng)用進(jìn)行大數(shù)據(jù)決策推送,再根據(jù)用戶(hù)的反饋結(jié)果進(jìn)行迭代試錯(cuò),當(dāng)然這是機(jī)器學(xué)習(xí)的部分,不必要再深入討論下去。我畫(huà)了一個(gè)簡(jiǎn)單的百度個(gè)性化推薦原理。

大數(shù)據(jù)

大數(shù)據(jù)群體化決策

個(gè)體與群體的價(jià)值思辨

之前我對(duì)百度個(gè)性化推送提出過(guò)缺陷的質(zhì)疑,一旦當(dāng)用戶(hù)更換手機(jī)之后,百度就無(wú)法再次為其建立個(gè)人畫(huà)像模型,進(jìn)而也就失去了對(duì)于個(gè)人的意義,百度又要重新建立個(gè)人數(shù)據(jù),十分麻煩。

而深入了解百度的大數(shù)據(jù)之后讓我感到更有一番深度,百度的大數(shù)據(jù)并非只為個(gè)體用戶(hù)服務(wù),更重要的是建立群體宏觀行為模型,通過(guò)這一整套模型為群體進(jìn)行宏觀決策,而群體決策部分的重要戰(zhàn)略意義遠(yuǎn)遠(yuǎn)大于個(gè)體意義。

我對(duì)此的理解為:如果我們將人類(lèi)整體行為看做為個(gè)體行為,那么同樣的作為個(gè)人總有一些誤操作,一些隨機(jī)的非主流的邊緣操作,而這些邊緣操作對(duì)于機(jī)器學(xué)習(xí)來(lái)說(shuō)只是噪聲而非信號(hào),是需要進(jìn)行過(guò)濾的,那么機(jī)器就需要過(guò)濾掉這些沒(méi)有價(jià)值的數(shù)據(jù),將有價(jià)值的信號(hào)數(shù)據(jù)沉淀與固定下來(lái),為整體行為進(jìn)行決策。

 [[111842]]

所以在某種程度上,我們都會(huì)陷入個(gè)性化至上的錯(cuò)覺(jué),而忽略群體數(shù)據(jù)決策的價(jià)值。再回到百度之前的個(gè)性化推送功能,這些推送一定是事先經(jīng)過(guò)群體過(guò)濾過(guò)后的信號(hào),再向用戶(hù)推送后才會(huì)更戳中人心。比如百度通過(guò)數(shù)據(jù)判斷出***流行的韓劇是《來(lái)自星星的你》,而不是過(guò)氣的《大長(zhǎng)今》,繼而向用戶(hù)推薦《星星》,這些都不是人工的,完全是自動(dòng)生成的。

也就是,這場(chǎng)思辨中我得出了一個(gè)關(guān)于大數(shù)據(jù)的重要結(jié)論,機(jī)器為個(gè)人的數(shù)據(jù)提供個(gè)人喜好的小范圍數(shù)據(jù),而群體大數(shù)據(jù)決策后的結(jié)果在為個(gè)體擴(kuò)大范圍。

個(gè)性化推送為個(gè)人提供確定性,為群體提供不確定性。而群體決策為個(gè)人提供不確定性,為群體提供確定性。

二者的噪聲互為價(jià)值,二者的信號(hào)互為干擾。

人工智能或許永遠(yuǎn)無(wú)法超越人類(lèi)

上次我和趙云峰還有劉峰老師在 3W 咖啡里討論了人工智能的未來(lái),其中我們談?wù)摰搅藞D靈測(cè)試,我們分析到圖靈測(cè)試的程序雖然越來(lái)越厲害了,但這依然是工具而已,本質(zhì)上人與人的博弈罷了,機(jī)器永遠(yuǎn)無(wú)法脫離人類(lèi)進(jìn)行自學(xué)習(xí)。

 [[111843]]

那么這里回到百度視頻上來(lái),百度目前做到了平均給每部視頻貼上上百個(gè)標(biāo)簽,而且這些標(biāo)簽根據(jù)時(shí)間還在不斷的更新與迭代,不僅如此,這些標(biāo)簽還在不斷的自行關(guān)聯(lián)。所以百度視頻能夠做到,搜索諸如“高智商電影”會(huì)出現(xiàn)《盜夢(mèng)空間》、《禁閉島》、《源代碼》等等這樣的關(guān)聯(lián)。

有人問(wèn),這些成百上千的標(biāo)簽都是人工匹配的嗎?如果這樣,百度人力需要很多啊。實(shí)際上標(biāo)簽是機(jī)器全自動(dòng)做好的。但制定標(biāo)簽還是需要人,機(jī)器應(yīng)當(dāng)是通過(guò)用戶(hù)先搜索到某個(gè)關(guān)鍵詞然后經(jīng)過(guò)一系列的行為判斷該關(guān)鍵詞與某電影的關(guān)系,通過(guò)大量用戶(hù)的反復(fù)出現(xiàn)的數(shù)據(jù),機(jī)器再建立出這些關(guān)聯(lián)。

假如有一天機(jī)器能夠完全通過(guò)獨(dú)立的自我學(xué)習(xí),通過(guò)自身而不借助人類(lèi)去關(guān)聯(lián)這些標(biāo)簽詞匯與電影的關(guān)系。那一刻才能算是真正實(shí)現(xiàn)了人工智能。

這只能說(shuō)明我和趙云峰還有劉老師在 3W 咖啡的談話(huà)是多么無(wú)聊的正確,對(duì)于機(jī)器來(lái)說(shuō),人類(lèi)就像他們的發(fā)動(dòng)機(jī),他們無(wú)法做到產(chǎn)生真正的意識(shí),他們無(wú)法像人類(lèi)一樣進(jìn)行自我追問(wèn)一切的起源,0 與 1 的結(jié)構(gòu)。

是啊,人類(lèi)是多么孤獨(dú),因?yàn)橹挥腥祟?lèi)才會(huì)意識(shí)到自己的孤獨(dú),而機(jī)器不會(huì)。但又或許,是我們正在共同創(chuàng)造機(jī)器的意識(shí)吧,這個(gè)超級(jí)有機(jī)體將會(huì)成為我們。

***奉上,根據(jù)理論,未來(lái)的大數(shù)據(jù)的群體與個(gè)人結(jié)合的私人定制圖。

人工智能

【編輯推薦】

責(zé)任編輯:彭凡 來(lái)源: 極客公園
相關(guān)推薦

2016-10-21 15:38:46

百度云

2015-03-11 17:53:36

2022-04-02 16:14:09

百度教育人才

2017-12-11 18:03:17

大數(shù)據(jù)AI智能

2016-11-10 13:15:43

百度

2010-01-28 10:29:44

2013-04-03 10:28:47

2013-04-07 09:32:55

2018-09-12 14:13:10

人工智能

2020-04-22 10:03:39

大數(shù)據(jù)人工智能AI

2016-10-12 18:27:52

百度開(kāi)放云百度云百度

2021-02-25 10:23:01

人工智能科技機(jī)器學(xué)習(xí)

2021-03-02 11:32:03

云計(jì)算大數(shù)據(jù)人工智能

2021-03-17 10:52:56

云計(jì)算大數(shù)據(jù)人工智能

2018-03-27 12:45:27

百度AI小度在家小魚(yú)在家

2020-10-29 10:27:29

人工智能技術(shù)數(shù)據(jù)

2017-07-26 16:26:47

數(shù)據(jù)中心人工智能技術(shù)

2021-04-23 10:13:59

大數(shù)據(jù)人工智能醫(yī)療

2021-08-03 10:23:26

人工智能AI數(shù)字化轉(zhuǎn)型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)