盛大騰訊專家談人機(jī)交互:忘記文字 回到原始
圖左一騰訊研究院人機(jī)交互中心陳波,左二盛大創(chuàng)新院多媒體院單霆 (TechWeb配圖)
【TechWeb報(bào)道】3月20日消息,TechWeb龍門陣本周的技術(shù)專場(chǎng)主題為“視覺識(shí)別在移動(dòng)互聯(lián)網(wǎng)上的應(yīng)用”,主講嘉賓為盛大創(chuàng)新院多媒體院的單霆和騰訊研究院人機(jī)交互中心模式識(shí)別項(xiàng)目負(fù)責(zé)人陳波。單霆認(rèn)為,人機(jī)交互技術(shù)的本質(zhì)是“忘記文字,回到原始”。
單霆從技術(shù)角度介紹了人臉識(shí)別系統(tǒng),識(shí)別過程包括從圖像到人臉檢測(cè)、特征定位、識(shí)別到生成結(jié)果。60年代、70年的研究以整張臉為特征進(jìn)行模板匹配,現(xiàn)在則采用了局部特征,一張臉上最多有8個(gè)定位點(diǎn)。
人臉識(shí)別的特點(diǎn)在于,光線、角度、表情、遮擋物、眼鏡、年齡等因素都會(huì)影響識(shí)別效果。“目前在業(yè)內(nèi)做模式識(shí)別(包括人臉識(shí)別)的人非常多,集中在科研,大規(guī)模的應(yīng)用比較少,大部分集中在安防領(lǐng)域。”
單霆具有多年的人臉識(shí)別及圖像搜索經(jīng)驗(yàn),現(xiàn)在在盛大創(chuàng)新院負(fù)責(zé)人臉識(shí)別的技術(shù)產(chǎn)品研發(fā)。他們開發(fā)的技術(shù)Face-API已經(jīng)進(jìn)行了開放,F(xiàn)ace-API可提供人臉檢測(cè)、五官定位、人臉相似度打分、性別檢測(cè)的接口,需要的開發(fā)者或者公司可申請(qǐng)獲得邀請(qǐng)碼。現(xiàn)有的公司申請(qǐng)者包括搜拍、碼圖網(wǎng)、應(yīng)用趣玩網(wǎng)等。
另外,盛大創(chuàng)新院還基于人臉識(shí)別開發(fā)了一款智能相冊(cè),使用戶可對(duì)手機(jī)相冊(cè)進(jìn)行按照時(shí)間以及人物分類瀏覽,并且還可將人物與通訊錄關(guān)聯(lián),直接打電話或發(fā)短信。單霆表示,智能相冊(cè)未來還將與更多的SNS打通。
騰訊研究院人機(jī)交互中心的陳波介紹了騰訊在模式識(shí)別領(lǐng)域做的幾方面研究。包括人臉識(shí)別、圖片識(shí)別、語音識(shí)別、手寫識(shí)別等。
陳波認(rèn)為,人機(jī)交互可分為三個(gè)階段:人適應(yīng)機(jī)器的規(guī)則、機(jī)器適應(yīng)人的規(guī)則、機(jī)器和人達(dá)成默契。新一代互聯(lián)網(wǎng)給人機(jī)交互帶來了新的機(jī)會(huì),這些機(jī)會(huì)體現(xiàn)在云計(jì)算的興起、新一代的移動(dòng)平臺(tái)的普及、終端運(yùn)算能力的提高等方面。
陳波特別提到,智能手機(jī)的攝像頭可以成為一個(gè)重要的信息入口。“讓你的手機(jī)變成成熟的圖像掃描儀。”基于攝像頭的交互技術(shù),可以進(jìn)行拍照翻譯、路牌拍照識(shí)別、建筑物識(shí)別、視頻分類、字幕識(shí)別等。騰訊據(jù)此推出了一款名為“QQ慧眼”的產(chǎn)品,已經(jīng)在App Store上架。
騰訊在人臉識(shí)別、語音識(shí)別以及文字識(shí)別方面的研究主要應(yīng)用于騰訊內(nèi)部產(chǎn)品,比如人臉識(shí)別與QQ登陸驗(yàn)證進(jìn)行關(guān)聯(lián),QQ輸入法的語音功能及手寫功能。
另外,陳波認(rèn)為模式識(shí)別在互動(dòng)娛樂、購物消費(fèi)領(lǐng)域也可以有很好的應(yīng)用。(張睿)