阿里11篇論文入選IJCAI2017 人工智能領(lǐng)域捷報頻傳
在今年的國際人工智能聯(lián)合會議(IJCAI)上,阿里巴巴有11篇論文入選,這是繼今年的CVPR會議入選4篇、KDD會議入選5篇后,阿里巴巴在人工智能***會議上斬獲的***成果。
IJCAI被認為是人工智能領(lǐng)域最***的學(xué)術(shù)會議之一,涵蓋機器學(xué)習(xí)、計算可持續(xù)性、圖像識別、語音技術(shù)、視頻技術(shù)等,對全球人工智能行業(yè)具有巨大影響力。今年IJCAI共收到2540篇論文投稿,再創(chuàng)歷史新高,最終錄用660篇,錄用率26%。
阿里巴巴入選的11篇論文中,有6篇來自阿里巴巴-浙大前沿技術(shù)聯(lián)合研究中心,3篇來自螞蟻金服,均被主會收錄。另外2篇來自天貓和菜鳥物流,被主題為“AI Applications in E-Commerce”的Workshop收錄。“阿里巴巴-浙江大學(xué)前沿技術(shù)聯(lián)合研究中心”,旨在攜手攻克面向未來20年的核心科技,在人工智能、泛在信息安全、無障礙感知互聯(lián)等前沿技術(shù)領(lǐng)域開展研究合作。
今年3月,阿里巴巴推出NASA計劃,面向未來20年組建強大的獨立研發(fā)機構(gòu),為服務(wù)近20億人的新經(jīng)濟體儲備核心科技。為實現(xiàn)該目標,一方面由金榕、華先勝、任小楓等技術(shù)領(lǐng)軍人物,組建iDST、AI Labs等研究機構(gòu);另一方面發(fā)布***全球性科研項目“AIR”計劃,推進計算機科學(xué)領(lǐng)域基礎(chǔ)性、前瞻性、突破性的研究,構(gòu)建技術(shù)生態(tài)。
當前的阿里巴巴正從“互聯(lián)網(wǎng)+模式”的商業(yè)模式創(chuàng)新***者,變成科技創(chuàng)新的***者。
以下為IJCAI 2017阿里巴巴入選論文(前6篇來自阿里-浙大前沿技術(shù)聯(lián)合研究中心,中間3篇來自螞蟻金服,***2篇來自天貓和菜鳥物流)
Image Gradient-based Joint Direct Visual Odometry for Stereo Camera
一種基于圖像梯度聯(lián)合優(yōu)化的雙目視覺里程計算法
作者:朱建科
本文中提出了一個全新的并且可以改進收斂獲得更精確姿態(tài)的雙目里程計方法。我們算法的關(guān)鍵部分是一個基于多尺度金字塔構(gòu)架的雙雅克比優(yōu)化方法,并介紹了一個基于梯度特征的圖像表示方式。這使得我們的算法對光線變化很魯棒。創(chuàng)新地提出的聯(lián)合優(yōu)化的雙目視覺里程計算法將結(jié)合***幀和之前關(guān)鍵幀的信息。
地址:https://www.ijcai.org/proceedings/2017/0636.pdf
DeepFacade: A Deep Learning Approach to Facade Parsing
深度表面:一種基于深度學(xué)習(xí)的建筑表面解析方法
作者:劉漢唐,張加良,朱建科,許主洪
我們提出一種基于深度學(xué)習(xí)的解析建筑物表面的方法。人工制造的建筑規(guī)則通常具有很高的對稱性。基于這個觀察,我們?yōu)樯窠?jīng)網(wǎng)絡(luò)提出了一個對稱的約束項。我們的方法可以同時采用深度學(xué)習(xí)和人工先驗信息的優(yōu)點。我們通過給FCN-8s增加對稱損失函數(shù)來檢測我們方法的效果。實驗結(jié)果顯示我們的方法在ECP和eTREIMS數(shù)據(jù)集上打敗了之前領(lǐng)域內(nèi)***進的方法,是***個在全圖尺度上使用深度神經(jīng)網(wǎng)絡(luò)的方法。
地址:https://www.ijcai.org/proceedings/2017/0320.pdf
CFNN: Correlation Filter Neural Network for Visual Object Tracking
CFNN:一種協(xié)相關(guān)濾波神經(jīng)網(wǎng)絡(luò)的可視物體跟蹤算法
作者:李洋,徐展 ,朱建科
我們提出了一個新穎的協(xié)相關(guān)濾波神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)以及一整套跟蹤算法,是傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)的一個特例。它的網(wǎng)絡(luò)初始化不需要在任何額外數(shù)據(jù)集上進行任何的提前訓(xùn)練。得益于循環(huán)采樣技術(shù),我們提出的方法在網(wǎng)絡(luò)初始化時便可以得到有效的判別能力并且在網(wǎng)絡(luò)更新時兼具向后傳播算法的優(yōu)勢從而習(xí)得新樣本的外觀變化。整個跟蹤過程同時繼承了卷機網(wǎng)絡(luò)以及協(xié)相關(guān)濾波算法的互補優(yōu)勢。
地址:https://www.ijcai.org/proceedings/2017/0309.pdf
Deep Optical Flow Estimation Via Multi-Scale Correspondence Structure Learning
基于多尺度對應(yīng)結(jié)構(gòu)化學(xué)習(xí)的深度光流估計
作者:趙杉杉,李璽,奧馬
我們提出的MSCSL學(xué)習(xí)框架利用深度學(xué)習(xí)得到多尺度特征空間,進而在該深度特征空間中學(xué)習(xí)多尺度圖像之間的對應(yīng)結(jié)構(gòu)。MSCSL通過建立一個空間卷積GRU(Spatial Conv-GRU)神經(jīng)網(wǎng)絡(luò)模型去自適應(yīng)地建模不同尺度對應(yīng)結(jié)構(gòu)之間的內(nèi)在依賴關(guān)系。***,在端到端深度學(xué)習(xí)框架中實現(xiàn)上面兩個過程。
地址:https://www.ijcai.org/proceedings/2017/0488.pdf
Group-wise Deep Co-saliency Detection
基于端到端全卷積神經(jīng)網(wǎng)絡(luò)的組協(xié)同顯著性檢測
作者:魏李娜,趙杉杉,奧馬,李璽,吳飛
我們設(shè)計了一個統(tǒng)一的端到端深度學(xué)習(xí)框架對組內(nèi)共享特征和單張圖像特征的互動及關(guān)聯(lián)關(guān)系進行聯(lián)合學(xué)習(xí),從而使模型更具準確性和魯棒性。
地址:https://www.ijcai.org/proceedings/2017/0424.pdf
Boosted Zero-Shot Learning with Semantic Correlation Regularization
基于語義相關(guān)性約束的提升零樣本分類學(xué)習(xí)
作者:皮特,李璽,張仲非
我們設(shè)計了一個語義相關(guān)性正則化(SCR)方法,以約束提升分類模型使之與類別間的語義相關(guān)性結(jié)構(gòu)相一致。隨著將SCR正則化嵌入提升分類,以及嵌入針對魯棒學(xué)習(xí)的自控制樣本選擇過程,我們提出了一個統(tǒng)一的框架,基于語義相關(guān)性約束的提升零樣本分類模型(BZ-SCR)。通過平衡受SCR正則化的提升模型選擇過程和自控制的樣本選擇過程,BZ-SCR能夠捕捉從特征到類別語義的有判別性的、可適應(yīng)的校準,同時保證被學(xué)習(xí)樣本的可靠性和對目標類別的適應(yīng)性。
地址:https://www.ijcai.org/proceedings/2017/0362.pdf
Local Linear Factorization Machines
局部線性因子分解機
作者:劉成昊, 張騰, 趙沛霖, 周俊, 孫建伶
因子分解機(FM)是一種被廣泛應(yīng)用的方法,因其在分類和回歸任務(wù)中可以高效利用高階特征交互。不幸地,盡管對因子分解機有不斷增長的興趣,現(xiàn)存工作僅僅考慮了輸入特征的二階信息。這限制了它在非線性問題上的能力且不能捕捉更復(fù)雜數(shù)據(jù)的潛在結(jié)構(gòu)。在這個工作中,我們提出了一種新的局部線性因子分解機(LLFM)。它利用局部編碼技術(shù)克服了上述FM的缺陷。現(xiàn)存局部編碼分類器的學(xué)習(xí)方法包含了一個無監(jiān)督錨點學(xué)習(xí)階段和一個預(yù)定義的局部編碼方案。由于編碼方案中沒有利用數(shù)據(jù)的類別信息,這些方法會導(dǎo)致用于預(yù)測的編碼是次優(yōu)的。不同于已有方法,我們在錨點、局部編碼坐標、和FM參數(shù)上規(guī)劃出一個聯(lián)合優(yōu)化方案,來最小化分類或回歸風(fēng)險。***,我們通過實驗證明了,我們的方法取得了比其他已有FM方案、以及利用無監(jiān)督錨點學(xué)習(xí)和預(yù)定義編碼的LLFM明顯更好的預(yù)測精度。
地址:https://www.ijcai.org/proceedings/2017/0319.pdf
Learning User Dependencies for Recommendation
為推薦學(xué)習(xí)用戶相關(guān)性
作者:劉勇, 趙沛霖, 劉星, 吳敏, 段立新, 李曉黎
社交推薦系統(tǒng)利用用戶的社交關(guān)系來提高推薦精度。直覺上來講,一個用戶對于不同的場景傾向于信任不同的用戶。因此,社交推薦的一個主要挑戰(zhàn)是對于一個給定的推薦任務(wù)如何利用用戶間的最合適的相關(guān)性。以前的社交推薦方法通常是基于預(yù)定義的用戶相關(guān)性而開發(fā)的。因此,對于一個具體的推薦任務(wù),它們可能不是***的。在這篇文章里,我們提出了一個名為概率關(guān)系矩陣分解(PRMF)的推薦方法,它可以自動學(xué)習(xí)用戶相關(guān)性來提高推薦精度。在PRMF里,我們假設(shè)用戶的潛在特征是服從矩陣變量正態(tài)(MVN)分布。此外,用戶的正負相關(guān)性都可以用MVN分布的行精度矩陣來模擬。為了求解PRMF里的優(yōu)化問題,我們提出了一個交替優(yōu)化算法。***,在四個真實數(shù)據(jù)上的大量實驗證明了所提PRMF算法的效力。
地址:http://static.ijcai.org/proceedings-2017/0331.pdf
Online Multitask Relative Similarity Learning
在線多任務(wù)相對相似度學(xué)習(xí)
作者:郝書吉, 趙沛霖, 劉勇, 許主洪, 苗春燕
相對相似度學(xué)習(xí)(RSL)旨在通過由相對約束組成的數(shù)據(jù)來學(xué)習(xí)相似度函數(shù)。以前的大部分為RSL設(shè)計的算法是離線學(xué)習(xí)算法,所以在處理現(xiàn)實世界中的流式數(shù)據(jù)時會遭受極差的可擴展性。此外,這些現(xiàn)存算法經(jīng)常被設(shè)計來為一個具體的任務(wù)學(xué)習(xí)一個單獨的相似度函數(shù)。因此,它們在解決多任務(wù)學(xué)習(xí)問題時是次優(yōu)的。為了克服這些缺陷,我們提出了一個可擴展的RSL框架,并命名為在線多任務(wù)相對相似度學(xué)習(xí)(OMTRSL)。具體來說,我們首先針對多任務(wù)相對相似度學(xué)習(xí)開發(fā)了一個簡單有效的在線學(xué)習(xí)算法。然后,我們又提出一個主動學(xué)習(xí)算法來節(jié)省打標的成本。所提出的算法不僅享有極好的理論保證,也在現(xiàn)實數(shù)據(jù)集的實驗上展現(xiàn)了其高效能和效率。
地址:https://www.ijcai.org/proceedings/2017/0253.pdf
以下兩篇被主題為“AI Applications in E-Commerce”的Workshop收錄
Solving a New 3D Bin Packing Problem with Deep Reinforcement Learning Method
利用深度強化學(xué)習(xí)解決新型三維裝箱問題
作者:胡浩源張曉東 王龍飛 徐盈輝
本文通過近些年被成功應(yīng)用于組合優(yōu)化問題的深度學(xué)習(xí)技術(shù)--Pointer Network來對物品的放入順序進行學(xué)習(xí)和優(yōu)化?;诖罅繉嶋H數(shù)據(jù)構(gòu)建和訓(xùn)練了深度強化學(xué)習(xí)網(wǎng)絡(luò),并對此網(wǎng)絡(luò)的效果進行了檢驗,結(jié)果表明相對于已有的啟發(fā)式方法,使用本文提出的深度強化學(xué)習(xí)方法可以獲得大約5%的效果提升。
Life-stage inference in E-commerce: a dynamic merging based approach
電子商務(wù)中的生命階段推斷:一種動態(tài)融合方法
作者:周中晟,張祎東,舒智超,鄧玉明,王曉晴
為了提升用戶購物體驗,豐富用戶資料并探索用戶的潛在興趣是有價值的。例如,我們應(yīng)該對初生嬰兒的媽媽展示尿布,對1到2歲寶寶的媽媽展示兒童服裝,因為媽媽們會在特定階段對購買這些商品感興趣。我們設(shè)計了一種基于動態(tài)融合方法的生命階段推斷,可用于預(yù)測用戶年齡并在電商推薦系統(tǒng)中使用。動態(tài)融合的關(guān)鍵是維護具有不同分類結(jié)論的多個概率分布,并在合適的時候?qū)ζ溥M行更新。長期來看,只有有限個概率分布會被保留下來,我們可以根據(jù)這些分布對生命階段進行推斷。這樣做的優(yōu)點是無論對一個或是多個用戶都能使用統(tǒng)一的生命階段預(yù)測結(jié)構(gòu),并且可以識別消費者的短期偏好。