強(qiáng)強(qiáng)聯(lián)手,可視化與人工智能的完美結(jié)合!
可視化與可視分析利用高帶寬的視覺感知通道, 將數(shù)據(jù)轉(zhuǎn)換為圖形表達(dá), 輔以交互手段, 以增強(qiáng)人對(duì)數(shù)據(jù)的認(rèn)知能力, 在態(tài)勢(shì)感知、關(guān)聯(lián)分析、決策輔助等方面展示了強(qiáng)大的賦能作用。隨著以深度學(xué)習(xí)為代表的人工智能技術(shù)的突破性進(jìn)展, 面向人工智能的可視化和人工智能驅(qū)動(dòng)的可視化受到了可視化、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等領(lǐng)域的高度關(guān)注。
一方面, 可視化與可視分析在改善人工智能的基礎(chǔ)數(shù)據(jù)質(zhì)量和可解釋性方面發(fā)揮了巨大作用 。高質(zhì)量訓(xùn)練數(shù)據(jù)是高性能人工智能應(yīng)用的必要前提。針對(duì)異常檢測(cè)、數(shù)據(jù)標(biāo)記等需要大量人工勞動(dòng)的任務(wù), 利用可視化與可視分析技術(shù)提高其效率, 是當(dāng)前的研究熱點(diǎn)之一 。更令人關(guān)注的是人工智能的可解釋性問題。以深度神經(jīng)網(wǎng)絡(luò)為例, 它具有非線性非凸、多層結(jié)構(gòu)、海量參數(shù)、弱語(yǔ)義特征等特點(diǎn), 被認(rèn)為是一個(gè)難以解釋的“黑盒子”。在自動(dòng)駕駛、智能醫(yī)療、金融投資等高風(fēng)險(xiǎn)決策領(lǐng)域, 可解釋性成為阻礙領(lǐng)域技術(shù)發(fā)展的瓶頸問題。可視化可以幫助提升機(jī)器學(xué)習(xí)的透明度, 增強(qiáng)人對(duì)大規(guī)模復(fù)雜機(jī)制的認(rèn)知能力。各領(lǐng)域在基于可視化的深度學(xué)習(xí)解釋方法方面進(jìn)行了大量的研究工作, 例如患者未來狀態(tài)預(yù)測(cè)、機(jī)器人訓(xùn)練策略 , 以及自然語(yǔ)言處理任務(wù)。
另一方面, 人工智能技術(shù)的進(jìn)步為可視化與可視分析的發(fā)展提供了強(qiáng)有力的工具。針對(duì)復(fù)雜數(shù)據(jù)、復(fù)雜模式等需要呈現(xiàn)大量信息的可視化任務(wù), 利用機(jī)器學(xué)習(xí)技術(shù)能夠去除數(shù)據(jù)噪聲、提取關(guān)鍵信息,從而減少視覺混亂、增強(qiáng)可視化效果 。同時(shí), 利用人工智能技術(shù)擬合數(shù)據(jù)特征和可視編碼也為可視化布局帶來了新的機(jī)遇。數(shù)據(jù)特征和可視編碼的結(jié)合催生了更具表現(xiàn)力的可視化設(shè)計(jì) ; 利用人工智能技術(shù)的海量數(shù)據(jù)自動(dòng)化布局避免了耗時(shí)的數(shù)據(jù)操作和數(shù)據(jù)計(jì)算 ; 人工智能技術(shù)還被應(yīng)用于解決大規(guī)模數(shù)據(jù)可視化中的交互效率難題, 例如體數(shù)據(jù)渲染中智能視角選擇、區(qū)塊鏈智能合約交互式構(gòu)建和大型網(wǎng)絡(luò)的交互式可視探索。
目前, 可視化與人工智能的交叉研究已經(jīng)表現(xiàn)出了巨大的潛力, 促進(jìn)了可視化與人工智能領(lǐng)域的關(guān)鍵技術(shù)發(fā)展。在如下方面, 可視化與人工智能的交叉研究有望取得較大突破。
(一)協(xié)同可視分析中的數(shù)據(jù)隱私保護(hù)
數(shù)據(jù)分布在多個(gè)數(shù)據(jù)擁有方, 是大數(shù)據(jù)應(yīng)用場(chǎng)景中的常態(tài), 自然產(chǎn)生了多方參與的協(xié)同可視分析任務(wù)。然而, 由于數(shù)據(jù)版權(quán)或隱私保護(hù)問題, 這些數(shù)據(jù)擁有方往往無(wú)法直接共享數(shù)據(jù)。協(xié)同可視分析有兩項(xiàng)關(guān)鍵挑戰(zhàn)。首先, 如何在不交互數(shù)據(jù)的情況下生成聯(lián)合數(shù)據(jù)可視化結(jié)果。其次, 數(shù)據(jù)可視化結(jié)果如何保護(hù)數(shù)據(jù)隱私。目前, 對(duì)于第一個(gè)問題的研究還較少。安全多方計(jì)算、聯(lián)邦學(xué)習(xí)等方法為解決數(shù)據(jù)孤島問題提供了思路。如何將這些方法應(yīng)用于協(xié)同數(shù)據(jù)可視分析, 是值得研究的方向。
(二)可解釋機(jī)器學(xué)習(xí)
首先, 目前的大部分研究聚焦于模型訓(xùn)練后的離線分析。但深度學(xué)習(xí)模型的訓(xùn)練本身是一個(gè)耗時(shí)的過程, 隨著深度學(xué)習(xí)模型規(guī)模和訓(xùn)練數(shù)據(jù)量的進(jìn)一步增長(zhǎng), 訓(xùn)練時(shí)長(zhǎng)已增加到數(shù)天甚至數(shù)周。及時(shí)發(fā)現(xiàn)訓(xùn)練過程中的偏差并進(jìn)行診斷和決策具有重要的意義。類似地, 在在線學(xué)習(xí)過程中, 訓(xùn)練過程隨著流數(shù)據(jù)的到來持續(xù)進(jìn)行, 離線分析模式往往難以及時(shí)捕捉數(shù)據(jù)和模型的變化, 從而無(wú)法提供有效的指導(dǎo)。研究深度學(xué)習(xí)的在線可視分析方法, 在訓(xùn)練過程中對(duì)模型進(jìn)行監(jiān)督和指導(dǎo), 具有重要的研究意義。
(三)智能特征提取
人工智能的進(jìn)展改變了特征提取的流程, 減少了特征工程的工作量, 通過端到端的形式提供數(shù)據(jù)的壓縮表達(dá)。另一方面, 人工智能提供了多種嵌入方法, 將復(fù)雜類型數(shù)據(jù)轉(zhuǎn)換到易于理解的高維空間。因此, 基于人工智能的特征提取為可視化與可視分析提供了簡(jiǎn)潔的表達(dá)基礎(chǔ)。用于可視化與可視分析的特征提取面臨的挑戰(zhàn)在于: 自動(dòng)提取的特征不一定具有明確的語(yǔ)義信息, 不利于理解與解釋。如何根據(jù)分析需求定制語(yǔ)義特征提取方法, 是當(dāng)前需要解決的難題。
(四)可視化的自動(dòng)生成
自動(dòng)可視化從數(shù)據(jù)自動(dòng)生成能夠準(zhǔn)確表達(dá)重要模式的可視化視圖, 對(duì)缺乏相關(guān)知識(shí)和技能的普通用戶具有重要的作用。當(dāng)前主要有兩類方法。第1類是基于設(shè)計(jì)經(jīng)驗(yàn)知識(shí), 將可視化設(shè)計(jì)問題歸約成最優(yōu)化問題求解。這一類方法效果較好, 具有較高的可理解性。但最優(yōu)化原則的提煉需要較多的設(shè)計(jì)經(jīng)驗(yàn)和嘗試。第2類方法是采用具有端到端性質(zhì)的深度學(xué)習(xí), 跳過了對(duì)設(shè)計(jì)原則的總結(jié)階段。當(dāng)前, 在大圖的布局、大規(guī)模數(shù)據(jù)體繪制等算法上, 深度學(xué)習(xí)模型取得了良好的效果。但由于數(shù)據(jù)空間和可視化視圖空間都非常龐大, 訓(xùn)練深度學(xué)習(xí)模型需要大量的高質(zhì)量訓(xùn)練數(shù)據(jù)。對(duì)于大多數(shù)可視化視圖而言, 訓(xùn)練數(shù)據(jù)集的生成是一個(gè)需要攻克的難題。
(五)智能交互
人機(jī)交互是可視分析中不可或缺的一環(huán), 目前的挑戰(zhàn)主要包括兩個(gè)方面。首先是精確的選擇。如何在全體數(shù)據(jù)集中精確地選取包含感興趣模式的子集, 是當(dāng)前研究的熱點(diǎn)問題, 例如在點(diǎn)云數(shù)據(jù)中選取感興趣部分, 在時(shí)空數(shù)據(jù)中選取保護(hù)特定模式的時(shí)間段。其次是大規(guī)模數(shù)據(jù)的交互難題。由于存儲(chǔ)和計(jì)算方面的壓力, 大規(guī)模數(shù)據(jù)的交互一直是一個(gè)挑戰(zhàn)。人工智能技術(shù)通過壓縮表達(dá)、智能索引、查詢預(yù)測(cè)等方法, 為解決交互難題提供了技術(shù)途徑。如何提出準(zhǔn)確、普適的智能交互方法, 將是未來研究的重點(diǎn)。
(六)智能故事敘述
可視化的核心功能是信息的表達(dá), 如何用可視化講好一個(gè)故事, 是可視化研究的重要主題。隨著人工智能技術(shù)的發(fā)展, 利用可視化進(jìn)行故事敘述的研究進(jìn)一步變?yōu)橹悄芄适聰⑹?。具體而言, 智能故事敘述主要體現(xiàn)在以下方面: 首先, 是故事的自動(dòng)拆解與自動(dòng)化生成。會(huì)有更多的研究致力于提煉故事敘述的元素、將組成故事的可視化表達(dá)進(jìn)行拆解與總結(jié), 進(jìn)一步地支持故事的自動(dòng)化生成。其次, 在自動(dòng)化的基礎(chǔ)上, 智能故事敘述的第二個(gè)體現(xiàn)是多樣性, 智能的意義在于可以學(xué)習(xí)不同的故事風(fēng)格、敘述手法、可視化表達(dá), 進(jìn)行組合與創(chuàng)造, 產(chǎn)生新的多種多樣的可視化故事敘述。最后是人機(jī)融合, 用戶可以用極小的交互代價(jià), 利用機(jī)器智能構(gòu)造出符合用戶心中構(gòu)思的故事的樣子, 即在多樣的故事中能夠快速智能地構(gòu)造出符合用戶預(yù)期的可視化故事。
本文由蠟筆聊最炫科技原創(chuàng),歡迎關(guān)注,帶你一起長(zhǎng)知識(shí)!