微軟發(fā)布 Data Formulator:AI 顛覆數(shù)據(jù)可視化,讓數(shù)據(jù)“說話”更輕松
IT之家 2 月 17 日消息,科技媒體 marktechpost 昨日(2 月 14 日)發(fā)布博文,報(bào)道稱微軟 Microsoft Research 團(tuán)隊(duì)提出 Data Formulator,通過概念驅(qū)動(dòng)的方法有效地解決了數(shù)據(jù)轉(zhuǎn)換的持續(xù)挑戰(zhàn)。
現(xiàn)有挑戰(zhàn)
IT之家注:Charticulator、Data Illustrator、Lyra 等現(xiàn)代可視化工具,以及 ggplot2、VegaLite 等庫,通常需要“整潔數(shù)據(jù)”作為輸入,意味著每個(gè)可視化變量都是一列,每個(gè)觀察值都是一行。
如果不是這種格式,用戶就需要進(jìn)行數(shù)據(jù)轉(zhuǎn)換,即使原始數(shù)據(jù)完整無缺。這需要編程專業(yè)知識(shí)以及 tidyverse、pandas 或 Wrangler 等專業(yè)工具,導(dǎo)致工作流程低效,不斷切換數(shù)據(jù)轉(zhuǎn)換和可視化步驟。
Data Formulator
Data Formulator 引入“概念綁定”范式,用戶將數(shù)據(jù)“概念”綁定到可視化通道。概念可以來自現(xiàn)有列,也可以按需創(chuàng)建。
創(chuàng)建新概念有兩種方法:自然語言提示(用于數(shù)據(jù)推導(dǎo))和基于示例的輸入(用于數(shù)據(jù)重塑)。用戶選擇圖表類型并映射所需概念后,Data Formulator 的 AI 后端會(huì)推斷必要的數(shù)據(jù)轉(zhuǎn)換并生成候選可視化結(jié)果。
系統(tǒng)為多個(gè)候選結(jié)果提供解釋性反饋,用戶可以通過直觀的界面檢查、優(yōu)化和迭代可視化結(jié)果。結(jié)合自然語言和編程示例,用戶可以使用熟悉的配置工具,同時(shí)訪問強(qiáng)大的轉(zhuǎn)換功能。
測(cè)試結(jié)果
用戶測(cè)試結(jié)果表明 Data Formulator 在任務(wù)完成度和可用性方面表現(xiàn)出色。參與者平均在 20 分鐘內(nèi)完成所有分配可視化任務(wù),其中任務(wù) 6 由于涉及 7 天移動(dòng)平均值計(jì)算而耗時(shí)最長。
展望未來,這種概念驅(qū)動(dòng)的可視化方法有望影響下一代可視化數(shù)據(jù)探索和創(chuàng)作工具,有可能消除可視化創(chuàng)建中長期存在的數(shù)據(jù)轉(zhuǎn)換障礙。
參考
- Data Formulator 2: Iteratively Creating Rich Visualizations with AI
- GitHub