人工智能公平技術(shù)對于挽救生命具有重大意義
弗吉尼亞理工大學(xué)計算機科學(xué)教授Daphne Yao希望提高機器學(xué)習(xí)模型在醫(yī)療應(yīng)用中的預(yù)測精度。不準(zhǔn)確的預(yù)測可能會導(dǎo)致危及生命的后果。這些預(yù)測誤差可能會導(dǎo)致錯誤計算病人在急診室就診時死亡或癌癥存活的可能性。
她的研究結(jié)果最近發(fā)表在《醫(yī)學(xué)通訊》雜志上,該雜志致力于發(fā)表高質(zhì)量的研究、評論和論文,涵蓋所有臨床、轉(zhuǎn)化和公共衛(wèi)生研究領(lǐng)域。
Yao說,許多臨床數(shù)據(jù)集是不平衡的,因為它們被多數(shù)群體樣本所主導(dǎo)。在典型的適用于所有人的一臺機器學(xué)習(xí)模型范式中,種族和年齡差異很可能存在,但可能被忽略。
Yao和她的研究團隊與Charles B. Nemeroff合作,Nemeroff是美國國家醫(yī)學(xué)院的成員,也是德克薩斯大學(xué)奧斯汀分校戴爾醫(yī)學(xué)院精神病學(xué)和行為科學(xué)系的教授,研究訓(xùn)練數(shù)據(jù)中的偏差如何影響預(yù)測結(jié)果,特別是對代表性不足的患者的影響,如年輕患者或有色人種患者。
Nemeroff說:“我非常高興能與Yao合作,她是先進機器學(xué)習(xí)領(lǐng)域的世界領(lǐng)導(dǎo)者。”“她和我討論了一個概念,即機器學(xué)習(xí)的新進展可以應(yīng)用于臨床研究人員經(jīng)常遇到的一個非常重要的問題,即通常參加臨床試驗的少數(shù)族裔人數(shù)相對較少。”
這導(dǎo)致醫(yī)療結(jié)論主要是針對多數(shù)群體(歐洲裔白人患者)得出的,這可能不適用于少數(shù)族裔群體。
Nemeroff稱:“這份新報告提供了一種方法來提高對少數(shù)群體的預(yù)測準(zhǔn)確性?!薄帮@然,這些發(fā)現(xiàn)對改善少數(shù)民族患者的臨床護理具有非常重要的意義。”
Yao的弗吉尼亞理工大學(xué)團隊由計算機科學(xué)系的博士生Sharmin Afrose和Wenjia Song以及化學(xué)工程系的Chang Lu,F(xiàn)red W. Bull教授組成。為了進行研究,她們在兩個數(shù)據(jù)集上對四種不同的預(yù)后任務(wù)進行了實驗,使用了一種新的雙優(yōu)先級(DP)偏差校正方法,為特定的種族或年齡組訓(xùn)練定制模型。
“我們的工作展示了一種新的人工智能公平技術(shù),可以糾正預(yù)測錯誤,”四年級博士生Song說,她的研究領(lǐng)域包括數(shù)字健康和網(wǎng)絡(luò)安全中的機器學(xué)習(xí)?!拔覀兊腄P方法提高了少數(shù)民族班級的表現(xiàn)高達38%,并顯著減少了不同人口統(tǒng)計群體之間的預(yù)測差異,比其他抽樣方法好88%?!?/span>
監(jiān)測、流行病學(xué)和最終結(jié)果數(shù)據(jù)集被Song用于乳腺癌和肺癌生存率的任務(wù),而五年級博士生Afrose則使用來自波士頓Beth Israel Deaconess醫(yī)療中心的數(shù)據(jù)集進行住院死亡率預(yù)測和失代償預(yù)測任務(wù)。
“我們很高興找到了減少偏見的解決方案,”Afrose說,她的研究重點包括醫(yī)療保健和軟件安全中的機器學(xué)習(xí)?!拔覀兊腄P偏差校正技術(shù)將減少對少數(shù)群體潛在的威脅生命的預(yù)測錯誤?!?/span>
隨著這些發(fā)現(xiàn)的發(fā)表和公開訪問,該團隊渴望與其他研究人員合作,在他們自己的臨床數(shù)據(jù)分析中使用這些方法。
Song說:“我們的方法很容易部署在各種機器學(xué)習(xí)模型上,可以幫助提高任何具有表征偏差的預(yù)后任務(wù)的性能?!?/span>