讓計算機讀懂好文章?
Kaggle 是一個有趣的站點,它以數(shù)字競賽的方式激發(fā)天才怪杰們的熱情,借助他們的高智商來解決現(xiàn)實中有趣,抑或難以解決的問題,比如預測未來五個月內(nèi)每位維基百科編輯的編輯次數(shù),或者是預測澳大利亞未來 24 小時內(nèi)的交通狀況等等。
這一次,Kaggle 又發(fā)起了新的數(shù)字競賽,這一次將挑戰(zhàn)各位天才怪杰的極限——“自動讀懂學生寫的文章,并打分”。
項目的想法是為了減輕老師的負擔,因為每年畢業(yè)的學生都要寫大量的文章,然而老師每次都要花費大量的時間閱讀并評分。這個競賽從三個方面來考驗參賽者:
- 參賽者要證明他開發(fā)的自動評分系統(tǒng)的優(yōu)勢。
- 將對比自動評分系統(tǒng)與學生所花費的成本和達成的效果。
- 向國家教育部門或其他關鍵的決策者說明這個產(chǎn)品運行的原理。
Kaggle 的競賽,旨在讓計算機在一定程度上讀懂人類所寫的文本,并給出評價。這種自動化的方式,確實能夠極大的解放老師的工作壓力。在以前,人們探索計算機能力時,會嘗試利用“無線猴子定理”創(chuàng)造出大量虛擬猴子和虛擬打印機,來打出莎士比亞著作。在 2011 年,開發(fā)者 Jesse Anderson 就進行過類似的嘗試。
計算機能夠理解人類的文本嗎?目前來看是不行的。
那么 Kaggle 的競賽有實現(xiàn)的可能嗎?有可能。因為無論測驗還是批改作業(yè), 老師都是通過一定的判斷方法來進行,而參賽者所要做的就是盡量把這個規(guī)則找出來,轉(zhuǎn)變?yōu)橛嬎銠C能夠操作的方法,實現(xiàn)計算機自動評分的目的。比如說一篇文章寫得好不好,可以看形容詞用了多少,句子是簡單還是復雜,計算機能夠通過統(tǒng)計來找出內(nèi)在的一些規(guī)律,而參賽者需要考慮的,則是如何讓自己的評分算法顯得更加公平,以及更加接近人類的判斷。
該競賽由 William and Flora Hewlett Foundation 贊助,***名達到目標參賽者將獲得 6 萬美元獎金,第二名則獲得 3 萬美元,第三名獲得 1 萬美元。目前該競賽已經(jīng)有 156 位參賽者參與,并且提交了 1123 篇文章。
【編輯推薦】