自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

T 前線 | 專訪作業(yè)幫首席AI架構(gòu)師王巖:AI的普惠性在于思路創(chuàng)新

原創(chuàng)
人工智能
AI研究熱潮的多次起伏,始終伴隨著應(yīng)用落地這個難題。如何將“高大上”的AI技術(shù)穩(wěn)步推向落地?如何看待AI與細(xì)分行業(yè)的深度融合?如何看待大模型的研究熱?T前線有幸邀請到了作業(yè)幫智能技術(shù)實(shí)驗(yàn)室首席架構(gòu)師王巖先生為我們提供他對這些問題的見解。

嘉賓 | 王巖

作者 | 云昭

欄目介紹:“T前線”是51CTO內(nèi)容中心專為技術(shù)人物開設(shè)的深度訪談欄目之一,通過邀請技術(shù)界內(nèi)的業(yè)務(wù)負(fù)責(zé)人、資深架構(gòu)師、資深技術(shù)專家等對當(dāng)下的技術(shù)熱點(diǎn)、技術(shù)實(shí)踐和技術(shù)趨勢進(jìn)行深度的解讀和洞察,推動前沿科技的傳播與發(fā)展。?

人工智能被稱為第四次工業(yè)革命,被社會各界寄予了無窮大的期望。它在改善人們生活的同時,提高了整個社會的運(yùn)行效率。近年以來的大模型、多模態(tài)也再一次助推了相關(guān)研究的火熱。

?而在聚光燈下,可能大家更多看到的是,業(yè)內(nèi)正在將AI推向極致的一面,卻往往忽略了它“水利萬物”的另外一面。

技術(shù)的發(fā)展離不開實(shí)際的場景,AI研究熱潮的多次起伏,始終伴隨著應(yīng)用落地這個難題。如何將“高大上”的技術(shù)穩(wěn)步推向落地?如何看待AI與細(xì)分行業(yè)的深度融合?如何看待大模型的研究熱?

懷揣著這些問題,“T前線”采訪了深耕教育場景的科技公司:作業(yè)幫。作為一家致力于用科技手段助力教育普惠的企業(yè),運(yùn)用人工智能、大數(shù)據(jù)等前沿技術(shù),不論面向數(shù)億規(guī)模的C端用戶,還是成千上萬的B端客戶,都提供了一系列高效的學(xué)習(xí)和教育解決方案與產(chǎn)品。

尤其在教育領(lǐng)域,AI技術(shù)的探索和落地,不管是用戶規(guī)模和技術(shù)選型,作業(yè)幫都具有很好的代表性。這也為我們思考如何用人工智能推動行業(yè)變革,給出了重要的借鑒與參考。T前線有幸邀請到了作業(yè)幫智能技術(shù)實(shí)驗(yàn)室首席架構(gòu)師王巖先生為我們提供他對這些問題的見解。

教育產(chǎn)品的基座:題庫建設(shè)三板斧

提起作業(yè)幫,大家可能印象深刻的還是強(qiáng)大的題庫功能。作業(yè)幫是全國最早建立題庫的教育科技公司之一,到目前已經(jīng)擁有5.4億+的題庫體量。如此龐大的題庫是如何建設(shè)起來的?據(jù)王巖介紹,題庫建設(shè)的成功,得益于三個方面的條件。

首先,源于作業(yè)幫的先天優(yōu)勢:眾所周知,作業(yè)幫最開始是百度內(nèi)部孵化的業(yè)務(wù),最初定位于一個問答互助社區(qū),后來推出搜索答疑業(yè)務(wù)。為了優(yōu)化搜索答疑結(jié)果,作業(yè)幫通過組建全職教研和兼職老師團(tuán)隊(duì),搭建起了線上最大的題庫生產(chǎn)平臺。這也是源于百度知道的模式,在崇尚分享交流的社區(qū)氛圍中,鼓勵用戶相互解決問題,也非常貼近網(wǎng)友實(shí)際的問答和交流場景。而不是當(dāng)時別家的做法:讓兼職大學(xué)生做題庫。這樣通過對用戶產(chǎn)出的內(nèi)容進(jìn)行深入的分析挖掘,我們就逐漸清楚了在學(xué)習(xí)的場景中,用戶到底最關(guān)注哪些問題,哪些是問題更難的、哪些問題是多數(shù)人都會遇到的。這是一個重要的前提,它明確了我們的建設(shè)方向。

第二,作業(yè)幫非常重視資源的價值與建設(shè),對題庫足夠重視。題庫不僅在用戶交流中作用巨大,在答疑和教學(xué)中也是非常重要的一環(huán)。憑借眾包的體系,將題庫的建設(shè)拆分成難度較小的獨(dú)立工藝環(huán)節(jié),使得題庫較好較快,也相對比較全面的建立起來,這樣很好地保證了題庫建設(shè)的規(guī)模性。

第三,光有一道道題目還不夠,還需要將題目關(guān)聯(lián)起來,比如:所考察的知識點(diǎn)、難易度以及所依賴的其他知識點(diǎn)等標(biāo)簽術(shù)語關(guān)聯(lián)起來。這就涉及標(biāo)簽的加工,并與知識圖譜、知識樹等技術(shù)基礎(chǔ)設(shè)施關(guān)聯(lián)起來。這樣才能讓題庫具備可被高效檢索和篩選的能力,讓題庫的價值得以真正發(fā)揮出來。當(dāng)然,題庫本身建設(shè)過程中有很多環(huán)節(jié)一開始都使用人工操作,后來不斷引入了AI技術(shù),比如題目拍照等大多數(shù)電子化錄入步驟,AI將這些圖像自動識別變成計(jì)算機(jī)可理解的格式化的數(shù)據(jù)和語言。通過自動打標(biāo)簽、格式化公式、AI糾錯技術(shù)等AI能力來進(jìn)行自動化輔助處理,準(zhǔn)確率大幅提升,也大大降低了人工成本。得益于題庫的建設(shè)以及對AI技術(shù)的不斷深入和擴(kuò)大,作業(yè)幫通過落地一系列AI加速技術(shù),把搜索答疑的響應(yīng)時間優(yōu)化到1秒,而早期同類產(chǎn)品的響應(yīng)時間都在8秒左右。

在對接公立學(xué)校的項(xiàng)目中,題庫在輔助教學(xué)場景中發(fā)揮了很大的作用。一個亮點(diǎn)的場景就是具備個性化精準(zhǔn)推題能力的高質(zhì)量作業(yè)系統(tǒng)。該系統(tǒng)的本質(zhì)是將基于不同的學(xué)生狀態(tài),比如做題時長,不同知識點(diǎn)掌握程度進(jìn)行數(shù)據(jù)分析進(jìn)行個性化推題。因?yàn)閷W(xué)生而言,太容易和太難都會讓題目失去價值。同樣一道題目對于不同的學(xué)生而言價值就會不同。所以需要對學(xué)生有充分的了解,結(jié)合題庫本身豐富的標(biāo)簽維度,精準(zhǔn)匹配,題庫在高質(zhì)量作業(yè)產(chǎn)品設(shè)計(jì)中的輔助作用很大,有利于學(xué)生鞏固真正需要鞏固的知識。

自動輔助批改:機(jī)器如何解圖形題

作業(yè)場景方面,除了題庫,比較重要的就是自動輔助批改技術(shù)。相較于客觀題,主觀題的批改就難度很大。以數(shù)學(xué)的解答題為例,利用多年積累的OCR技術(shù)對學(xué)生的作答內(nèi)容進(jìn)行精準(zhǔn)的識別,在通過NLP技術(shù)進(jìn)行結(jié)構(gòu)化的分析,比如答題內(nèi)容的邏輯分析,再根據(jù)答題規(guī)范識別錯誤點(diǎn)等;此外,還運(yùn)用了知識圖譜的能力,不僅指出學(xué)生哪里錯了,還可以告訴學(xué)生為什么會錯,再配合用戶畫像和推薦算法的能力生成學(xué)生專屬的學(xué)習(xí)報(bào)告,幫助學(xué)生找出學(xué)習(xí)過程中的薄弱點(diǎn)。同時,依賴于作業(yè)幫云原生、多云容災(zāi)的一套體系,為這套服務(wù)體系提供了高穩(wěn)定性和高可靠性。因此這也就保證了即便很多學(xué)校同時用,也不會產(chǎn)生宕機(jī)的情況,保證了用戶的穩(wěn)定使用。

據(jù)王巖介紹,出于作業(yè)幫多年的大規(guī)模用戶體量的積累,他們會定期對作業(yè)系統(tǒng)進(jìn)行性能評測,評測結(jié)果也處于行業(yè)領(lǐng)先的地位,相較于市面上同類的產(chǎn)品,目前作業(yè)幫也支持更多的題型,準(zhǔn)確率也更高。

1、步驟級自動輔助批改

知識的學(xué)習(xí)存在一個閉環(huán):老師通過教學(xué)傳授知識,學(xué)生通過做練習(xí)題檢驗(yàn)自己哪些知識點(diǎn)是學(xué)會的,哪些是不會的,不會的知識又需要不斷的學(xué)習(xí)與練習(xí)。在這個“講題→做題→判題→講題”的教學(xué)閉環(huán)中,老師反復(fù)批改大量的作業(yè)成為了一大痛點(diǎn),老師過去很難精準(zhǔn)地去輔導(dǎo)每個學(xué)生。用AI來輔助批改,可以幫教師有效降低批改負(fù)擔(dān),大幅減少不必要的時間和精力,同時讓更多的學(xué)生有效提高成績。

目前,作業(yè)產(chǎn)品系統(tǒng)有著很高的使用率,教師們幾乎每天都在使用。而且,這套系統(tǒng)還可以融合老師的教學(xué)經(jīng)驗(yàn)和風(fēng)格,根據(jù)老師的不同需求做定制化。目前,主觀題、應(yīng)用題可以做到基于步驟級的批改。后期的改進(jìn),還是以繼續(xù)降低教師在批改作業(yè)中的人工占比為主要方向。

2、圖形題的解答內(nèi)有乾坤

相較于文字題而言,一般通過OCR、文字檢索等就能在題庫中識別和匹配出正確題目。然而,對于某一類題目比較特殊,那就是圖形題。比如試卷上經(jīng)常會有這樣的題目:求下列圖形的陰影面積,這時候需要提取的特征就不只是文字了,還需要提取圖片的特征。因?yàn)閮H通過文字檢索,題庫背后的檢索系統(tǒng)可以搜到類似的題干,但得到的結(jié)果中每道題目的形狀都不一樣。這時候我們就需要對圖像進(jìn)行向量化特征提取。數(shù)字化的向量表達(dá),與大量題庫的特征聚合起來,就形成了“文字+圖像”的特征。尤其小學(xué)題目中的經(jīng)常有許多圖像文字混合的題目,不光需要理解題干文字,還需要理解框與框之間的結(jié)構(gòu)化關(guān)系,包括“連線題”提取線條的特征的起始位置,提取軌跡來進(jìn)行判定。畫圖題也是這樣。

3、試卷還原:黑科技往往植根于現(xiàn)實(shí)

在輔助教學(xué)場景下,作業(yè)幫也積累了很多OCR、語音、圖像識別、作業(yè)批改方面的技術(shù)專利。比如我們已經(jīng)公開的人工智能高效矯正扭曲圖像專利,這是一個在非常剛需的場景里研究出來的。眾所周知,“錯題重做”是教學(xué)場景下很重要的環(huán)節(jié),學(xué)生家長與教師需要將試卷還原成未答題的狀態(tài),但給試卷拍照后,經(jīng)常會出現(xiàn)字跡不平整,試卷題目扭曲的情況,所以需要技術(shù)來解決排版矯正的問題。

我們通過采用深度神經(jīng)網(wǎng)絡(luò),將人的手寫筆跡進(jìn)行識別并與試卷字體區(qū)分開,結(jié)合圖像增強(qiáng)的技術(shù)等,可以非常有效的還原試卷,目前這項(xiàng)技術(shù)已經(jīng)在作業(yè)幫的App里上線,并且已應(yīng)用到打印機(jī)產(chǎn)品,可以將紙質(zhì)的試卷還原到初始的狀態(tài),從拍照到還原僅需幾秒鐘。放到以前的做法,一般是需要學(xué)生把題目手動抄一篇,再重新做。這可以說是一種功能強(qiáng)大的“黑科技”了。當(dāng)然,這項(xiàng)技術(shù)不僅用于還原試卷,還可以用于網(wǎng)課提交作業(yè)之前,對拍照的作業(yè)進(jìn)行矯正和美化,以還原成更好的排版狀態(tài),一方面利于保存,另一方面也是可以提高內(nèi)容的識別精度。

4、知識圖譜:專家知識的聚集地

知識圖譜的建設(shè)離不開人類的經(jīng)驗(yàn)體系,教育場景也是如此。我們的知識圖譜能力更多的是在課程場景中積累起來的。大量的教研老師在教研過程中總結(jié)知識點(diǎn)的前后關(guān)系、依賴關(guān)系和學(xué)習(xí)路徑。這些關(guān)系和路徑可以將零散的知識點(diǎn)聯(lián)結(jié)成網(wǎng)狀,這樣就有了知識圖譜的雛形。教研老師提供了豐富的專家經(jīng)驗(yàn)和知識點(diǎn)體系,研發(fā)部門在這個過程中采用一系列自動化的AI機(jī)器學(xué)習(xí)能力來進(jìn)行大范圍的落地。有了圖譜以后,我們就可以做出下一步個性化作業(yè)設(shè)計(jì),比如推薦與能力相當(dāng)甚至有一定挑戰(zhàn)的題目,去學(xué)習(xí)更深層次的知識點(diǎn)。目前知識圖譜在作業(yè)幫的應(yīng)用場景十分廣泛:教學(xué)場景、作業(yè)批改、個性化學(xué)習(xí)、作業(yè)診斷、包括剛才介紹的題庫中有關(guān)題目的關(guān)聯(lián),本質(zhì)是讓題目有了更精準(zhǔn)的維度去做檢索和推薦。

從數(shù)字化到AI:尊重用戶原有習(xí)慣

在過去教學(xué)場景中,一方面紙質(zhì)的書、教師的板書、PPT等都沒有做到數(shù)字化,另一方面,學(xué)生的作答內(nèi)容,包括答題的正確與否、作業(yè)和考試成績等也需要做數(shù)字化。為什么要做數(shù)字化?因?yàn)槿绻麤]有把自然物理世界的內(nèi)容轉(zhuǎn)化成為計(jì)算機(jī)可以理解的數(shù)據(jù)信息,我們在計(jì)算機(jī)領(lǐng)域相關(guān)的先進(jìn)技術(shù)研究不僅無法落地,甚至僅僅是提高效率的技術(shù),比如檢索和推薦等,都會無用武之地。因此,不管說語音還是圖像,都是傳遞教學(xué)思想和知識的重要媒介與載體,這些都需要做深度的數(shù)字化。

近些年,隨著教育信息化的不斷推進(jìn),大部分的教室配備上了數(shù)字化大屏,日常上課所用的教學(xué)課件已經(jīng)完成了數(shù)字化,而我們現(xiàn)在做的就是要推進(jìn)作業(yè)場景完成數(shù)字化。但值得注意的是,現(xiàn)階段使用AI的能力,要尊重教師和學(xué)生的原來習(xí)慣,不宜輕易改變。比如原有的教學(xué)模式,大家都習(xí)慣了紙質(zhì)試卷,如果你取消紙質(zhì)試卷,全都搬到線上,就會出現(xiàn)“水土不服”的嚴(yán)重問題。雖然要求網(wǎng)上答題也可以數(shù)字化,但這就改變了習(xí)慣。而一改變習(xí)慣,就很難大規(guī)模使用。

基于此,出于尊重教師批卷和學(xué)生作答的真實(shí)習(xí)慣,作業(yè)幫創(chuàng)新了業(yè)務(wù)思路:在作業(yè)系統(tǒng)中引進(jìn)了“原卷留痕”這個功能。所以,在王巖看來,我們更多需要的是進(jìn)行思路上的創(chuàng)新,去降低技術(shù)的使用門檻,以不改變習(xí)慣的情況下進(jìn)行數(shù)字化。

從作業(yè)場景放大到教育場景,就會發(fā)現(xiàn)很多新場景下的新的需求。比如體育場景:體育老師在上課期間非常注重每位學(xué)生可以承受的運(yùn)動強(qiáng)度,比如心率的監(jiān)控。當(dāng)學(xué)生運(yùn)動時心率過高了,就應(yīng)該提醒學(xué)生停下來休息。再比如“跳繩計(jì)數(shù)”,我們不用計(jì)數(shù)器,而是讓攝像頭去自動識別和計(jì)數(shù)會更加便捷。另外,肢體動作類的捕捉也是一個實(shí)用的技術(shù),來幫助學(xué)生查看動作是否標(biāo)準(zhǔn)和規(guī)范,這些AI都可以做輔助糾正。

1、如何為AI尋找落地機(jī)會

作業(yè)幫是一家技術(shù)驅(qū)動的公司。開發(fā)團(tuán)隊(duì)經(jīng)常會問這樣的問題:還有哪些技術(shù)可以有用武之地?有沒有好的技術(shù)可以讓過去沒有滿足很好的需求現(xiàn)在可以滿足、原來不可完成的現(xiàn)在可以完成?基于此,如何為AI尋找落地機(jī)會,王巖總結(jié)了背后的邏輯:我們應(yīng)清楚自己掌握了哪些技術(shù),擁有哪些資源,然后再考慮如何把合適的技術(shù)應(yīng)用到具體場景上?;谝延械募夹g(shù)資源,做場景匹配。下一步就是思考和權(quán)衡技術(shù)能做到什么程度,然后再去做試點(diǎn)和優(yōu)化。

2、B端精準(zhǔn)度要求更苛刻

作業(yè)場景下,相較于C端場景, B端客戶的需求比較特殊,有定制化的要求。比如學(xué)校在準(zhǔn)確率方面的要求會更高,像批改的環(huán)節(jié),更不能出錯。而C端產(chǎn)品更多的是突出功能的豐富度、使用體驗(yàn),對精準(zhǔn)度的預(yù)期并沒有那么極致。

關(guān)于AI行業(yè)的看法

1、基礎(chǔ)研究是底座,前沿技術(shù)更香

基礎(chǔ)研究是我們的技術(shù)底座,這些技術(shù)已經(jīng)有相當(dāng)?shù)膹V泛的應(yīng)用場景,對基礎(chǔ)技術(shù)的優(yōu)化,會帶來相當(dāng)大規(guī)模的應(yīng)用性能的提升,所以對基礎(chǔ)研究的投入,是必不可少的。而前沿技術(shù)的研究,帶來的則可能是玩法的變化,隨著技術(shù)不斷發(fā)展創(chuàng)新,原來不能做的也許突然某一天就可以實(shí)現(xiàn)了,鼓勵實(shí)驗(yàn)室的同學(xué)分配20%到30%的精力去關(guān)注和跟進(jìn)。對于候選人能力方面,希望具備一定的學(xué)術(shù)研究能力的同時,也會看重工程化能力。更強(qiáng)的工程化能力就意味著更強(qiáng)的落地能力,而要真正把AI技術(shù)推動落地,就需要不斷在應(yīng)用層面上做扎實(shí)。當(dāng)然,理想情況下希望人才具備全棧的能力,可以獨(dú)立完成實(shí)驗(yàn)設(shè)計(jì)和應(yīng)用落地,去快速驗(yàn)證某些創(chuàng)新點(diǎn)在實(shí)際應(yīng)用中帶來的提升效果。

2、模型不能單純追求大,惠及也要廣

教育領(lǐng)域與通用行業(yè)的實(shí)踐和發(fā)展經(jīng)驗(yàn),跟通用的技術(shù)還是有一定區(qū)別的。AI現(xiàn)在已經(jīng)應(yīng)用到各行各業(yè)中,但細(xì)分到教育場景,基于通用場景的模型多數(shù)不能“普惠”到具體的場景。王巖為我們舉了一個形象的例子,比如手寫輸入法中的手寫字識別,算法模型有一個假定前提:成年人書寫的字跡。但作業(yè)場景中,不同年齡段的學(xué)生寫的字是不一樣,工整度,整潔度沒有那么大的要求 。所以對于教育領(lǐng)域來說,AI需要基于具體的場景進(jìn)行細(xì)化,需要下沉到具體場景里去沉淀,去解決掉通用領(lǐng)域不太好的地方,探索并發(fā)現(xiàn)新的業(yè)務(wù)需求,在解決實(shí)際問題的過程中去推動相關(guān)技術(shù)的發(fā)展。

被廣泛使用的,必是大眾可承擔(dān)的。“大模型取得了公認(rèn)的性能提升,但距離用戶的廣泛使用還是有很遠(yuǎn)的距離。”在王巖看來,大模型、多模態(tài)的研究確實(shí)可以帶來的精度上提升,但往往一個任務(wù)的準(zhǔn)確率的提升,比如從95提升到96,這一個點(diǎn)提升的背后是以巨大的算力犧牲為代價的?,F(xiàn)在千億、萬億級別參數(shù)規(guī)模的大模型,都需要非常龐大的集群去支撐和運(yùn)行,這對于實(shí)際場景,如果沒有龐大算力集群去使用,原本一秒內(nèi)就可以跑出結(jié)果的大模型,可能就需要相當(dāng)漫長的運(yùn)行時間。雖然集群硬件的性能在不斷提升,對應(yīng)的單位算力成本在不斷降低,但能被廣泛應(yīng)用的技術(shù)一定是成本低廉的、可負(fù)擔(dān)的。把精力全放在算力的追求上某種程度上看,有些舍本逐末。AI的廣泛落地,更在于思路上的創(chuàng)新,在于追求技術(shù)本身的性價比。

如何將技術(shù)惠及到成千上萬的用戶,如何將噱頭一樣的功能在實(shí)際生活中廣泛使用到,是一個關(guān)鍵的問題。我們目前用戶量非常龐大,每秒鐘都有非常多的用戶在使用,所以如果用“堆算力”的方式去做,成本將是難以想象的。目前在可負(fù)擔(dān)的情況下 ,我們要做的是為用戶提供盡可能豐富的功能和服務(wù)。一方面,我們思考如何將算力的利用率提高,讓設(shè)備不閑著,另一方面,我們?nèi)ヌ剿魅绾卧谀P秃凸こ碳軜?gòu)做改進(jìn)和優(yōu)化,用最合理的成本去提供每秒數(shù)萬次級別的大型AI服務(wù)。更重要的是,如何進(jìn)行思路創(chuàng)新。只有從解決問題的思路上進(jìn)行創(chuàng)新,讓更多的人用戶去切實(shí)觸摸和感受技術(shù)帶來的便利,才能釋放出更大的價值。

嘉賓介紹

王巖,作業(yè)幫首席架構(gòu)師,作業(yè)幫智能技術(shù)實(shí)驗(yàn)室負(fù)責(zé)人。曾任百度知道、百度百科技術(shù)負(fù)責(zé)人,目前擔(dān)任作業(yè)幫智能技術(shù)實(shí)驗(yàn)室負(fù)責(zé)人,專注于人工智能、圖像技術(shù)、大規(guī)模高并發(fā)在線架構(gòu)等技術(shù)領(lǐng)域的相關(guān)研究及落地應(yīng)用,主要負(fù)責(zé)作業(yè)幫搜索答疑、AI批改、題庫等相關(guān)業(yè)務(wù)。

責(zé)任編輯:薛彥澤 來源: 51CTO
相關(guān)推薦

2016-08-29 11:33:23

京東云云計(jì)算云安全

2017-08-28 15:24:36

AIWIFI網(wǎng)絡(luò)

2024-05-15 23:53:27

火山引擎豆包大模型火山方舟

2011-12-23 15:56:02

2022-03-23 18:26:17

AI裁判編譯器端側(cè)AI

2018-11-20 16:57:19

華為云

2020-09-06 20:20:26

百度黃埔學(xué)院

2018-08-28 18:12:58

華為云

2010-04-24 22:15:21

Python豆瓣洪強(qiáng)寧

2009-12-18 10:22:50

Ray Ozzie架構(gòu)師

2023-04-27 09:04:02

亞馬遜云科技

2012-03-21 17:30:21

百度架構(gòu)師

2020-01-13 19:53:09

AI

2012-04-25 14:33:52

HTML5UniSDP混合應(yīng)用

2020-10-15 15:42:12

天翼云普惠AI

2021-10-15 18:09:24

人工智能AI架構(gòu)百度飛槳
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號