緊密協(xié)作!Testin云測助力大模型廠商化解質(zhì)量難題,勇登下載榜首
隨著科技飛速發(fā)展,以大模型為代表的新一代人工智能技術(shù)正成為軟件領(lǐng)域智能化轉(zhuǎn)型的核心驅(qū)動力。2024 年《政府工作報告》首次提出 “人工智能 +” 戰(zhàn)略行動,旨在推動人工智能賦能千行百業(yè) 。大模型不僅為傳統(tǒng)軟件注入新智力,提升生產(chǎn)效率、改善軟件質(zhì)量、加速軟件創(chuàng)新迭代,還推動了軟件產(chǎn)品形態(tài)、軟件技術(shù)層面以及軟件與行業(yè)場景的深度變革。
在大模型行業(yè)蓬勃發(fā)展的浪潮下,APP 作為技術(shù)落地和用戶交互的關(guān)鍵載體,其質(zhì)量直接影響著用戶體驗和企業(yè)的市場競爭力。一款出現(xiàn)諸多軟件缺陷的 APP,可能會出現(xiàn)閃退、崩潰、兼容性差等問題,這不僅會導(dǎo)致用戶投訴,更會使企業(yè)上線時間延遲,錯失市場先機,損害企業(yè)的品牌形象和口碑。因此,APP 測試這個環(huán)節(jié),成為大模型技術(shù)能夠真正為用戶帶來優(yōu)質(zhì)服務(wù)和體驗的關(guān)鍵防線,亦是各大模型產(chǎn)品上市前的必經(jīng)流程。
近期,Testin云測與國內(nèi)某頭部大模型廠商達成合作,共同攻克了大模型APP研發(fā)期間的質(zhì)量保障問題。該企業(yè)是一家在 AI 大模型、人工智能基礎(chǔ)研究領(lǐng)域嶄露頭角的新銳企業(yè),其業(yè)務(wù)范圍廣泛,涵蓋工程和技術(shù)研究與試驗發(fā)展、技術(shù)服務(wù)、軟件開發(fā)、計算機系統(tǒng)服務(wù)、人工智能應(yīng)用軟件開發(fā)等多個領(lǐng)域。在軟件開發(fā)的進程中,該大模型廠商把大量的時間和精力都投入了產(chǎn)研方面,致力于打造先進的大模型產(chǎn)品。然而,在軟件測試領(lǐng)域,該廠商面臨著諸多挑戰(zhàn)。
由于缺乏專業(yè)的測試人員和充分的硬件機型設(shè)備, 短期內(nèi)實現(xiàn)APP兼容適配各大機型較為困難。這導(dǎo)致在產(chǎn)品上線前,該大模型APP缺陷難以被全面發(fā)現(xiàn)和修復(fù)。在測試過程中,該APP也頻繁出現(xiàn)各類問題:如在部分安卓和 iOS 設(shè)備上顯示異常、功能無法正常使用等,這些問題嚴重影響了產(chǎn)品的質(zhì)量和上線進度,質(zhì)量保障的不夠完備也對該產(chǎn)品上市造成了底層風險。該廠商作為一家對產(chǎn)品質(zhì)量極其重視的新興科技公司,十分關(guān)注軟件測試這一過程難題,并積極與國內(nèi)AI測試頭部服務(wù)商Testin云測接洽,協(xié)商合作。
Testin 云測基于超300萬款A(yù)PP測試項目經(jīng)驗,豐富的測試設(shè)備資源以及先進的測試技術(shù)和工具資源,經(jīng)過專業(yè)溝通與項目梳理,Testin云測為其規(guī)劃了匹配且專業(yè)的深度兼容測試服務(wù)。針對該大模型APP需要適配不同地區(qū)、不同系統(tǒng)設(shè)備的需求,Testin云測利用自身豐富的資源,提供了覆蓋國內(nèi)外主流終端版本的深度兼容測試服務(wù)。
在測試技術(shù)工具方面,Testin云測運用自主研發(fā)的 UI 自動化工具,該工具能夠模擬用戶在各種設(shè)備上的操作行為,高效地對該大模型APP 進行功能測試和兼容性測試。同時,通過自然語言處理技術(shù),測試過程可實現(xiàn)無碼化腳本編寫,大大降低了測試腳本編寫的難度和時間成本,使得測試人員能夠更專注于測試策略的制定和優(yōu)化。結(jié)合強化學習技術(shù),該大模型廠商能夠?qū)崟r根據(jù)測試結(jié)果調(diào)整測試策略,提高測試的覆蓋率和有效性。
2024 年 11 月,該大模型廠商在完成功能測試等前期工作后,正式與Testin云測對接兼容測試相關(guān)需求與痛點。短時間內(nèi),雙方迅速對接并組建了專項項目團隊,Testin云測調(diào)度了具備一線大模型測試經(jīng)驗的高級測試工程師、技術(shù)專家以及項目經(jīng)理參與其中,確保項目的順利進行。
在測試執(zhí)行過程中,一方面,由于該大模型APP涉及大量復(fù)雜的數(shù)據(jù)交互和處理的業(yè)務(wù)屬性,數(shù)據(jù)整合成為一大難題。不同模塊之間的數(shù)據(jù)格式、數(shù)據(jù)接口存在差異,給測試數(shù)據(jù)的準備和驗證增加了困難。另一方面,該大模型的部分團隊成員對Testin云測所采用的AI技術(shù)及模式,如無碼化腳本編寫、強化學習調(diào)整測試策略等,初期接受度較低,對新技術(shù)是否增加測試的風險和不確定性存在一定顧慮。
而針對數(shù)據(jù)整合難題,Testin云測團隊與該廠商開發(fā)團隊緊密合作,共同梳理數(shù)據(jù)流程和接口規(guī)范。通過開發(fā)專項數(shù)據(jù)轉(zhuǎn)換工具和腳本,實現(xiàn)了異格式數(shù)據(jù)的有效整合和驗證,確保了測試數(shù)據(jù)的準確性和完整性。為了推進大模型廠商內(nèi)部團隊對AI測試模式的進一步理解與認可,Testin云測協(xié)調(diào)了數(shù)次AI測試技術(shù)培訓和項目交流會議,詳細介紹AI測試技術(shù)的原理、優(yōu)勢以及實際應(yīng)用案例。通過現(xiàn)場演示和實際操作,該大模型廠商內(nèi)部成員親歷體驗AI測試帶來的高效和便捷。同時,Testin云測還提供了后備技術(shù)支持和保障措施,確保在項目實施過程中,隨時解決項目因耦合AI測試技術(shù)應(yīng)用可能出現(xiàn)的協(xié)調(diào)問題。
經(jīng)過雙方協(xié)作與努力,Testin云測高效完成并輸出了兼容性測試報告,初版報告顯示該大模型APP通過率較低,需盡快對產(chǎn)品進行進一步優(yōu)化。在后續(xù)的一個月里,該廠商開發(fā)團隊全力投入 Bug 優(yōu)化工作中,進一步優(yōu)化用戶體驗。2024年12 月中下旬,雙方再度合作,開展了一輪次深度兼容測試。經(jīng)過雙方的共同協(xié)作,產(chǎn)品順利通過測試,成功上線國內(nèi)和海外的應(yīng)用市場。然而,產(chǎn)品上線后還遇到了 APP Store 的清榜問題。該大模型廠商第一時間向Testin云測咨詢,Testin云測迅速組織對應(yīng)的專家團隊,深入分析問題的根源,經(jīng)過深入溝通并細致盤查,最終找到了問題的解決方案,幫助其迅速解決了上架被清榜問題
在與Testin云測緊密協(xié)作,攻克質(zhì)量大關(guān)后,該大模型廠商在市場上取得了顯著成果。行業(yè)成績方面,該大模型宣布開源發(fā)布引起了行業(yè)震動,各大平臺紛紛為其宣傳推廣,成為推動AI領(lǐng)域進步的重要力量。下載量方面,該大模型在國內(nèi)外雙端應(yīng)用市場 AI 大模型軟件下載量中位居榜首,迅速占領(lǐng)市場高地,產(chǎn)品功能與質(zhì)量贏得了用戶和各行業(yè)的廣泛認可。
隨著 AI 大模型行業(yè)的持續(xù)發(fā)展,未來,Testin云測將繼續(xù)與大模型廠商緊密合作,不斷優(yōu)化測試服務(wù)和技術(shù),助力其在激烈的市場競爭中持續(xù)創(chuàng)新和發(fā)展,共同推動 AI 大模型行業(yè)邁向新的高度。