什么時候需要訓(xùn)練和微調(diào)屬于自己的大模型——小微企業(yè)必須要明白的問題 原創(chuàng)
“ 從問題出發(fā),先有需求再有解決方案 ”
老板和員工在思維方式上有一個很大的差別就是,作為老板他們喜歡尋找現(xiàn)有的解決方案,如果現(xiàn)有的解決方案無法滿足的情況下,才會自己設(shè)計一個解決方案。
而作為員工來說特別是技術(shù)人員,大都有一種技術(shù)至上的心態(tài),比如說很多技術(shù)人員找工作會特別在乎公司用的技術(shù)是否足夠牛逼,足夠高大上。
之所以產(chǎn)生這種現(xiàn)象的原因是因為,技術(shù)人員的心態(tài)是學(xué)會牛逼的技術(shù),走到哪里都不怕。
而老板的心態(tài)是,能解決問題把業(yè)務(wù)跑起來最重要,現(xiàn)有的解決方案或許不是最好的,但它卻是經(jīng)過驗證的,能夠保證業(yè)務(wù)的穩(wěn)定性;但如果提出新的解決方案,就要承擔(dān)新方案潛在的各種風(fēng)險。等以后業(yè)務(wù)穩(wěn)定之后,可以慢慢的優(yōu)化現(xiàn)有的方案。
什么時候需要訓(xùn)練和微調(diào)模型?
在上面的內(nèi)容中,描述了一下員工與老板思維以及心態(tài)上的區(qū)別;這兩種思維方式?jīng)]有絕對的對錯之分,區(qū)別只是兩種完全不同的發(fā)展方向,一種是打工人的思維方式,一種是創(chuàng)業(yè)者的思維方式。
就拿大模型訓(xùn)練與微調(diào)來說,很多技術(shù)人員都想親自參與或體驗一下一個模型從無到有的誕生過程;但受限于各種原因,有機會參與這樣工程的人還是比較少的;因此很多人都退而求其次,想做一下模型的訓(xùn)練與微調(diào)。
舉個例子,你是某個小公司的技術(shù)人員,老板想引入大模型技術(shù)來升級現(xiàn)有的業(yè)務(wù)系統(tǒng),然后讓你做一下前期調(diào)查和簡單的解決方案。
不管使用的是大模型的什么技術(shù),比如Agent,知識庫,AIGC等;很多技術(shù)人員下意識的方式就是先搞一個本地模型,試試能不能訓(xùn)練和微調(diào)一下,然后就陷入各種技術(shù)細節(jié)中無法自拔。
但事實上,市面上已經(jīng)有很多大模型服務(wù)商,他們有專門訓(xùn)練和微調(diào)過的模型;根據(jù)現(xiàn)有的業(yè)務(wù)體系,或許隨便找一個合適的模型就可以用了。
為什么不建議企業(yè)引入大模型技術(shù)時,就直接打造屬于自己的大模型?
原因就是,你還不知道怎么把大模型技術(shù)與自己的業(yè)務(wù)場景相結(jié)合;雖然市面上可能有一些相似的案例,但每個企業(yè)都有其獨特的運作方式,適合別人的不一定適合你。
簡單來說就是,你都不知道現(xiàn)有業(yè)務(wù)引入大模型能解決哪些問題,以及潛藏著哪些問題;說白了就是,你都不知道要訓(xùn)練和微調(diào)出一個需要解決什么問題的模型,這樣的模型怎么可能做的好呢?
就類似于你需求都不清楚,就直接開始開發(fā)產(chǎn)品了,這樣的產(chǎn)品能有人用嗎?
當然,如果說你覺得你是上帝之子,即使需求不明確也能做出符合業(yè)務(wù)場景的大模型;或者說你不差錢,訓(xùn)練一次不行就重新訓(xùn)練,那也可以。
因此,什么時候開始訓(xùn)練和微調(diào)模型?
最好的時機就是,在你的業(yè)務(wù)成型之后,有一些問題確實需要解決或者說需要節(jié)約成本;這時,你再去考慮訓(xùn)練和微調(diào)一個模型,甚至是找模型服務(wù)商幫你重新設(shè)計一個模型都可以。
一句話就是,在你的需求明確之后,也就是你知道要訓(xùn)練出一個什么樣的模型,并且你有足夠的技術(shù)和資金支持,那么你就可以訓(xùn)練和微調(diào)自己的模型了。
說到底還是那句話,技術(shù)是為業(yè)務(wù)服務(wù)的,技術(shù)的發(fā)展是基于業(yè)務(wù)場景的落地,而不是從技術(shù)去推動業(yè)務(wù)場景的發(fā)展,雖然技術(shù)的發(fā)展也有可能顛覆現(xiàn)有的業(yè)務(wù)場景,但那是技術(shù)與業(yè)務(wù)場景的深度融合的結(jié)果。
總之,不要一開始就想著訓(xùn)練和微調(diào)屬于自己的模型,要從問題出發(fā),而不是從結(jié)果出發(fā)。
本文轉(zhuǎn)載自公眾號AI探索時代 作者:DFires
原文鏈接:??https://mp.weixin.qq.com/s/Ag2thIY2-TCAX15rbugWyA??
