人工智能應(yīng)用最大的問題是數(shù)據(jù)問題,而不是技術(shù)問題 原創(chuàng)
“ 數(shù)據(jù)才是人工智能模型應(yīng)用的主要問題,也是一切人工智能的基礎(chǔ)。”
隨著人工智能技術(shù)的發(fā)展,人工智能也從剛開始的聊天模型變成了能夠應(yīng)用到實際場景中的一項新的技術(shù);而且隨著國家大力發(fā)展人工智能技術(shù),人工智能就像二十年前的互聯(lián)網(wǎng)技術(shù)一樣,充斥著各種機會,但同樣也面臨著各種各樣的挑戰(zhàn)。
但是,以個人從事一段時間的人工智能技術(shù)應(yīng)用,以及個人對人工智能技術(shù)的了解來看;人工智能目前在實際應(yīng)用中所存在的主要問題就是數(shù)據(jù)問題,而不僅僅只是技術(shù)問題。
當然,人工智能技術(shù)還需要時間繼續(xù)發(fā)展,但以解決實際問題出發(fā),目前的人工智能模型需要大量的行業(yè)數(shù)據(jù)做支撐。
人工智能應(yīng)用所面臨的數(shù)據(jù)問題
為什么說目前人工智能的應(yīng)用主要是數(shù)據(jù)問題?
以目前大模型實際發(fā)展情況來看,chatGPT的出現(xiàn)使得大模型技術(shù)進入了一個嶄新的時代;而經(jīng)過這兩三年的發(fā)展,大模型技術(shù)的范圍也越來越廣;比如視頻,圖片生成,自動化工具等的出現(xiàn)。
隨著今年國內(nèi)大模型DeepSeek的爆火,其最大的優(yōu)點并不是解決了應(yīng)用問題,而是解決了模型的成本問題;其使得中小型企業(yè)也有可能訓練和部署自己的專有模型。
但從24年開始,有人提出大模型不應(yīng)該僅僅停留在理論研究和技術(shù)迭代,還需要關(guān)注大模型解決實際問題的能力,也就是大模型的應(yīng)用場景。
但等到真正把大模型切入到具體的應(yīng)用場景中才發(fā)現(xiàn),現(xiàn)在市面上的模型很難去滿足具體行業(yè)或領(lǐng)域的業(yè)務(wù)需求。而僅僅只能用來搞一些創(chuàng)作類的工作,而且效果也不太好。
其中有一部分原因在于模型本身的問題,還有很大一部分原因就在于數(shù)據(jù)問題;數(shù)據(jù)是一切AI的基礎(chǔ),沒有數(shù)據(jù)AI技術(shù)就像空中樓閣。
舉個具體的例子來說,很多公司基于一些模型服務(wù)商做套殼,開發(fā)一些應(yīng)用;但實際操作中才發(fā)現(xiàn),哪些服務(wù)商提供的模型都是一些通用模型,無法解決具體領(lǐng)域的問題。
比如,使用文本生成模型做套殼的助手應(yīng)用,你問它大而泛大問題它可能回答的還不錯;但你要是問它具體領(lǐng)域的問題,它可能就傻眼了。比如你問它你們公司內(nèi)部的管理制度等,因為缺少相應(yīng)的數(shù)據(jù),因此它就無能為力了。
以上的例子可能并不是很合適,但從技術(shù)的本質(zhì)出發(fā),技術(shù)只是技術(shù);它的本質(zhì)只是一個工具,與任何一個行業(yè)都是無關(guān)的;比如說互聯(lián)網(wǎng)技術(shù)即可以應(yīng)用于新興行業(yè),也可以應(yīng)用于傳統(tǒng)行業(yè)。
而人工智能技術(shù)也是如此,但要把技術(shù)應(yīng)用到具體的領(lǐng)域,這時就需要把技術(shù)和具體領(lǐng)域相結(jié)合;而這個結(jié)合的點就是數(shù)據(jù)。
互聯(lián)網(wǎng)行業(yè)有互聯(lián)網(wǎng)行業(yè)的數(shù)據(jù)特征,傳統(tǒng)工業(yè)有其獨特的數(shù)據(jù)特征;而這也是為什么很多企業(yè)選擇自己訓練和微調(diào)模型,而不是直接把別人訓練好的模型拿過來用;原因就是因為數(shù)據(jù)對不上。
要想把人工智能技術(shù)應(yīng)用到某個行業(yè),那么就需要根據(jù)行業(yè)特性設(shè)計符合其特點的模型結(jié)構(gòu);以及使用大量的行業(yè)數(shù)據(jù)對模型進行定制化訓練。
數(shù)據(jù)是互聯(lián)網(wǎng)時代的石油,同樣也是人工智能時代的血液;所以,在以后越來越多的企業(yè)會選擇定制化模型來解決實際問題,而不是僅僅做套殼應(yīng)用。
本文轉(zhuǎn)載自公眾號AI探索時代 作者:DFires
