國內(nèi)大模型代理商的騷操作 原創(chuàng)
?“ 世界就是一個巨大的草臺班子,而很多看起來高大上的場景,背后就是一個low的不能再low的處理方式 ”
對大模型有過了解的人應(yīng)該都知道,整體來說國外的大模型要比國內(nèi)的強;但由于封禁的原因?qū)е聡鴥?nèi)無法直接使用國外的大模型,因此對一些做大模型應(yīng)用的人和企業(yè)來說,要想使用國外的大模型只有一個辦法,那就是找一些中間商,通過他們的轉(zhuǎn)發(fā)服務(wù)來調(diào)用國外大模型。
如果是那種正常的國外大模型服務(wù)商還比較好對接,但其中有這么一種服務(wù)商,那就是他們自己是做大模型產(chǎn)品的,自己做產(chǎn)品,自己做模型;因此這類的服務(wù)商有一個問題就是由于他們是完全封閉式的產(chǎn)品,因此他們不會對外提供API接口,但由于他們產(chǎn)品做的還不錯,因此有些人就想使用他們的服務(wù)。但前面說了,他們又不對外提供API接口,這個該怎么辦?
中間商是怎么調(diào)用國外大模型的
可能這里有人已經(jīng)有疑問了,既然他們不提供API接口,哪些中間服務(wù)商為什么可以提供這種服務(wù)?
想到這里,你就已經(jīng)發(fā)現(xiàn)了問題的所在;俗話說,有需求就有市場,為了解決這個問題有一些中間商就想到了一些“鬼點子”也就是騷操作。
那他們是怎么做的呢?
既然你們不提供API,但你們提供產(chǎn)品??;所以,這些中間商就通過模仿正常用戶的操作,比如登陸那些模型服務(wù)商的系統(tǒng),然后模擬用戶設(shè)置條件,模擬點擊,最后把獲取的結(jié)果返回給調(diào)用方。
說到這里有些人應(yīng)該就已經(jīng)明白了,這就是典型的爬蟲技術(shù),只不過使用的是比較簡單的,也是最麻煩的無頭瀏覽器+自動化爬蟲工具去模擬用戶的操作。
說到這里可能有些對爬蟲不了解的人還是一臉懵逼;所以這里就簡單解釋一下。
比如說我們想使用chatGPT的功能,但我們又不想花錢,這時該怎么辦呢?
既然你chatGPT的接口都要收費,但是他們的網(wǎng)頁版功能部分是免費的;因此,我就可以通過使用瀏覽器進行操作,比如打開chatGPT的官網(wǎng)地址,點擊創(chuàng)建會話,輸入提示詞,獲取結(jié)果等等一系列流程。
這種方式完全就是普通用戶的正常操作行為,因此chatGPT也不會對這種操作進行監(jiān)管。
但是人的時間和精力都是有限的,總不能中間商在自己的系統(tǒng)中接收調(diào)用方的提示詞,然后人工輸入到chatGPT的聊天框中,這是不可能的,而且也忙不過來。
因此,這時自動化爬蟲工具的作用就體現(xiàn)出來了,這種工具可以通過設(shè)置參數(shù)來模擬用戶的行為。
技術(shù)原理就是,瀏覽器的背后是一段html和js, css代碼,不論是輸入框還是提交按鈕等都有其節(jié)點id;因此自動化爬蟲工具就可以通過解析網(wǎng)頁代碼,去獲取這些重要的節(jié)點數(shù)據(jù),然后再模擬鼠標(biāo)和鍵盤的操作,使得其像一個正常人進行操作。
而且,由于是程序自動執(zhí)行,也就解決了人工處理的速度和效率問題。因此正常情況下,類似于這種網(wǎng)頁不會有大的變動,比如不可能今天輸入框在這里,明天在哪里。
這樣,等這些大模型服務(wù)商的服務(wù)進行響應(yīng)時,中間商再通過節(jié)點獲取到響應(yīng)結(jié)果返回給調(diào)用方。
這也是網(wǎng)頁爬蟲比較主流的操作方式之一,這種方式相對比較簡單,因為不需要對接口進行逆向破解等操作。只需要模擬正常的用戶操作就可以了。
而為了加快速度,因為這些自動化工具不會配合正常的瀏覽器進行使用,因為這種方式太麻煩,而且資源占用率高,效率低;因此,他們會使用另一種無頭瀏覽器進行操作,所謂的無頭瀏覽器就是沒有頁面的瀏覽器,用戶看不到操作過程,但它又確實可以像瀏覽器一樣去訪問網(wǎng)站。
這也是為什么這些中間商的服務(wù)特別不穩(wěn)定的原因,因為哪些模型服務(wù)商他們也會采取一些反爬措施,比如中間商不能進行高頻訪問,比如一個人不可能再一秒中操作幾十個任務(wù),但自動化工具卻可以。
其次,中間商使用的賬號也需要經(jīng)常更換,畢竟正常用戶也不可能一天二十四小時,每天大半夜的還在操作。
當(dāng)然,除了爬蟲之外還有一些類似于RPA(機器人流程自動化)的系統(tǒng)來模擬這些流程化的操作;但本質(zhì)上都是通過爬蟲技術(shù)來實現(xiàn)這種方式。
所以說,世界是個草臺班子,我們以為的高大上的東西,事實上背后是一些想象不到的騷操作。
?
本文轉(zhuǎn)載自公眾號AI探索時代 作者:DFires
