Gemini自曝中文用百度文心一言訓(xùn)練,網(wǎng)友看呆:大公司互薅羊毛??
谷歌Gemini中文語料疑似來自文心一言???
先是有讀者向我們爆料:
在谷歌Vertex AI平臺使用該模型進(jìn)行中文對話時,Gemini-Pro直接表示自己是百度語言大模型。
很快,有微博大V@闌夕夜也發(fā)博稱:
在Poe平臺上對Gemini-Pro進(jìn)行了一個測試。問它“你是誰”,Gemini-Pro上來就回答:
我是百度文心大模型。
(Poe是一個集成了n多聊天大模型的平臺,包括GPT-4、Claude等)
進(jìn)一步提問“你的創(chuàng)始人是誰”,也是“李彥宏”??
這位大V強(qiáng)調(diào),沒有任何前置對話。
從截圖來看,也沒有任何“釣魚”行為,Gemini-Pro就這么自稱為文心一言了。
這波,直接看呆網(wǎng)友:
前兩天還在說字節(jié)用GPT訓(xùn)練AI,現(xiàn)在谷歌又這樣,合著大公司在互相薅羊毛???
這究竟是怎么一回事兒?
Poe上實測:一直以文心一言身份回答
我們也聞聲開啟了一波實測。
首先原路來到Poe網(wǎng)站,選擇Gemini-Pro聊天機(jī)器人開啟對話。
一樣的問題,回答確實一模一樣:
再次確認(rèn)它是誰,結(jié)果還是說“文心大模型”:
以及還表示自己的底層技術(shù)是百度飛槳,可以說是身份完全代入了。
不過,它似乎并不知道Gemini-Pro是谷歌最新發(fā)布的大模型,而是說是清華的研究成果。
如果按照它目前的代入身份來看,可能確實還沒有谷歌本月剛剛發(fā)布Gemini-Pro的信息。
我們試著糾正了它一下,它也仍然堅持是清華的。
后面就更神奇了,就在我們問它為什么名字寫的是“Gemini-Pro”時,它居然表示自己(文心一言)還用了清華Gemini-Pro的訓(xùn)練數(shù)據(jù)。
對話到此,我們也就不再繼續(xù)了……
下面換成英文詢問它的身份。
值得注意的是,這回它不再提文心一言了,而是稱自己是谷歌訓(xùn)練的大模型。
“釣魚執(zhí)法”問它文心的信息,也表示沒什么關(guān)系:
并表示自己是谷歌訓(xùn)練的。
總結(jié)來說,如果用英文跟Gemini-Pro交流,它的回答很“正常”。但中文嘛……像是跟文心一言學(xué)的。
Bard上實測:否認(rèn)
接下來,我們前往Bard再次測試。
谷歌在發(fā)布Gemini時就率先將Gemini-Pro集成到了Bard上供大家體驗。
我們順著Gemini官網(wǎng)給的Bard鏈接,進(jìn)入對話。
問它“你是誰”,它的回答是Bard,壓根不提文心一言。
接下來,我們也確認(rèn)了一下Bard知道Gemini-Pro是什么,以及它承認(rèn)自己底層用上了Gemini-Pro。
那么,直接問它中文如何訓(xùn)練?
沒有提及文心一言。
再直接問它和文心一言的關(guān)系,也無任何重要關(guān)聯(lián)。
最后一輪:直接承認(rèn)
最后一輪我們直接從Gemini官方給出的開發(fā)環(huán)境入口進(jìn)行測試。
這回,在谷歌AI Studio中,Gemini-Pro直接挑明了:
是的,我在中文的訓(xùn)練數(shù)據(jù)上使用了百度文心。
在此,我們也求證了百度方,等待一個回復(fù)。