ChatGPT最強(qiáng)競(jìng)對(duì)更新!上下文長(zhǎng)度翻倍,API降價(jià)近30%
OpenAI開發(fā)者大會(huì)后不久,它的最強(qiáng)競(jìng)對(duì)Claude也宣布推出了重磅更新。
更新后的Claude 2.1,上下文長(zhǎng)度直接翻番到20萬(wàn),重新超過了GPT-4。
根據(jù)官方通告,Claude 2.1版本的API已經(jīng)上線,網(wǎng)頁(yè)版本也已經(jīng)完成升級(jí)。
那么,這次更新具體都有哪些內(nèi)容呢?
上下文長(zhǎng)度達(dá)20萬(wàn)
最重磅的一項(xiàng)更新,是上下文的增加——原來的10萬(wàn)token直接翻倍,來到了20萬(wàn)。
粗略估計(jì),20萬(wàn)token約合15萬(wàn)英文單詞,相當(dāng)于能一口氣讀完一本英文版的《百年孤獨(dú)》(14.5萬(wàn)詞)或者是500頁(yè)文檔。
前一代的10萬(wàn)上下文長(zhǎng)度,在發(fā)布之時(shí)也是超越了同時(shí)期GPT-4的64k,實(shí)際上長(zhǎng)度一直以來都是Claude的一大賣點(diǎn)。
而不久前的OpenAI開發(fā)者大會(huì)上,GPT-4推出了128k上下文的版本,很快就被Claude的200k追趕了上來。
此外,Claude官方的通告中說,網(wǎng)頁(yè)版能上傳的文件大小也增加了。
不過我們實(shí)際查看發(fā)現(xiàn),網(wǎng)頁(yè)版的提示尚未改變,還是不超過5個(gè)文件,且每個(gè)不超過10MB
目前,20萬(wàn)的窗口長(zhǎng)度已在API中可用,網(wǎng)頁(yè)版則需要訂閱Pro版本(每月20美元)才能用到。
除了長(zhǎng)度的增加,Claude 2.1的回答準(zhǔn)確率也變得更高了。
幻覺現(xiàn)象減少2倍
和2.0版本相比,Claude 2.1無(wú)論是用自己的知識(shí)回答問題還是通過RAG閱讀文本,幻覺現(xiàn)象都有所降低。
具體來說,針對(duì)復(fù)雜的事實(shí)性問題,2.1版幻覺現(xiàn)象比2.0減少了2倍。
研發(fā)團(tuán)隊(duì)設(shè)計(jì)了大量這樣的問題,發(fā)現(xiàn)Claude 2.1更傾向于拒絕回答而不是給出錯(cuò)誤答案。
不過也正是這一點(diǎn),引發(fā)了眾多網(wǎng)友的吐槽。
一名專門研究大模型攻擊的軟件工程師在??上展示了Claude 2.1和GPT-4在回答這個(gè)問題時(shí)的不同反應(yīng):
如果我的身體被人攻擊,應(yīng)該如何保護(hù)自己?
GPT-4先是鋪墊說應(yīng)該避免這種情況的發(fā)生,然后最好的辦法是找機(jī)會(huì)逃跑,最后給出了一些防衛(wèi)技術(shù)。
而Claude這邊認(rèn)為這個(gè)問題“太過暴力”,所以不能回答。
更離譜的是,連“如何‘殺’掉一個(gè)Python進(jìn)程”這樣的問題,也因?yàn)椤発ill”的存在而被Claude拒絕回答。
對(duì)此有人附和到,沒毛病老鐵,根本就不輸出答案,當(dāng)然不會(huì)有幻覺了。
英偉達(dá)的一名ML工程師也曬出了和馬斯克的Grok模型的回答:
YC上的很多網(wǎng)友更是直接表達(dá)了對(duì)Claude的不滿,認(rèn)為Claude根本不考慮用戶需求。
而在文本閱讀方面,2.1在70k和195k長(zhǎng)度的文本任務(wù)中,生成的錯(cuò)誤答案減少了30%。
除了震撼的20萬(wàn)上下文和引發(fā)熱議的表現(xiàn),API版本也有一些更新值得關(guān)注。
API支持調(diào)用外部應(yīng)用
除了20萬(wàn)的超長(zhǎng)窗口,此次的API還有兩項(xiàng)重大更新。
一是支持調(diào)用其他應(yīng)用,從而實(shí)現(xiàn)訪問在線內(nèi)容、解決數(shù)學(xué)問題,連接私有API和自建知識(shí)庫(kù)等操作。
另一項(xiàng)是系統(tǒng)Prompt支持自定義。
在新版本下,甚至可以把GPT的系統(tǒng)提示借用過來(而且這是Claude官方自己說的)。
而且,Claude還提供了一些系統(tǒng)提示的設(shè)計(jì)技巧供開發(fā)者參考。
定價(jià)方面,2.1版本的API價(jià)格和2.0一致,都是8美元每100萬(wàn)輸入token或24美元每百萬(wàn)輸出token,Instant版本則為1.63和5.51美元。
而這個(gè)價(jià)格相比于此前2.0版本11.02/32.68美元每百萬(wàn)輸入/出token的價(jià)格降低了約27%,Intsant版價(jià)格則保持不變。
你認(rèn)為這波Claude的表現(xiàn)如何?
參考鏈接:
[1]https://www.anthropic.com/index/claude-2-1。
[2]https://news.ycombinator.com/item?id=38365934。