OpenAI發(fā)布GPT-4.5:功能非常特殊,推理很貴 精華
今天凌晨4點,OpenAI進行了在線技術直播,發(fā)布了最新模型GPT-4.5。
GPT-4.5與之前的模型相比,本次最大的亮點是加上了“情商”,這也是目前所有大模型最缺、最難的功能。
此外,GPT-4.5 在SimpleQA上的測試數據顯示,超過OpenAI o1、OpenAI o3-mini并且幻覺非常低,是目前OpenAI最強大模型之一。
OpenAI聯合創(chuàng)始人兼首席執(zhí)行官Sam Altman特意發(fā)文對GPT-4.5進行了詳細解讀。
對我來說,GPT-4.5是第一個讓我感覺像是在和一個有思想的人對話的模型。有好幾次,我都不禁靠在椅背上,驚訝于能從人工智能那里得到真正有用的建議。
壞消息:GPT-4.5是一個大型且成本高昂的模型。我們本真的很想同時向Plus和Pro用戶推出,但我們的業(yè)務增長迅猛,GPU 已經不夠用了。下周我們會增加數萬個 GPU,到時候就會向 Plus 用戶推出。(很快還會有數十萬個 GPU 到位,我敢肯定,大家會把我們能配備的每一個 GPU 都充分利用起來。)
我們也不想這樣,但要精準預測導致 GPU短缺的增長高峰實在太難了。
提前告知一下:這不是一個推理模型,也不會在基準測試中表現得特別突出。是一種不同類型的智能,有著我從未感受過的神奇之處。真的很期待大家去體驗!
看了Sam這段話估計大家心里都有一個共同想法吧,既然推理這么貴,需要那么多GPU,是時候讓DeepSeek再次出手量化一下了吧~
這不網友直接就替咱說出來了,你們一直嚴重依賴大量的 GPU,而中國人在沒有這么多 GPU 的情況下也取得了同樣的成果。為什么不像中國人那樣專注于效率呢?
作為一名交易員,我只是不希望當 Deepseek用十分之一的計算力推出比 GPT-4.5 更強大的產品時,交易市場再次陷入動蕩。
剛剛看了一下API價格,確實貴的離譜…
這聽起來像是一個在大量錄制的人類之間電話通話內容上進行訓練的模型。
增加服務之后,API價格會下降嗎?
真是令人激動的時代!一個真正讓人感覺像是在與有思想的人對話的模型,這是一個巨大的飛躍。GPU 短缺只是暫時的困難,重要的是你們創(chuàng)造出的神奇成果。期待能親自體驗 GPT-4.5!
GPT-4.5情商
在以往的大模型中,雖然能夠生成流暢的文本,但在處理情感相關的場景時,往往顯得生硬、機械,甚至有時會給出不恰當的回應。
GPT-4.5通過一系列技術創(chuàng)新和訓練方法為模型增加了“情商”功能,顯著提升了其在情感識別、同理心表達以及情感引導等方面的能力,使其在與人類互動時能夠展現出更加溫暖、細膩且富有同理心的特質。
GPT-4.5能夠通過用戶的文字輸入,敏銳地捕捉到其中的情感色彩,無論是喜悅、悲傷、憤怒還是焦慮。這種能力并非簡單地基于關鍵詞的匹配,而是通過深度學習和大量的對話數據訓練而來。
模型學會了從語句的整體語境中理解情感的細微差別,從而能夠更準確地判斷用戶的情緒狀態(tài)。例如,當用戶表達“我最近考試沒過,心情很糟糕”時,GPT-4.5不僅能夠識別出這句話中的負面情緒,還能進一步感知到用戶可能需要的不僅僅是解決問題的建議,更需要的是情感上的支持和安慰。
基于這種情感識別能力,GPT-4.5能夠以一種富有同理心的方式回應用戶。不會簡單地給出一些通用的、冷漠的建議,而是會用溫暖、關懷的語言來表達對用戶情感的理解和支持。例如,可能會說:“哎呀,聽到這個我很難過??荚嚊]過確實會讓人感到沮喪和失落,但這只是暫時的,并不能代表你的能力和價值?!?/p>
這樣的回應不僅能夠緩解用戶的情緒,還能讓用戶感受到被理解和關注。這種同理心的表達是GPT-4.5情商功能的核心體現,使得模型在與人類互動時更加自然、親切,仿佛是一個真正能夠傾聽和理解的朋友。
此外,GPT-4.5還具備情感引導的能力。不僅能夠回應用戶當前的情感狀態(tài),還能夠通過對話引導用戶走向更加積極的情緒狀態(tài)。
例如,在面對用戶的焦慮或壓力時,GPT-4.5可以提供一些緩解壓力的方法,或者通過鼓勵的話語幫助用戶重建信心??赡軙f:“雖然這次考試沒有達到預期,但你可以把當作一個學習的機會,相信自己下次一定能夠做得更好。”這種情感引導能力使得GPT-4.5不僅僅是一個被動的情感回應者,更是一個能夠幫助用戶調節(jié)情緒的真正人工智能。
GPT-4.5架構簡單介紹
GPT-4.5的核心架構建立在無監(jiān)督學習和推理能力的結合之上。無監(jiān)督學習是其基礎,通過海量未標注數據的訓練,模型能夠自主學習語言的結構和模式,從而提高其準確性和直覺能力。使得模型在處理復雜的語言任務時,能夠憑借其對語言的深刻理解來生成更加自然和準確的文本。
推理能力的引入為模型增加了“思考”推理鏈的能力,在回答問題之前進行邏輯分析和思考,這在處理需要復雜推理的任務時尤為重要,例如,科學問題、數學問題以及其他需要深度分析的復雜問題。
在預訓練完成后,GPT-4.5還使用了復雜的后訓練過程。采用了監(jiān)督微調和基于人類反饋的強化學習相結合的方法。監(jiān)督微調通過標注數據進一步優(yōu)化模型的性能,使其在特定任務上表現得更加精準。
這種方法使得模型能夠更好地適應不同的應用場景,提高其在實際任務中的表現。而基于人類反饋的強化學習則讓模型能夠更好地理解人類的需求和意圖。通過與人類的互動,模型不斷學習如何生成更符合人類期望的文本,從而使對話更加自然和富有情感。
在模型規(guī)模方面,GPT-4.5是OpenAI迄今為止最大的模型,其參數規(guī)模達到了前所未有的高度。為了訓練這樣一個龐大的模型,OpenAI開發(fā)了一系列創(chuàng)新的訓練機制。
其中,低精度訓練技術是關鍵之一,通過優(yōu)化計算資源,低精度訓練使得模型能夠在有限的硬件條件下進行高效的訓練。這種技術不僅提高了訓練效率,還降低了訓練成本,使得大規(guī)模模型的訓練成為可能。
OpenAI還首次嘗試了跨數據中心的分布式訓練。由于模型規(guī)模龐大,單個數據中心的計算資源無法滿足其訓練需求。因此,OpenAI利用多個數據中心同時進行預訓練,充分利用了大規(guī)模計算資源,顯著提升了模型的訓練效率。
目前,ChatGPT Pro用戶已經可以使用GPT-4.5模型,下周OpenAI將為Plus和Team用戶推出。
本文轉自 AIGC開放社區(qū) ,作者:AIGC開放社區(qū)
