自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

上下文1.6萬token的編程大模型來了!與Stable Diffusion出自同門,一次吃5個Python文件不費勁

開發(fā) 架構(gòu)
我們非常喜歡BigCode,因為他們在數(shù)據(jù)治理、模型治理和模型訓練方面做了驚人的工作,我們用了他們的數(shù)據(jù)集,并對其進行了額外的過濾和清理,同時也用在了構(gòu)建長上下文窗口的模型,在我們的集群上進行了訓練。

一個Stable Diffusion還不夠!Stability AI再放殺手锏,進擊代碼生成領域:

推出了一款自稱具有革命性的編碼工具StableCode。

敲重點的是,StableCode不僅支持Python、Go、Java、JavaScript、C、Markdown、C++等多種編程語言。

還直接把上下文長度拉到16000個token。

圖片圖片

好家伙,網(wǎng)友直呼瘋批:

圖片圖片

這波還直接戳中網(wǎng)友痛點:

我們真的很需要一個能夠?qū)⒄麄€代碼庫塞進上下文的工具。

圖片圖片

上下文窗口16000token

官網(wǎng)顯示,StableCode模型具有30億參數(shù),將提供基礎模型、指令模型、長上下文窗口模型三種不同的模型,幫助開發(fā)人員編碼。

圖片圖片

StableCode在HPC(高性能計算)集群上,使用5600億代碼token的編程語言數(shù)據(jù)集starcoder-data對基礎模型進行了訓練。

StarCoder是HuggingFace和ServiceNow合作成立的開放科學合作組織BigCode于五月份開源的針對代碼的大模型。

Stability AI首席研究科學家Nathan Cooper對VentureBeat表示:

我們非常喜歡BigCode,因為他們在數(shù)據(jù)治理、模型治理和模型訓練方面做了驚人的工作,我們用了他們的數(shù)據(jù)集,并對其進行了額外的過濾和清理,同時也用在了構(gòu)建長上下文窗口的模型,在我們的集群上進行了訓練。

對于復雜的編程任務,StableCode則針對特定用例進行了指令調(diào)優(yōu)。

在基礎模型的基礎上,用約120000個Alpaca格式的“代碼指令-回答”對訓練了指令模型。

圖片圖片

△StableCode指令生成對給定指令響應的代碼。

此外,為了滿足用戶對上下文窗口長度的需求,StableCode的長上下文窗口模型直接將上下文窗口拉長至16000個token,是此前開源模型的2-4倍。

△與類似大小的模型(3B)進行的 HumanEval 基準比較。△與類似大小的模型(3B)進行的 HumanEval 基準比較。

不僅為用戶提供了可單行、多行自動完成建議的工具,還允許用戶同時查看編輯相當于五個中等大小的Python文件,允許更專業(yè)復雜的代碼生成prompt。

下面是一個StableCode利用Pytorch深度學習庫完成一個相對復雜的Python文件展示(灰色文本顯示了StableCode的預測)。

圖片圖片

使用了RoPE的方法

此外,StableCode也是用到了Transformer架構(gòu),不同于StarCoder用ALiBi(線性偏差的注意力)的方法定位模型輸出,StableCode則是使用了RoPE(旋轉(zhuǎn)位置嵌入)的方法。

Cooper表示:

在Transformer模型中,ALiBi方法傾向于更加重視當前的token,而不是過去的token。這對于代碼生成來說不是一個理想的方法,因為代碼沒有固定的敘述結(jié)構(gòu),沒有明確的開始、中間和結(jié)束。代碼的功能可以在應用流程的任何點被定義。所以我們使用RoPE,它沒有這種偏見。

StableCode目前還處于早期階段,初始發(fā)布的目標是觀察開發(fā)者如何接受和使用這個模型。

我們將與社區(qū)進行互動合作,看看他們會提出哪些有趣的方向,并針對開發(fā)者領域進行生成式探索 。

研究主管Christian Laforte也淺聊了StableCode的目標:

與Stable Diffusion幫助世界上任何人成為藝術(shù)家類似,我們希望StableCode模型能讓任何有好點子但卻遇到問題的人,能夠編寫一個解決問題的程序。

看到Stability AI再放大招的這波操作,有網(wǎng)友在去測試Github Copilot的路上來了個掉頭:

圖片圖片

還有網(wǎng)友希望“預定”下一次動作:

真的很想看Stability AI在文本轉(zhuǎn)語音方面,做些類似谷歌SoundStorm(聲音風暴)的事啊。

圖片圖片

此外,StableCode目前已經(jīng)開源啦!

參考鏈接:
[1]https://venturebeat.com/programming-development/stability-ai-launches-stablecode-an-llm-for-code-generation/
[2]https://twitter.com/StabilityAI/status/1688931312122675200

責任編輯:武曉燕 來源: 量子位
相關推薦

2023-08-10 14:04:15

代碼模型

2024-03-14 08:11:45

模型RoPELlama

2023-07-11 10:02:23

2025-03-18 08:14:05

2025-03-18 09:10:00

MCPAI模型上下文協(xié)議

2017-05-11 14:00:02

Flask請求上下文應用上下文

2025-01-08 11:10:46

2025-02-26 00:16:56

RAGAI服務

2025-03-26 03:00:00

MCPAI應用

2012-12-31 10:01:34

SELinuxSELinux安全

2021-07-26 07:47:36

Cpu上下文進程

2024-03-29 14:04:00

模型訓練

2023-08-25 13:27:00

模型開源

2022-10-19 23:21:20

Python編程核心協(xié)議

2022-09-14 13:13:51

JavaScript上下文

2022-11-03 08:29:32

編程管理器協(xié)議

2023-11-22 11:22:57

AI模型

2023-10-04 08:16:04

點贊
收藏

51CTO技術(shù)棧公眾號