深夜突襲!DeepSeek V3 偷偷更新變強(qiáng)
DeepSeek 剛剛悄然發(fā)布了 DeepSeek-V3-0324 模型。這次更新遠(yuǎn)超預(yù)期,不僅性能大幅提升,而且新增了多項(xiàng)實(shí)用功能,讓開發(fā)者和企業(yè)用戶都為之驚嘆。
回顧之前的 DeepSeek R1 版本,盡管能力出色,但仍存在幾個(gè)明顯短板:缺乏函數(shù)調(diào)用能力、不支持規(guī)范化的 JSON 輸出。這些功能對(duì)于 AI 在實(shí)際業(yè)務(wù)場(chǎng)景中的應(yīng)用至關(guān)重要。
以下是官方樸實(shí)無華的更新日志:
圖片
中文寫作能力測(cè)試
提示詞:假設(shè)你是一名環(huán)保專家,最近你發(fā)現(xiàn)了一種新的可持續(xù)能源技術(shù)。請(qǐng)描述這項(xiàng)技術(shù)的原理、優(yōu)勢(shì)以及對(duì)環(huán)境的潛在影響。
1742904958
寫作能力有了大幅度提升,畢竟基于 R1 ,「左腳踩右腳」
前端開發(fā)能力測(cè)試
接下來,我測(cè)試了它的前端開發(fā)能力:
我問了它:技術(shù)棧不限制,幫我實(shí)現(xiàn)一個(gè)網(wǎng)站登錄界面 .html
1742905401
DeepSeek V3 函數(shù)調(diào)用功能
函數(shù)調(diào)用是這一功能使大語言模型能夠根據(jù)用戶提示,生成調(diào)用特定函數(shù)的結(jié)構(gòu)化請(qǐng)求,包含函數(shù)名稱和必要參數(shù)。這為 AI 與外部工具、API 的無縫集成提供了強(qiáng)大支持。
舉例來說,眾所周知大語言模型在處理復(fù)雜數(shù)學(xué)計(jì)算時(shí)存在局限性。通過函數(shù)調(diào)用,您可以為模型提供一個(gè) "數(shù)學(xué)工具庫 ",模型會(huì)指示應(yīng)調(diào)用哪個(gè)函數(shù)以及需要哪些參數(shù)。系統(tǒng)執(zhí)行該函數(shù)后,將結(jié)果與原始提示一起返回給模型,從而獲得完整、準(zhǔn)確的回答。
需要明確的是:模型自身不執(zhí)行函數(shù),它只是指示應(yīng)該調(diào)用什么函數(shù)以及如何調(diào)用。
1742906059
實(shí)際應(yīng)用示例
添加依賴
<dependency>
<groupId>dev.langchain4j</groupId>
<artifactId>langchain4j-open-ai</artifactId>
<version>1.0.0-beta2</version>
</dependency>
創(chuàng)建 AI 服務(wù)接口
public interface FunctionAssistant {
String chat(String message);
}
用注解實(shí)現(xiàn)業(yè)務(wù)邏輯
public class InvoiceHandler {
@Tool("根據(jù)用戶提交的開票信息進(jìn)行開票 ")
public String handle(String companyName, String dutyNumber, @P("金額保留兩位有效數(shù)字 ") String amount) {
log.info("companyName =>>>> {} dutyNumber =>>>> {} amount =>>>> {}", companyName, dutyNumber, amount);
return "開票成功 ";
}
}
測(cè)試調(diào)用效果
@Test
publicvoidtest2() {
ChatLanguageModelchatLanguageModel= OpenAiChatModel.builder()
.apiKey("sk-")
.modelName("deepseek-chat")
.baseUrl("https://api.deepseek.com/v1")
.logRequests(true)
.logResponses(true)
.build();
FunctionAssistantassistant= AiServices.builder(FunctionAssistant.class)
.chatLanguageModel(chatLanguageModel)
.tools(newInvoiceHandler())
.build();
Stringchat= assistant.chat("幫我開具發(fā)票,公司名稱:深圳市騰訊計(jì)算機(jī)系統(tǒng)有限公司,稅號(hào):91440300734991234A,金額:100.123456");
System.out.println(chat);
}
1742906411
總結(jié)彩蛋
從筆者近期對(duì) AI Chat2BI 業(yè)務(wù)落地的研究來看,V3 相比 R1 推理模型具備更高的可玩性。在 Chat2BI 的優(yōu)化過程中,我們嘗試了多種策略,但準(zhǔn)確性始終難以顯著提升。V3-0324 發(fā)布后,我們第一時(shí)間進(jìn)行了實(shí)測(cè),結(jié)果表明,在國內(nèi)模型中,唯有 V3-0324 能夠穩(wěn)定地通過 function 實(shí)現(xiàn) Chat2BI 效果(在相同提示詞、SQL 字段未進(jìn)行語義或向量?jī)?yōu)化的情況下,該模型自身的能力遠(yuǎn)超大部分調(diào)優(yōu)手段。當(dāng)然,Claude 3.7 Sonnet 也展現(xiàn)了驚艷的表現(xiàn))。
本次更新彌補(bǔ)了諸多短板,使 AI 更加深度融入業(yè)務(wù)流程,未來可期待更多 AI 創(chuàng)新案例的涌現(xiàn)。唯有真正賦能業(yè)務(wù),AI 才能創(chuàng)造真正的價(jià)值。
1742922457