自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

深夜突襲!DeepSeek V3 偷偷更新變強(qiáng)

人工智能
在 Chat2BI 的優(yōu)化過程中,我們嘗試了多種策略,但準(zhǔn)確性始終難以顯著提升。V3-0324 發(fā)布后,我們第一時(shí)間進(jìn)行了實(shí)測(cè),結(jié)果表明,在國內(nèi)模型中,唯有 V3-0324 能夠穩(wěn)定地通過 function 實(shí)現(xiàn) Chat2BI 效果(在相同提示詞、SQL 字段未進(jìn)行語義或向量?jī)?yōu)化的情況下,該模型自身的能力遠(yuǎn)超大部分調(diào)優(yōu)手段。

DeepSeek 剛剛悄然發(fā)布了 DeepSeek-V3-0324 模型。這次更新遠(yuǎn)超預(yù)期,不僅性能大幅提升,而且新增了多項(xiàng)實(shí)用功能,讓開發(fā)者和企業(yè)用戶都為之驚嘆。

回顧之前的 DeepSeek R1 版本,盡管能力出色,但仍存在幾個(gè)明顯短板:缺乏函數(shù)調(diào)用能力、不支持規(guī)范化的 JSON 輸出。這些功能對(duì)于 AI 在實(shí)際業(yè)務(wù)場(chǎng)景中的應(yīng)用至關(guān)重要。

以下是官方樸實(shí)無華的更新日志:

圖片圖片

中文寫作能力測(cè)試

提示詞:假設(shè)你是一名環(huán)保專家,最近你發(fā)現(xiàn)了一種新的可持續(xù)能源技術(shù)。請(qǐng)描述這項(xiàng)技術(shù)的原理、優(yōu)勢(shì)以及對(duì)環(huán)境的潛在影響。

17429049581742904958

寫作能力有了大幅度提升,畢竟基于 R1 ,「左腳踩右腳」

前端開發(fā)能力測(cè)試

接下來,我測(cè)試了它的前端開發(fā)能力:

我問了它:技術(shù)棧不限制,幫我實(shí)現(xiàn)一個(gè)網(wǎng)站登錄界面 .html

17429054011742905401

DeepSeek V3 函數(shù)調(diào)用功能

函數(shù)調(diào)用是這一功能使大語言模型能夠根據(jù)用戶提示,生成調(diào)用特定函數(shù)的結(jié)構(gòu)化請(qǐng)求,包含函數(shù)名稱和必要參數(shù)。這為 AI 與外部工具、API 的無縫集成提供了強(qiáng)大支持。

舉例來說,眾所周知大語言模型在處理復(fù)雜數(shù)學(xué)計(jì)算時(shí)存在局限性。通過函數(shù)調(diào)用,您可以為模型提供一個(gè) "數(shù)學(xué)工具庫 ",模型會(huì)指示應(yīng)調(diào)用哪個(gè)函數(shù)以及需要哪些參數(shù)。系統(tǒng)執(zhí)行該函數(shù)后,將結(jié)果與原始提示一起返回給模型,從而獲得完整、準(zhǔn)確的回答。

需要明確的是:模型自身不執(zhí)行函數(shù),它只是指示應(yīng)該調(diào)用什么函數(shù)以及如何調(diào)用。

17429060591742906059

實(shí)際應(yīng)用示例

添加依賴

<dependency>
  <groupId>dev.langchain4j</groupId>
  <artifactId>langchain4j-open-ai</artifactId>
  <version>1.0.0-beta2</version>
</dependency>

創(chuàng)建 AI 服務(wù)接口

public interface FunctionAssistant {
    String chat(String message);
}

用注解實(shí)現(xiàn)業(yè)務(wù)邏輯

public class InvoiceHandler {
    @Tool("根據(jù)用戶提交的開票信息進(jìn)行開票 ")
    public String handle(String companyName, String dutyNumber, @P("金額保留兩位有效數(shù)字 ") String amount) {
        log.info("companyName =>>>> {} dutyNumber =>>>> {} amount =>>>> {}", companyName, dutyNumber, amount);
        return "開票成功 ";
    }
}

測(cè)試調(diào)用效果

@Test
publicvoidtest2() {
    ChatLanguageModelchatLanguageModel= OpenAiChatModel.builder()
            .apiKey("sk-")
            .modelName("deepseek-chat")
            .baseUrl("https://api.deepseek.com/v1")
            .logRequests(true)
            .logResponses(true)
            .build();

    FunctionAssistantassistant= AiServices.builder(FunctionAssistant.class)
            .chatLanguageModel(chatLanguageModel)
            .tools(newInvoiceHandler())
            .build();

    Stringchat= assistant.chat("幫我開具發(fā)票,公司名稱:深圳市騰訊計(jì)算機(jī)系統(tǒng)有限公司,稅號(hào):91440300734991234A,金額:100.123456");
    System.out.println(chat);
}

17429064111742906411

總結(jié)彩蛋

從筆者近期對(duì) AI Chat2BI 業(yè)務(wù)落地的研究來看,V3 相比 R1 推理模型具備更高的可玩性。在 Chat2BI 的優(yōu)化過程中,我們嘗試了多種策略,但準(zhǔn)確性始終難以顯著提升。V3-0324 發(fā)布后,我們第一時(shí)間進(jìn)行了實(shí)測(cè),結(jié)果表明,在國內(nèi)模型中,唯有 V3-0324 能夠穩(wěn)定地通過 function 實(shí)現(xiàn) Chat2BI 效果(在相同提示詞、SQL 字段未進(jìn)行語義或向量?jī)?yōu)化的情況下,該模型自身的能力遠(yuǎn)超大部分調(diào)優(yōu)手段。當(dāng)然,Claude 3.7 Sonnet 也展現(xiàn)了驚艷的表現(xiàn))。

本次更新彌補(bǔ)了諸多短板,使 AI 更加深度融入業(yè)務(wù)流程,未來可期待更多 AI 創(chuàng)新案例的涌現(xiàn)。唯有真正賦能業(yè)務(wù),AI 才能創(chuàng)造真正的價(jià)值。

17429224571742922457

責(zé)任編輯:武曉燕 來源: JAVA架構(gòu)日記
相關(guān)推薦

2024-12-30 20:32:36

2024-12-30 09:25:00

數(shù)據(jù)訓(xùn)練摩擦

2025-03-25 09:48:22

2025-03-31 00:00:00

DeepSeekAI人工智能

2025-03-26 10:38:40

2011-05-20 07:52:54

RADVISIONSCOPIA Mobi

2025-03-13 06:34:49

2025-02-19 10:49:30

2025-04-29 08:14:14

2025-03-03 08:21:00

2025-03-03 08:17:00

DeepSeek模型數(shù)據(jù)

2024-12-27 09:50:00

模型數(shù)據(jù)測(cè)試

2023-12-25 09:41:37

點(diǎn)云訓(xùn)練

2025-03-17 00:22:00

DeepSeek指令模型

2024-12-31 12:35:46

2025-02-05 12:53:21

2011-03-28 12:17:03

ibmdwRational

2010-07-30 13:17:33

NFS V3
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)