自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<dfn id="pr5bs"><strong id="pr5bs"><s id="pr5bs"></s></strong></dfn>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

討論一個(gè)技術(shù)問題，大模型流式返回原創(chuàng)

AI探索時(shí)代

發(fā)布于 2024-12-9 10:01

瀏覽

0收藏

?“ 技術(shù)上最容易犯的錯(cuò)就是經(jīng)驗(yàn)主義，以及拿來主義”

最近在對(duì)接GPT實(shí)現(xiàn)一個(gè)功能，具體功能就不說了；主要是這個(gè)功能需要流式返回，因此踩了一些坑；所以就在此記錄一下。至于什么是流式返回，不清楚的可以自己問度娘。

大模型流式返回帶來的問題

自chatGPT推出以來，其一個(gè)字一個(gè)字的出現(xiàn)，就像一個(gè)打字機(jī)；這效果驚艷了很多人，因此在很多場景下很多人都會(huì)選擇打字機(jī)的效果。而打字機(jī)效果背后的實(shí)現(xiàn)就是流式返回。

對(duì)技術(shù)有過了解的人應(yīng)該都知道，正常情況下接口是在所有業(yè)務(wù)處理完成之后一起返回；但流式返回是分多批次返回。簡單來說就是處理了一部分就返回一部分，不用等全部完成之后再返回。

如下圖所示就是一個(gè)典型的流式返回：

討論一個(gè)技術(shù)問題，大模型流式返回-AI.x社區(qū)

那目前流式返回所遇到的問題是什么呢？

其實(shí)從后端的角度來說，流式返回沒有任何問題；不論是使用大模型官方提供的SDK亦或者是調(diào)用他們的接口，都是正常的流式返回。但問題是，調(diào)用第三方接口的目的是為了完成業(yè)務(wù)功能，因此怎么把這個(gè)流式返回也用流式返回給前端就是一個(gè)需要思考的問題了。

從web開發(fā)的角度來說，現(xiàn)在前后端交互主要使用的是http協(xié)議；但http協(xié)議是前端向后端發(fā)起請(qǐng)求，而不能從后端向前端發(fā)起請(qǐng)求；為了解決這個(gè)問題，因此就有了websocket和SSE協(xié)議。

這兩個(gè)協(xié)議的區(qū)別是websocket是全雙工的，而SSE是半雙工的；意思就是說，websocket建立連接之后，前端可以主動(dòng)向后端發(fā)消息，后端也可以主動(dòng)向前端發(fā)消息；而SSE是只能后端向前端發(fā)消息。

但不論是websocket還是SSE協(xié)議，本質(zhì)上只是一種通訊協(xié)議，和業(yè)務(wù)沒什么具體的關(guān)系；這就類似于，搞貨運(yùn)的目的是把貨物安全的送到目的地，至于你是用汽車運(yùn)，還是用火車運(yùn)都可以。

那問題出在哪里呢？

剛開始我們使用的是websocket作為流式返回的通訊工具；但再實(shí)際使用中才發(fā)現(xiàn)一個(gè)很大的問題，那就是websocket無法在短時(shí)間內(nèi)接受大量的網(wǎng)絡(luò)傳輸需求；一旦過量就會(huì)導(dǎo)致websocket緩沖區(qū)溢出，也就是TEXT_FULL_WRITRING異常；簡單來說就是，websocket為了減輕網(wǎng)絡(luò)壓力，每次發(fā)送消息都會(huì)先把緩沖區(qū)寫滿；然后再一次性發(fā)送。

但由于流式返回速度較快，有時(shí)候websocket上一條消息還沒發(fā)送出去，下一條新的數(shù)據(jù)又進(jìn)來了；因此就會(huì)導(dǎo)致websocket報(bào)錯(cuò)，即使使用的是異步發(fā)送也會(huì)報(bào)錯(cuò)。

public void sendText(String text) {
        for(Session session : sessions.values()){
            if (session.isOpen()) {
                try {
                    //異步發(fā)送
                    session.getAsyncRemote().sendText(text);
                   
                } catch (Exception e) {
                    log.error("發(fā)送會(huì)話異常");
                }
            }else{
                log.error("socket 在不可發(fā)送狀態(tài)");
            }
        }
    }

為了解決這個(gè)問題，因此就在網(wǎng)上查了一下發(fā)現(xiàn)；類似于這種流式返回，大部分人的處理方式都是用SSE協(xié)議；因?yàn)镾SE協(xié)議相對(duì)websocket更簡單，效率更高。而在java語言中，使用SSE有兩種方式，第一種就是自己手動(dòng)創(chuàng)建SSE對(duì)象，使用SseEmitter 對(duì)象來實(shí)現(xiàn)。

但這種原生的實(shí)現(xiàn)方式存在很多問題，比如需要自己去控制sse與用戶的關(guān)聯(lián)關(guān)系，sse的狀態(tài)判斷，自動(dòng)重連等等。

因此，springboot就提供了另一種方式，那就是Flux流式處理。

OpenAIClient client = new OpenAIClientBuilder().credential(new AzureKeyCredential(key)).endpoint(endPoint).buildClient();
        IterableStream<ChatCompletions> stream = client.getChatCompletionsStream(modelName, new ChatCompletionsOptions(messages));
        StringBuffer stringBuffer = new StringBuffer();
        return Flux.<String>create(sink -> {
                    stream.iterator().forEachRemaining(
                            chatCompletions -> {
                                if (chatCompletions.getChoices() != null && chatCompletions.getChoices().size() > 0) {
                                    if (chatCompletions.getChoices().get(0).getDelta() != null) {
                                        String content = chatCompletions.getChoices().get(0).getDelta().getContent();
                                        log.info(content);
                                        if (content != null) {
                                            stringBuffer.append(content);
                                            sink.next(content);
                                        }
                                    }
                                }
                            }
                    );
                    sink.complete();
                }).map(data -> ServerSentEvent.<String>builder().data(data).build())
                // 每隔一段時(shí)間發(fā)送一個(gè)字符
                .delayElements(Duration.ofMillis(10))
                // 停止
                .takeWhile(i -> !redisUtil.hasKey(stopKey))
                // 最后執(zhí)行
                .doOnComplete(() -> {
                  //傳輸完成 業(yè)務(wù)處理
                });

如上所示，F(xiàn)lux通過sink封裝大模型的流式返回，然后調(diào)用next方法主動(dòng)把數(shù)據(jù)返回給前端，以此達(dá)到流式效果。

雖然從操作上來說，各種技術(shù)已經(jīng)逐漸成熟，我們都可以直接拿來主義，拿過來用就好了；但實(shí)際上存在的一個(gè)問題就是，當(dāng)你不知道其原理，又沒有經(jīng)驗(yàn)時(shí)，你還是會(huì)踩很多坑。

?

本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/UmxRyvtqhkuR521L3VE48w??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

大模型流式返回

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

手動(dòng)實(shí)現(xiàn)一個(gè)擴(kuò)散模型DDPM

pangguiyu ? 5707瀏覽 ? 0回復(fù)
MSRA：視覺生成六大技術(shù)問題

Crystalcxt ? 1823瀏覽 ? 0回復(fù)
如果老板讓你基于大模型搭建一個(gè)系統(tǒng)，怎么選擇一個(gè)適合自己任務(wù)的大模型？選擇大模型需要考慮哪些問題？

AI探索時(shí)代 ? 2307瀏覽 ? 0回復(fù)
怎么評(píng)價(jià)一個(gè)模型的好壞？大模型應(yīng)用重要環(huán)節(jié)之——模型評(píng)估

AI探索時(shí)代 ? 4306瀏覽 ? 0回復(fù)
xLAM: 一個(gè)賦能AI agent系統(tǒng)的動(dòng)作大模型家族

sbf_2000 ? 2489瀏覽 ? 0回復(fù)
支持大模型流式輸出的JSON提取工具

恰似驚鴻 ? 2968瀏覽 ? 0回復(fù)
不要沉迷大模型的技術(shù)與理論，學(xué)習(xí)大模型的方法——從做一個(gè)小應(yīng)用開始

AI探索時(shí)代 ? 2432瀏覽 ? 0回復(fù)
不要上來就大模型，從訓(xùn)練一個(gè)小模型開始

AI探索時(shí)代 ? 2341瀏覽 ? 0回復(fù)
一個(gè)關(guān)于學(xué)習(xí)大模型技術(shù)的方法論

AI探索時(shí)代 ? 1833瀏覽 ? 0回復(fù)
大模型榜單還能信嗎？一個(gè)假模型就能登頂排行榜

大語言模型論文跟蹤 ? 2390瀏覽 ? 0回復(fù)
怎么設(shè)計(jì)一個(gè)自己的大模型？設(shè)計(jì)一個(gè)大模型需要哪些能力？

AI探索時(shí)代 ? 3060瀏覽 ? 0回復(fù)
我訓(xùn)練了一個(gè)醫(yī)療多模態(tài)大模型幫家里老人看病

一起AI技術(shù) ? 3462瀏覽 ? 0回復(fù)
大模型技術(shù)全面解析，從大模型的概念，技術(shù)，應(yīng)用和挑戰(zhàn)多個(gè)方面介紹大模型

AI探索時(shí)代 ? 1.4w瀏覽 ? 0回復(fù)
Reyes：一個(gè)從0到1開始訓(xùn)練的多模態(tài)大模型（技術(shù)報(bào)告）

大模型自然語言處理 ? 1857瀏覽 ? 0回復(fù)
為什么在解決技術(shù)問題時(shí)，Stack Overflow 和 Reddit 仍然勝過 AI？

丟翅膀的魚 ? 2204瀏覽 ? 0回復(fù)
怎么自定義一個(gè)數(shù)據(jù)集？自定義數(shù)據(jù)集面臨哪些問題？

AI探索時(shí)代 ? 1585瀏覽 ? 0回復(fù)
自己打包一個(gè)數(shù)據(jù)集代碼案例——使用Numpy計(jì)算框架自定義一個(gè)類似MINST的數(shù)據(jù)集

AI探索時(shí)代 ? 1478瀏覽 ? 0回復(fù)
人工智能應(yīng)用最大的問題是數(shù)據(jù)問題，而不是技術(shù)問題

AI探索時(shí)代 ? 1171瀏覽 ? 0回復(fù)
部署一個(gè)大模型，到底需要多大機(jī)器？

hm673c38238a021 ? 1069瀏覽 ? 0回復(fù)

AI探索時(shí)代

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

關(guān)于RAG應(yīng)用中怎么高質(zhì)量的進(jìn)行數(shù)據(jù)召回——召回策略的研究 1天前發(fā)布
關(guān)于基于RAG技術(shù)的智能客服系統(tǒng)解決方案 1天前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：使用大模型實(shí)現(xiàn)一個(gè)聊天機(jī)器人思路以及困難點(diǎn)

下一篇：人工智能的未來——AI Agent和Agentic AI的區(qū)別與聯(lián)系

社區(qū)精華內(nèi)容

目錄