自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<ruby id="6gnvd"></ruby>

<strike id="6gnvd"><progress id="6gnvd"></progress></strike>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

無需訓(xùn)練，100%完美檢索！LLM練出「火眼金睛」，InfiniRetri超長文本一針見血

作者：新智元 2025-03-17 09:40:00

人工智能新聞

LLM自身有望在無限長token下檢索信息！無需訓(xùn)練，在檢索任務(wù)「大海撈針」（Needle-in-a-Haystack）測試中，新方法InfiniRetri讓有效上下文token長度從32K擴展至1000+K，讓7B模型比肩72B模型。

全新檢索模式：在無限長token下，大語言模型自身或能檢索信息！

受大語言模型（LLM）上下文窗口大小的限制，處理輸入token數(shù)超過上限的各種任務(wù)頗具挑戰(zhàn)性，無論是簡單的直接檢索任務(wù)，還是復(fù)雜的多跳推理任務(wù)。

盡管新提出的各種方法用來增強大語言模型的長上下文處理能力，但這些方法痛點突出：

要么會產(chǎn)生高昂的訓(xùn)練后成本，

要么需要額外的工具模塊（如檢索增強生成RAG），

要么在實際任務(wù)中顯示出改進，并不明顯。

研究團隊觀察了各層注意力分布與生成答案之間的相關(guān)性，通過實驗證實了注意力分配與檢索增強能力是一致的。

基于上述見解，研究團隊提出了一種全新的方法InfiniRetri，該方法利用大語言模型自身的注意力信息，實現(xiàn)對任意長度輸入的精確檢索。

實驗表明，在100萬個token的「大海撈針」（Needle-In-a-Haystack，NIH）測試中，InfiniRetri將5億參數(shù)的模型從44.6%提升到了100%的準(zhǔn)確率。

沒有InfiniRetri的NIH測試只有44.6%的準(zhǔn)確率

要知道GPT-4在NIH測試中都做不到100%準(zhǔn)確率。

InfiniRetri一舉超過了其他方法或更大的模型，創(chuàng)造了當(dāng)前最佳（SOTA）結(jié)果。

值得注意的是，某7B模型在HotpotQA任務(wù)上的得分，超越了其他同等參數(shù)規(guī)模的模型。

類似地，Mistral-7B-Instruct v0.2作為擅長短文本推理的模型，在長文本任務(wù)中的表現(xiàn)也得到了顯著提升。

此外，新方法在實際基準(zhǔn)測試中也取得了顯著的性能提升，最大提升幅度達(dá)到288%。

另外，無需額外訓(xùn)練，InfiniRetri就可應(yīng)用于任何基于Transformer的大語言模型，并且能大幅降低長文本推理延遲和計算開銷。

論文鏈接：https://arxiv.org/abs/2502.12962

項目地址：https://github.com/CapitalCode2020/InfiniRetri2

文章主要貢獻如下：

創(chuàng)新性提出「注意力分配與檢索增強對齊」概念，并成功利用這一特性提升LLM處理長文本的能力。
無需額外訓(xùn)練，InfiniRetri可直接應(yīng)用于任何基于Transformer的LLM，使其具備處理無限長上下文的能力。
不同于RAG依賴外部嵌入模型，提出了「注意力中的檢索」這一新穎視角，充分利用LLM內(nèi)在能力增強長文本處理能力。
顯著降低推理延遲和計算開銷，在大規(guī)模數(shù)據(jù)集上的檢索與問答任務(wù)中表現(xiàn)優(yōu)異，展現(xiàn)出在極長文本處理場景中的實際應(yīng)用價值。
不僅僅是擴展上下文窗口，證明了可以通過多種方式提升LLM處理長文本能力。未來的改進可通過在較小上下文窗口內(nèi)增強模型內(nèi)部能力，從而獲得更優(yōu)的長文本處理效果。

鞭辟入里，靈魂三問

近年來，許多主流的LLM都在致力于擴展上下文窗口的規(guī)模。

例如，GPT-4、Llama3和DeepSeekV3支持最長128K的上下文長度，Claude-3可達(dá)200K，而Gemini-Pro-1.5和Qwen2.5-1M甚至支持1M的上下文長度。

然而，實際效果并未完全達(dá)到這些模型所宣稱的長度。

LLM在處理超長上下文方面仍然面臨重大挑戰(zhàn)。

那自然考慮：是否能不斷延長上下文窗口？

這是第一個問題，答案是不能，有3大原因：

增加計算成本，產(chǎn)生明顯的延遲。
輸入長度具有長尾效應(yīng)，簡單地擴展上下文窗口帶來的提升注定會帶來越來越低。
持續(xù)和階段性訓(xùn)練成本極高，絕大多數(shù)研究人員無法承受。

接下來，進一步考慮第二個問題：要打破處理長上下文時不同窗口之間的信息壁壘，是否存在一種低成本的方法？

事實上，業(yè)界已經(jīng)通過檢索增強生成（Retrieval-Augmented Generation，RAG）提供了答案。

RAG由兩大核心組件組成：檢索模塊和生成模塊。其中，檢索模塊依賴外部嵌入模型，根據(jù)輸入查詢從長文本中檢索相關(guān)內(nèi)容。

然而，RAG系統(tǒng)普遍難以建立檢索信息之間的關(guān)聯(lián)。

相比之下，在推理過程中，LLM的注意力機制，能夠高效地建立不同信息片段之間的聯(lián)系。

由此引出了第三個問題：為何不直接利用LLM自身的檢索能力，來處理長文本上下文？

為了讓LLM以低成本的方式壓縮并存儲過去的鍵（key）和值（value），研究團隊認(rèn)為，只有打破不同上下文窗口之間的信息壁壘，LLM才能真正提升其處理長文本的能力。

此外，通過觀察LLM在推理過程中回答問題時的注意力分配模式，研究團隊提出：這種注意力分配模式與檢索增強能力（RAG）高度契合。

研究團隊測試了基于所有層的注意力分布來檢索答案的準(zhǔn)確性。

正如下圖3所示，越接近輸出層，這種模式的增強效果就越明顯。

此外，在第14層和第15層，檢索準(zhǔn)確率達(dá)到一個局部峰值。

因此，InfiniRetri引入了全新的策略，利用LLM自身的注意力信息，而非依賴外部嵌入模型，去提升其長文本處理能力。

無需對基于Transformer的LLM進行額外訓(xùn)練，InfiniRetri可以開箱即用。得益于此，研究團隊在多個模型上進行了全面的對比實驗。

在跨上下文長度的事實檢索任務(wù)「大海撈針」（Needle In A Haystack，NIH）中，InfiniRetri僅使用5億個額外參數(shù)，就將模型的上下文長度從原始的32K擴展至100萬個token（如圖1所示）。

原始方法（上）與InfiniRetri方法（下）對比，準(zhǔn)確檢索的最大文本長度從原始32K提升至超過1M tokens。

更值得注意的是，InfiniRetri在NIH任務(wù)上實現(xiàn)了無限長度范圍內(nèi)的精準(zhǔn)檢索，不僅超越了當(dāng)前主流方法，還有效解決了NIH任務(wù)的挑戰(zhàn)。

此外，在LongBench提供的9個真實數(shù)據(jù)集上，InfiniRetri在基于KV Cache甚至Full KV的主流方法中均取得了超越性的表現(xiàn)，尤其是在多文檔問答（Multi-Document QA）任務(wù)（如HotpotQA、2WikiMQA和Musique）中，Qwen2-7B-Instruct采用InfiniRetri后，平均性能提升高達(dá)369.6%。

InfiniRetri方法：帶著問題閱讀

那么，如何應(yīng)用這一模式來處理超出上下文窗口的長文本，并真正提升LLM的長文本處理能力呢？

在本節(jié)中，將InfiniRetri方法拆分為三個小節(jié)，分別介紹該模式的應(yīng)用方式，以提升LLM的長文本處理能力。

如圖4所示，該方法的完整工作流程包括五個主要步驟，詳細(xì)介紹這些步驟：

步驟1（切分，Chunk）、步驟2（合并，Merge）和步驟3（推理，Inference）。
步驟4（檢索，Retrieval）是方法的核心部分。
步驟5（緩存，Cache）。

圖4：InfiniRetri方法在增強LLM長上下文處理能力中的完整工作流程

文本分割

新方法受到人類閱讀書籍過程的啟發(fā)，專門針對LLM在處理超出上下文窗口的文本時所面臨的挑戰(zhàn)。

盡管人類的視野有限，一次只能看到一頁內(nèi)容，但仍然可以逐頁閱讀并理解整本書。在這個過程中，大腦就像一個緩存（cache），通過記憶保留并整合每一頁的信息，從而掌握整本書的內(nèi)容。

類似地，InfiniRetri將整篇文本拆分為連續(xù)的文本塊（chunk）。

這種切分方式雖然與RAG相似，但不同之處在于，InfiniRetri不是并行處理每個文本塊，而是按照順序逐塊迭代地處理每個文檔。

這種方法能夠保留文本的順序信息，更符合人類的閱讀習(xí)慣。

具體而言，如圖4所示，在步驟1（切分，Chunk）中，研究團隊根據(jù)句子邊界將整個長文本劃分為長度大致相等的文檔塊，其長度由方法參數(shù)ChunkSize3決定。

然后，這些文檔塊依次與緩存（Cache）中保留的token進行合并，形成完整的輸入序列，稱為MergeToken，并將其輸入LLM進行處理。

InfiniRetri采用了類似滑動窗口注意力（Slide Window Attention，SWA）的迭代方式，按順序處理每個文本片段。

然而，InfiniRetri對緩存的處理方式與傳統(tǒng)方法有本質(zhì)區(qū)別。

傳統(tǒng)緩存通常在每一層存儲過去的鍵值（Key-Value）狀態(tài)，而新方法則重新定義了緩存概念，改為存儲過去的token ID。
如圖4，步驟2（合并，Merge）所示，新方法在輸入LLM之前，將緩存的token ID與當(dāng)前文本片段的token進行合并，從而取代了推理過程中對歷史鍵值狀態(tài)的合并需求。
因此，在步驟3（推理，Inference）階段，LLM仍然使用標(biāo)準(zhǔn)注意力機制，而非SWA。對于第h層的注意力得分，其計算公式如下：

其中，A^h∈R^{n×m}表示查詢（query）和鍵（key）組成的注意力矩陣，n是查詢的數(shù)量，m是鍵的數(shù)量。

在注意力中檢索（Retrieval In Attention）

在單個上下文窗口內(nèi)，根據(jù)問題token準(zhǔn)確定位相關(guān)的上下文token，注意力分配模式能夠幫助LLM找到正確答案。

如果在滑動窗口框架內(nèi)的每次推理過程中持續(xù)應(yīng)用這一模式，理論上，LLM就可以在保持查詢不變的情況下，對整個長文本進行推理。

這一過程與人類的閱讀方式高度相似，類似于公認(rèn)的「帶著問題閱讀」學(xué)習(xí)策略，即通過問題作為錨點，在LLM可處理的范圍內(nèi)逐步整合相關(guān)信息。

因此，LLM能否精準(zhǔn)檢索與問題最相關(guān)的文本，是本方法有效性的核心。

關(guān)鍵在于設(shè)計基于注意力得分分布的token檢索策略和算法，以確保模型能夠在長文本中高效提取關(guān)鍵信息。

借鑒實驗結(jié)果，研究團隊選取了多頭注意力（Multi-Head Attention）的最后一層，并對所有注意力頭的得分進行求和聚合（如公式2所示），探索了一種能夠準(zhǔn)確判斷模型關(guān)注重點的方法。

通過可視化注意力得分，研究團隊觀察到：與答案相關(guān)的信息通常由連續(xù)的token組成。

也就是說，它們以短語級別的粒度存在。

這一發(fā)現(xiàn)與在圖2c的實驗結(jié)果一致，進一步確認(rèn)了LLM在token級別上具備較高的注意力精度。

因此，希望設(shè)計的操作是：計算每個token及其相鄰token在2D注意力得分矩陣中的累積注意力得分。

計算結(jié)果將作為新的特征，在后續(xù)的檢索過程中用于排序。經(jīng)過深入分析，發(fā)現(xiàn)此操作等效于使用一個填充了1的卷積核（kernel）進1D卷積。

對于查詢i和鍵j，其特征重要性計算如下：

1. 聚合所有注意力頭的得分（公式2）：

2. 基于1D卷積計算每個token及其相鄰token的重要性（公式3）：

其中，k是1D卷積核的大小，對應(yīng)于方法中的參數(shù)Phrase Token Num。

3. 沿矩陣的列方向求和，計算每個上下文token的總重要性分?jǐn)?shù)（公式4）：

其中，s_i代表第i個上下文token的綜合重要性分?jǐn)?shù)。

4. 最后，選取重要性分?jǐn)?shù)最高的前K個上下文token，并將其所在句子的所有token寫入緩存（cache）。這個過程可表示為：

即，從所有token的重要性分?jǐn)?shù)v中，選擇排名前K的token，并將它們所在的完整句子存入緩存，以便后續(xù)推理時使用。

緩存句子Token（Cache Sentence Token）

在推理過程中對緩存（cache）的使用方式，InfiniRetri與傳統(tǒng)方法存在本質(zhì)性區(qū)別。

相比于直接使用緩存，InfiniRetri將其用于存儲過去的上下文信息。

具體而言，主要有以下兩點不同：

1 新方法在模型外部緩存token ID，而不是每層的歷史鍵值（Key-Value）狀態(tài)。具體來說，在推理過程中不使用傳統(tǒng)的Key-Value緩存，而是在每次推理前，將過去的上下文信息與當(dāng)前輸入合并后再進行推理。

2 新方法基于短語級特征進行檢索，并在緩存中存儲包含Top-K token的句子級token。也就是說，存儲的是完整的句子，而不是單獨的token，從而確保檢索到的信息更具上下文完整性。

事實上，正是這兩項創(chuàng)新性改進，使得新方法在無需微調(diào)的情況下，就能比傳統(tǒng)的KV緩存方法更有效地提升LLM處理長文本的能力。

新方法并不試圖壓縮緩存中的token，而是保留句子級別的相關(guān)上下文信息。這是因為，句子是最小的完整語義單元，相比于單個token，更能確保LLM對上下文的理解。

在LLM逐步推理每個文本片段的過程中，緩存中保留的中間結(jié)果是動態(tài)變化的，它們由先前存儲的token和當(dāng)前輸入片段的組合決定。因此，在整個過程中，這些中間結(jié)果會相對調(diào)整和更新，以適應(yīng)模型的理解需求。

AI界的「大海撈針」

大海撈針（Needle-in-a-Haystack，NIH）任務(wù)要求模型在一篇「超長文檔」（「大海撈針」之海）中，精準(zhǔn)檢索出一個特定的目標(biāo)句子（「針」），該句子可以被隨機插入到文檔的任意位置。

通過調(diào)整「針」的放置位置（文檔深度）和上下文長度，反復(fù)測試以衡量模型的表現(xiàn)。

為了直觀分析模型的檢索能力，采用了熱力圖（heatmap）可視化實驗：

綠色代表完美檢索（準(zhǔn)確找到目標(biāo)句），
其他顏色表示檢索錯誤。

這種可視化方法可以直觀展示LLM處理長文本的能力上限，因此被廣泛用于評估。

實驗1：Llama3-8B-Instruct的對比

如圖6所示，在Llama3-8B-Instruct模型上測試NIH任務(wù)，并與以下方法進行了對比：Full KV（完整KV緩存）

StreamingLLM、H2O、SnapKV、PyramidKV以及InfiniRetri（新方法）。

在最長32K token的輸入文本上進行實驗，結(jié)果表明：

傳統(tǒng)KV緩存壓縮方法雖有所改進，但沒有超越Full KV的性能。
InfiniRetri方法的表現(xiàn)優(yōu)于FullKV，顯著增強了Llama3-8B-Instruct處理NIH任務(wù)的能力，甚至突破了原始8K token上下文窗口的限制。

實驗2：Mistral-7B-Instruct的對比

為了進一步驗證InfiniRetri的有效性，在Mistral-7B-Instruct上擴展了輸入長度。

Mistral-7B-Instruct官方支持的上下文窗口為32K token，對比了FullKV和InfiniRetri的表現(xiàn)，如圖7所示：

Mistral-7B-Instruct+FullKV（圖7a）：最多可在43K token長度范圍內(nèi)正確完成NIH任務(wù)。
Mistral-7B-Instruct+InfiniRetri（圖7b）：在相同的參數(shù)設(shè)置下，新方法不僅超越了Llama3-8B-Instruct，而且在NIH任務(wù)上達(dá)到了100%的檢索準(zhǔn)確率，并將可處理的輸入長度擴展至1M token，且沒有損失準(zhǔn)確率。

關(guān)鍵發(fā)現(xiàn)與額外實驗

進一步觀察到：只要LLM在有限上下文窗口內(nèi)具備足夠的檢索能力，新方法就可以賦能模型處理超長文本的檢索任務(wù)，理論上可支持無限長輸入。

基于這一發(fā)現(xiàn)，在更小的開源模型上的額外實驗，結(jié)果符合預(yù)期：

新方法將該模型的有效上下文token長度從32K擴展至1M+，從而使其在NIH任務(wù)上具備了近乎無限的長文本處理能力（如圖1所示）。

LongBench實驗

從表1的整體實驗結(jié)果來看，新方法是唯一一個在所有模型上全面超越Full KV的方法，其中在文檔問答（DocumentQA）任務(wù)中的提升最為顯著。

主要實驗結(jié)果：

LLaMA3-8B-Instruct：相對提升4.9%（32.92→34.56）
Qwen2-7B-Instruct：相對提升70.5%（25.11→42.82）
Mistral-7B-Instruct-v0.3：相對提升55.8%（24.17→37.68）

其中，Qwen2-7B-Instruct在HotpotQA任務(wù)上的表現(xiàn)提升最為顯著，最大增幅達(dá)到288%（14.8→57.52）。

關(guān)鍵發(fā)現(xiàn)

值得注意的是，Qwen2-7B-Instruct在HotpotQA任務(wù)上的得分，超越了其他同等參數(shù)規(guī)模的模型，表明其在短文本推理方面的優(yōu)勢。這進一步說明，Qwen2-7B-Instruct通過新方法，能夠有效提升其長文本推理能力。
類似地，Mistral-7B-Instruct v0.2作為擅長短文本推理的模型，在長文本任務(wù)中的表現(xiàn)也得到了顯著提升。

隨后，雖然新方法在長文檔問答任務(wù)中取得了顯著改進，但在文檔摘要任務(wù)上的表現(xiàn)相對較差。

這種差異可能源于摘要任務(wù)的性質(zhì)，這些任務(wù)通常需要更豐富的上下文信息來生成高質(zhì)量的輸出。

新方法無法一次性訪問所有相關(guān)信息，這在一定程度上限制了它在這些任務(wù)中的有效性。

與問答和檢索任務(wù)不同，在這些任務(wù)中，答案通常依賴于長上下文的一小部分，摘要任務(wù)則高度依賴于對整個上下文的全面理解。

因此，新方法可能需要進一步的優(yōu)化和改進，以更好地應(yīng)對這些摘要任務(wù)。

為了進一步評估InfiniRetri的有效性，使用最新的Qwen2.5-7B-Instruct模型在LongBenchV2上進行了額外的實驗。

正如表2所示的結(jié)果，在應(yīng)用了新方法InfiniRetri后，在處理LongBenchV2上的長文本和中等長度文本方面，Qwen2.5-7B整體性能與72B的對比模型相當(dāng)，表現(xiàn)出顯著的改進。

這一結(jié)果進一步驗證了，只要LLMs在短上下文場景中表現(xiàn)出色，新方法就可以有效地提高其處理更長上下文文本的能力。

降低延遲與計算開銷

如前所述，新方法采用分段滑動窗口機制+迭代處理，在確保LLM推理長度保持在方法參數(shù)范圍內(nèi)的同時，僅在緩存中保留最相關(guān)的token。

這種機制使得LLM僅需處理長文本中的少部分關(guān)鍵信息，從而顯著降低長文本處理時的推理延遲和計算開銷。

正如表4所示，即使未對方法參數(shù)進行精細(xì)調(diào)整，新方法仍能在LongBench文檔問答（QA）任務(wù)中，大幅降低推理成本，適用于Llama3-8B-Instruct、Mistral-7B-InstructV0.2和Qwen2-7B-Instruct等模型。

例如，在NtvQA任務(wù)中，僅保留4.5%的原始輸入文本（18409->834）；在HotpotQA任務(wù)中，Qwen2-7B-Instruct僅需處理8.7%的原始文本（9152->795），但推理性能提升高達(dá)288%。

這些實驗結(jié)果進一步證明，新方法能夠通過優(yōu)化LLM在較小上下文窗口內(nèi)的能力，有效提升其長文本處理能力。

這一發(fā)現(xiàn)表明，提升LLM的長文本處理能力不僅可以通過擴展上下文窗口，還可以通過優(yōu)化模型在小窗口內(nèi)的推理能力，再結(jié)合新方法機制，實現(xiàn)高效處理長文本的目標(biāo)。

評論

這篇論文強調(diào)了一個本應(yīng)顯而易見的事實：預(yù)測和檢索是同一枚硬幣的兩面。

要有效地進行預(yù)測，首先必須確定什么是相關(guān)的。令人驚訝的是，適當(dāng)?shù)乩?/strong>注意力模式，擁有5億參數(shù)的模型可以在100萬個token上執(zhí)行完美的檢索。

這引發(fā)了一個有趣的問題：如果圍繞檢索能力明確設(shè)計架構(gòu)會怎樣？

Transformer架構(gòu)是為預(yù)測而設(shè)計的，檢索是作為副產(chǎn)品出現(xiàn)的。那么，專門為檢索優(yōu)化的架構(gòu)會是什么樣子呢？

許多資金已經(jīng)投入到構(gòu)建大規(guī)模RAG（檢索增強生成）系統(tǒng)中。

如果這篇論文所承諾的性能改進是真實的，其影響將是巨大的。

責(zé)任編輯：張燕妮來源：新智元

LLM 模型 AI

分享到微信

微信掃碼分享

分享到微博

相關(guān)推薦

無需大圣的“火眼金睛”，連云港依然有辦法明察秋毫
連云港為“雪亮工程”構(gòu)筑了完善的上層應(yīng)用體系，數(shù)據(jù)從街頭巷尾或者村委會議匯聚而來，并最終呈現(xiàn)于群眾的手機和電視等終端，在此過程中，視頻監(jiān)控、云計算等技術(shù)得到了充分的應(yīng)用，全面提升新形勢下政法綜治工作水平和能力

2018-11-28 14:59:56

云計算

火眼金睛：云存儲廠商選擇十問十答
誠然每一個用例場景都有一些不同，但是在選擇云存儲提供商時，有一個對于所有用例都適用的通用評估標(biāo)準(zhǔn)核心集。下面的十個問題將幫助我們來對比云存儲服務(wù)。

2013-01-23 09:12:13

云存儲服務(wù)云存儲提供商選擇云存儲

以太坊創(chuàng)始人一針見血
在加密貨幣的投資方面最中肯的一個建議可能來自以太坊創(chuàng)始人維塔利克·布特林，那就是——不要將任何你無法承擔(dān)損失的錢投入進去。

2021-04-20 06:06:16

比特幣區(qū)塊鏈加密貨幣

練就火眼金睛識破云計算三大安全風(fēng)險
全球服務(wù)公司安永（Ernst&Young）近日表示，公司對云計算的投入應(yīng)用將會面臨三大風(fēng)險，它們分別是：數(shù)據(jù)泄漏、數(shù)據(jù)丟失和未經(jīng)授權(quán)的數(shù)據(jù)訪問。

2011-03-08 09:27:33

Windows 10火眼金睛一秒揪出元兇
為了幫助用戶查找解決電腦故障，微軟也是一直不遺余力。Windows10v1809的時候，就引入了一個名為“PacketMonitor”(數(shù)據(jù)包監(jiān)視器)的新功能，簡稱PacketMon，對應(yīng)進程為pktmon.exe。

2020-05-26 12:52:06

Windows 10 網(wǎng)絡(luò)故障

Linux火眼金睛：查找兩個目錄之間的差異
在本文中，我們將描述如何在Linux中找到兩個目錄之間的差異。

2021-03-19 11:05:50

Linux 目錄命令

搜狗輸入法“零錯行動” 火眼金睛糾錯字
6月22日，搜狗輸入法及旗下字媒體聯(lián)合教育部語言文字應(yīng)用管理司、共青團中央宣傳部、共青團北京市委，發(fā)起一場全民隨手拍錯字的“零錯行動“，呼吁大家關(guān)注社會語言環(huán)境，減少公共區(qū)域錯別字。

2017-06-23 17:18:56

互聯(lián)網(wǎng)

高達(dá)99.5%準(zhǔn)確率，火眼金睛的“鑒黃系統(tǒng)”背后技術(shù)大揭秘
悟空鑒黃系統(tǒng)在京東上線已一年多，在京東云上提供接口也有數(shù)月，同時服務(wù)于京東主圖、曬單圖及京東公有云網(wǎng)站的圖片審核，并向外部提供通用鑒黃功能。

2017-10-17 09:49:06

初學(xué)Tips - 為啥Flink的Java模塊需要Scala的版本后綴
用戶的眼光都是雪亮的，問題都是一針見血的，這問題也的的確確是Flink社區(qū)需要解決的，也發(fā)起了去掉Scala依賴的討論。

2022-06-13 12:43:13

Java 模塊

練就火眼金睛：Python助你一眼看穿社交媒體中的假新聞
假設(shè)你已經(jīng)用Python構(gòu)建了一個web抓取應(yīng)用程序，它收集了來自社交媒體網(wǎng)絡(luò)的所有新聞鏈接。你該如何知道這些網(wǎng)站上的信息是來自真實事件呢？

2020-07-08 13:26:47

Python

當(dāng)prompt策略遇上分治算法，南加大、微軟讓大模型煉成「火眼金睛」
為了使LLM更好地分辨并盡可能避免這種中間錯誤，來自南加州大學(xué)、微軟的研究者提出了一種基于分治算法的提示策略。這種策略利用分治程序來引導(dǎo)LLM。

2024-03-11 12:21:07

模型數(shù)據(jù)

找出軟件開發(fā)過程中的BUG，你需要火眼金睛
軟件開發(fā)過程中，BUG的出現(xiàn)似乎在所難免。不過如何才能發(fā)現(xiàn)BUG，處理BUG，似乎有時我們需要007邦德那樣的技巧。

2010-11-17 13:35:50

BUG

雨林木風(fēng)Linux罵聲一片用戶反擊針針見血
今天看到雨林木風(fēng)開源操作系統(tǒng)YlmfOS3.0評測，甚為欣喜，其中在國內(nèi)，真正有資金在做Linux的除了Redflag，就是雨林木風(fēng)了。至于Magic早已半死不活，而在distrowatch排名比較高的CDLinux，其主攻目標(biāo)并不在桌面。但是，在臺下，卻是罵聲一片。

2010-06-09 09:26:50

常見的linux問題解決答案針針見血
本文給大家列舉了十五個常見的linux問題解決答案，比如問題IDE2的主分區(qū)的第一個邏輯分區(qū)的設(shè)備代號，默認(rèn)的Linux文件格式等，本文都將給出詳細(xì)解答。

2009-10-27 10:48:26

linux問題解決

企業(yè)“入坑”大模型，為什么建議大廠出品？
大模型競爭激烈，企業(yè)用戶如果沒有練就一雙“火眼金睛”，很有可能踩坑，從而造成項目爛尾的后果。

2023-09-06 07:11:41

大模型人工智能

WindowsPhone誤區(qū) 你是不是也有這樣的錯誤認(rèn)識
本文的作者從WP開發(fā)者的角度，談了一下多數(shù)WP用戶的幾個誤區(qū)。這篇帖子在百度貼吧深受好評，它所提到的WindowsPhone誤區(qū)，一針見血，歡迎大家閱讀。

2013-04-07 10:17:54

WindowsPhon

Diffusion反饋強勢助力CLIP秒變火眼金睛！北京智源&中科院自動化所
本文分享論文DiffusionFeedbackHelpsCLIPSeeBetter，專注于通過自監(jiān)督學(xué)習(xí)范式解決CLIP無法區(qū)分細(xì)粒度視覺細(xì)節(jié)的問題。

2024-08-06 12:00:00

監(jiān)督學(xué)習(xí)視覺

如何練就需求分析的火眼金晴？
一個項目經(jīng)理如何做好需求分析工作？客戶要求什么就做什么的心態(tài)是錯誤的態(tài)度，我們該如何練就火眼金睛.

2011-12-20 09:23:09

企業(yè)想低成本上云?當(dāng)然不能錯過11.11最全省錢攻略!
51CTO記者幫各位整理了一份企業(yè)上云省錢攻略，幫您火眼金睛辨別一下誰家折扣力度最大，誰家優(yōu)惠含金量最高，誰家促銷最劃算!

2018-11-09 13:36:10

企業(yè)上云華為云

AI創(chuàng)業(yè)踩坑！YC合伙人警告：“僅僅在業(yè)務(wù)中調(diào)用OpenAI API，并不會改變創(chuàng)業(yè)公司的命運！”，建議創(chuàng)始人來灣區(qū)定居
AI賦予了一個人進化成“超級個體”的機會，也讓許多“一人公司”等小團隊實現(xiàn)高收入神話。然而，YC合伙人Brad一針見血地戳到痛處：AI創(chuàng)業(yè)并不像想象中那么簡單，不是ChatGPT的套殼就是一個好產(chǎn)品！

2025-02-03 13:18:01

AI OpenAI API

相似話題

機器學(xué)習(xí)
2031內(nèi)容

深度學(xué)習(xí)
1694內(nèi)容

自然語言處理
 110內(nèi)容

語音識別
 107內(nèi)容
全部話題

同話題下的熱門內(nèi)容

DeepSeek R2提前泄露？周二或周三發(fā)布？海外謠言一夜刷屏，HggingFace CEO一帖子引瘋狂猜想，DS又被消費了深夜突襲，阿里Qwen3登頂全球開源王座！暴擊DeepSeek-R1，2小時狂攬17k星 MCP 服務(wù)器很危險！這里有安全使用指南！剛剛，Qwen3強勢登頂，成開源新王！國內(nèi)首個混合推理模型，235B擊敗R1、o1!源神火力全開：全系列8個模型一口氣開源！Kimi-Audio開源橫掃全場景，1300萬+小時數(shù)據(jù)煉成語音世界“大一統(tǒng)”看不懂GitHub代碼？剛剛這個AI工具讓全球每個GitHub項目開口說話大模型應(yīng)用系列：兩萬字解讀MCP 一文詳解深度學(xué)習(xí)中的標(biāo)量、向量、矩陣、張量

相關(guān)專題更多

解讀惠普Z系列工作站ZBook Ultra G1a高性能移動

HPE ProLiant DL145 Gen11 服務(wù)器解讀

2025-04-21 09:59:50

開發(fā)者成長學(xué)院 | 成長有徑 · 代碼有方

2025-04-23 08:49:09

我收藏的內(nèi)容

微博

QQ

微信

復(fù)制鏈接

微信掃碼分享

51CTO業(yè)務(wù)

媒體
51CTO CIOAge HC3i Techplur
社區(qū)
51CTO博客軟考社區(qū)鴻蒙開發(fā)者社區(qū)AI.x社區(qū)
教育
51CTO學(xué)堂精培企業(yè)培訓(xùn)CTO訓(xùn)練營

51CTO學(xué)堂

51CTO學(xué)堂企業(yè)版

51CTO官微

51CTO

關(guān)于我們&條款

關(guān)于我們

新聞動態(tài)

站點地圖

意見反饋

English

用戶協(xié)議

隱私協(xié)議

北京市海淀區(qū)中關(guān)村南1條甲1號ECO中科愛克大廈6-7層

北京市公安局海淀分局備案編號：110108002980號
營業(yè)執(zhí)照京ICP備09067568號

Copyright ? 2005-2025 51CTO.COM 京ICP證060544 版權(quán)所有未經(jīng)許可請勿轉(zhuǎn)載

營業(yè)執(zhí)照出版物經(jīng)營許可證

友情鏈接

新浪科技騰訊科技網(wǎng)易科技鳳凰科技驅(qū)動科技科技行者 TechWeb 艾瑞網(wǎng)站長之家速途網(wǎng)中國經(jīng)濟新聞網(wǎng)IT之家工聯(lián)網(wǎng)極客公園 236視頻會議中國IDC圈企業(yè)網(wǎng)D1Net 投資界次方元火山引擎

51CTO技術(shù)棧公眾號

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

在線客服

媒體
51CTO CIOAge HC3i

社區(qū)
51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育
51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

感谢您访问我们的网站，您可能还对以下资源感兴趣：
自拍偷在线精品自拍偷