2025年4月29日凌晨,阿里巴巴正式開源了其新一代通義千問大模型Qwen3系列,這一發(fā)布不僅登頂全球開源模型性能榜首,更以創(chuàng)新的"混合推理"架構重新定義了大型語言模型的效率邊界。作為國內首個集成"快思考"與"慢思考"能力的開源模型,Qwen3在性能全面超越DeepSeekR1、OpenAIo1等頂尖模型的同時,將部署成本降低至競品的13。阿里巴巴還公開了兩個MoE模型的權重:Qwen3235BA22B和Qwen330BA3B。前者是一個具有2350億總參數(shù)和2200億...
背景信息近期前線人員反饋,在使用問答系統(tǒng)處理PPT文件時回答效果不佳。經(jīng)查發(fā)現(xiàn),用戶上傳的PPT內容多為圖文混排形式,包含大量圖像和統(tǒng)計圖表。用戶提問主要聚焦于圖表數(shù)據(jù)及其相互關系。我這里隨意在網(wǎng)上找了一個PPT做嘗試,這個PPT有一張圖如下所示:提問:"2017年大數(shù)據(jù)開發(fā)人數(shù)比2016年增加了還是減少了,具體增加或減少了多少人?"系統(tǒng)返回:根據(jù)提供的資源數(shù)據(jù),2017年大數(shù)據(jù)開發(fā)職位的招聘人數(shù)大幅增加。具體來說,201...
Ollama在人工智能技術迅猛發(fā)展的今天,大型語言模型(LLM)的應用越來越廣泛。Ollama作為一款創(chuàng)新的開源框架,為開發(fā)者和研究者提供了在本地環(huán)境高效部署和運行LLM的全新解決方案??缙脚_安裝指南Ollama支持主流操作系統(tǒng),安裝過程極為簡便:?Linux用戶可通過終端一鍵安裝:wgetOhttps:setup.ollama.aibash?macOS用戶推薦使用Homebrew:brewtapollamaollama&&brewinstall?Windows用戶可通過WSL輕松部署模型快速啟動示例啟動預...
當AI不僅能“看”圖,還能“用圖思考”,甚至自主調用工具解決現(xiàn)實中的復雜問題,人類與機器的協(xié)作邊界正在被重新定義。今天凌晨,OpenAI發(fā)布的兩款新模型o3和o4mini,不僅刷新了多項性能紀錄,更首次將圖像深度融入推理鏈條。顛覆性突破首次實現(xiàn)圖像思維鏈整合圖片OpenAI首次展示了其模型如何嵌入圖像進行理性分析的例子。該模型不僅具備“觀察”圖像的能力,更可以“用圖像推導”。這一創(chuàng)新使視覺和文字理解能力深度結合,在...
今天,國內AI行業(yè)迎來了一場震撼性的開源盛宴——智譜AI(ZhipuAI)一口氣免費開源了6款GLM系列大模型,涵蓋基座、推理、沉思三大類別,并細分9B和32B兩種參數(shù)量級。更令人振奮的是,其中GLMZ132B推理模型實測速度高達200tokens秒,登頂國內商用模型速度之最,而價格卻僅為DeepSeekR1的130,甚至部分版本完全免費商用!這一波操作,不僅讓開發(fā)者直呼“真香”,更讓行業(yè)開始思考:大模型的商用門檻是否正在被徹底打破?免費開源...
2025-04-16 07:06:16 1615瀏覽 0點贊 0回復 0收藏
北京時間4月15日凌晨,OpenAI毫無預兆地上線了GPT4.1系列模型!包含GPT4.1標準版、輕量級GPT4.1mini和極致性價比的GPT4.1nano三款模型,性能全面超越GPT4o,支持百萬級token上下文處理,價格卻更低。這一發(fā)布不僅讓開發(fā)者直呼“真香”,更標志著AI技術向實用化邁出關鍵一步。顛覆性突破性能全面碾壓前代,長文本理解史詩級升級百萬token上下文窗口:GPT4.1系列支持100萬tokens的上下文長度(相當于一本長篇小說的體量),是GPT4...
2025-04-16 07:05:56 689瀏覽 0點贊 0回復 0收藏
在人工智能技術日新月異的今天,昆侖萬維再次以驚人的創(chuàng)新力震撼業(yè)界——全新升級的SkyworkOR1(OpenReasoner1)系列中文推理大模型正式發(fā)布!這不僅是一次技術迭代,更是一場關于開源精神與AI普惠化的革命性突破。120參數(shù)量,比肩640B頂級模型SkyworkOR1系列最令人驚嘆的,莫過于其"以小博大"的卓越性能。據(jù)官方數(shù)據(jù)顯示,旗艦版本SkyworkOR132B雖然參數(shù)量僅為32B,卻能在多項基準測試中與參數(shù)量高達640B的DeepSeekR1打得有來有...
2025-04-16 07:05:05 812瀏覽 0點贊 0回復 0收藏
什么是元數(shù)據(jù)簡單來說,元數(shù)據(jù)就是"描述數(shù)據(jù)的數(shù)據(jù)"。它就像我們?yōu)橹R庫文檔貼上的各種標簽和屬性,例如文檔的保密等級、創(chuàng)建者、所屬類別等。每個文檔可以擁有多組這樣的描述信息。實際上,元數(shù)據(jù)早已滲透到我們日常生活的方方面面,只是大多數(shù)人并不熟悉這個專業(yè)術語而已。為了更好地理解這個概念,我們可以觀察一些常見例子。在計算機操作系統(tǒng)中,每個文件都包含一系列基礎屬性信息:文件格式、創(chuàng)建者、存儲大小、最后修改...
2025-04-14 08:25:45 1282瀏覽 0點贊 0回復 0收藏
Dify作為一款先進的AI應用開發(fā)平臺,其檢索增強生成(RAG)功能為知識管理提供了強大支持。本指南將詳細介紹如何利用該平臺搭建高效知識庫系統(tǒng)。在模型選擇方面,雖然本示例采用OpenAI的接口,但平臺同樣兼容各類本地化模型部署方案,如Ollama框架等。前置知識數(shù)據(jù)采集階段支持多格式文檔上傳接口智能文檔解析與內容提取內容結構化處理自適應文本分塊算法向量空間映射轉換高維索引存儲方案查詢響應機制語義向量實時計算多維度相似...
2025-04-09 12:23:06 5571瀏覽 0點贊 0回復 0收藏
就在4月6日凌晨,Meta毫無預兆地發(fā)布了Llama4,這是其開源大模型Llama系列的最新成員,也是迄今為止最強的開源多模態(tài)大模型!此次發(fā)布的Llama4系列包括Scout、Maverick和Behemoth三個版本,其中Scout和Maverick已開放下載,而Behemoth仍在訓練中,預計未來幾個月正式亮相。Meta首席執(zhí)行官馬克·扎克伯格在官方公告中激動地表示:“我們的目標是打造世界領先的AI,并將其開源,讓全球受益。今天,Llama4讓這一愿景更進一步!”下...
2025-04-07 06:35:31 1180瀏覽 0點贊 0回復 0收藏
去年在Dify還是0.x版本時,我曾用過一段時間。但就像很多技術愛好者一樣,因為工作變動不得不暫時擱置。最近收到不少讀者咨詢:"Dify現(xiàn)在發(fā)展到什么程度了?還值得投入學習嗎?"帶著這些疑問,我重新審視了Dify,發(fā)現(xiàn)其已經(jīng)發(fā)展到1.x版本,從一個"有趣玩具"開始轉變成"生產級工具"。我準備深入研究一下它,并計劃寫一個系列文章,從基礎使用到核心原理,再到個性化定制開發(fā)。今天先為大家?guī)鞤ify的全面介紹,后續(xù)會持續(xù)更新深...
2025-04-02 09:06:52 2675瀏覽 0點贊 0回復 0收藏
在人工智能技術日新月異的今天,Embedding模型作為連接非結構化數(shù)據(jù)與機器理解的橋梁,正在悄然重塑知識管理和智能檢索的邊界。本文將帶您深入探索這一技術核心,揭示如何通過精準選型突破知識庫與RAG系統(tǒng)的性能極限。一、Embedding技術1.1從離散符號到連續(xù)空間傳統(tǒng)數(shù)據(jù)處理面臨的根本困境在于:計算機天生擅長處理結構化數(shù)字,而人類信息卻以非結構化形式(文本、圖像、音頻等)自然存在。Embedding技術通過將離散符號映射到連...
2025-04-02 08:49:21 863瀏覽 0點贊 0回復 0收藏
今年DeepSeek的熱度以及KIMI、通義千問、豆包大模型的發(fā)展,推動了人們在遇到問題時依賴AI工具尋求答案的習慣。這些工具能提高效率并補充我們的知識空缺,使我們對"聯(lián)網(wǎng)搜索"越來越依賴,甚至減少了對傳統(tǒng)搜索引擎的需求。AI通過改寫用戶問題進行召回,最后總結并輸出收集的信息。結合GoogleSearch等互聯(lián)網(wǎng)搜索技巧,我們可以更有效地使用AI工具獲取滿足需求的答案。下面給出一些檢索的技巧,方便我們在日常使用中進行檢索。指...
2025-03-28 10:56:34 1305瀏覽 0點贊 0回復 0收藏
背景最近,公司的一個項目經(jīng)理找我聊了個頭疼的問題:他們給外部交付的項目POC效果不太理想,他發(fā)現(xiàn)從向量庫中檢索不到想要的信息。起初,我建議他換個更好的embedding模型,別再用??textembeddingada002???了。結果他反饋說,試了??textembedding3large???和??bgem3??,效果也沒啥顯著提升。我仔細看了他們的數(shù)據(jù),發(fā)現(xiàn)他們上傳了大量用戶的文檔,并對文檔進行了切分,分成一個個??chunk???,然后召回這些...
2025-03-25 10:23:46 1030瀏覽 0點贊 0回復 1收藏
凌晨1點,OpenAI的技術直播再次點燃了AI圈的熱情!這一次,OpenAI帶來了三款全新的語音模型,專為開發(fā)語音AIAgent而生。無論是開發(fā)者還是普通用戶,這場直播都值得你關注。相關地址API地址:https:platform.openai.comdocsguidesaudio展示地址:https:www.openai.fm三款語音模型,各有所長OpenAI此次發(fā)布的三款語音模型分別是:GPT4oTranscribe、GPT4MiniTranscribe和GPT4oMiniTTS。它們各司其職,為語音AIAgent的開發(fā)提供了強...
2025-03-24 13:03:58 1146瀏覽 0點贊 0回復 0收藏
在人工智能的浪潮中,每一次技術的突破都可能引發(fā)行業(yè)的巨變。2024年11月,Anthropic推出了一項名為MCP(ModelContextProtocol)的開放協(xié)議,這一協(xié)議旨在為大型語言模型(LLM)與外部數(shù)據(jù)和行為的連接提供一個通用的開放標準。今天,我們就來深入探討MCP的架構、功能及其對未來AI發(fā)展的潛在影響。MCP的核心架構MCP的設計理念是通過一個開放的協(xié)議,為外部工具或數(shù)據(jù)源提供與LLM交互的統(tǒng)一接口。其系統(tǒng)架構主要包含以下幾個關鍵...
2025-03-24 13:00:11 1677瀏覽 0點贊 0回復 0收藏
最近,AI圈子里有個詞兒特別火——Agent(智能體)。隨著大模型在推理與生成上的能力不斷提升,Agent技術也迎來了它的“高光時刻”。特別是3月初,Manus展示的多智能體Demo,直接讓整個行業(yè)沸騰了。緊接著,國內的DeepWisdomMetaGPT團隊和CAMELAI團隊也迅速跟進,開源了OpenManus和OWL,瞬間在社交媒體和GitHub上掀起了一股多智能體技術的熱潮。今天,我們就來聊聊這個開源項目OpenManus,看看它到底有什么魔力,能在短短幾天內...
2025-03-13 11:39:03 3855瀏覽 0點贊 0回復 0收藏
我們都知道,對于RAG(檢索增強生成)的項目來說,構建知識庫的過程常常包含文檔的解析。文檔的解析效果直接影響到知識庫的質量,進而影響問答系統(tǒng)的質量。因此,一款好的PDF解析工具對于RAG項目的成功至關重要。今天,向大家推薦一款由上海人工智能實驗室打造的智能文檔處理工具——MinerU。這款工具剛剛完成了新年大升級,在GitHub上已經(jīng)獲得了超過2.5萬星標,甚至連谷歌工程師都在安利!獲取MinerUMinerU官網(wǎng):https:mineru....
2025-03-10 08:12:24 4303瀏覽 0點贊 0回復 1收藏
最近,銷售團隊頻繁反饋一個問題:在給客戶演示時,我們的AI系統(tǒng)知識庫爬蟲表現(xiàn)不佳,輸入客戶的網(wǎng)頁地址后,往往什么都抓取不到,導致知識庫無法更新。作為技術負責人,我一開始也有些頭疼,畢竟我對爬蟲的了解還停留在Scrapy和Selenium的時代,覺得這些工具既復雜又耗時,于是干脆拒絕了銷售的需求。銷售團隊一度認為我們的爬蟲功能“雞肋”,直到我發(fā)現(xiàn)了這款好用的爬蟲工具——Crawl4AI。自從用上Crawl4AI,銷售團隊反饋說...
2025-03-10 08:12:03 4188瀏覽 0點贊 0回復 0收藏
在人工智能領域,每一次重大突破都能引發(fā)全球科技愛好者的熱烈討論。Anthropic公司發(fā)布的全新模型——Claude3.7Sonnet,無疑再次點燃了AI社區(qū)的熱情。作為全球首個混合推理模型,Claude3.7Sonnet不僅在編碼能力上實現(xiàn)了質的飛躍,還通過其獨特的“標準和擴展思考模式”重新定義了AI的推理方式。一個模型,兩種思考方式Claude3.7Sonnet的最大亮點在于其“一個模型,兩種思考方式”的設計理念。用戶可以根據(jù)需求選擇“標準模式”...
2025-03-03 07:32:12 2102瀏覽 0點贊 0回復 0收藏