自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

探索AGI
LV.4
專注于大模型agent的產(chǎn)品落地方向
聲望 449
關(guān)注 0
粉絲 2
私信
主帖 46
回帖
周末的時候,Anthropic發(fā)布了AgenticCoding的最佳實踐博客。今天給家人們分享一下具體的內(nèi)容,先揭秘一個它背后有點“反直覺”的小把戲,看看“高端的AI”是如何用上“樸素的ifelse”的,最后再帶給大家一波官方總結(jié)的實戰(zhàn)干貨!“ultrathink”的魔法與樸素的ifelse在博客中提到,如果你想讓Claude在處理復雜問題時“多想想”,可以在指令里加上"think"這個詞。想讓它想得更深?那就用"thinkhard"或者"thinkharder"。甚至還有一...
8天前 645瀏覽 0點贊 0回復 0收藏
嘿,大家好!這里是一個專注于前沿AI和智能體的頻道還記得Google剛出現(xiàn)時那種"真TM牛逼"的感覺么?到現(xiàn)在,當我們習慣了“問啥搜啥”的節(jié)奏,搜索引擎的革命又來了——不過這次,它不是為人類設計的!今天要介紹的Exa,是專為AIAgent打造的搜索引擎,重新定義AI時代的搜索基礎設施。2024年7月完成了2200萬美金的A輪融資,由Lightspeed領投,英偉達、YC等跟投,ARR超千萬美金。人類搜索VSAgent搜索:差別到底在哪?人類搜索:"機...
2025-04-10 06:40:23 1151瀏覽 0點贊 0回復 0收藏
SamAltman通過社交媒體宣布OpenAI將全面支持ModelContextProtocol(MCP),這意味著曾經(jīng)引領行業(yè)的OpenAI,最終還是向這一由競爭對手Anthropic主導的開放協(xié)議低頭了。OpenAI之前一直在推廣自己的FunctionCall、GPTs和AgentSDK,試圖建立自己的護城河。然而,隨著越來越多的開發(fā)者和企業(yè)選擇MCP,OpenAI不得不面對現(xiàn)實:標準之戰(zhàn)已經(jīng)落下帷幕,MCP贏了。a16z梳理的mcpmarketMCP已顯著壟斷了AIApps&Agents和Tools&DataSources之間...
2025-03-28 00:12:02 1429瀏覽 0點贊 0回復 0收藏
嘿,大家好!這里是一個專注于前沿AI和智能體的頻道DeepSeekV30324前天悄然發(fā)布,沒有任何預告和宣傳,卻因其極強的編碼能力,迅速火遍全網(wǎng)?;蛟S,它已成為目前最優(yōu)秀的"非推理"模型。編碼性能直追目前基本唯一可用的ClaudeSonnet3.7。到昨天晚上,官方終于發(fā)布公告,在LiveCodeBench編碼測試中,性能指標已超越ClaudeSonnet3.7。官網(wǎng)已更新至最新版模型,不開啟深度推理時,即使用的是這一最新版本。昨晚上,Google發(fā)布了Gemi...
2025-03-28 00:05:37 1555瀏覽 0點贊 0回復 0收藏
嘿,大家好!這里是一個專注于前沿AI和智能體的頻道Manus可能會成為一個導火索,引爆Agent的競爭。在過去的幾個月里,頭部AI公司紛紛發(fā)布了自己的“智能體”產(chǎn)品。目前來看,各家Agent產(chǎn)品各有側(cè)重,但我們開始看到兩條截然不同的技術(shù)路線:一類是基于工作流的“偽Agent”(如爆火但是很多人說的沒有護城河的Manus(該觀點不代表作者觀點)),它們本質(zhì)上是將LLM和工具通過預定義代碼路徑進行編排;另一類是基于端到端訓練的“...
2025-03-17 09:33:42 1377瀏覽 0點贊 0回復 0收藏
AgenticAI、AIAgents和Agents這三個詞頻繁出現(xiàn)在各大自媒體上。上周和朋友討論時,我們發(fā)現(xiàn)很容易把這三個術(shù)語混為一談。乍看之下,它們很相似,但它們并不可互換。但是可能理解他們的區(qū)別,似乎也并不重要,當一個事情所有人都模糊的時候,那就都是對的。從目前來看,真正的AgentAgentic產(chǎn)品,似乎在擺脫Agent的概念。比如說,AI編程、AI研究...過度強調(diào)Agent概念可能會讓用戶產(chǎn)生過高期待,而且堆砌高端的詞匯會拉遠用戶與產(chǎn)...
2025-03-05 11:25:12 2993瀏覽 0點贊 0回復 0收藏
繼谷歌、OpenAI和Perplexity相繼發(fā)布各自的DeepResearch后,牛津大學發(fā)布了一個“AgenticReasoning:ReasoningLLMswithToolsfortheDeepResearch”的工作,并且代碼開源了,今天咱們來詳細看看他們的deepresearch的玩法!這個框架,不僅在PhD級別的科學推理測試(GPQA)上超越了現(xiàn)有的RAG系統(tǒng)和閉源大模型,而且在金融、醫(yī)療和法律等領域的深度研究任務中,擊敗了谷歌的GeminiDeepResearch!為什么能做到這一點普通的推理模型只能依...
2025-02-25 13:17:01 1844瀏覽 0點贊 0回復 0收藏
嘿,大家好!這里是一個專注于AI智能體的頻道DeepSeek剛剛又發(fā)補給了,補給4件套。包含2個配置項,不要設置systemprompt+temperature設置為0.6。還有大家比較期待的官網(wǎng)的,接入搜索的R1的prompt設計及最佳用法!以及如何緩解R1系列模型繞過思考的解決辦法。在DeepSeek官網(wǎng)版本,沒有使用系統(tǒng)提示詞,而是為文件上傳和網(wǎng)絡搜索設計了兩個特定的提示詞以獲得更好的用戶體驗。并且temperature設置為0.6。對于文件上傳,請按照模板...
2025-02-17 09:36:35 1724瀏覽 0點贊 0回復 0收藏
嘿,大家好!這里是一個專注于AI智能體的頻道早上,OpenAI又在折騰了,現(xiàn)在o3mini支持思維鏈可視了!當然能看到的,既不是原始思維鏈的赤裸展示,也不再是完全的黑箱操作。圖片有限透明的技術(shù)妥協(xié)o3mini的思維鏈展示并非實時思維流,而是經(jīng)過三重過濾的精致產(chǎn)物:安全審查層:自動剔除涉及倫理爭議的推理片段(如怎么做炸藥)復雜性蒸餾:將數(shù)學證明過程壓縮為步驟大綱,保留結(jié)論但隱去關(guān)鍵參數(shù)多語言轉(zhuǎn)換:非英語用戶的思維鏈...
2025-02-07 13:30:28 1397瀏覽 0點贊 0回復 0收藏
嘿,大家好!這里是一個專注于AI智能體的頻道今天給家人們聊一期播客總結(jié),四十二章經(jīng)最新一期播客請到了在Meta工作了七年的應用強化學習組負責人朱哲清Bill。作為斯坦福大學強化學習專業(yè)博士,現(xiàn)在創(chuàng)業(yè)做Agent的他,拋出了一個巨大的反共識觀點:"LLM只是一個翻譯官,真正的Agent核心應該是RL。"等等,這是什么意思?在2024年,我們見證了GPT4掀起的Agent熱潮。Claude、GPTs、Copilot...幾乎所有大公司都在用LLM構(gòu)建Agent。但B...
2025-01-23 09:19:13 2570瀏覽 0點贊 0回復 1收藏
今天給家人們分享一下AgentLess,這個輿論比較高的研究工作。。AGENTLESS:DemystifyingLLMbasedSoftwareEngineeringAgentsAI編程在最近幾個月非?;馃?,像Devin這種自主Agent,已經(jīng)可以完成端到端的軟件開發(fā)任務。最新的Agent基本具備了使用工具、執(zhí)行命令、觀察環(huán)境反饋并規(guī)劃下一步行動的能力。但是,這些基于Agent的方法往往非常復雜,而且當前LLM的能力也存在局限性。這就引出了一個問題:我們真的需要如此復雜的自主Agent...
2025-01-14 12:57:53 1801瀏覽 0點贊 0回復 0收藏
嘿,大家好!這里是一個專注于AI智能體的頻道AI的“知識焦慮”很多時候,即使是最強大的AI模型,在面對復雜問題時也會顯得力不從心?它們仿佛擁有驚人的記憶力,卻無法真正理解知識背后的邏輯和關(guān)聯(lián)。這就像一個學霸,背誦了無數(shù)知識點,卻難以靈活運用。原因在于,傳統(tǒng)的AI模型(例如大模型)處理信息的方式,通常是將數(shù)據(jù)視為孤立的個體。它們無法像人類一樣,自然而然地捕捉到數(shù)據(jù)之間的關(guān)系,而這種關(guān)系正是理解知識的關(guān)鍵...
2025-01-06 11:08:03 2349瀏覽 0點贊 0回復 0收藏
嘿,大家好!這里是一個專注于AI智能體的頻道在a16z預測2025年的發(fā)展中,Agent占據(jù)了很重要的一個環(huán)節(jié)。昨天中金也發(fā)研報,表示看好Agent的發(fā)展趨勢。包括langchain發(fā)布的24年總結(jié)報告,Agent是持續(xù)保持增長的。所以25年,Agent或許值得期待?今天給家人們完全梳理一下Agent智能體的系統(tǒng),作為Agent入門指南(超長超長)!這篇文章會幫你理清頭緒,明確地告訴你智能體到底是什么,以及它們是怎么工作的。我們會拆解智能體的關(guān)鍵...
2024-12-26 13:11:27 2225瀏覽 0點贊 0回復 0收藏
AI編程,下半年火遍全網(wǎng),最近的Devin,以500美刀M的價格殺瘋了,早上openai2000刀訂閱的新聞也傳遍了各個微信群。cursor、windsurf、bold.new都逐漸的進入了實用的階段,未來對AI說“幫我寫個微信”這種需求,似乎也不太遙遠。今天給家人們分享的是AI編程賽道的獨角獸,Replit。背景早期流行的,如githubcopilot,國產(chǎn)的通義靈碼這些AI編程產(chǎn)品,在代碼補全和增量開發(fā)方面表現(xiàn)出色,所以獲得了比較大的市場。但是短期來看,AI...
2024-12-17 13:15:42 1910瀏覽 0點贊 0回復 0收藏
嘿,大家好!這里是一個專注于AI智能體的頻道!LlamaAgents和LangGraph,這兩個框架分別由llamaIndex團隊和langchain團隊開源,都是人工智能領域的熱門框架。首先看LlamaAgents的流程圖如下:在LlamaAgents中,用戶可以直接與controlplane交互,控制平面由一個協(xié)調(diào)器和一系列服務元數(shù)據(jù)組成。協(xié)調(diào)器負責決定下一步會發(fā)生什么,顯示出動態(tài)決策的能力。服務元數(shù)據(jù)則負責維護服務的元信息,確保信息的適當管理和檢索。LlamaAgents...
2024-12-13 14:06:23 2121瀏覽 0點贊 0回復 0收藏
嘿,大家好!這里是一個專注于AI智能體的頻道!今天分享一個針對RAG噪聲的綜述,中文標題為:潘多拉魔盒還是阿拉丁神燈:揭示RAG噪聲在大型語言模型中作用的綜合分析Pandora’sBoxorAladdin’sLamp:AComprehensiveAnalysisRevealingtheRoleofRAGNoiseinLargeLanguageModels檢索增強生成(RAG)已成為解決大型語言模型(LLMs)幻覺問題的關(guān)鍵方法。盡管近期研究已將RAG模型擴展到復雜的噪聲場景中,但這些探索往往局限于有限的噪...
2024-12-06 07:19:18 1981瀏覽 0點贊 0回復 0收藏
嘿,大家好!這里是一個專注于AI智能體的頻道今天給大家分享一個新研究,前頂會AAAI主席SubbaraoKambhampati發(fā)布的論文。能夠規(guī)劃一系列行動以實現(xiàn)預期目標,長期以來被認為是智能體的核心能力之一,并自人工智能研究之初便成為其不可或缺的一部分。隨著大型語言模型(LLMs)的出現(xiàn),關(guān)于它們是否具備這種規(guī)劃能力的問題引起了廣泛關(guān)注。我們于2022年開發(fā)的可擴展基準測試PlanBench,緊隨GPT3的發(fā)布推出,至今仍是評估LLMs規(guī)劃...
2024-11-28 15:27:46 1752瀏覽 0點贊 0回復 0收藏
嘿,大家好!這里是一個專注于AI智能體的頻道今天給家人們分享一些智能體應用的目前的一些好的消息。今年在AI開發(fā)工具領域有一個逐漸興起的觀點:具有更好"AI計算機交互接口"的工具,將有比較大希望能解決AIAgent的可靠性和準確性問題。目前這種趨勢已經(jīng)在多個產(chǎn)品中體現(xiàn)出來,比如E2B平臺(??https:github.come2bdevE2B??),以及由JeremyHoward發(fā)起、現(xiàn)在被Anthropic采用的llms.txt文檔規(guī)范。最新Vercel也推出了一個通用的A...
2024-11-21 14:02:46 1974瀏覽 0點贊 0回復 0收藏
近期,微軟推出了一款創(chuàng)新性的通用MultiAgent框架——MagenticOne。這個開源項目致力于處理各類復雜的開放性任務,涵蓋范圍包括網(wǎng)絡瀏覽操作、本地文件管理、Python代碼編寫與執(zhí)行、市場研究分析以及學術(shù)論文撰寫等多個方面。該框架由五個核心智能體構(gòu)成:總體協(xié)調(diào)的Orchestrator、負責網(wǎng)絡任務的WebSurfer、管理文件系統(tǒng)的FileSurfer、專注編程的Coder,以及處理終端操作的ComputerTerminal。在這個體系中,Orchestrator作為核...
2024-11-14 15:54:56 2360瀏覽 0點贊 0回復 0收藏
在與用戶進行自然對話交互時,智能體需要完成兩個核心任務:一是進行對話交流,二是執(zhí)行推理與規(guī)劃。智能體在對話過程中,需要綜合利用所有可獲取的信息來做出回應,同時其行為要始終圍繞目標展開。這種對話交互與多步推理規(guī)劃的雙重模式,與卡尼曼所描述的人類快速和緩慢思維系統(tǒng)頗為相似?;谶@一理念,DeepMind團隊開發(fā)了一個雙系統(tǒng)框架,稱為TalkerReasoner,旨在模仿人類的這兩種思維模式。為了實現(xiàn)智能體與用戶之間的自...
2024-11-08 15:02:46 2021瀏覽 0點贊 0回復 0收藏
獲得成就
已積累 2.3w 人氣
獲得 1 個點贊
獲得 2 次收藏