軟件安裝總共需要安裝三個軟件,分別為Ollama、DockerDesktop、OpenWebUIOllama介紹:Ollama是一款開源工具,專注于簡化大型語言模型(LLM)在本地環(huán)境中的部署與運行。它支持多種主流模型(如Llama3、Mistral、Gemma等),提供跨平臺兼容性(macOSLinuxWindows),通過命令行實現(xiàn)快速安裝與交互。其核心優(yōu)勢在于隱私保護(數(shù)據(jù)無需上傳云端)和可定制性,允許用戶微調(diào)模型參數(shù)或加載自定義模型。開發(fā)者和研究者可借助其輕量化...
2025-03-18 23:20:51 1467瀏覽 0點贊 0回復 0收藏
今天在看DeepseekR1的技術(shù)報告,看到rewardhacking不懂,于是分別問了kimi長思考和deepseek深度思考功能。kimi推理及結(jié)果:Deepseek的推理及結(jié)果:RewardHacking(獎勵漏洞)可以理解為:一個系統(tǒng)為了“刷分”而鉆規(guī)則的空子,結(jié)果雖然分數(shù)很高,但實際效果卻跑偏了。就像學生為了考高分只背題不學知識,或者游戲玩家用漏洞刷分但破壞了游戲體驗。舉個栗子??假設你訓練一個清潔機器人,規(guī)則是“每撿一件垃圾得1分”。結(jié)果機器人...
2025-02-08 14:11:15 2204瀏覽 0點贊 0回復 0收藏
本篇文章來自Anthropic,我用大模型給翻譯了一下,以下是全文。過去一年里,我們與數(shù)十個團隊合作,跨行業(yè)構(gòu)建大型語言模型(LLM)智能體。通常,最成功的實施案例并不是使用復雜的框架或?qū)iT的庫。相反,它們是用簡單、可組合的模式來構(gòu)建的。在這篇文章中,我們分享了從與客戶合作及自行構(gòu)建智能體中學到的經(jīng)驗,并為開發(fā)者提供了構(gòu)建高效智能體的實用建議。什么是智能體?“Agent”可以通過多種方式定義。一些客戶將智能體定...
2025-01-24 10:36:07 7472瀏覽 0點贊 0回復 0收藏
1.通義PPT創(chuàng)作體驗最近在研究知識圖譜,搜集網(wǎng)上資料和理解,寫了一篇學習筆記剛好看到通義千問里面有一套效率工具,其中就有PPT創(chuàng)作,于是拿著學習筆記試試PPT生成的效果。首先我選擇的是上傳文件生成PPT,當然你也可以寫一句話生成主題PPT生成過程如下圖所示,整體操作非常簡單。開始創(chuàng)作上傳文件生成PPT選擇要上傳的具體文件,支持的格式非常多等待生成大綱?編輯生成的大綱?選擇模板生成完成,看看效果生成過程:根據(jù)文件...
2025-01-15 12:50:22 1587瀏覽 0點贊 0回復 0收藏
什么是RAG?RAG的全稱是檢索增強生成(RetrievalAugmentedGeneration,簡稱RAG),它結(jié)合了檢索和和生成技術(shù),通過整合檢索系統(tǒng)和生成模型的優(yōu)勢,來提升模型生成文本的質(zhì)量和上下文相關(guān)性。這種技術(shù)主要是為了解決生成式模型在面對需要具體、實時或領(lǐng)域?qū)I(yè)知識時可能產(chǎn)生的準確性不足和上下文不敏感的問題。即它先根據(jù)外部知識庫搜索到的信息來作為上下文,再來輔助模型回答問題,使得模型的回答更準確。比如你想做一個智能助...
2025-01-07 11:41:18 1872瀏覽 0點贊 0回復 0收藏
本篇文章參考吳恩達大佬的推文,做了一些補充。對于AI產(chǎn)品管理最佳實踐,他認為可總結(jié)為以下三點:使用具體示例來明確AI產(chǎn)品需求、通過提示工程和RAG初步驗證產(chǎn)品的技術(shù)可行性、在V0、Bolt等AICode工具幫助下,產(chǎn)品經(jīng)理獨立實現(xiàn)原型系統(tǒng),從而快速推到市場,拿到用戶反饋。AI產(chǎn)品管理正迅速發(fā)展。生成式AI和基于AI的開發(fā)者工具的興起,為構(gòu)建AI應用創(chuàng)造了眾多機遇。這使得構(gòu)建新型事物成為可能,進而推動了產(chǎn)品管理最佳實踐的轉(zhuǎn)...
2024-12-27 13:56:29 1780瀏覽 0點贊 0回復 0收藏
前言在微博看到有i陸三金大佬發(fā)了OpenAI、Anthropic兩家公司的首席產(chǎn)品官的同臺訪談,看倆人討論如何在生成式AI的不確定性下做產(chǎn)品。提取了一下要點,有興趣可以去看原視頻:在模型被訓練出來之前,每個人都不知道模型會怎么樣,會涌現(xiàn)哪些能力,研究團隊也不知道,它的性能是60%、90%還是99%,而基于每一種情況去構(gòu)建產(chǎn)品又很不一樣。OpenAICPO:很多事情在60%的情況下已經(jīng)可以做,只是你要針對性的做產(chǎn)品。AnthropicCPO:與客...
2024-12-19 11:45:21 2551瀏覽 0點贊 0回復 0收藏
?前言依稀記得十年前,我在上遙感概論專業(yè)課時,老師帶我們用ERDASIMAGINE遙感圖像處理軟件做地物分類,每個人電腦上先發(fā)一段區(qū)域的遙感影像,進行人工判讀和標注,比如把這個區(qū)域影像上的林地標注出來喂給模型,再用這個模型去識別另外一個區(qū)域影像中的林地,機器學習中典型的的有監(jiān)督學習應用。大概5年前,在和公司研發(fā)人員閑聊時,聊到公司在做的“三調(diào)”項目,公司數(shù)據(jù)工程師當時正日夜對著國家下發(fā)的衛(wèi)星影像,進行地物分...
2024-12-09 10:47:58 3945瀏覽 0點贊 0回復 0收藏
大語言模型(LLM)通常被優(yōu)化用來回答人們的問題。但是現(xiàn)在有一個趨勢是模型也在被優(yōu)化以適應智能體工作流程。這將大大提升智能體的性能!在ChatGPT在問答方面取得突破性成功之后,大量的LLM開發(fā)都集中在提供良好的消費者體驗上。因此,LLM被調(diào)教來回答問題("為什么莎士比亞要寫《麥克白》?")或遵循人類提供的指令("解釋為什么莎士比亞寫了《麥克白》")。指令微調(diào)數(shù)據(jù)集中的很大一部分都在引導模型為人類編寫的問題和指令提...
2024-11-29 15:17:01 1648瀏覽 0點贊 0回復 0收藏
首先說下背景,我是個非技術(shù)出身的產(chǎn)品經(jīng)理,除了PM平時工作中所需要掌握的技術(shù)常識和概念之外,我只自學過一些前端和python技術(shù)知識,沒有實戰(zhàn)項目經(jīng)驗,可以說是幾乎沒有任何的程序開發(fā)經(jīng)歷。之前在網(wǎng)上看到有些編程小白使用ChatGPT生成代碼寫出了瀏覽器插件工具。心想要不我也試試?正好我需要寫一個程序來幫忙爬取項目招標信息進行市場分析,借助最近比較火的kimi大模型來試試。在整個和kimi“結(jié)對編程”的過程中,我問了不...
2024-11-22 12:09:38 2489瀏覽 0點贊 0回復 0收藏