自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="1ntdn"></sub>

^{<sub id="1ntdn"></sub>}

<sup id="1ntdn"></sup>

<style id="1ntdn"></style>

<blockquote id="1ntdn"><rt id="1ntdn"></rt></blockquote>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

小模型和開源正在成為AI發(fā)展的變數(shù) 原創(chuàng)

51CTO技術(shù)棧

發(fā)布于 2024-8-5 13:38

瀏覽

0收藏

編譯丨諾亞

出品 | 51CTO技術(shù)棧（微信號：blog51cto）

在IT行業(yè)，“精益”常用來描述追求更高效率和成本效益的流程，生成式AI也不例外。一些企業(yè)的AI系統(tǒng)運(yùn)行成本高達(dá)數(shù)百萬美元，并消耗大量電力，促使企業(yè)尋求更高效、精益的AI解決方案。

企業(yè)自然傾向于借助公共云快速部署生成式AI，因其提供便捷的一站式服務(wù)。大型云服務(wù)商已從AI投資中獲益。但使用云服務(wù)的成本有時會超過傳統(tǒng)數(shù)據(jù)中心，盡管如此，企業(yè)仍在尋找有效降低成本的方法，這正是精益AI概念的意義所在。

1.精益AI是如何工作的

精益人工智能是一種戰(zhàn)略方法，強(qiáng)調(diào)在交付最大商業(yè)價值的同時注重效率、成本效益以及最小資源消耗。許多精益人工智能的方法借鑒了最初用于制造業(yè)和產(chǎn)品開發(fā)的精益管理方法。

精益人工智能側(cè)重于優(yōu)化人工智能系統(tǒng)的開發(fā)、部署和運(yùn)營。它采用較小的模型、迭代開發(fā)實踐以及資源高效的技巧來減少浪費(fèi)。通過優(yōu)先考慮敏捷的數(shù)據(jù)驅(qū)動決策制定和持續(xù)改進(jìn)，精益人工智能使企業(yè)能夠以可持續(xù)且可擴(kuò)展的方式利用人工智能的力量。這確保了人工智能計劃既具有影響力又經(jīng)濟(jì)可行。

如今，企業(yè)意識到更大的并不總是更好的。企業(yè)人工智能轉(zhuǎn)型的景觀由小型語言模型（SLM）和一波開源進(jìn)展所標(biāo)志。這種演變是對生成式人工智能系統(tǒng)使用大型語言模型（LLM）所帶來的高昂成本和資源需求的一種直接回應(yīng)。許多企業(yè)現(xiàn)在希望重新評估成本與商業(yè)價值之間的平衡。

2.大型語言模型的挑戰(zhàn)

像OpenAI的GPT-4和Meta的Llama這樣的大型語言模型在理解和生成人類語言方面展示了非凡的能力。然而，這些優(yōu)勢伴隨著許多越來越難以讓企業(yè)接受的挑戰(zhàn)。這些模型的計算需求及其相應(yīng)的云成本非常高，給預(yù)算帶來壓力并限制了更廣泛的采用。還有能源消耗的問題，這不僅帶來了財務(wù)負(fù)擔(dān)，也帶來了重大的環(huán)境影響。

操作延遲是另一個障礙，特別是對于需要實時響應(yīng)的應(yīng)用程序而言。我們也不應(yīng)忽視管理和維護(hù)這些龐大模型的復(fù)雜性，這些模型需要專門的專業(yè)知識和基礎(chǔ)設(shè)施，而并非所有組織都具備這些條件。

3.轉(zhuǎn)向小型語言模型

在這種背景下，小型語言模型被加速用于生成式人工智能在云端和非云端環(huán)境中的部署。它們正越來越多地被視為實用的選擇。小型語言模型旨在顯著降低計算資源需求和能源消耗。這意味著更低的運(yùn)營成本和更具吸引力的人工智能計劃投資回報率。更快的訓(xùn)練和部署周期也使得小型語言模型對那些需要在快節(jié)奏市場中保持敏捷性和響應(yīng)性的企業(yè)更具吸引力。

企業(yè)通常不會使用大型語言模型，所以建議它們這樣做是不現(xiàn)實的。相反，它們將構(gòu)建更有針對性的人工智能系統(tǒng)來解決特定的應(yīng)用場景，例如設(shè)備維護(hù)、運(yùn)輸物流和制造優(yōu)化等領(lǐng)域，在這些領(lǐng)域中，精益人工智能方法可以立即產(chǎn)生商業(yè)價值。

小型語言模型還加強(qiáng)了定制化。這些模型可以針對具體任務(wù)和行業(yè)領(lǐng)域進(jìn)行精細(xì)調(diào)整，產(chǎn)生專業(yè)應(yīng)用并產(chǎn)生可衡量的商業(yè)成果。無論是在客戶服務(wù)、金融分析還是醫(yī)療診斷領(lǐng)域，這些更精簡的模型都證明了自己的有效性。

4.開源的優(yōu)勢

開源社區(qū)一直是推動小型語言模型進(jìn)步和采用的驅(qū)動力。Meta的新版本Llama 3.1提供了多種大小選項，能夠在不過度消耗資源的情況下提供強(qiáng)大的能力。其他模型，如斯坦福大學(xué)的Alpaca和Stability AI的StableLM，表明小型模型的表現(xiàn)可以媲美甚至超越其大型對手，尤其是在特定領(lǐng)域的應(yīng)用中。

來自Hugging Face、IBM的Watsonx.ai等公司的云平臺和工具使得這些模型更容易獲取，并降低了各類企業(yè)的入門門檻。這種人工智能能力的民主化是一個游戲規(guī)則改變者。更多的組織可以在不依賴專有且往往價格昂貴的解決方案的情況下融入先進(jìn)的人工智能技術(shù)。

5.企業(yè)的轉(zhuǎn)變

采用小型語言模型對企業(yè)來說有多重好處：

成本效益：這些模型讓企業(yè)能以更低的成本部署人工智能，這對需要最大化技術(shù)投資的初創(chuàng)公司和中小企業(yè)尤為重要。
敏捷性提升：更快的部署速度和更靈活的定制能力確保AI功能更好地適應(yīng)不斷變化的業(yè)務(wù)需求。
數(shù)據(jù)隱私與主權(quán)：在本地或私有云部署小型模型可以更好地保護(hù)數(shù)據(jù)隱私，滿足監(jiān)管要求并確保數(shù)據(jù)安全。
可持續(xù)發(fā)展：較低的能源消耗支持企業(yè)的環(huán)保目標(biāo)。

借助開源創(chuàng)新，小型語言模型降低了大型AI系統(tǒng)的成本和復(fù)雜度，為企業(yè)提供了高效、可定制的路徑。這種轉(zhuǎn)變提高了AI投資的價值，并促進(jìn)了可持續(xù)且可擴(kuò)展的增長。在可持續(xù)且經(jīng)濟(jì)實惠的人工智能領(lǐng)域，小型模型正變得越來越重要。

參考鏈接：https://www.infoworld.com/article/3480593/small-language-models-and-open-source-are-transforming-ai.html

本文轉(zhuǎn)載自??51CTO技術(shù)棧??，作者：諾亞

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

系統(tǒng)回顧生成式AI的發(fā)展：GANs、GPT、自編碼器、擴(kuò)散模型和Transformer系列

angel ? 3854瀏覽 ? 0回復(fù)
小即是大？HuggingFace CEO預(yù)測小模型元年將至，將成為AI的下一個“大事件”

51CTO技術(shù)棧 ? 2676瀏覽 ? 0回復(fù)
大佬怎么看OpenAI 和Google 本周相繼發(fā)布的模型及未來發(fā)展的？

angel ? 2368瀏覽 ? 0回復(fù)
一文回顧生成式AI的發(fā)展：GANs、GPT、自編碼器、擴(kuò)散模型和Transformer系列

angel ? 3035瀏覽 ? 0回復(fù)
小扎深夜炸場！Meta首個開源多模態(tài)模型Llama 3.2橫空出世，能力不輸GPT4o-mini；小扎：開源的拐點(diǎn)來了！

51CTO技術(shù)棧 ? 2906瀏覽 ? 0回復(fù)
OpenAI離不開微軟，但Anthropic正在成為新寵

51CTO技術(shù)棧 ? 1741瀏覽 ? 0回復(fù)
微軟、Anthropic正在拉滿大模型的情緒價值

51CTO技術(shù)棧 ? 2164瀏覽 ? 0回復(fù)
騰訊發(fā)布全新混元大模型Hunyuan-Large：全球最大開源Transformer模型，助力AI發(fā)展新高度

Halo咯咯 ? 2303瀏覽 ? 0回復(fù)
人工智能智能體(AI Agent)發(fā)展趨勢2024年總結(jié)與2025年展望

十一月雨_55 ? 8315瀏覽 ? 0回復(fù)
AI 發(fā)展是否正在放緩？AI 發(fā)展將駛向何方？

Baihai_IDP ? 1971瀏覽 ? 0回復(fù)
代理AI是AI發(fā)展的新前沿

51CTO內(nèi)容精選 ? 1540瀏覽 ? 0回復(fù)
【萬字長文】深度剖析：RAG、AI Agent與Agentic RAG的融合發(fā)展|值得收藏

Halo咯咯 ? 3711瀏覽 ? 0回復(fù)
AI 大模型：產(chǎn)業(yè)變革的引擎與未來發(fā)展的關(guān)鍵路徑

AI算力補(bǔ)給站 ? 1691瀏覽 ? 0回復(fù)
英偉達(dá)全力發(fā)展AI Agent！開源專屬大模型，最強(qiáng)AI工廠

Aceryt ? 1305瀏覽 ? 0回復(fù)
AMD開源30億小參數(shù)模型，媲美Qwen-2.5

Aceryt ? 1221瀏覽 ? 0回復(fù)
AI浪潮下，對DeepSeek發(fā)展的哲學(xué)新思考

51CTO內(nèi)容精選 ? 1202瀏覽 ? 0回復(fù)
千億模型做不到的事，7B小模型實現(xiàn)了？阿里這次開源有點(diǎn)狠！

蜂耘網(wǎng)iphoneyun ? 1170瀏覽 ? 0回復(fù)
不再只是建議：Augment Agent 想成為真正幫你干活的 AI 開發(fā)伙伴！

墨風(fēng)如雪小站 ? 1905瀏覽 ? 0回復(fù)
忘掉 Manus 模型上下文協(xié)議MCP 正在重新定義智能體的未來

數(shù)字化助推器 ? 1031瀏覽 ? 0回復(fù)

51CTO技術(shù)棧

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

微軟突然封鎖Cursor，全面禁用C、C++、C#擴(kuò)展，網(wǎng)友：理解微軟，Cursor白嫖VSCode 0回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇：企業(yè)級智能知識庫搜索問答技術(shù)與應(yīng)用

下一篇：美國國防部大刀闊斧，啟動AI項目：將老舊C代碼全部轉(zhuǎn)換為Rust

社區(qū)精華內(nèi)容

目錄

<cite id="8jzkn"></cite>