?OpenAI的o1系列和DeepSeekR1的成功充分證明,大規(guī)模強化學(xué)習(xí)已成為一種極為有效的方法,能夠激發(fā)大型語言模型(LLM)的復(fù)雜推理行為并顯著提升其能力。然而,這些推理模型的核心訓(xùn)練方法在其技術(shù)報告中仍然鮮有披露。近期社區(qū)的主要工作也僅局限于數(shù)學(xué)推理領(lǐng)域,使得跨領(lǐng)域泛化這一挑戰(zhàn)依然未得到充分探索。此外,GRPO訓(xùn)練過程中存在多項常見問題,如性能瓶頸、樣本利用效率低下,以及在處理混合領(lǐng)域數(shù)據(jù)集時難以培養(yǎng)專業(yè)推理...
6天前 594瀏覽 0點贊 0回復(fù) 0收藏
?ICLR(InternationalConferenceonLearningRepresentations)是人工智能領(lǐng)域頂級學(xué)術(shù)會議之一,主要聚焦于深度學(xué)習(xí)及其在表示學(xué)習(xí)(representationlearning)方面的最新研究進展,是學(xué)術(shù)界和工業(yè)界展示最前沿機器學(xué)習(xí)成果的重要平臺。ICLR2025將于4月24日至28日在新加坡博覽中心舉行,本屆論文錄用結(jié)果揭曉,本次大會共收到11672篇有效投稿,最終有3706篇論文中稿,錄取率為31.75%。logo快手憑借其在深度學(xué)習(xí)算法研發(fā)領(lǐng)域的持...
6天前 756瀏覽 0點贊 0回復(fù) 0收藏
快手靜態(tài)部署托管服務(wù)(KFX)歷經(jīng)四年發(fā)展,經(jīng)歷了三個階段,一步步從勉強能行車的“崎嶇土路”到現(xiàn)在多車道并行的“平坦高速”,這一轉(zhuǎn)變極大地提升了資源利用率和效率,滿足業(yè)務(wù)的實際需要。本文將帶你了解其背后的演進歷程。一、KFX前端通用靜態(tài)托管服務(wù)KFX是什么:KFX是快手前端通用靜態(tài)托管服務(wù)。為什么要有KFX?靜態(tài)托管服務(wù)是前端工程化發(fā)展的必然結(jié)果??焓智岸瞬渴鸬陌l(fā)展大致經(jīng)歷了這三個階段:1.直接在物理機上部署ng...
2025-02-26 19:50:52 1492瀏覽 0點贊 0回復(fù) 0收藏
小程序是一種運行在快手生態(tài)內(nèi),無需下載安裝、即用即走的輕量級應(yīng)用。其中,模擬器是快手開發(fā)者所使用的工具中最核心的模塊之一,但因性能問題收到開發(fā)者反饋。為此,24年Q2快手啟動了模擬器性能優(yōu)化專項,從線上數(shù)據(jù)看:模擬器秒開率從18%提升至64%,F(xiàn)CPP90從4.4s提升至1.9s。本文詳細介紹優(yōu)化措施和成效。一、問題背景小程序是快手開放平臺對外提供的開放能力之一,是一種運行在快手生態(tài)內(nèi),無需下載安裝、即用即走的輕量級...
2025-02-26 14:58:29 1629瀏覽 0點贊 0回復(fù) 0收藏
引言:本文將全面且深入地解析BlazeRangePartitioning算子的Native實現(xiàn)過程。相較于原生Spark,RangePartitioning的Native實現(xiàn)在執(zhí)行時間上達到了30%的顯著下降,同時在資源開銷方面節(jié)省了高達76%。這一改進大幅降低了運行成本,展現(xiàn)了Native實現(xiàn)帶來的巨大優(yōu)勢。一、算子描述RangePartitioning是shufflepartitioning的一種分區(qū)類型。它通過根據(jù)數(shù)據(jù)的值范圍將數(shù)據(jù)劃分成多個分區(qū)。每個分區(qū)包含特定范圍內(nèi)的值,通常用于處理有...
2025-02-21 16:36:46 1520瀏覽 0點贊 0回復(fù) 0收藏
導(dǎo)讀:快手動效Vision平臺為解決動效資源交付問題,引入了動效資源準入準出檢測機制。通過分析現(xiàn)有交付流程的痛點,平臺增加了了靜態(tài)和動態(tài)檢測服務(wù),確保動效質(zhì)量與性能。該套系統(tǒng)已成功召回并預(yù)防了多次線上問題,提升了使用動效資源的穩(wěn)定性和效率。一、引言在系列文章的首篇??《快手前端動效大揭秘:告別低效,vision平臺來襲!》(點擊回顧)???中,我們探討了Vision平臺的整體架構(gòu)和演進思路,特別是針對動效生產(chǎn)成...
2025-02-21 14:52:13 1454瀏覽 0點贊 0回復(fù) 0收藏
KwaiCoder23BA4v1是快手Kwaipilot團隊最新開源的自研代碼續(xù)寫大模型,模型的訓(xùn)練依托于Kwaipilot團隊提出的一種高效的模型訓(xùn)練方案。通過結(jié)合模型剪枝、知識蒸餾、細粒度合并等技術(shù),相比傳統(tǒng)方法以130的成本完成了23B寬MoE架構(gòu)代碼續(xù)寫模型的訓(xùn)練,并在多個代碼領(lǐng)域評測集上實現(xiàn)了新的SOTA。開源地址:??https:huggingface.coKwaipilotKwaiCoder23BA4Bv1??我們的路徑:高質(zhì)量數(shù)據(jù):我們強調(diào)篩選和整理高質(zhì)量代碼、文本與合...
2025-01-24 15:04:35 1960瀏覽 0點贊 0回復(fù) 0收藏
導(dǎo)讀:在上一篇文章中,我們詳細介紹了Vision動效平臺的渲染引擎——Crab,并分享在復(fù)雜動效渲染場景下積累的實踐經(jīng)驗和精彩案例。今天,我們將揭秘如何將「動效描述翻譯為動效代碼」——從Lottie導(dǎo)出CSSAnimated代碼。一、項目背景在進行前端頁面開發(fā)中,經(jīng)常需要涉及到元素動效的開發(fā),比如按鈕的呼吸狀態(tài)動效,彈窗的出現(xiàn)和消失動效等等,這些動效為用戶在頁面交互過程中獲得良好的體驗起到重要的作用。要開發(fā)這些動效,一般...
2024-12-31 17:02:32 1723瀏覽 0點贊 0回復(fù) 0收藏
導(dǎo)讀:在上一篇文章中,我們?nèi)轿坏亟馕隽丝焓諺ision動效平臺的整體架構(gòu)及其演進思路。快手前端動效大揭秘:告別低效,vision平臺來襲!?????今天,我們將進一步深入,詳細介紹Vision動效平臺的渲染引擎——Crab,并分享在復(fù)雜動效渲染場景下積累的實踐經(jīng)驗和精彩案例。?一、項目背景?1.1快手大型活動中的動效動效在設(shè)計和用戶體驗領(lǐng)域中有重要的價值,表現(xiàn)力強的動效不僅能夠激發(fā)受眾用戶的興趣,提高參與度,還能提高...
2024-12-31 14:48:54 2206瀏覽 0點贊 0回復(fù) 0收藏
一、系統(tǒng)軟件技術(shù)的核心價值與面臨挑戰(zhàn)系統(tǒng)軟件作為軟件架構(gòu)的基石,扮演著連接軟件與硬件的橋梁角色,位于整個軟件生態(tài)的最底層,處于關(guān)鍵核心的位置。系統(tǒng)軟件最為顯著的特征在于其規(guī)模效應(yīng),隨著服務(wù)器體量的增加,系統(tǒng)軟件研發(fā)的價值愈發(fā)凸顯。首先,系統(tǒng)軟件技術(shù)能夠顯著提升服務(wù)器資源的利用率,實現(xiàn)翻倍效果,同時性能也能提升30%~50%,從而大幅降低公司的服務(wù)器資源成本。其次,專業(yè)的系統(tǒng)軟件團隊能夠迅速定位并解決...
2024-12-31 11:42:51 1794瀏覽 0點贊 0回復(fù) 0收藏
一、背景介紹1.1頁面性能優(yōu)化的價值與意義在業(yè)務(wù)迅猛發(fā)展的時代,用戶體驗已成為企業(yè)成功的關(guān)鍵因素之一,而頁面性能則是塑造用戶體驗的核心要素。早在十多年前,亞馬遜就已經(jīng)意識到頁面加載速度對商業(yè)成果的深遠影響:亞馬遜支付頁面每增加100毫秒的延遲,可能減少1%有效轉(zhuǎn)化。頁面加載時間的延長和交互操作的不流暢性,不僅會損害用戶體驗,還可能導(dǎo)致轉(zhuǎn)化率下降和用戶流失等后果。在快手商業(yè)化團隊,我們深知頁面性能對提升...
2024-12-13 11:58:59 1853瀏覽 0點贊 0回復(fù) 0收藏
導(dǎo)讀:動效平臺作為快手舉辦大型線上活動的堅實后盾,發(fā)揮著承上啟下的關(guān)鍵作用。本篇文章將全方位地為您呈現(xiàn)Vision動效平臺的整體架構(gòu)及其演進思路,為您揭開這一強大平臺的神秘面紗。一、前言本系列文章從我們在Vision動效平臺中做的一些工作為切入點,計劃通過多篇文章全面展現(xiàn)我們的工作成果。首篇將闡述Vision動效平臺的整體演進思路,聚焦于平臺的核心能力,為讀者勾勒出我們在動效領(lǐng)域的初步布局。隨后,我們將詳細介紹...
2024-12-06 11:18:20 1912瀏覽 0點贊 0回復(fù) 0收藏
Blaze是快手自研的基于Rust語言和DataFusion框架開發(fā)的Spark向量化執(zhí)行引擎,旨在通過本機矢量化執(zhí)行技術(shù)來加速SparkSQL的查詢處理。Blaze在快手內(nèi)部上線的數(shù)倉生產(chǎn)作業(yè)也觀測到了平均30%的算力提升,實現(xiàn)了較大的降本增效。本文將深入剖析blaze的技術(shù)原理、實現(xiàn)細節(jié)及在快手實際生產(chǎn)環(huán)境中的真實表現(xiàn)。一、研究背景當下,Spark的重要發(fā)展方向之一是通過向量化執(zhí)行進一步提升性能。向量化執(zhí)行的思想是將算子的執(zhí)行粒度從每次處...
2024-09-29 15:24:18 2106瀏覽 0點贊 0回復(fù) 0收藏
導(dǎo)語:大模型技術(shù)正以前所未有的速度與各領(lǐng)域融合,為各行各業(yè)帶來變革,圍繞快手B端商業(yè)化的業(yè)務(wù)場景,本文詳細闡述了構(gòu)建基于LLM的Agent技術(shù)平臺的策略、挑戰(zhàn)及解決方案,為您帶來寶貴的見解與啟示。一、大模型應(yīng)用建設(shè)背景快手商業(yè)化業(yè)務(wù)中臺,作為核心支撐,全面賦能內(nèi)部的一線銷售、運營團隊,以及外部的代理商和服務(wù)商。面對大模型技術(shù)的浪潮,我們精準捕捉智能化轉(zhuǎn)型的先機。面對眾多可選擇的技術(shù)路徑,經(jīng)過我們進行了深...
2024-09-29 11:59:17 2473瀏覽 0點贊 0回復(fù) 0收藏