自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

詳解堆排序解決TopK問題

作者：小sen 2021-01-20 06:09:30

開發(fā) 前端

上次介紹了堆排序，這次介紹堆排序常見的應(yīng)用場景TopK問題。

上次介紹了堆排序，這次介紹堆排序常見的應(yīng)用場景TopK問題。

利用堆求TopK問題TopK問題是一個堆排序典型的應(yīng)用場景。

題目是這樣的：假設(shè)，我們想在大量的數(shù)據(jù)，如 100 億個整型數(shù)據(jù)中，找到值最大的 K 個元素，K 小于 10000。對此，你會怎么做呢?

對標(biāo)的是Leetcode第215題：「數(shù)組中的第K個最大元素?！?/strong>

具體鏈接：https://leetcode-cn.com/problems/kth-largest-element-in-an-array/

在未排序的數(shù)組中找到第 k 個最大的元素。請注意，你需要找的是數(shù)組排序后的第 k 個最大的元素，而不是第 k 個不同的元素。

示例 1:

輸入: [3,2,1,5,6,4] 和 k = 2
輸出: 5
示例 2:

輸入: [3,2,3,1,2,4,5,5,6] 和 k = 4
輸出: 4

經(jīng)典的TopK問題還有：最大(小) K 個數(shù)、前 K 個高頻元素、第 K 個最大(小)元素

對此TopK問題本質(zhì)上是一個排序問題，排序算法一共有十個，這個還有很多排序算法沒有介紹過。

至于為什么TopK問題最佳的答案是堆排序?其實在空間和時間的復(fù)雜度來考量，雖說快排是最好的排序算法，但是對于100億個元素從大到小排序，然后輸出前 K 個元素值。

可是，無論我們掌握的是快速排序算法還是堆排序算法，在排序的時候，都需要將全部的元素讀入到內(nèi)存中。也就是說，100億個整型元素大約需要占用40GB的內(nèi)存空間，這聽起來就不像是普通民用電腦能干的事情，(一般的民用電腦內(nèi)存比這個小，比如我寫文章用的電腦內(nèi)存是 32GB)。

眾所周知，快速排序和堆排序的時間復(fù)雜度都可以達到，但是對于快速排序來說，數(shù)據(jù)是順序訪問的。而對于堆排序來說，數(shù)據(jù)是跳著訪問的。比如堆排序中，最重要的一個操作就是數(shù)據(jù)的堆化。因此，快速排序的時間復(fù)雜度是優(yōu)于堆排序的。

但是快速排序是新建數(shù)組，空間復(fù)雜度是，遠低于堆排序的。對于龐大的數(shù)據(jù)量，應(yīng)該優(yōu)先選擇堆排序。

如果使用heapq內(nèi)置模塊，尋找數(shù)組中的第K個最大元素就是一行代碼，heapq中的nlargest接口封裝好了，返回的是一個數(shù)組，需要切片取值。

import heapq
class Solution:
    def findKthLargest(self, nums: List[int], k: int) -> int:
        return heapq.nlargest(k,nums)[-1]

當(dāng)然，一般都是手寫堆排序，尋找數(shù)組中的第K個最大元素建立最小堆，尋找數(shù)組中的第K個最小元素建立最大堆，

思路：「取nums前K個元素建立大小為K的最小堆，后面就是維護一個容量為k的小頂堆，堆中的k個節(jié)點代表著當(dāng)前最大的k個元素，而堆頂顯然是這k個元素中的最小值?！?/strong>

因此只要遍歷整個數(shù)組，當(dāng)二叉堆大小等于K后，當(dāng)遇見大于堆頂數(shù)值的元素時彈出堆頂，并壓入該元素，持續(xù)維護最大的K個元素。遍歷結(jié)束后，堆頂元素即為第K個最大元素。時間復(fù)雜度。

class Solution:
    def findKthLargest(self, nums: List[int], k: int) -> int:
        heapsize=len(nums)
        def maxheap(a,i,length):
            l=2*i+1
            r=2*i+2
            large=i
            if l<length and a[l]>a[large]:
                large=l
            if r<length and a[r]>a[large]:
                large=r
            if large!=i:
                a[large],a[i]=a[i],a[large]
                maxheap(a,large,length)

        def buildheap(a,length):
            for i in range(heapsize//2,-1,-1):
                maxheap(a,i,length)

        buildheap(nums,heapsize)
        for i in range(heapsize-1,heapsize-k,-1):
            nums[0],nums[i]=nums[i],nums[0]
            heapsize-=1
            maxheap(nums,0,heapsize)
        return nums[0]

相反如果是求前k個最小，那么就用最大堆，因此面對TopK問題，最完美的解法是堆排序。因此，只有你看到數(shù)組的第K個……，馬上就是想到堆排序。

如果在數(shù)據(jù)規(guī)模小、對時間復(fù)雜度、空間復(fù)雜度要求不高的時候，真沒必要上 “高大上” 的算法，寫一個快排就很完美了。

TopK問題就像搜索引擎每天會接收大量的用戶搜索請求，它會把這些用戶輸入的搜索關(guān)鍵詞記錄下來，然后再離線地統(tǒng)計分析，得到最熱門的Top10搜索關(guān)鍵詞，啥啥惹事就出來了。

本文已收錄 GitHub https://github.com/MaoliRUNsen/runsenlearnpy100

責(zé)任編輯：姜華來源： Python之王

堆排序 TopK 應(yīng)用場景

分享到微信

微信掃碼分享

分享到微博

相關(guān)推薦

Java排序算法總結(jié)（六）：堆排序
1991年計算機先驅(qū)獎獲得者、斯坦福大學(xué)計算機科學(xué)系教授羅伯特·弗洛伊德(RobertW．Floyd)和威廉姆斯(J．Williams)在1964年共同發(fā)明了著名的堆排序算法(HeapSort)。本文主要介紹堆排序用Java來實現(xiàn)。

2011-04-20 15:06:44

堆排序

淺析經(jīng)典排序算法之堆排序
堆通常是一個可以被看做一棵樹(完全)的數(shù)組對象。

2021-01-19 07:02:26

算法數(shù)據(jù)結(jié)構(gòu)堆排序

堆排序算法普及教程
本文我們要講的是堆排序算法。據(jù)我所知，要真正徹底認(rèn)識一個算法，最好是去查找此算法的原發(fā)明者的論文或相關(guān)文獻。把堆想象成為一種樹，二叉樹之類的。所以，用堆做數(shù)據(jù)查找、刪除的時間復(fù)雜度皆為O（logN）。那么是一種什么樣的二叉樹列一種特殊的二叉樹，分為最大堆，最小堆。最大堆，就是上頭大，下頭小。最小堆就是上頭小，下頭大。

2014-10-30 15:59:10

圖解堆結(jié)構(gòu)、堆排序及堆的應(yīng)用
這次我們介紹另一種時間復(fù)雜度為O(nlogn)的選擇類排序方法叫做堆排序。堆(Heap)是計算機科學(xué)中一類特殊的數(shù)據(jù)結(jié)構(gòu)的統(tǒng)稱。堆通常是一個可以被看做一棵完全二叉樹的數(shù)組對象。

2020-03-06 16:08:46

堆結(jié)構(gòu)堆排序應(yīng)用

一次搞透，面試中的TopK問題！
本文將介紹隨機選擇，分治法，減治法的思想，以及TopK問題優(yōu)化的來龍去脈，原理與細節(jié)，保證有收獲。

2021-12-20 10:39:30

TopK 排序代碼

Java編程內(nèi)功-數(shù)據(jù)結(jié)構(gòu)與算法「堆排序」
堆排序是利用堆這種數(shù)據(jù)結(jié)構(gòu)而設(shè)計的一種排序算法，堆排序是一種選擇排序，它的最好、最壞、平均時間復(fù)雜度均為O(nlogn)，它是不穩(wěn)定排序。

2021-03-23 08:33:22

Java 數(shù)據(jù)結(jié)構(gòu)算法

我們一起聊聊C#堆排序算法
堆排序是一種高效的排序算法，通過構(gòu)建最大堆和反復(fù)調(diào)整堆的操作，實現(xiàn)對數(shù)組的排序。其時間復(fù)雜度為O(nlogn)，并且具有較好的穩(wěn)定性和空間效率。

2023-10-10 08:00:07

TopK，玩出花來了！
TopK問題是一個非常經(jīng)典的問題，在筆試和面試中出現(xiàn)的頻率都非常非常高(從不說假話)。下面，從小小白的出發(fā)點,認(rèn)為topK是求前K大的問題，一起認(rèn)識下TopK吧!

2021-12-14 10:54:31

TopK 面試排序法

解決Oracle分頁查詢中排序與效率問題
本文將結(jié)合作者近日工作中，在ORACLE數(shù)據(jù)庫分頁查詢時，遇到一個小問題，為大家講解如何解決Oracle分頁查詢中排序與效率問題。

2009-03-04 13:32:28

排序 SQL Oracle

使用內(nèi)置函數(shù)解決PHP多維數(shù)組排序問題
我們都知道數(shù)組在編程中的重要性，文章這里就PHP多維數(shù)組排序的問題做出了詳細的講解，希望對大家有幫助。

2009-11-17 09:17:49

PHP多維數(shù)組排序

詳解策略路由如何解決南北互通問題
文章主要分析了策略路由中如何破解南北互通難題之路，這是我們一直都很關(guān)注的問題，不過相信隨著通信行業(yè)的發(fā)展，南北互通問題一定會得到很好的解決。

2009-11-09 15:10:42

詳解Objective-C歸檔問題解決
ObjcetiveC歸檔問題解決是本文要將誒少的內(nèi)容，主要是來學(xué)習(xí)在ObjcetiveC如何來歸檔，本文很詳細的解決了這一問題，來看詳細內(nèi)容。

2011-08-16 13:34:23

Objective-C 歸檔

詳解C#排序函數(shù)實現(xiàn)冒泡排序
這里將介紹C排序函數(shù)實現(xiàn)冒泡排序，冒泡排序是我們使用過的最簡單的排序，希望通過本文能讓大家對C排序函數(shù)有所了解。

2009-09-10 16:30:11

C#排序函數(shù)

聊聊TopK 算法的多種實現(xiàn)
TopK，即求數(shù)組的最小（或最大）的k個數(shù)，且不要求這些數(shù)要排序返回。

2022-02-18 08:26:12

TopK 數(shù)組面試題

計數(shù)排序（Counting Sort）詳解
計數(shù)排序是一種高效的非比較排序算法，適用于整數(shù)排序和穩(wěn)定性排序的場景。盡管它對整數(shù)范圍有一定要求，但在合適的情況下，計數(shù)排序能夠提供線性時間復(fù)雜度的排序性能，相對于其他復(fù)雜排序算法來說，它具有獨特的優(yōu)勢。

2023-10-05 06:02:52

計數(shù)排序 Counting

Flex安全沙箱問題解決方法詳解
Flex安全沙箱問題你是否遇到過，這里向大家簡單介紹一下關(guān)于Flex安全沙箱問題的解決，希望本文的介紹能讓你有所收獲。

2010-08-03 09:12:52

Flex安全沙箱

MySQL死鎖問題分析及解決方法實例詳解
MySQL死鎖問題是很多程序員在項目開發(fā)中常遇到的問題，現(xiàn)就MySQL死鎖及解決方法進行詳解。

2017-06-14 22:11:57

數(shù)據(jù)庫 MySQL 死鎖

詳解SQL Server排序規(guī)則
什么叫SQLServer排序規(guī)則呢？對于很多剛剛接觸SQLServer數(shù)據(jù)庫的新人來說，都有這樣的疑問，其實排序規(guī)就是指定表示每個字符的位模式以及存儲和比較字符所使用的規(guī)則。

2010-11-11 14:05:17

SQL Server排

JAVA8如何用Optional解決NPE問題詳解
NPE（NullPointerException）是調(diào)試程序最常見的異常。google一下有很多關(guān)于方法到底應(yīng)該返回null還是new一個空對象的討論。

2021-01-04 08:39:26

JAVA8 Optional NPE

JSP中文編碼問題解決方法詳解
本文中作者總結(jié)了JSP中文編碼問題中常見的幾種亂碼情況，希望通過對本文的學(xué)習(xí)可以解決你的問題。

2009-02-18 14:28:23

編碼亂碼 JSP

相似話題

后端
 26350內(nèi)容

開發(fā)工具
 7413內(nèi)容

測試
 530內(nèi)容

游戲開發(fā)
654內(nèi)容
全部話題

同話題下的熱門內(nèi)容

SpringBoot 集成 Camunda 流程引擎，實現(xiàn)一套完整的業(yè)務(wù)流程顛覆配置加載！Spring Boot 3.4 全新 ConfigData 機制重磅升級 SpringBoot 棄用 spring.factories：技術(shù)革新下的必然選擇 @JsonFormat 只會轉(zhuǎn)日期？這四個高能用法太強大了招行二面：為什么需要序列化和反序列？為什么不能直接使用對象？接口冪等性設(shè)計：六種解決方法讓重復(fù)請求不再成為系統(tǒng)隱患新特性真香！Spring Boot 3.4 配置屬性驗證大升級，一文看懂更強大！Spring Boot 3.4 配置校驗新特性全解鎖

相關(guān)專題更多

解讀惠普Z系列工作站ZBook Ultra G1a高性能移動

HPE ProLiant DL145 Gen11 服務(wù)器解讀

2025-04-21 09:59:50

開發(fā)者成長學(xué)院 | 成長有徑 · 代碼有方

2025-04-23 08:49:09

我收藏的內(nèi)容

微博

QQ

微信

復(fù)制鏈接

微信掃碼分享

51CTO業(yè)務(wù)

媒體
51CTO CIOAge HC3i Techplur
社區(qū)
51CTO博客軟考社區(qū)鴻蒙開發(fā)者社區(qū)AI.x社區(qū)
教育
51CTO學(xué)堂精培企業(yè)培訓(xùn)CTO訓(xùn)練營

51CTO學(xué)堂

51CTO學(xué)堂企業(yè)版

51CTO官微

51CTO

關(guān)于我們&條款

關(guān)于我們

新聞動態(tài)

站點地圖

意見反饋

English

用戶協(xié)議

隱私協(xié)議

北京市海淀區(qū)中關(guān)村南1條甲1號ECO中科愛克大廈6-7層

北京市公安局海淀分局備案編號：110108002980號
營業(yè)執(zhí)照京ICP備09067568號

Copyright ? 2005-2025 51CTO.COM 京ICP證060544 版權(quán)所有未經(jīng)許可請勿轉(zhuǎn)載

營業(yè)執(zhí)照出版物經(jīng)營許可證

友情鏈接

新浪科技騰訊科技網(wǎng)易科技鳳凰科技驅(qū)動科技科技行者 TechWeb 艾瑞網(wǎng)站長之家速途網(wǎng)中國經(jīng)濟新聞網(wǎng)IT之家工聯(lián)網(wǎng)極客公園 236視頻會議中國IDC圈企業(yè)網(wǎng)D1Net 投資界次方元火山引擎

51CTO技術(shù)棧公眾號

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

在線客服

媒體
51CTO CIOAge HC3i

社區(qū)
51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育
51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

感谢您访问我们的网站，您可能还对以下资源感兴趣：
自拍偷在线精品自拍偷

^{<center id="nq1rv"><i id="nq1rv"></i></center>}