功耗激增,客戶意見大?小D支招!
客戶安裝沒有經(jīng)過DELL測試的第三方的PCI-E卡,導(dǎo)致服務(wù)不能正常工作,并且功耗激增,客戶意見非常大,經(jīng)過與DELL的售后同事溝通,此問題來自于DELL在PCI Riser卡上安裝了新的傳感器,如果檢測到為非DELL的認(rèn)證的PCI-E卡,就會全力驅(qū)動風(fēng)扇及相關(guān)供電設(shè)備保證卡的正常工作,但是如果為認(rèn)證卡,就會根據(jù)預(yù)先設(shè)定的標(biāo)準(zhǔn)進(jìn)行調(diào)整風(fēng)扇轉(zhuǎn)速和供電。
與第三方卡的工程師一同對的DELL 13G服務(wù)器PowerEdge R730xd做相關(guān)的溫度及能耗測試。
測試結(jié)果如下:
1
安裝了第三方的PCI-E卡,沒有進(jìn)入系統(tǒng)風(fēng)扇及電源狀態(tài),可以看出風(fēng)扇轉(zhuǎn)速都在5500左右,電源功耗是238W。
2
進(jìn)入系統(tǒng)后電源及風(fēng)扇的狀態(tài)圖:
3
我們在系統(tǒng)運行的情況下打開服務(wù)器上第三方硬件檢測開關(guān),這時風(fēng)扇及電源狀態(tài),風(fēng)扇從5500RPM提升到了16000RPM,功耗也上升到了392W,十分驚人:
4
關(guān)閉掉服務(wù)器上對于PCI-E插槽的第三方硬件探測器,并將風(fēng)扇速度偏移至中等風(fēng)扇速度45%,這時再觀察風(fēng)扇狀態(tài)及電源、溫度,電源能耗會降低到308瓦,風(fēng)扇轉(zhuǎn)速維持在10300RPM,CPU的溫度為53°。
5
我們開始對PCI-E卡進(jìn)行加壓測試,滿負(fù)載運行30分鐘后,服務(wù)器電源、風(fēng)扇、溫度狀態(tài)圖,之前陶工有做過相關(guān)測試,滿負(fù)載情況下,卡運行了5分鐘就開始報警,溫度超過了90°。30分鐘過后,卡的表面溫度為60°,核心溫度為71.5°,一切正常。服務(wù)器的功耗也有所調(diào)整為294W,CPU溫度維持在50°,風(fēng)扇由于調(diào)整了轉(zhuǎn)速故沒有變化,還是10300RPM。
6
測試完P(guān)CI-E卡,我們又對PowerEdge R730xd服務(wù)器的CPU進(jìn)行壓力測試,使用ptugen – haswell, CPU滿負(fù)載工作10分鐘, 觀察風(fēng)扇、電源、CPU溫度狀態(tài),可以看到電源為378W,CPU溫度在61°,風(fēng)扇轉(zhuǎn)速不變。由于測試服務(wù)器硬盤為滿配,抽出一定數(shù)量的硬盤后,服務(wù)器的功耗下降到310W左右。故測試完成,通過對風(fēng)扇的轉(zhuǎn)速偏移調(diào)整,并關(guān)閉掉對第三方硬件的識別,使得PowerEdge R730xd服務(wù)器可以正常穩(wěn)定的工作,不再受到電源能耗偏高,溫度過高等一些問題的困擾。
做技術(shù)的朋友可能有過類似這樣的感覺——每天都會遇到新的問題,或者學(xué)到新的知識。然而一個人的時間和精力畢竟有限,不是所有的崗位都能做到總是親力親為,每人最擅長的領(lǐng)域也各不相同。為了使工程師自己踩過的坑、那些實用的心得體會也能給大家?guī)韼椭?,把?jīng)驗記錄和分享出來就顯得尤為可貴,這就是我們開設(shè)《工程師筆記》專欄的目的。