“別人家車廠”2.5分鐘下線一輛汽車 急需呼喚神龍!
2017地表上最快的計算機
基于HPCC平臺神威太湖一號(Sunway TaihuLight) 全球***理論性能超過每秒10億億次。看看斯坦福大學(xué)的Dell HPC集群如下圖:https://www.top500.org/site/50628
在螺螄粉的故鄉(xiāng), 創(chuàng)造著這樣一個汽車神話,它不是汽車里速度最快的,它也不是汽車里***雅豪華的,但是它曾經(jīng)創(chuàng)造了一臺車成為全球銷量最多的車型, 如今依舊在書寫著傳奇。然而隨著中國經(jīng)濟的不斷發(fā)展,國富民強,人們對汽車的要求不僅僅停留在代步,經(jīng)濟緊湊的階段。更多的車型以及內(nèi)飾的需求如同雪花般的經(jīng)過經(jīng)銷商飛向客戶的研發(fā)部門。如何加快產(chǎn)品的研發(fā)迭代速度,縮短設(shè)計和分析的循環(huán)周期,如何更快的滿足客戶和市場的需求成為擺在客戶研發(fā)領(lǐng)導(dǎo)面前的一道難題。公司領(lǐng)導(dǎo)按照奧林匹克的精神對研發(fā)部門提出了“更快,更高,更強”的奮斗目標??墒茄邪l(fā)部門也面臨著難題,按照車廠要求,整車級別網(wǎng)格尺寸為8~10mm,所以強度疲勞方面***網(wǎng)格數(shù)量大概500W,安全的模型算上假人的話,大約350w單元。帶假人計算時,他們用12個CPU測試計算時間大約24小時。 CFD(整車級別)網(wǎng)格數(shù)量約3500W, 32個CPU計算時間為60小時左右。一個設(shè)計人員提交作業(yè)需要等待24小時-- 60小時, 而且都是協(xié)同作業(yè),一人工作,大家等待?這個速度嚴重拖累了這個現(xiàn)代化車廠的后腿, 業(yè)界老大哥豐田的精益模式是2.5分鐘就能下線一輛汽車的, 急需呼喚神龍!
記得某位偉人曾經(jīng)說過,要想解決問題就必須深入到生產(chǎn)戰(zhàn)斗的一線去,那小D也來看看一個汽車設(shè)計工程師一天是如何度過的。在吃過了美味的螺螄粉后,工程師打開了它的戴爾工作站,一堆熟悉的圖標映入了眼簾,打開了UG設(shè)計軟件,從公司的PDM(產(chǎn)品數(shù)據(jù)管理系統(tǒng))系統(tǒng)上下載了今天的工作文檔,手指在鼠標和鍵盤上飛舞,一輛心儀的汽車設(shè)計圖紙就完工了。
緊接著,工程師就會使用工具軟件(Hypermesh)對模型進行網(wǎng)格劃分,這道工序他們親切的稱為前處理。做完了前處理以后,就交給我們的CAE軟件求解了。CAE軟件五花八門就像一個大江湖,但是按照門派分,大致可以分成 結(jié)構(gòu)分析、NVH、碰撞安全、CFD(空氣動力學(xué)分析、熱管理分析、成員舒適性分析)、約束產(chǎn)品五大門派。談到這5大門派,其實常用的武功(軟件)多達幾十種之多,主要的軟件及分類下表:
接著當您看到工作站的硬盤燈在狂閃,CPU利用率一直居高不下的時候,您應(yīng)該意識到求解器正在努力的算啊算。當求解完成后CAE的結(jié)果需要用CAD技術(shù)生成形象的圖形輸出,如生成位移圖,應(yīng)力,溫度,壓力分布的彩色明暗圖,我們稱它為后處理。一旦后處理做完了,工程師會喝上一杯美美的咖啡,然后完成***的CAE分析報告,整個工作就告一段落了。
看完了工程師的一天的工作流程之后,相信聰明的您肯定發(fā)現(xiàn)這個流程中的瓶頸在哪里了?對的,單臺工作站的硬件配置是有限的,計算一個小零件或者一個車門運算量或許還能承受,但對于數(shù)據(jù)量較大的整車模型,工作站就明顯有點力不從心了。這個時候CAE協(xié)同計算平臺就成了我們需要呼喚的那條神龍。一個合格的CAE協(xié)同計算平臺需要包括以下子模塊:
- VDI遠程可視化設(shè)計桌面
- CAE虛擬仿真(網(wǎng)格劃分及前后處理)
- HPC高性能計算(FEA&CFD仿真分析)
- 交互式作業(yè)、批處理作業(yè)提交與管理
- 批量作業(yè)提交與管理
- 仿真數(shù)據(jù)管理(仿真數(shù)據(jù)自動按照軟件、項目、類型、作業(yè)自動化管理)
- 仿真項目管理功能
- 仿真數(shù)據(jù)備份管理
- 集群管理與監(jiān)控(支持集群界面化的系統(tǒng)用戶、部門、部門角色添加和管理)
- HPC許可證資源管理
從以上模塊可以看出來,一個CAE協(xié)同計算平臺基本涵蓋了一個CAE工程師一天工作所要做的所有的事情,包括前后處理,計算,仿真數(shù)據(jù)管理,備份以及平臺監(jiān)控等等。戴爾的CAE協(xié)同計算平臺邏輯拓撲圖如下,從底層的硬件平臺到OS/編譯環(huán)境再到平臺軟件,戴爾可以提供端到端的整體解決方案。
這篇文章里面我們著重闡述戴爾高性能計算解決方案,高性能運算就是利用一個集群中的多臺機器共同完成同一件任務(wù),使得完成任務(wù)的速度和可靠性都遠遠高于單機運行的效果,彌補了單機性能上的不足。本文我們將會從網(wǎng)絡(luò),計算服務(wù)器,存儲,集群軟件分別描述高性能計算解決方案的主要構(gòu)成部分。
高性能計算網(wǎng)絡(luò)
高性能計算的網(wǎng)絡(luò)可以分成3類:
- 計算網(wǎng)絡(luò):各服務(wù)器之間進行通訊交互的計算網(wǎng)絡(luò),推薦采用高速、低延遲的戴爾56GB Infiniband 網(wǎng)絡(luò)交換機加以配套的HBA卡和IB線纜,以保證將集群軟件在分發(fā)任務(wù)到多個計算節(jié)點的過程中保證各節(jié)點之間能夠高速傳輸數(shù)據(jù)。
- 存儲網(wǎng)絡(luò):CAE軟件將計算任務(wù)提交到計算節(jié)點,計算節(jié)點通過計算最終會產(chǎn)生很大的文件數(shù)據(jù),為了高效的存儲這些數(shù)據(jù),存儲端采用光纖交換網(wǎng)絡(luò)保證計算節(jié)點的數(shù)據(jù)可以快速的存放到存儲中。整個存儲網(wǎng)絡(luò)要求高帶寬低延時。
- 管理網(wǎng)絡(luò):除了計算網(wǎng)絡(luò),存儲網(wǎng)絡(luò)外,我們還有管理網(wǎng)絡(luò),通過戴爾的以太網(wǎng)交換機,將各個計算節(jié)點, 存儲結(jié)點, 光纖存儲都納入到Dell OpenManage Essentials管理平臺進行統(tǒng)一管理并結(jié)合自帶的告警平臺進行監(jiān)控,降低管理員的運維壓力。
高性能計算服務(wù)器
計算是高性能運算的核心模塊,它的功能就是執(zhí)行計算。不同的CAE軟件對于CPU和內(nèi)存的需求各不相同,我們也會把計算節(jié)點分為胖/瘦節(jié)點,以胖節(jié)點為例,它就適用于對內(nèi)存、處理性能要求高的計算任務(wù),在實際應(yīng)用中可以需要根據(jù)需求和預(yù)算來決定采用什么樣的配置。因為一個計算節(jié)點的失效通常不會影響其他節(jié)點,所以計算節(jié)點不需要冗余的硬件保護。
分布式高性能存儲
存儲采用在高性能計算領(lǐng)域普遍使用的Lustre 分布式存儲解決方案,2臺戴爾R730服務(wù)器作為Lustre存儲元數(shù)據(jù)節(jié)點,保證高可用性,多臺R730組成Lustre對象數(shù)據(jù)節(jié)點,在保證節(jié)點的高可用性的前提下,數(shù)據(jù)分別從不同的節(jié)點高速傳輸?shù)酱鎯χ?。從整個架構(gòu)上消除存儲設(shè)計的瓶頸,為后續(xù)的數(shù)據(jù)持續(xù)增長,快速橫向擴展提供便利條件。
高性能集群軟件
戴爾聯(lián)合優(yōu)質(zhì)合作伙伴提供具有大量用戶實際使用案例的高性能集群軟件,覆蓋統(tǒng)一訪問門戶,集群運維管理,監(jiān)控,計算任務(wù)的分發(fā),計算任務(wù)的調(diào)度,許可證管理,統(tǒng)計記賬,計算數(shù)據(jù)管理等等功能。同時個性化的能夠結(jié)合CAE軟件提供集成接口等功能,更好的方便后續(xù)用戶管理和運維高性能計算集群環(huán)境。
解決方案拓撲:
解決方案產(chǎn)品:
- M1000e
- 10Gb Dell MXL Blade Switch
- M630
- M830
- R730
- Brocade 300
- Powervault MD3400
- IB Switch(MSX6036)
- Dell HPCC services
- Lusture
解決方案效果:
實施完一期的HPCC 后,作業(yè)效率大大提高,項目目標提前完成,該部門多次受到表揚, 工程師有時間在享受完一碗正宗的螺螄粉后,思考更多的項目創(chuàng)新。
戴爾的高性能計算解決方案——我們眼中的“利器”不但是為中國汽車生產(chǎn)制造貢獻了一份力量,同時還在眾多如氣象地震分析、石油勘探、基因工程、動漫特技渲染、生物制藥等涉及國家科技及普及民生的眾多領(lǐng)域,承擔了技術(shù)改良和發(fā)展的責任。戴爾一直在高性能計算領(lǐng)域處于***地位,致力于設(shè)計開放、性能出色及高性價比的解決方案,為客戶帶來更大的靈活性、更高價值及更便捷的業(yè)務(wù)運營。