
上一篇,我們圍繞著億萬研發(fā)工程師的夢想,考察了市面上幾乎所有類型的工業(yè)仿真平臺(tái),深度評(píng)測了他們本質(zhì)究竟是什么,適用場景有哪些,分別能給研發(fā)和IT工程師們減輕多少工作量。
據(jù)此,我們搭建了一個(gè)工業(yè)仿真平臺(tái)【心累指數(shù)】金字塔模型。

戳這里回顧金字塔模型與基本設(shè)定:八大類主流工業(yè)仿真平臺(tái)【心累指數(shù)】終極評(píng)測(上)
不同廚房/餐廳設(shè)定對應(yīng)著同一層級(jí)不同“仿真平臺(tái)”的本質(zhì)屬性,詳細(xì)展開可以戳上面的鏈接。總之,從金字塔底層到塔尖,不論是對研發(fā)還是IT工程師,都是站得越高,用得越爽。
你可以跳過下文直接掃碼獲取白皮書閱讀原文,但看完會(huì)獲得一個(gè)新的視角,也非常不錯(cuò)。

在上篇里,我們從基礎(chǔ)定義與適用場景出發(fā),討論了8種平臺(tái)/方案的產(chǎn)品模式、兼容性、支持的CAE仿真軟件、底層資源量與類型、計(jì)費(fèi)模式等信息。
今天,我們將更進(jìn)一步,從研發(fā)和IT工程師的雙視角用戶體驗(yàn)出發(fā),一起看看這8種平臺(tái)/方案究竟是如何提升研發(fā)效率、降低IT工作量的?

研發(fā)視角 如何提升研發(fā)效率?
3.1、需要研發(fā)掌握什么技能?
底層:
自己買機(jī)器,研發(fā)+IT需要聯(lián)合搞定包括但不限于軟件、系統(tǒng)、硬件行情、機(jī)房選址、網(wǎng)絡(luò)配置、IT運(yùn)維、數(shù)據(jù)安全、集群調(diào)度……等事情。自家IT的能力越強(qiáng),研發(fā)就相對輕松,反之就更心累。
超算中心需要研發(fā)點(diǎn)亮部分IT技能。
特別是超算中心大多使用Linux系統(tǒng),要求研發(fā)掌握一定的Linux常識(shí)才能上手。貼一張超算的實(shí)際運(yùn)行界面,大家感受一下?

云廠商同樣需要研發(fā)點(diǎn)亮部分IT技能。但是云廠商可同時(shí)提供Windows和Linux的若干版本供用戶選擇,只不過帶Windows系統(tǒng)的云資源普遍要比帶Linux系統(tǒng)的貴。
中層:
這一層屬于第三方平臺(tái),用戶沒有接觸底層資源的權(quán)限,自然也不需要有太多IT技能。但這也代表著,很多東西是不能輕易改動(dòng)的。
如果遇到使用上的問題,一般需要呼喚第三方平臺(tái)的人來協(xié)助。自家IT可能幫不了太多。
塔尖:
針對研發(fā)與IT之間的交叉領(lǐng)域,我們的一整套端到端的仿真研發(fā)環(huán)境將很多IT工作自動(dòng)化操作,大大減少了交叉領(lǐng)域的工作難度和工作量。另外,還有fastone的R&D-IT團(tuán)隊(duì)還可以提供全方位的服務(wù)支持。
fastone在支持Windows的同時(shí),也可支持用戶在Linux系統(tǒng)中使用圖形化界面操作仿真任務(wù),你只需熟悉一下Linux的常用操作與工具(如瀏覽器、文本編輯器),即可在很短的時(shí)間內(nèi)上手,操作習(xí)慣幾乎無需改變。

詳請可戳:怎么把需要45天的突發(fā)性Fluent仿真計(jì)算縮短到4天之內(nèi)?
3.2、是否包含前后處理+求解等一整套完整功能?
底層:
買機(jī)器,系統(tǒng)環(huán)境都需要自己部署,更別提軟件功能了,一切都要靠自己。超算中心和云廠商絕大多數(shù)只支持計(jì)算求解。
中層:
你可在軟件平臺(tái)中直接點(diǎn)擊進(jìn)入相關(guān)步驟,完成前后處理和計(jì)算求解。其他平臺(tái)主要集中在計(jì)算求解這一環(huán)節(jié)。
塔尖:
同時(shí)包含前后處理+計(jì)算求解。
3.3、可以圖形化界面操作嗎?
底層:
均無。
中層:
云廠商的仿真平臺(tái)不支持。
部分硬件廠商的仿真平臺(tái)可支持圖形界面。
超算云做了類似電腦桌面的界面,所有服務(wù)(包括SSH、上傳下載,應(yīng)用等)都可以在圖形界面上操作。
軟件平臺(tái)一般完美支持。

塔尖:
fastone針對不同的用戶,提供多種任務(wù)提交方式以供選擇。
圖形界面模式:可通過Web瀏覽器啟動(dòng)集群,跳轉(zhuǎn)到虛擬桌面,并可在該桌面直接操作應(yīng)用進(jìn)行相應(yīng)設(shè)置以開啟云端仿真任務(wù)。
任務(wù)模式:用戶可以通過Web瀏覽器選擇新建任務(wù)、選擇應(yīng)用、上傳文件、輸入?yún)?shù)、配置資源等一系列向?qū)铰窂教峤蝗蝿?wù)。
集群模式:對于高級(jí)用戶,比如本身對應(yīng)用工作流的理解和編程能力超強(qiáng),可以不用走普通用戶通過應(yīng)用向?qū)教峤坏穆窂剑梢灾苯痈鶕?jù)自己寫的腳本,通過Web瀏覽器選擇新建集群,然后按需動(dòng)態(tài)地在云端創(chuàng)建HPC集群。

3.4、突然有個(gè)緊急項(xiàng)目,我能不能馬上用上?
底層:
買機(jī)器響應(yīng)時(shí)間最長,采購、運(yùn)輸、調(diào)試、部署環(huán)境、安裝軟件一套流程走下來,黃花菜都涼了。超算中心需要排隊(duì),基本不可能滿足緊急需求。
云廠商可以較快地拿到資源,但配置環(huán)境、安裝軟件也需要時(shí)間。
中層:
除了超算云依然面臨排隊(duì)問題,在資源需求量不大的情況下,其他三個(gè)平臺(tái)理論上均能較快地拿到資源并開始計(jì)算。
塔尖:
快速啟動(dòng),即開即用。
尤其是當(dāng)這個(gè)緊急項(xiàng)目需要非常多的算力時(shí),fastone云平臺(tái)的全球數(shù)據(jù)中心能持續(xù)穩(wěn)定地提供用戶所需資源類型及數(shù)量,分鐘級(jí)調(diào)度開啟上萬核計(jì)算資源,滿足業(yè)務(wù)緊迫度。

3.5、自動(dòng)化程度有多高?
自動(dòng)化是什么意思?不需要你一臺(tái)臺(tái)地開機(jī)器,鼠標(biāo)簡單點(diǎn)幾下就能自動(dòng)開關(guān)機(jī);能夠自定義工作流程,不需要每次跑仿真都重復(fù)設(shè)定;
自動(dòng)檢查任務(wù)狀態(tài),出現(xiàn)錯(cuò)誤可以及時(shí)重復(fù)提交并通知你;
甚至對于某些因資源類型報(bào)錯(cuò)的任務(wù),還能自動(dòng)定位并調(diào)度其他類型的資源來跑任務(wù)……
底層:
均無。
中層:
均無。
塔尖:
fastone云平臺(tái)可提供包括自動(dòng)化部署、自定義工作流、自動(dòng)檢查任務(wù)狀態(tài)與重復(fù)提交、自動(dòng)定位任務(wù)并調(diào)度其他類型資源重算等IT自動(dòng)化能力與Auto-Scale自動(dòng)伸縮等功能,可快速全面地提升仿真研發(fā)效率。
比如我們的Auto-Scale功能可以自動(dòng)監(jiān)控用戶提交的任務(wù)數(shù)量和資源的需求,動(dòng)態(tài)按需地開啟所需算力資源。在資源不夠的時(shí)候,還能根據(jù)不同的用戶策略,自動(dòng)化調(diào)度本區(qū)域及其他區(qū)域的目標(biāo)類型或相似類型實(shí)例資源。
效果怎么樣?看這篇:從4天到1.75小時(shí),如何讓Bladed仿真效率提升55倍?
3.6、當(dāng)有多個(gè)仿真任務(wù)時(shí),是否支持開多臺(tái)機(jī)器同時(shí)跑任務(wù)?
多個(gè)任務(wù)同時(shí)在數(shù)臺(tái)機(jī)器上跑,這個(gè)我們稱之為并行計(jì)算,一般都需要有調(diào)度器的參與。
關(guān)于調(diào)度器的相關(guān)知識(shí),看這里:億萬打工人的夢:16萬個(gè)CPU隨你用
這么多機(jī)器,這么多任務(wù),怎么順利一一配置、啟動(dòng)、關(guān)閉,提高整體資源利用率,最好還能自動(dòng)化管理等等,難度就陡然提升了。

對研發(fā)來說,能否支持大規(guī)模并行計(jì)算,是提升研發(fā)效率的關(guān)鍵。
底層:
買機(jī)器需要自己搞定一切。
超算中心和云廠商則是為你提供了一個(gè)基礎(chǔ)架構(gòu),只要應(yīng)用支持,你就可以進(jìn)行并行計(jì)算。
中層:
同樣在應(yīng)用支持的前提下,金字塔中層可以讓用戶較為方便地進(jìn)行并行計(jì)算。
不過這一層平臺(tái)提供的只是基礎(chǔ)環(huán)境,用戶能否用好取決于其自身技術(shù)能力。
塔尖:
我們自主研發(fā)的云原生國產(chǎn)化調(diào)度器Fsched,可分鐘級(jí)自動(dòng)化調(diào)度上萬核計(jì)算資源,幫助用戶應(yīng)對突發(fā)算力需求場景。更重要的是,fastone能夠結(jié)合業(yè)務(wù)特點(diǎn)以及應(yīng)用特性,利用計(jì)算機(jī)技術(shù)提升不同業(yè)務(wù)場景的計(jì)算效率。
舉個(gè)栗子:這樣跑COMSOL,是不是就可以發(fā)Nature了
3.7、能否提供任務(wù)監(jiān)控及相應(yīng)的告警、優(yōu)化分析功能?
研發(fā)工程師關(guān)心的主要是自己的任務(wù)情況。
底層:
均無。
中層:
均無。
塔尖:
這方面fastone云平臺(tái)可謂一枝獨(dú)秀。
我們能多維度監(jiān)控任務(wù)狀態(tài),提供基于任務(wù)層的監(jiān)控、告警、數(shù)據(jù)統(tǒng)計(jì)分析功能與服務(wù)。

有啥用呢?戳這兩篇了解:
王者帶飛LeDock!開箱即用&一鍵定位分子庫+全流程自動(dòng)化,3.5小時(shí)完成20萬分子對接
Auto-Scale這支仙女棒如何大幅提升Virtuoso仿真效率?
3.8、仿真文件那么大,數(shù)據(jù)傳輸效率跟得上嗎?
底層:
買機(jī)器如果是在本地進(jìn)行數(shù)據(jù)傳輸,取決于本地網(wǎng)絡(luò)配置。如果是多地傳輸,就看你買多大的帶寬了。
超算中心對外的網(wǎng)絡(luò)帶寬十分有限,且被很多并發(fā)用戶共享,數(shù)據(jù)傳輸是個(gè)大問題,人肉送硬盤有時(shí)甚至是最好的解決方案。
云廠商對結(jié)果數(shù)據(jù)支持直接讀取,云上存儲(chǔ),按需下載。但怎么用,能不能用好,還是取決于用戶自己。
中層:
超算云有專線網(wǎng)絡(luò),傳輸效率優(yōu)于超算中心。
其他三者的傳輸效率視自身機(jī)房條件/資源提供方而定。
塔尖:
fastone云平臺(tái)擁有自主可控的數(shù)據(jù)傳輸方案。
你只需要把數(shù)據(jù)上傳到的DM(Data Manager)工具上,就可以直接使用數(shù)據(jù)來跑任務(wù)。
與市面上開源的數(shù)據(jù)傳輸工具相比,DM使用方便、功能全面,利用fastone自主研發(fā)的分段上傳、高并發(fā)、斷點(diǎn)續(xù)傳等數(shù)據(jù)傳輸技術(shù),可大幅優(yōu)化海量數(shù)據(jù)的傳輸效率。
IT視角 如何降低IT工作量?
4.1、需要IT掌握什么技能?
底層:
自己買機(jī)器需要強(qiáng)大的IT團(tuán)隊(duì),搞定機(jī)房、硬件、環(huán)境、軟件……等一系列事項(xiàng)。超算中心與云廠商的情況比較類似,除了機(jī)器在別人機(jī)房你摸不著,IT需要協(xié)助研發(fā)搞定在使用過程中遇到的其他任何問題……
中層:
這一層,自家IT在熟讀第三方平臺(tái)操作說明之后可以幫上一定的忙。
塔尖:
借助多個(gè)自動(dòng)化功能與管理系統(tǒng)(具體可見本章節(jié)其他回答),IT只需簡單熟悉操作之后便可快速上手平臺(tái)。
而R&D-IT服務(wù)的存在也讓IT與研發(fā)之間的溝通更加順暢。
4.2、機(jī)器多了之后,方便管理嗎?
這個(gè)問題其實(shí)有兩層含義,即機(jī)器多了之后——
1)是否可以方便地自動(dòng)化運(yùn)維?這里面涉及到包括開關(guān)機(jī)、軟件安裝配置、資源監(jiān)控、集群管理等IT基礎(chǔ)工作的自動(dòng)化程度;
2)是否可以方便地分配業(yè)務(wù)?比如臨時(shí)需要將一批機(jī)器從團(tuán)隊(duì)A劃撥給團(tuán)隊(duì)B使用,是否能夠支持IT快速方便地進(jìn)行配置?
而能否做到第二點(diǎn),事實(shí)上是由第一點(diǎn)決定的。也就是說,自動(dòng)化運(yùn)維的程度越高,越能夠快速方便地分配業(yè)務(wù)。對IT來說,也就意味著更便于管理。

底層:
買機(jī)器需要IT自己搞定所有的運(yùn)維工作,機(jī)器越多越麻煩。
超算中心提供統(tǒng)一的人工運(yùn)維。
云廠商會(huì)提供諸如資源監(jiān)控、集群管理模塊等功能,具體使用程度取決于用戶本身。
中層:
金字塔中層基本都具備一定的自動(dòng)化運(yùn)維能力,如資源監(jiān)控、權(quán)限分配等,但同時(shí)也存在著一定程度的功能缺失,比如需要IT自行搞定支持列表之外的軟件、除云廠商的仿真平臺(tái)之外均缺失集群管理模塊等等。
塔尖:
fastone云平臺(tái)擁有完整的全維度自動(dòng)化運(yùn)維能力,機(jī)器再多都能輕松管理,快速分配業(yè)務(wù)。比如大家都熟悉的集群管理,在云端手動(dòng)管理集群和自動(dòng)化部署的工作量區(qū)別一目了然:

4.3、權(quán)限管理方便嗎?比如分配資源上限啥的?
底層:
均無此功能。
中層:
均可提供管理員賬號(hào)和子用戶權(quán)限分配功能。
塔尖:
支持管理員角色對每一個(gè)用戶進(jìn)行相關(guān)權(quán)限設(shè)定,包括預(yù)算使用上限和CPU核數(shù)使用上限。

4.4、需要用戶自己來維護(hù)機(jī)器嗎?
此處的“維護(hù)機(jī)器”專指對硬件的維護(hù)。
底層:
買機(jī)器需要自己負(fù)責(zé)所有機(jī)器的維護(hù)。超算中心和云廠商無需維護(hù)。
中層:
無需自己維護(hù)。
塔尖:
無需自己維護(hù)。
4.5、有沒有資源監(jiān)控及相應(yīng)的告警、優(yōu)化分析功能?
底層:
買機(jī)器需要自己搞定資源監(jiān)控。
超算中心的監(jiān)控功能僅存在于全局統(tǒng)計(jì),無法拆開,其他層面的監(jiān)控功能缺失。

云廠商會(huì)提供類似Cloud Watch的基礎(chǔ)監(jiān)控功能,對云資源的監(jiān)控十分細(xì)致,但配置相對復(fù)雜。

中層:
基本都支持資源監(jiān)控功能。
云廠商的Cloud Watch在金字塔底層說過了,就不再重復(fù)了。
有的軟件平臺(tái)支持定制監(jiān)控管理工具,可實(shí)時(shí)監(jiān)控任務(wù)狀態(tài)以及CPU/內(nèi)存等資源的使用情況;也有的做了中央管理儀表板可視化功能,幫助你方便快捷地監(jiān)控?cái)?shù)據(jù)。
塔尖:
不同角色的用戶可根據(jù)自身需求,查看所需的資源監(jiān)控信息。如研發(fā)可查看單個(gè)任務(wù)的資源使用情況,IT則可通過監(jiān)控功能掌握平臺(tái)整體的資源消耗水平。團(tuán)隊(duì)管理者可以監(jiān)控各個(gè)重要指標(biāo),從全局角度掌握項(xiàng)目的整體任務(wù)及資源情況,為未來項(xiàng)目規(guī)劃、集群生命周期管理、成本優(yōu)化提供支持。

4.6、有什么安全上的風(fēng)險(xiǎn)嗎?
底層:
買機(jī)器的都是純本地資源,需要自己搭建防火墻等安全措施,還得注意機(jī)房安全。而且機(jī)器在自己上手看似能完全掌控計(jì)算資源,其實(shí)麻煩更多,軟件、硬件、機(jī)房、網(wǎng)絡(luò)、人員……任何環(huán)節(jié)出了問題都可能影響你的仿真進(jìn)程。
超算中心的底層是非隔離的,你能看到其他用戶的任務(wù)信息,這是一個(gè)比較致命的問題。
更致命的一點(diǎn)是,而超算由于要優(yōu)先服務(wù)國家級(jí)科研項(xiàng)目,在某些情況下,即便已經(jīng)分配到的超算資源,也有可能會(huì)被無條件收回。
想象一下,有一天,你吃著火鍋唱著歌,跑著仿真等結(jié)果,突然就被收回了資源……任務(wù)就涼了。

云廠商的是獨(dú)占資源,可以理解為在海量云資源中劃出一塊專屬區(qū)域供用戶使用,別人無法觸及。獨(dú)占資源意味著:
1)云資源在任何情況下都不用會(huì)被搶走;
2)可根據(jù)用戶的習(xí)慣和應(yīng)用的特性自由選擇操作系統(tǒng),沒有任何限制;
3)應(yīng)用與依賴組件安裝靈活;
4)安全。
中層:
跟第三方平臺(tái)底層資源保持一致。
塔尖:
fastone云平臺(tái)提供的也是獨(dú)占資源。
我們提供完整的云安全策略模型,可對整個(gè)安全生命周期進(jìn)行管理。我們用更完善更具體的產(chǎn)品安全架構(gòu),全面保障客戶業(yè)務(wù)系統(tǒng)安全,包括身份認(rèn)證、操作日志、MFA、數(shù)據(jù)隔離、數(shù)據(jù)加密、數(shù)據(jù)審批、日志審計(jì)、安全規(guī)范、安全組織、風(fēng)險(xiǎn)預(yù)警等。
綜合對比之后,我們來給8個(gè)產(chǎn)品/解決方案排個(gè)序:

我們還有更為完整的仿真平臺(tái)對比白皮書,歡迎直接掃碼獲取白皮書閱讀完整報(bào)告:

目錄先睹為快~

關(guān)于fastone云平臺(tái)在各種CAE應(yīng)用上的表現(xiàn),可以點(diǎn)擊以下應(yīng)用名稱查看:Bladed │ Fluent │ LS-DYNA │ COMSOL
- END -
我們有個(gè)CAE仿真研發(fā)云平臺(tái)
集成多種CAE/CFD應(yīng)用,大量任務(wù)多節(jié)點(diǎn)并行
應(yīng)對短時(shí)間爆發(fā)性需求,連網(wǎng)即用
跑任務(wù)快,原來幾個(gè)月甚至幾年,現(xiàn)在只需幾小時(shí)
5分鐘快速上手,拖拉點(diǎn)選可視化界面,無需代碼
支持高級(jí)用戶直接在云端創(chuàng)建集群
掃碼免費(fèi)試用,送200元體驗(yàn)金,入股不虧~
測-底部-1024x517.png)
更多電子書
歡迎掃碼關(guān)注小F(ID:imfastone)獲取

你也許想了解具體的落地場景:
王者帶飛LeDock!開箱即用&一鍵定位分子庫+全流程自動(dòng)化,3.5小時(shí)完成20萬分子對接
這樣跑COMSOL,是不是就可以發(fā)Nature了
Auto-Scale這支仙女棒如何大幅提升Virtuoso仿真效率?
1分鐘告訴你用MOE模擬200000個(gè)分子要花多少錢
LS-DYNA求解效率深度測評(píng) │ 六種規(guī)模,本地VS云端5種不同硬件配置
揭秘20000個(gè)VCS任務(wù)背后的“搬桌子”系列故事
155個(gè)GPU!多云場景下的Amber自由能計(jì)算
怎么把需要45天的突發(fā)性Fluent仿真計(jì)算縮短到4天之內(nèi)?
5000核大規(guī)模OPC上云,效率提升53倍
提速2920倍!用AutoDock Vina對接2800萬個(gè)分子
從4天到1.75小時(shí),如何讓Bladed仿真效率提升55倍?
從30天到17小時(shí),如何讓HSPICE仿真效率提升42倍?
關(guān)于為應(yīng)用定義的云平臺(tái):
八大類主流工業(yè)仿真平臺(tái)【心累指數(shù)】終極評(píng)測(上)
2023仿真宇宙漫游指南——工業(yè)仿真從業(yè)者必讀
當(dāng)仿真外包成為過氣網(wǎng)紅后…
和28家業(yè)界大佬排排坐是一種怎樣的體驗(yàn)?
這一屆科研計(jì)算人趕DDL紅寶書:學(xué)生篇
楊洋組織的“太空營救”中, 那2小時(shí)到底發(fā)生了什么?
一次搞懂速石科技三大產(chǎn)品:FCC、FCC-E、FCP
Ansys最新CAE調(diào)研報(bào)告找到阻礙仿真效率提升的“元兇”
國內(nèi)超算發(fā)展近40年,終于遇到了一個(gè)像樣的對手
幫助CXO解惑上云成本的迷思,看這篇就夠了
花費(fèi)4小時(shí)5500美元,速石科技躋身全球超算TOP500
