持續(xù)演進的高性能計算
高性能計算是利用超級計算機實現(xiàn)并行計算的一門技術(shù)。通過使用大量通用型計算節(jié)點搭建陣列式計算集群,替代單體超級計算機的方式,來實現(xiàn)并行計算加速,已成為高性能計算的通用方案。
傳統(tǒng)的HPC平臺
傳統(tǒng)的HPC平臺基于物理機或云主機,在此之上安裝Slurm或PBS調(diào)度器實現(xiàn)集群管理和資源監(jiān)控。對于新入局科學研究行業(yè)的企業(yè)和開發(fā)者、以及AI科學家而言,使用傳統(tǒng)高性能計算平臺可能會存在諸多問題:
需要采購高主頻硬件、RDMA網(wǎng)絡和高性能存儲;
需要專業(yè)的IT運維搭建控制面、數(shù)據(jù)面、登錄節(jié)點;
調(diào)度組件維護和升級;
SSH用戶的文件權(quán)限管理;
適應業(yè)務動態(tài)調(diào)整集群資源分區(qū);
存儲服務磁盤容量監(jiān)控、擴容;
用戶作業(yè)配額管理;
集群滿載時,新加入資源從采購到加入集群需要較長時間;
擴容的資源在集群負載不高時閑置,造成資源浪費;
除此之外,容器、微服務、聲明式API構(gòu)成的云原生基礎設施,已成為構(gòu)建AI應用的主流架構(gòu)。主流人工智能平臺和開源的AI框架/套件(如 Tensorflow、Pytorch、Paddlepaddle)支持部署至Kubernetes環(huán)境,提升AI模型開發(fā)、訓練、推理效率。而傳統(tǒng)的高性能計算平臺目前仍缺乏對云原生底層設施靈活適配的方案和快速擴展的能力。
新一代HPC平臺
京東云高性能計算HPC平臺致力于降低企業(yè)基礎設施建設和運維成本,使用戶聚焦于高性能計算作業(yè)本身,低門檻快速使用平臺能力。并且兼顧新型科學研究和AI開發(fā)場景,以普惠的方式對外提供高性能計算HPC能力。
與傳統(tǒng)的HPC平臺相比,新一代的HPC平臺具備種種優(yōu)勢:




京東云高性能計算HPC平臺以其簡易操作的平臺體驗和云上豐富的彈性資源,為企業(yè)和個人開發(fā)者在高性能計算任務場景帶來了靈活性和便利性。在AI+基礎科學的新趨勢下,助力企業(yè)降本增效。
特別聲明:智慧醫(yī)療網(wǎng)轉(zhuǎn)載其他網(wǎng)站內(nèi)容,出于傳遞更多信息而非盈利之目的,同時并不代表贊成其觀點或證實其描述,內(nèi)容僅供參考。版權(quán)歸原作者所有,若有侵權(quán),請聯(lián)系我們刪除。
凡來源注明智慧醫(yī)療網(wǎng)的內(nèi)容為智慧醫(yī)療網(wǎng)原創(chuàng),轉(zhuǎn)載需獲授權(quán)。
Copyright ? 2022 上??评讜狗沼邢薰?旗下「智慧醫(yī)療網(wǎng)」版權(quán)所有 ICP備案號:滬ICP備17004559號-5