在一年一度的超算大会上,高性能计算行业的许多参与者都在积极讨论硬件、安装、以及设计等方面的最新进展。期间,芯片巨头英特尔也展示了自家的硬件,并披露了有关下一代 Aurora Exascale 超算的诸多细节。起初,Aurora 计划采用英特尔的 10nm 至强(Xeon)融核(Phi)平台,但随着技术的飞速发展,后续该项目也经历了多次推倒重来。
几年前最终敲定的方案,为 Aurora 选用了英特尔 Sapphire Rapids 处理器,特点是配备 HBM2e 高带宽缓存。以及 Ponte Vecchio 架构的 Xe-HPC GPU 加速器,可扩展数百 PetaFLOP 到 ExaFLOP 级别的算力。
早些时候,英特尔新任 CEO 帕特·基辛格透露,Ponte Vecchio 加速器实现了性能的翻番,可让建成后的 Aurora 成为一台“2+ EF”级别的超级计算机。
该公司预计将在 2022 年之前交付机器的其余部分,并于第一季度增加主流用户的硬件生产,以便在上半年有更广泛的发布。
处理器方面,Aurora 为每个单元都配备了两块 Sapphire Rapids CPU(简称 SPR)。其具有四个计算块、DDR5、PCIe 5.0、CXL 1.1(而不是 CXL.mem),并大量借用 EMIB 技术来实现连接。
至于自带的高带宽内存(HBM),可知英特尔为该系列 SPR 处理器选用了 8-Hi 堆栈,以提供高达 64GB 的 HBM2e 内存。(据说英特尔打算使用四个 16GB HBM2e 堆栈来组成 64GB 内存)
考虑到英特尔与美光之间的特殊关系,我们发现 Micron HBM2e 的物理尺寸,正巧与 Intel 材料中给出的标示一致(而不是三星或 SK 海力士)。
当前美光提供了两种带有硬件 ECC 的 16GB HBM2e 产品,一种为每引脚 2.8 Gbps(每堆栈 358 GB/s)、另一种为每引脚 3.2 Gbps(每堆栈 410 GB/s)。
取决于英特尔使用的版本,其峰值总带宽可介于 1.432 ~ 1.64 TB/s 之间。不过 SPR HBM 版本还会额外使用四个 Tile,并将每个 HBM 堆栈连接到一个小芯片。
由图可知,尽管 Intel 表示 SPR+HBM 版本与普通 SPR SKU 共享插槽,但明显还是存在不兼容的地方。这也能是一个实例,即 Aurora 超算上使用了专门的调整设计。
至于 Ponte Vecchio(Xe HPC 2-Tile / PVC),英特尔披露单个 Aurora 服务器里的每两块 SPR 处理器,将搭配六块 PVC 加速器。
每个加速器都将使用内置的新 Xe-Link 全拓扑互连协议,尽管全连接模式下支持 8 路,但 Aurora 还是相对节制了一下。
尽管英特尔尚未披露 PVC 是如何与 SPR 处理器连接的,但至少 CPU / GPU 之间采用了统一内存架构设计。
英特尔补充道,每个 Ponte Vecchio 双栈部署将具有总共 64 MB 的 L1 缓存和 408 MB 的 L2 缓存(每个堆栈具有 204 MB L2),并由 HBM2e 提供支持。
作为比较,英伟达 A100 方案具有 40MB L2 缓存、AMD Navi 21 配备了 128MB 无限缓存(Infinity Cache / 有效 L3)。
至于 AMD 为 Frontier 超算提供的 CDNA2 MI250X 加速卡,则配备了每堆栈 8MB L2 缓存(总共 16MB)。
(图 via AnandTech)
无论采用何种方式进行切片,英特尔都在努力为 PVC 提供正确的缓存层次结构。由图表的 4 个 HBM2e 芯片设计来看,每个 PVC 双堆栈或具有高达 128GB 的 HBM2e 内存。
更重要的是,我们还正式获悉 Aurora 将用到多少块 Ponte Vecchio GPU 加速卡和 Sapphire Rapids(+HBM)处理器。
早在 2019 年 11 月,当 Aurora 还仅规划了 1 EF 算力时,就有基于 200 个机架布局的猜想 —— 简单换算是 5000 颗 CPU + 15000 块 GPU 加速卡,且每个 PVC 大约 66.6 TF 性能。
当时英特尔在早期芯片上展示了每张卡 40 TF 的性能,而 Aurora 2 EF 的官方参数则是 54000+ GPU / 18000+ CPU,意味每个 PVC 仅 37 TeraFlops(完全未将 CPU 性能算进去的话)。
至于 PVC 的功率,可参考额定功率为 60 MW 的 FP64 Vector(2 ExaFlops),那样系统为每张卡分配的功率或为 1053 W 。若 Frontier 与 Aurora 的开销类似,预计每个 PVC 的功率在 615 W。
最终 37 TF 的 PVC 功率为 615 W,而 MI250X 的 47.9 FP 功率仅为 560 W 。不过这里并未深入每张卡的原始性能,及其在特定用例中的特定功能
访问购买页面:
英特尔旗舰店
标签:
-
“表演服”用完就退?不能放任后悔权被滥用 世界短讯“七天无理由退货”本是为了保护消费者合法权益,但有人利用...
-
周大生:去年电商业务收入同比增35%,今年目标超去年增速_全球看点周大生在机构调研时表示,2022年电商业务收入同比增长34 65%...
-
视频号运费险正式上线,首次投保根据经营类目有5档选择 环球播报据亿邦动力消息,腾讯发布“视频号小店运费险”服务指南,视...
-
淘宝发布中小商家造星计划,推出最高2000元广告补贴券淘宝宣布启动中小商家的造星计划,推出包含最高2000元广告补...
-
OpenAI CEO:OpenAI还没有开始训练GPT-5大模型 天天播报据外媒报道,OpenAI首席执行官SamAltman在印度经济时报主办的一场会议
-
亚马逊与Hexa达成协作,支持卖家创建3D图像据亿邦动力消息,亚马逊和3D可视化公司Hexa达成一项新举措,...
-
属于王亚伟的时代一去不返近日屡有传闻称,昔日“公募一哥”王亚伟已被监管部门带走调...
-
今头条!渤海化学:全资子公司渤海石化拟投建丙烯酸酯和高吸水性树脂新材料项目渤海化学公告,全资子公司渤海石化拟投资建设丙烯酸酯和高吸...
-
上常从容与信言诸将能不文言文翻译通假字_上常从容与信言诸将能不,各有差翻译想必现在有很多小伙伴对于上常从容与信言诸将能不,各有差翻译...
-
环球快看:信濠光电:公司暂未涉及上述VR、MR领域同花顺金融研究中心6月7日讯,有投资者向信濠光电提问,请问...
- 智联世界,元生无界!快手虚拟人IP亮相2022人工智能大会
2022-09-07 10:47:54
- 机器人界“奥林匹克”!2022世界机器人大会8月18日举行
2022-08-10 09:58:58
- 2025年全球人口将达到90亿!机器人将在农业领域大显身手
2022-07-14 09:41:10
- 中科院院士蒋华良:AI+分子模拟与药物研发将大有可为
2022-07-14 09:37:00
- “千垛之城荷你有约” 2022兴化市荷文化旅游节正式开幕
2022-07-07 09:28:34