- 萝莉 视频 北京俄罗斯文化中心主任:“东谈主文金砖”同意合手久人命力
- 原标题:萝莉 视频 北京俄罗斯文化中心主任:“东谈主文金砖”同意合手久人命力 东谈主民网北京10月24日电 (记者邓洁) 当地本领10月23日,国度主席习近平在...
公共AI的顶级嘉会GTC于3月17日到3月21日在好意思国硅谷无际举行。在GTC大会期间,华瑞指数云ExponTechCTO曹羽中受邀参预了专注于AIStorage的本事研讨会并发扮演讲。在演讲中,曹羽中先容了ExponTech与合营伙伴ScaleFlux,AIC基于英伟达的BlueField3DPU以及英伟达最新发布的Spectrum-X汇集打造的新式AIStorage有盘算,展示了该有盘算的骨子测试数据,并与合营伙伴,AIStorage行业众人以及一些大型客户进行了深切商榷。与会的众人均暗示该有盘算的实测性能数据以及详尽上风清晰远超预期,具备很高的生意价值国产 自拍偷拍,veryimpressive!
新式AI存储有盘算采选的软硬件有盘算:
硬件:
F2026 AI工作器,是一台2U闪存JBOF,配备2个或4个NVIDIA BlueField-3数据处理单位(DPU)和24块高性能ScaleFlux CSD5000 NVMe SSD(CSD5000是ScaleFlux公司最新推出的一款内置硬件压缩与解压缩才智的高性能NVMe SSD介质);
NVIDIA Spectrum-X汇集交换机;
软件:
华瑞指数云ExponTech下一代漫衍式存储软件平台WADP (WiDE AI Data Platform);
(本有盘算采选的2U存储节点及ScaleFluxCSD5000 NVMe SSD)
基于此有盘算的AI测验和推理环境的实测部署架构如下图:
1台2U AIC JBOF算作存储工作器, 配备4块NVIDIA BlueField3 DPU, 提供1600Gbps汇集带宽,24块ScaleFlux CSD5000 NVMe SSD,ExponTech WADP存储软件的后端开动于BlueField3 DPU内;
1 台尺度2U工作器算作斟酌工作器,配备4块NVIDIA BlueField3 DPU,提供800Gbps汇集带宽,在DPU里面开动ExponTech WADP存储软件的存储网关和左券;
斟酌工作器上不错成立GPU,用于测验或推理,存储软件和汇集流量开动于DPU内,存储IO不会浪掷斟酌工作器的CPU和内存资源,斟酌工作器不错领有更充沛的资源用于斟酌处理;
金瓶梅在线观看测试环境稀罕聘任了4台NVIDIA Spectrum-X交换机组成两层汇集,主若是为了模拟与考证在大范围组网的情况下,RoCE汇集是否依然不错很好的处理拥塞,存储软件不错依然保捏清爽的存储性能和低时延;
存储工作器(JBOF)和斟酌工作器均不错按需稀罕彭胀,按需加入更多的存储工作器(JBOF)或者斟酌工作器,组成大范围的,存算分手的,按需彭胀的AI测验和推理集群。
基础存储性能考证:
基于上一节所述的实测部署环境,进行了存储系统的基础性能考证,其考证门径是从斟酌节点上开动FIO,测试存储系统的基础性能成见。
单个斟酌节点不错达到近90GB/s的存储带宽,接近斟酌节点网卡的物理带宽上限;
单个斟酌节点不错达到310万IOPS,当成立更多的斟酌节点时,不错同步取得更多的IOPS。研究到悉数这个词存储系统的后端以及左券端齐是跑在DPU内,DPU内的CPU处感性能远远不如工作器成立的CPU,单个斟酌节点+单个存储节点即达到310万IOPS一经充分展现了本有盘算很是惊东说念主的IO处理后果;
存储系统的IOPS与存储节点上部署的数据处理单位(DPU)数目呈线性比例彭胀,系统的IOPS随DPU部署数目线性彭胀,标明其具备极佳的横向彭胀才智。本有盘算采选的存储节点最多不错成立8张DPU(面前测试环境成立4张),还不错杀青IOPS性能翻倍以及汇集带宽翻倍;
存储系统在使用小IO size时,并发大压力时延低至266us, 在使用大IO size时,打满斟酌节点的汇集物理带宽,时延还能遥远保捏在1毫秒以下。
MLPerfStorage v1.0测试收尾:
MLPerf™是影响力最广的海外AI性能基准评测,MLPerf™Storage是针对AIStorage的基准性能测试,不错较为全面的评估测试AI应用体式的存储需求。MLPerf™Storage基准测试通过开动一个漫衍式测验测试体式,模拟GPU斟酌流程,在此流程中简直的推论AI工作器对存储系统的读写拜谒,以此来测试存储系统或者复古的最大GPU数目和带宽清晰。
MLPerfStoragev1.0于2024年8月推出,国表里一共有十三家从事高性能存储研发的厂家参与了测试并提交认真测试收尾,其中包括DDN(Lustre),华为,WekaIO,Hammerspace等著名的漫衍式文献系统厂家。
本次咱们聘任了ResNet50模子(主要用于图像分类和图像识别场景),在上述1存储节点(JBOF)+1斟酌节点的测试环境上进行了MLPerfStorage v1.0基准测试,测试的收尾如下:
测试收尾标明:
ExponTech的新式AI存储有盘算具备公共最先的性能,单客户端或者支捏的GPU卡的数目进步了悉数参与了MLPerf Storage v1.0认真测试的厂商,位居公共第一;单客户端或者杀青的存储带宽达到近30GB/s, 位居公共第二;
本次测试环境唯唯一个客户端节点(斟酌节点),CPU和内存成立较低,在开动MLPerf Storage v1.0的测试中一经达到了客户端节点的斟酌才智的瓶颈,然而还远远莫得达到存储节点的存储才智的瓶颈。如果换用处理才智更强的斟酌节点来作念测试,不错测试出更高的性能数据,即支捏更多的GPU卡,杀青更高的存储带宽。
转头
基于本次在简直的环境上的全面测试,转头一下ExponTech与合营伙伴ScaleFlux,AIC基于英伟达的BlueField3DPU以及英伟达最新发布的Spectrum-X汇集打造的新式AIStorage有盘算的关节特色和上风:
宇宙顶级性能,SPC-1 评测越过悉数高端全闪存储阵列,冲突宇宙记载,MLPerf Storage v1.0测试数据大幅度越过WekaIO, DDN等有名并行文献系统;
宇宙顶级容量密度,面前每2U Storage Node可杀青进步1.6PB存储裸容量,来岁可彭胀至每2U进步6.6PB,最大化数据中心空间的AI数据价值;
成立的ScaleFlux CSD5000 NVMe SSD具有盘内透明压缩解压缩才智,或者在不浪掷畸形系统资源,不影响性能的情况下杀青有储裸容量的数倍放大,存储容量后果取得惊东说念主的进步;
合并平台上同期支捏高性能漫衍式块存储和文献存储等多种左券,除了支捏AI的测验和推理场景,还不错障翳数据汇集,数据准备,RAG等AI Pipeline全场景,无用为AI Pipeline成立不同的存储有盘算以及反复进行数据拷贝挪动,不错杀青AI算力和存力的统统存算分手和稀罕彭胀,具备更好的可处分性和后果;
浩大的并行彭胀性,存储节点及斟酌节点均不错稀罕的水平彭胀,同期杀青有储性能和容量的等比例彭胀;
可靠性高,可珍爱性高,存储节点采选比较尺度工作器更为精简的JBOF,硬件故障率更低,同期JBOF里面采选冗余的硬件假想来保险可靠性,进步可珍爱性;
支捏基于RoCE的超大范围组网,采选RoCE动态路由和细粒度的负载平衡杀青更好的拥塞抑制,基于尺度以太网在大范围RDMA组网中杀青高效带宽, 低抖动和超低时延;
优化的总体领有资本(TCO),高密度的存储节点+透明盘内压缩+新式软件界说存储软件的组合简化了硬件资本,大幅度进步了存储空间愚弄后果和读写性能,简化了处分,AI客户将因此大幅度优化其AI Storage的总体领有资本(TCO);
基于此有盘算的KV Cache大范围捏久化有盘算也行将推出,杀青AI推理集群内的K,V向量的全局分享国产 自拍偷拍,或者以低资本高性能的大范围存储才智替代AI推理流程中K,V向量的大齐重叠运算,杀青AI推理算力资本的大幅裁减。
声明:新浪网独家稿件,未经授权不容转载。 -->