星云智联正式发布面向全行业DPU商用解决方案,持续推进多客户商业部署

 

星云智联NebulaMatrix首款DPU产品NebulaX D1055AS,近期已完成多家客户测试,并实现灰度上线。这标志着星云智联已顺利完成首款DPU产品的研发,具备了在更多客户准入测试,实现商用部署的条件

 

该产品是国内首款全硬加速、超强转发、极简运维的DPU产品,也是国内首款面向所有商用客户并拥有全部自主知识产权的DPU产品。

 

NebulaX D1055AS

硬件卸载 极致性能 开放灵活

 
 

 

NebulaX D1055AS 聚焦云计算的裸金属、虚机、容器等场景,实现网络与存储卸载与加速,提升业务性能,节省主机CPU,简化IaaS运维。可广泛用于互联网、公有云、运营商、政企与行业的云基础设施。

 

产品为PCIe插卡形态,安装于标准服务器内运行,产品功能包括数据面和管控面两部分:

 

数据面以纯硬件方式实现数据流处理,以获得高吞吐量和低延时性能,其中包括报文分析、流表查找、报文编辑、流量QoS控制、虚拟化队列等处理功能,支持灵活可配置可编程。

 

管控面采用通用的CPU+Linux架构,其中DPU OS上运行了OVS控制面、弹性块存储客户端EBS-Client、管理监控等软件,支持带外管理网口,通过管理网络对接云平台。这个架构拥有极好的软件生态兼容性,用户可按需安装部署相应的管理和应用软件,比如OpenStack Agent,K8S Kubelet等IaaS/PaaS应用,也可移植现有云基础设施中的软件到DPU OS上运行。这种开放的管控面架构,简化了DPU与用户云管控平台集成,加速定制化DPU新功能开发上线。

 

星云智联DPU产品解决方案

在如下方面实现了业界领先

全硬件高密度I/O虚拟化

  • SR-IOV 1K VF,2K硬件virtio队列

  • virtio-net和virtio-blk 1.0和1.1版本,裸机免驱动安装

  • vDPA实现虚机平滑热迁移,既保证与Hypervisor上内存脏页状态一致,又提升了硬件刷新“dirty page bitmap”效率

全硬件卸载高性能网络转发

  • 硬件高速流查找算法,实现50Mpps高性能线速包处理

  • 百万级超大流表,减少OVS流表换入换出,保证高吞吐,低延迟转发

  • 识别协议和QoS标签流分类,4级层次化QoS调度和流控,实现对每租户、每虚机/容器、每业务进行流量管理

全硬件卸载灵活多样存储栈

  • 硬件模拟PCIe NVMe设备和Virtio-blk设备,支持HOST云盘启动,云盘挂载

  • 支持iSCSI initiator,NVMeoF/TCP,NVMeoF/RDMA, Ceph RBD等多种存储客户端,或客户自行定制开发

  • 硬件加速存储协议栈,实现最高50万IOPS读写性能

创新RDMA更强扩展性

  • 自研NBL-CC拥塞控制算法,不依赖网络设备PFC/ECN实现动态拥塞控制,适应复杂变化的大规模网络拓扑,无PFC死锁、风暴问题

  • 自研NBL-SRP选择重传算法,在Lossy网络环境仍可实现低延时,高有效吞吐量

  • 标准RoCEv2协议和Verbs API,配置简洁,参数模板化,易运维

完整管控面卸载

  • 独立于HOST运行的DPU OS,内置网络与存储管控面,IPMI板级监控管理软件

  • 按需部署OpenStack agent,K8S Kubelet等IaaS/PaaS 应用插件

  • 生态开放,客户可按需安装自有云平台插件,运维工具等

 

星云智联DPU产品解决方案

将首先在云计算场景商用,

包括裸金属,虚机,容器等细分应用场景:

裸金属服务器

和传统基于PXE和iSCSI的裸金属服务不同的是,星云智联DPU方案具有如下技术优势:

  • 芯片硬件实现PCIe virtio-blk和virtio-net设备,HOST侧使用OS内核标准驱动即可运行;

  • 运行高性能弹性块存储客户端,支持分布式块存储,实现裸金属服务器的云盘启动,云盘挂载;

  • 集成OVS控制面和芯片硬件流表,实现高性能VPC网络;

  • 内置DPU OS运行独立的管理监控应用,实现独立于HOST的管理和监控;

  • 真正实现了裸金属服务器HOST侧的“0开销”。

     

虚机服务

针对虚机场景下,HOST部署OVS网络转发性能差、虚机性能隔离不足、热迁移方案复杂、HOST资源占用率高等难题,星云智联DPU方案具有如下技术优势:

  • vDPA数据直通,支持虚机平滑热迁移;

  • 百万级流表,网络数据流量通过芯片硬件高速转发,确保吞吐率和低时延转发性能

  • 芯片硬件全流统计,层级化QoS调度,精准平稳,进一步降低HOST开销;

  • 支持标准的OVS rte_flow下发接口,便于与控制器集成。

     

云原生容器

面向云原生高密集容器部署等场景,针对容器网络和存储性能开销和可扩展性瓶颈,星云智联DPU方案具有如下技术优势:

  • 海量的SR-IOV VF和virtio队列,实现高密度容器可硬件直通网络和远端存储;

  • 硬件实现频繁的容器流表操作,硬件实现队列和带宽隔离,确保容器拉起/销毁,业务突发等过程中,各个应用保持平稳运行和互不影响;

  • CNI/CSI插件为容器网络提供overlay网络和弹性块存储服务,实现更大范围的容器集群的网络和存储资源调度;

  • K8S Kubelet可部署于DPU内置OS,实现容器管控与HOST的分离。

     

星云智联联合客户POC实践

针对HOST开销较大的高密度虚机部署场景,实测100 VM/Server条件下,网络和存储硬件卸载释放HOST CPU算力如下

  • 网络:VPC VXLAN网络转发,星云智联DPU实现相对HOST实现,可节省HOST CPU算力约21%

  • 存储:块存储客户端挂载远端盘,星云智联DPU实现相对HOST实现,可节省HOST CPU算力约41%

综合分析评估可节省35%。

 

虚机场景DPU卸载方案及HOST CPU节省评估

多家客户一致看好星云智联DPU产品在实际业务中的性能表现,认可其在优化网络和存储IO性能,降低算力成本,提高运维效率等方面的优势。

 

客户根据实际经验从ROI角度综合评价,云计算场景,典型服务器配置DPU卡,至少可节省3~7个CPU核。如果综合考虑CPU功耗、内存、整机和运维等成本分摊,互联网和云计算数据中心配置DPU卡可带来显著的TCO优化,及更高效的运维管理。

 

更多的应用场景

更多应用场景包括:

  • 云游戏/电商/CDN,采用NVMeoF方案,实现高性能SSD存储的拉远集中池化和按需灵活分配;

  • HPC/AI/GPU集群,采用弹性裸金属和RDMA方案,实现高价值算力分时复用和集群算力提升;

星云智联持续和客户联合创新,挖掘DPU应用价值,逐步推进商用部署。

 

星云智联DPU支持Intel、AMD主流X86平台及ARM服务器生态,兼容Redhat、CentOS、Ubuntu、Debian、Vmware、Windows等主流操作系统及虚拟机环境,并可适配海光、飞腾、鲲鹏等国产CPU及麒麟、统信等国产操作系统,在浪潮、新华三、戴尔、华为、联想、长城、中科可控等服务器硬件上完成验证,满足各类客户与多种业务场景对未来数据中心的发展诉求。星云智联致力打造DPU开放生态,期望与合作伙伴合力推动产业稳步发展,在数字经济大潮中合作共赢,共促行业繁荣。

 

 

 

新闻中心

 

获取星云智联最新动态和新闻资讯