BOB(中国)官方入口-BOB体育官网登陆

BOB综合体育在线 DPU:5G边缘云的新基石

2021年7月24日,由江苏省未网络创新钻研院主理、SDNLAB承办的2021中国5G网络创新论坛上,多家机构谈到了DPU的挺进BOB综合体育在线,吾们对此进走了清理,以飨读者。

5G时代带通信带宽的重大升迁,更多的带宽使能更多的行使。数据量的迅猛添多以及服务器网络带宽的迅速添长都已经远超计算能力的添长,有线速I/O处理需求的行使程序受到CPU和内存的限定,现有体系也会由于CPU资源占用而导致耽延增补,包处理性能展现震荡。

5G时代带互联终端设备的大爆发,也带数据大爆发。据统计2019年全球产生数据45ZB,展望到2024年这一数字将达到142ZB,其中24%的数据将自终端实时数据。海量数据条件下矮时延网络传输及数据处理的算力需求及性能压力重大。

5G时代带个性化定制私域网络时代。5G网络不止用于公多客户,更主要的赋能各走各业,行为新基建的主要构成,推动社会发展。5G将大量安放在网络边缘,挑供实时行使和服务。据IDC统计,近10年全球算力添长清晰滞后于数据的添长。每3.5个月全球算力的需求就会翻一倍,远超算力添长的速度。算力,行为先辈生产力,承载了十万亿美元周围经济。在5G的推动下,计算结构从“端-云”一体,到“端-边缘-云”一体;从内存计算发展到网内计算。基础设施云资源行为5G发展的主要基石,也发生了极大的转折。

5G的需求

5GMEC是一栽分布式计算安放架构,将计算能力、营业以及片面5G网络能力安放到网络边缘,实现矮时延的就地数据处理、敏感数据本地处理。MEC能够很益的适配矮频、频次不确定性同往往间敏感的营业场景。

5GMEC包括5G网关UPF、边缘行使平台MEP、走业行使APP以及虚拟化基础设施。5GMEC行为一体式设备安放在挨近终端用户侧的边缘位置,挑供大带宽、矮时延的网络连接能力,AI、图像渲染等计算能力,以及面向走业的坦然能力。

图1:边缘云网融相符架构

边缘计算将从传统的荟萃式互联网交换模型扩展到边缘交换模型。位于边缘的最后用户和设备远隔主要IX点,流量到达这些位置所需的距离会降矮性能并隐微增补传输成本。网络互联必要在挨近最后用户的末了一公里网络附近的边缘进走。数据在边缘互联和共享,不涉及中央网。边缘互联将更多流量保留在本地。

矮耽延网络是边缘计算的主要构成,请求网络节点尽能够挨近本地。随着越越多的数据在本地产生本保存,网络互联密度将在边缘激添,主干网将延长到边缘,对等互联和数据交换将发生在接入网的1-2跳内。随着边缘计算基础设施的建设,很多设施将发挥网络间数据交换点的作用。网络汇聚于这些节点,为边缘服务挑供声援,降矮边缘服务耽延,萎缩光纤距离,削减网络跳数。随着计算向边缘扩展,网络交叉连接也将更添松散。展望到2025年,75%的数据将在工厂、医院、零售、城市的边缘产生、处理、存储和分析。

5G具有变通的前导码,以已足矮耽延连接的需求。随着边缘计算需求的添长,现有的回传网络处理速度无法匹配5G网络数据产生的速度和容量需求,必要在边缘安放新的、更快和更高容量的路由。

5G虚拟化网络功能必要高度分布式的数据中央。这类数据中央能够安放有余多的服务器,在运走5G网络的同时运走边缘云服务。

将做事负载置于边缘请求对行使构建和运走的手段进走调整,让代码能够从数据中央的服务器到客户场所设备中的微控制器。必要管理高度分布式的行使和数据,排大周围的边缘操作。推送到边缘的代码答该是自包含的,每个组件必须完善,包含代码、配置、库以及柔件定义的环境,代码行为一个团体构建、测试和安放,确保容器或虚拟机能够在任何地方运走。

DPU的展现

在云基础设施周围,CPU用于通用计算,构建行使生态,虚拟化技术例如Hypevisor等占用大量的内存和CPU资源,而真实用作共享的资源受到较大的影响。以网络制定处理为例,解析报文必要挨近100个cycle,线速处理10G的网络必要约4个XeonCPU的核,单做网络数据包处理,就能够占往一个8核高端CPU一半的算力。而GPU用于添速计算,凝神于图像处理、流媒体处理,并不息朝着AR、VR处理,AI添速的倾向发展。在云基础设施周围,必要一栽技术,能够卸载CPU负荷,最大限度的将硬件资源共享给租户。

十年前,网络处理器主要用于包处理、制定处理添速,行使在各栽网关、防火墙、UTM等设备上,多采用多核NOC架构。后Intel推出了DPDK技术,在用户空间上行使自己挑供的数据平面库手段数据包,绕过linux内核制定栈,极大升迁了包转发速率BOB综合体育在线,原必要NP实现的网关类设备,现在X86就能已足性能请求。而DPU则是5G时代集网络添速为一体的新式数据处理单元。DPU内部融相符了RDMA、网络功能、存储功能、坦然功能、虚拟化功能。接手CPU不拿手的网络制定处理、数据添解密、数据压缩等数据处理义务,同时兼顾传输和计算的需求。DPU首到连接枢纽的作用,一端连接CPU、GPU、SSD、FPGA添速卡等本地资源,一端连接交换机/路由器等网络资源。总体而言,DPU不光挑高了网络传输效率,而且开释了CPU算力资源,从而带动团体数据中央的降本添效。

1950年以,CPU是计算机或智能设备的中央

1990年以,GPU登上舞台

而5G的时代是数据革命时代,也是DPU的时代。

什么是DPU

DPU是相等于智能网卡的升级版本,添强了网络坦然和网络制定的处理能力,添强了分布式存储的处理能力,将柔件定义网络、柔件定义存储、柔件定义添速器融相符到一个有机的团体中,解决制定处理,数据坦然,算法添速等计算负载,替代数据中央用于处理分布式存储和网络通信的CPU资源。

DPU内心上是分类计算,是将数据处理/预处理从CPU卸载,同时将算力分布在更挨近数据发生的地方,从而降矮通信量,涵盖基于GPU的异构计算,基于网络的计算的计算等多个方面。DPU定位于协同处理单元,是数据面与控制面别离思维的一栽实现,其与CPU协调协调,后者负责通用控制,前者凝神于数据处理。在局域网场景下DPU议定PCIe/CXL等技术连接联相符边缘内各栽CPU、GPU,广域网场景下主要议定Ethernet/infiniband等技术实现边缘与边缘间、边缘与云之间的连接。

DPU包括特定的报文处理引擎,如P4、POF等,BOB综合体育在线此外还包含ARM等协处理器能够处理路由器场景中的大量分支展望。具备矮耽延的交换能力能将分歧类型的数据包迅速分发给分歧的处理单元。

基于DPU的网络处理模块是十足可程的。相比于ASICDPU能随着网络、制定、封装和添密算法的迅速转折以柔件的速度转折硬件的能力。议定DPU挑高每个网络节点上的计算能力相比标准网卡一致算力所需的服务器数目更少降矮了前期成本、空间、电力和散炎的请求DPU会降矮大周围安放网络服务的TCO。

DPU将成为新的数据网关集成坦然功能使网络接口成为隐私的边界。可将支付重大的添解密算法如国密标准的非对称添密算法SM2、哈希算法SM3和对称分组暗号算法SM4交由DPU处理。未随着区块链技术的成熟共识算法POW、验签等都会消耗大量的CPU算力也能够固化在DPU中。

DPU将成为存储的入口。分布式体系中NVMeof制定扩展到InfiniBand或TCP互联的节点中实现存储的共享和长途访问。这些数据流的制定处理能够集成在DPU中行为各栽互联制定控制器。

DPU将成为云服务挑供商管理资源的工具云服务挑供商将云资源管理占用全属下沉至DPU将CPU、GPU通盘开释出行为基础设施挑供给云租户。挑供者与行使者两者之间的资源厉格区分管理界面清亮方便行使。

DPU实现的手段:

分歧厂商DPU实现手段纷歧:

Marvell收购了Innovium挑供面向5G的基带处理DPU其OCTEON10系列DPU采用台积电5nm制程首次采用ARMNeoverseN2CPU内核; Netronome其NFP4000流处理器包括48个数据包处理内核和60个流处理内核一切这些内核都能够议定P4程; Pensando其Capri处理器具有多个可程的P4处理单元。 Fungible其DPU基于MIPS面向网络、存储、虚拟化包含52个MIPS幼型通用核以及6个大类的专用核。

英伟达2019年3月收购以色列芯片公司Mellanox其推出的BlueField-2包括8个ARMCortex-A72核及多个专用添速核区域。DOCA行为DPU上的柔件开发平台挑供标准API将驱动程序、库、示例代码、文档和与包装的容器组相符在一首声援基于DPU行使和服务的迅速开发。

英特尔收购了深度学习芯片公司NervanaSystem以及移动和嵌入式机器学习公司Movidius将CPU与FPGA结相符在一首构建DPU。挑供DPDK为用户空间高效的数据包处理挑供库函数核驱动的声援议定SR-IOV技术实现分歧行使议定DMA直接与PCIe设备一首做事。FPGA扩展到300万个逻辑单元能够与其他处理模块一首实现网络、内存、存储和计算。

Broadcom基于Arm实现DPU主要面向交换机、路由器芯片。以NetXtremeE系列控制器为基础搭载TruFlow技术推出了StingraySmartNIC。

Xilinx2019年收购了solarFlare其最新发布的AlveoSN1000系列基于16nmUltraScale+FPGA架构容量为100万个LUT包含一个NXP的16核ARM处理器能够在FPGA上每秒处理400万个状态连接和1亿个数据包。其solarFlareonload功能行使于全球90%的金融营业所。

AWSNitro采用了网络卡、存储卡、控制器卡多卡形式实现DPU功能。收购了以色列芯片上Annapurnalabs。

阿里云推出了MOC卡产品集成了志强D处理器、FPGA是一栽单卡形式产品。

英伟达的DPU功能特色

从2021中国5G网络创新论坛上英伟达沈宇希嘉宾的演讲中获知英伟达的BlueField-2采用SoC架构设计最大200Gbps带宽码手段声援NRZ25Gbps模式和PAM450Gbps模式内置ConnectX-6Dx网卡芯片声援RDMA同时声援TLS/IPSec。

图2:BlueField-2DPU芯片

DPU能够挑供实往往钟。搭载ConnectX-6DX的DPU议定PHC2SYS能够实现服务器与网卡之间400ns的同步精度ConnetX-6DX之间借助PTP4l能够实现20ns的同步精度已足5G无线DU时钟同步需求。

DPU添强边缘网络安放智能。DPU声援裸金属、虚拟化、容器化安放模式。裸金属控制层议定DPU仿真NVMe设备数据层借助DPU的ASIC芯片高速转发并议定NVMatrix基于Infiniband或RoCEv2无损网络连接后端高通量分部式集群。DPU可为裸金属物理机接入变通可扩展的高速云盘服务。

DPU能够挑供变通可扩展的网络设备。DPU能够配置为两类设备:一类为NVIDIA原生设备包括PF/VF、SF;另一类为VirtIO-Net设备。其中SF特意针对基于裸金属的大周围容器开发功能与VF设备相等声援RDMA、内核制定栈开启无需掀开SR-IOV。该DPU最大声援512个SF。

图3:DPU暗示图

DPU对网络添速。DPU采用了ASAP2网络添速技术。ConnetX-6DX内置了Embededswitch能够实现网络设备之前的数据交换和处理。E-Switch可程声援查外操作及外跳转外项与OVS数据面匹配。OVS数据面可卸载至E-Switch议定ASIC实现了内核OVS的卸载转发性能高。议定ASAP2将OVS数据面、控制面、管理面睁开后两者议定DPU的ARM计算组件实现数据面卸载到E-Switch从而实现添速的终局。E-Switch声援多栽Overlay制定的卸载如VXLAN、GRE等声援报文头修改实现NAT功能。E-Switch声援ConnectionTrack实现TCP连接的状态监控此外还声援流量统计和限速、镜像;E-Switch与现有SDN控制器及排工具无缝兼容。基于该DPU裸金属云能够迅速安放实现网络性能的升迁。

DPU挑供高郑重的存储。相比于智能网卡DPU增补了存储卸载功能议定SNAP技术向主机OS表现多个存储设备。行使对DPU的访问由IOProcessor联相符处理包括SPDK和硬件卸载两栽处理手段。用户能够在DPU连接的存储设备上安设操作体系并启动从而构建本地十足异国磁盘的裸金属架构实现比本地磁盘更高的郑重性。租户对存储的定义和访问都议定DPU完善对主机操作体系无倚赖同时能够足够行使远端存储声援数据迅速迁移。

幼结

现在固然有多多巨头的参与DPU市场照样处于初级阶段。随着网络流量指数上涨在任何有大流量的地方BOB综合体育在线DPU都将存在市场前景汜博。在DPU添持下5G时代边云协同、云网一体都将逐渐成为现实。


Powered by BOB(中国)官方入口-BOB体育官网登陆 @2018 RSS地图 HTML地图