飛象網(wǎng)訊(易歡) 4月23日消息,在今日舉辦的“2025云網(wǎng)智聯(lián)大會(huì)”上,SNAI推委會(huì)榮譽(yù)主席、原中國電信科技委主任韋樂平表示,生成式人工智能的聯(lián)網(wǎng)技術(shù)主要包括以太網(wǎng)、IB(InfiniBand)、芯片光互連、PCIe、CXL(計(jì)算機(jī)快速鏈路)、OCS(光纖交換)等。
其中,以太網(wǎng)是世界上規(guī)模最大的低成本聯(lián)網(wǎng)技術(shù),但是,其傳統(tǒng)形態(tài)和協(xié)議已經(jīng)不能滿足大集群聯(lián)網(wǎng)的苛刻性能需求。目前有三個(gè)改進(jìn)方向:RoCE是一種基于以太網(wǎng)的RDMA。允許直接訪問遠(yuǎn)程節(jié)點(diǎn)內(nèi)存,減小了數(shù)據(jù)傳遞時(shí)延,降低了CPU的使用率。適合GenAI應(yīng)用的需求;無損以太網(wǎng)在現(xiàn)有以太網(wǎng)基礎(chǔ)上進(jìn)一步采用先進(jìn)的流控、改進(jìn)擁塞處理、優(yōu)化哈希算法等新技術(shù),性能大為改進(jìn),但是長尾時(shí)延仍偏高(5-10us),趕不上IB(1us),適合不高于2000GPU互連場景;超級(jí)以太網(wǎng)聯(lián)盟(UEC)從物理層、鏈路層、傳輸層和軟件層全面改進(jìn)以太網(wǎng),具有優(yōu)異的負(fù)荷均衡、更好的網(wǎng)絡(luò)利用率和更短的時(shí)延,滿足GenAI和HPC所需,同時(shí)保留以太網(wǎng)生態(tài)系統(tǒng)的優(yōu)勢,期望性價(jià)比全面趕超IB。預(yù)計(jì)2026年起量。
IB是一種用于高性能計(jì)算的計(jì)算機(jī)網(wǎng)絡(luò),具備高寬帶、高擴(kuò)展、高可靠、無阻塞、超低時(shí)延(1us)的特點(diǎn)。但其需要采用專用硬件IB交換機(jī)和IB網(wǎng)卡,成本較高,擴(kuò)展性受限,產(chǎn)業(yè)生態(tài)較弱,過于封閉,由英偉達(dá)獨(dú)家控制。最適用高性能計(jì)算和高質(zhì)量大模型訓(xùn)練場景。
芯片光互連是利用CMOS工藝,將光波導(dǎo)、耦合器和諧振器直接刻蝕在硅基上,再利用先進(jìn)的封裝技術(shù)將分立的具有特定功能的芯片組(各種XPU) 集成進(jìn)來,構(gòu)成一個(gè)實(shí)用化的,結(jié)合SiP和Chiplet技術(shù)的光互連器。 芯片光互連具備改進(jìn)了計(jì)算集群的擴(kuò)展性(超100T)和帶寬(擴(kuò)大5- 10倍)。并且,具備極低功耗、降低時(shí)延(可達(dá)10倍)、 能效(4-8倍) 和物理尺寸的優(yōu)勢。但其技術(shù)還不成熟,標(biāo)準(zhǔn)缺失,預(yù)計(jì)最快2026年就有產(chǎn)品。
PCIe是一種計(jì)算機(jī)串行擴(kuò)展總線技術(shù)。自從1992年以來, PCIe一直用于高速、低時(shí)延、高帶寬場景,例如數(shù)據(jù)中心內(nèi)的非易失內(nèi)存快 線(MVMe) 和GPU與CPU的互連等場景。當(dāng)前應(yīng)用最廣的是PCIe5.0,采用NRZ調(diào)制格式,具備34GT/S能力。2022年發(fā)布PCIe6.0,進(jìn)一步采用PAM4調(diào)制格式和靈活電源管理,最大限度的降低了功耗,具備64GT/S能力,還擴(kuò)展了傳輸距離、簡化了系統(tǒng)設(shè)計(jì)、降低了時(shí)延、改善了信號(hào)完整性。但是迄今尚無實(shí)際商用產(chǎn)品問世。2025年計(jì)劃發(fā)布PCIe7.0版本,期望進(jìn)一步提升至128GT/S能力。
CXL是一種架構(gòu)在PCIe串行總線上的新接口協(xié)議和高速互連技術(shù)。CXL允許計(jì)算機(jī)系統(tǒng)內(nèi)不同組件間進(jìn)行快速、可靠的數(shù)據(jù)傳輸。CXL打破了CPU與內(nèi)存間的捆綁關(guān)系,能夠在維系CPU內(nèi)存空間和設(shè)備內(nèi)存一致性的前提下,實(shí)現(xiàn)更加靈活和高容量的內(nèi)存池化架構(gòu)。長期看,CXL將導(dǎo)致現(xiàn)有服務(wù)器架構(gòu)的解構(gòu),將處理、內(nèi)存和I/0分別納入不同物理模塊,使能資源的查詢和共享,適應(yīng)大集群的訓(xùn)練需要和高性能計(jì)算的需要。
OCS是一種以光纖通道為交換顆粒的大容量交換。近中期主要替代AIDC中的Spine層的電交換機(jī)。長期會(huì)進(jìn)一步向外擴(kuò)展。