在2024年10月15日至17日,世界瞩主义敞开计较世界峰会(OCP Global Summit)在好意思国加州圣何塞举行。本届峰会以“改进的力量”为主题,聚焦于AI基础挨次本事生态的构建,招引了高出7000名世界基础挨次领域的内行参与。在这个充满改进氛围的舞台上,阿里云的磐久AI Infra 2.0工作器联袂UALink定约,共同展示了他们在AI互连本事领域的最新效力。
峰会上,阿里云工作器研发资深总监文芳志与UALink定约主席Kurtis Bowman结伙髻表了题为《UALink:加快AI的异日》的演讲,共同探讨了AI工作器Scale UP互连本事的最新发展,UALink尺度的演进旅途,以及UALink定约与ALink System产业生态的协同互助后劲。
UALink条约,看成一项新兴的行业尺度,由AI芯片、工作器和云工作提供商等行业归并者共同发起,旨在鼓舞AI工作器Scale UP互连本事的发展。UALink条约以其高性能内存语义看望、显存分享、赈济Switch组网步地以及超高带宽和超低时延等特质,为AI工作器Scale UP互连本事的发展提供了新的能源。UALink定约筹谋于10月底细致缔造,并在年底发布初版UALink spec,这象征着AI工作器互连本事将插足一个新的发展阶段。
濒临世界尤其是中国阛阓的挑战,ALink System(ALS)产业生态应时而生,旨在鼓舞UALink尺度的落地奉行。ALS提供了长入尺度的互连络统,包括ALS-D数据面和ALS-M管控面,为AI磨练和推理场景提供全面的处分决策。
ALS-D赈济UALink外洋尺度,酿成了具有竞争力的数据面决策。它不仅赈济高性能内存语义看望和显存分享,还具备超高带宽和超低时延,同期加多了网内计较等特质。ALS-M则为不同芯片决策提供尺度化的接入决策,赈济敞开生态和厂商荒谬互连条约的长入软件接口,为云计较等集群管制场景提供活泼和弹性的建树才能。
除名ALink System规范,阿里云瞎想了面向下一代超大界限AI集群的磐久AI Infra 2.0工作器。该工作器体现了敞开生态、高能效、高性能和高可用的瞎想理念,界说了AI计较节点和Scale Up/Scale Out互连络统,赈济业界主流AI决策,鼓舞了AI领域的“一云多芯”发展。
互连络统ALink System全面兼容UALink生态,与行业伙伴共同构建超高性能、超大界限的Scale UP集群互连才能。一级互连赈济64-80个节点,二级互连可达2000个以上节点,提供了PB级分享显存和TB级互连带宽,为AI的发展提供了高大的赈济。
AI Infra 2.0工作器集成了阿里自研的CIPU 3.0芯片,赈济高带宽大界限AI工作器的Scale Out汇聚彭胀,同期赋闲云汇聚的弹性和安全需求。在硬件工程方面,AI Infra 2.0工作器单机柜赈济最大80个AI计较节点,业界密度最高;经受400V PSU,单体供电效力可达98%,举座供电效力提高2%。散热瞎想上,机柜级液冷决策不错凭证本色负载动态养息CDU冷却才能来降调皮耗,单柜冷却系统节能30%。在运维管制上,全新的CableCartridge后可贵瞎想,赈济全盲插,零理线易运维、零误操作,可贵效力升迁50%。
在可靠性方面,AI Infra 2.0工作器赈济弹性节点、智能路由、高可靠供电、分离式CDU等本事,不错及时监控、探伤多样硬件故障并自愈,硬件的故障域也缩减到节点级。
阿里云在ALink System产业生态建筑上,秉握敞开互助的政策,鼓舞互连本事领域的发展和茁壮。自ALink System产业生态在敞开数据中心大会上细致发布以来,已有20多家AI芯片、互连芯片、工作器整机硬件和IP瞎想厂商加入,成员单元已就干系条约尺度制定和实行旅途选拔张开相同。
阿里云不仅是UALink的积极赈济者和ALink System产业生态的牵头者,已经OCP、CXL、UCIe和UEC等多个互连本事行业组织的创举成员或本事委员会成员,并用本色步履赈济干系敞开互连本事尺度的制定和落地。
通过这些互助和起劲,阿里云磐久AI Infra 2.0工作器与UALink定约的联袂,不仅展示了阿里云在AI基础挨次领域的本事实力和改进才能,也体现了阿里云在鼓舞敞开计较和AI本事发展中的归并地位。阿里云将链接引颈AI本事的异日发展,为世界客户提供愈加高大、活泼和高效的AI基础挨次处分决策。
在本届OCP峰会上,阿里云的展示和磋商不仅为与会者提供了潜入了解AI互连本事的契机,也为行业表里的不雅察者描摹了一个由改进运转的AI异日。跟着本事的不断朝上和互助的潜入,咱们有根由服气shibo体育游戏app平台,阿里云磐久AI Infra 2.0工作器将在AI领域演出越来越报复的脚色,为九行八业的数字化转型提供强有劲的赈济。