脸 Kub华为重磅露 原生技能交融跃迁驱动云原生向 AI
级别: 超级版主
UID: 2
积分:1967加为好友
威望:3415 精华: 735
主题:7571 回复:6
注册时间:14:26
在线时长:86715
1#  发表于:2025-07-04 05:55:05

6 月 10 日-11 日,重磅由云原生核算基金会(CNCF)和 Linux 基金会联合主办的露脸 KubeCon+CloudNativeCon China 2025 ,在我国香港隆重举行。驱动作为全球云原生与开源尖端会议,云原原生跃迁大会会聚了来自全球的技能交融开源开发者 、技能首领 、重磅企业代表及终端用户,露脸深度评论云原生与 AI 交融的驱动最新进展与未来趋势 ,一起见证了这一技能盛宴 。云原原生跃迁

作为全球云原生技能与开源生态建设的技能交融前锋,华为携 10 多位大咖和技能专家深度参加本次大会,重磅带来了 3 场 Keynote 主题讲演及 10 多个技能分会场的露脸同享 。,驱动全方位展现了在云原生与 AI 交融范畴的云原原生跃迁打破性效果。

开源生态引领 AI 年代技能跃迁 。技能交融

开源作为加快立异协同的重要范式,会聚全球才智 、缩短立异周期 、催化更多立异运用落地 ,也为下一轮技能革新发明指数级价值 。

会上 ,华为首席开源联络官、CNCF 基金会董事任旭东 。带来。《Towards Clouds of AI Clusters》 。的 Keynote 主题讲演,同享了 AI 年代的算力集群技能演进趋势 ,华为在异构集群办理  、超大规划集群调度、云边协同 AI 等范畴的运用实践等。

图片 1.png

任旭东表明 ,当时企业在办理 AI 作业负载时 ,仍面对严峻应战 ,尤其是在大模型练习 、推理中对算力规划和集群协同的极高要求  。集群并行核算提高算力规划将是企业打破算力瓶颈、完成大模型落地的必经之路  。

为呼应上述需求 ,华为从硬件驱动到集群资源调度完成算力设备的一致办理,支撑 HyperNode 与多集群拓扑感知调度,并对 PyTorch/TensorFlow/MindSpore 等干流结构、大言语模型(LLMs)及智能体开发场景供给一致支撑的全栈开源基础设施处理计划。

“经过 openEuler、Volcano 、Karmada 、KubeEdge 、openFuyao 五大项目,华为完成了从操作体系到渠道层的全栈开源打通与落地,协助企业完成 AI 集群内优化 、跨集群协同和云边协同 ,然后破解人工智能开展算力基础设施上面对的困局 。” 。

Volcano+Karmada 驱动。

B站亿级月活云原生 AI 调度跃迁 。

华为如此原生开源负责人,CNCF 技能监督委员会副主席王泽锋 。联合 。 BiliBili 资深开发工程师许龙 。 ,宣布。《Bilibili 构建高效云原生 AI 渠道的实践之路》 。的 Keynote 主题讲演 ,深入评论视频网站人工智能作业负载调度优化途径 。

图片 2.png

Bilibili 具有上亿月活用户,环绕视频事务掩盖查找引荐、图画处理 、视频编解码等多种运用场景。在 AI 技能深度浸透视频处理 、模型练习等场景的当下,B站面对负载多样性 、多集群办理等算力应战 ,构建了以 Volcano 和 Karmada 为中心的调度结构:单集群侧经过 Volcano 完成 Workload 一致调度,引进等价类调度与 JobSet 目标优化功用;多集群层用 Karmada 支撑在线使命联邦调度,自研轻量体系处理离线高吞吐需求 。结合 GPU 同享调度 、编解码混合等三种方式 ,在提高资源运用率的一起,为B站 AI 运用落地供给了高效的云原生算力支撑。

Volcano 助力科大讯飞完成 AI 基础设施打破 ,

赢得 CNCF 最终用户事例 。

会上,华为如此原生团队高级工程师常旭征 。联合 。科大讯飞渠道架构师董江 。 ,宣布。《Scaling Model Training with Volcano: iFlytek's Kubernetes Breakthrough》 。的 Keynote 主题讲演,同享根据 Volcano 的云原生 AI 练习资源调度优化计划 。

科大讯飞在大规划模型练习中凭借 Volcano 完成要害打破 :经过构建根据 Volcano 的一致核算渠道,集成 AirFlow / Spark 等传统使命结构 ,以行列机制处理多租户资源公正分配问题 ,一起运用 Gang 调度、Binpack 算法及拓扑感知战略,将 GPU 运用率提高 40% 以上 ,毛病恢复时刻缩短 70%,资源搅扰率下降 50%,保证事务稳定性和资源运用灵活性。

图片 3.png

Volcano 是华为云建议开源的业界首个云原生批量核算引擎,也是 CNCF 首个批量核算项目 ,首要用于 AI 、大数据、基因 、烘托等许多高功用核算场景,才能包括行列与资源办理、一致作业 API 、多样化调度战略  、在离线混部、GPU 虚拟化、异构算力支撑及功用优化等要害范畴。针对当时大规划 AI 集群的功用问题 ,Volcano 新增根据 HyperNode 的网络拓扑感知调度战略,大幅提高人工智能练习和推理功率。

Cloud Native for AI:

多范畴技能立异使能工业晋级 。

Karmada :破解 AI 使命布置多集群编列难题,支撑大规划数据渠道的弹性与牢靠性 。

Karmada 作为云原生多云多集群办理引擎备受用户与开发者欢迎 。来自。华为云的 Karmada 社区 Maintainer 任洪彩 。,环绕 Karmada 的技能更新 、中心特性 、实践运用事例及社区生态 ,解说了近期版别中备受重视的运用跨集群翻滚更新 ,有状况运用毛病搬迁,优先级调度机制 ,Dashboard,联邦资源配额等特性 。

图片 4.png

一起,华为云技能团队也与 Bloomberg 进行了社区协作沟通 。Bloomberg 同享了其运用 Karmada 构建弹性数据剖析渠道的实践经验 ,展现了 Karmada 在多集群办理场景下的优势功用。经过功用迭代和生态扩展,Karmada 处理了企业在跨集群办理中的中心应战 ,Bloomberg 等企业的实践证明,Karmada 可以有用支撑大规划数据渠道的弹性与牢靠性需求,未来在 AI 练习、边际核算等场景的拓宽值得等待。

KubeEdge 赋能多范畴 、多场景边云协同 AI 智算 。

来自 。华为如此原生团队的 KubeEdge 社区 Maintainer 鲍玥。,携手社区同伴 ,带来 4 场云原生边际核算技能讲演,议题包括 KubeEdge 大规划完成 、落地事例同享以及社区办理作业等多个方向。在“KubeEdge 社区新特性解读及多元场景事例”、“运用混沌工程构建超大规划云原生边际体系” 、“KubeEdge 深度探究 :架构  、用例和项目结业动态”系列议题中 ,KubeEdge 同享了社区在才智物流、机器人编列等范畴的职业事例,介绍了项目在边际场景中发挥的一致化办理 、边际自愈、实时性等优势 ,一起也带来了社区最新的新特性,包括支撑批量边际节点办理 ,全新 DashBoard,子项目 Sedna 支撑 HPA 等 ,以及在支撑大规划场景的探究实践。

图片 5.png

作为 CNCF 首个云原生边际核算结业级项目,KubeEdge 的结业旅程备受重视,在“ KubeEdge 结业探究:从零开始构建多元化 、协作型开源社区”圆桌中,KubeEdge TSC 等技能专家 ,一起向参会者同享总结了 KubeEdge 在社区开展与结业进程中所做的作业 ,从技能成熟度 、采用率、社区多样化、中立性等多个视点评论社区健康开展的要害要素,并对 KubeEdge 结业后的作业进行了规划与展望 。

Kmesh: 内核级流量办理引擎, 高效应对大规划流量运用需求。

Kmesh 是集高功用、低开支及安全牢靠于一身的内核级云原生流量办理引擎。本次大会上,来自 。华为云的 Kmesh 社区技能专家徐中虎 。一行 ,在 4 场议题讲演中同享 ,包括 Service Mesh 高功用、低底噪  、安全性,易用性方面的评论。本着轻量 、易用、运用无侵入的规划准则 ,Kmesh 运用 eBPF 将 Service Mesh 彻底革新 ,推出业界极具竞争力的 Sidecarless 计划,在功用和牢靠性上遥遥领先 。

图片 6.png

Kmesh 从高功用  、低开支技能愿景动身 ,凭借 kfunc ,内核原生方式将流量办理才能彻底下沉到 Kernel Space 。一起,为处理 Service Mesh 重启晋级影响用户事务稳定性的问题  ,Kmesh 用 eBPF prog 和 BPF Map 与 Kmesh Daemon 运转进程别离的方法,完成重启晋级不影响事务已有衔接,减少了 Service Mesh 对事务稳定性的影响。Kmesh 立异性地运用 Linux 内核的 XDP 技能 ,在网络包进入内核协议栈之前就进行快速处理  ,极大地下降了时延 ,提高了吞吐,克服了在处理大规划流量时 ,用户态鉴权存在的瓶颈,完成了服务间极致的鉴权功用 。

openGemini:高功用时序数据库,下降企业事务本钱。

openGemini 是一款高功用时序数据库 ,首要面向物联网,车联网和运维监控等场景 ,为用户供给海量时序数据的高效存储和查询。openGemini 现在现已在动力、电力 、航空航天、devops 、物联网 、车联网 、矿山 、大宗物流等 9 大范畴运用落地。本届 KubeCon China ,openGemini 正式以 CNCF Sandbox 项目的身份参加。

图片 7.png

会上 ,来自  。华为云的 openGemini 社区 Maintainer 向宇。 ,向与会者介绍了 openGemini 技能特性与未来规划 ,并要点介绍了数据多副本及流式核算两个重要新特性 ,多副本可满意大都事务对数据牢靠性的需求 ,一起社区将流式核算融入内核,简化事务架构 ,下降事务本钱。

openFuyao:为国际供给多样化算力集群软件生态。

openFuyao 架构师姚晓忠 。带来“构建核算亲和性云原生生态体系”主题讲演,他表明 ,在“云原生 + AI”的新范式年代 ,面对软件生态适配缺乏、AI 负载特性杂乱、软件工程杂乱度提高等技能应战。为此 ,openFuyao 打造多样化算力互联的集群办理与调度体系,促进 AI 和大数据场景有用算力的高效开释  ,构筑算力亲和的高功用运用生态社区 ,为开发者和同伴供给立异处理计划 。会上同步介绍了第一批开源的五大集群调度才能及两类面向常用场景的参阅完成 ,并在现场同与会专家火热评论怎么经过 openFuyao 来构建具有高效核算集群办理才能的云原生体系 。

AI-Native 立异 ,加快全球智能化  。

除了以上说到的主题同享之外 ,华为展区更是引来很多参会者停步沟通  。华为云解说专家向与会者展现了 AI-Native 的云原生基础设施,包括 UCS ,CCI ,CCE Autopilot,CCE Turbo 等多个职业级云原生代表产品  ,并介绍了在 KubeEdge 、Volcano 、Karmada 、Kuasar、openGemini、Kmesh 等业界创始开源项目中的技能立异效果。

图片 8.png

openFuyao 携“云原生 + AI”工业交融硬核计划冷艳露脸,招引开发者停步沟通 ,共探落地实践场景 。

展区还展现了华为环绕鲲鹏  、昇腾所构建的全栈生态和最新进展,经过建议包括服务器操作体系 openEuler、企业级开源数据库 openGauss、AI 结构昇思 MindSpore、昇腾 AI 算力底座 CANN 等在内的开源社区和项目为国际供给第二挑选 。一起积极参加干流上游开源社区的鲲鹏、昇腾使能和优化 ,现已完成了掩盖从底层硬件 、操作体系、数据库到 AI 结构的全栈才能 ,经过软硬协同、多元硬件生态及云原生技能整合 ,以规划化落地效果为 AI 原生年代供给了坚实的“算力 + 生态”一体化基础设施蓝图 。

未来 ,华为将持续与全球企业和开发者携手 ,经过开源会聚全球才智 ,一起应对当时的应战 ,推进 AI 和云原生技能的立异与运用 ,为千行万业智能化转型  、为构建全球智能化未来 ,贡献力量  !

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等方式) ,用于传递更多信息 ,节约甄选时刻 ,成果仅供参阅 ,一切文章均包括本声明 。