2021年12月11日-12日,由Linux基金会、LF AI &DATA、LF Edge、CNCF、LFN等开源社区联合举办,开源科技OSTech和西丽湖人才服务中心协办的Kubernetes on AI & Edge Day在深圳召开。会中,大咖云集、干货满满。对目前云原生、AI、边缘计算、开放网络以及开源社区的现状及未来进行了深度剖析解读,为现场以及线上收看直播的观众奉献了十数场精彩纷呈的主题分享。
LF AI &DATA基金会主席堵俊平先生致辞
LF AI &DATA基金会在过去三年中,共有383个组织参与了代码提交,见证了开源社区的壮大与成长。同时也在面临很多挑战,例如算力、人才、建立信任、数据隐私等等。需要大家携手并进,为开源社区的发展一起努力。
CNCF亚太区首席战略官陈泽辉致辞
疫情的出现让更多的开源社区,正在以一种新使命感向前推进。越来越多的社区在获得持续性增长,交付质量和速度也有着明显提升。并分享多个成功案例。再次验证了那句经典老话“开源不是零和游戏,你在帮助别人的同时也在帮助自己”。
尖峰对话
LF AI &DATA基金会主席堵俊平先生、CNCF亚太区首席战略官陈泽辉
两位共同探讨在数字时代云原生与AI开源社区的角色和未来。他们认为在当下,各开源社区应进一步加强协作、深度融合、互相赋能,让开源社区更加强大。最后,两位大咖还就云原生、AI两者之间的关系展开讨论。他们认为,两者一个偏底层创新,另一个则偏应用层,并不是分割、对立,而应该互补。
华为黄之鹏:MindSpore Community Operation
华为昇腾开源生态总监黄之鹏
目前MindSpore正在逐渐成为面向全球的中国第一热度人工智能开源社区。他坚信,想要一个社区能健康成长,必须能让每个用户拥有足够的幸福感。这又体现在技术、文化等多个方面。同时,通过多渠道推广分享、公正的管理等扽,才能让开源社区快速健康的发展。精彩的内容也得到了众多行业大咖与开源社区同学的一致赞同。
OPPO:ChubaoFS云原生存储平台落地经验
OPPO分布式存储架构师常亮
作为首个国产开源存储系统,ChubaoFS已经在众多大型企业的业务场景中得以应用。借助开源,也让ChubaoFS拥有更强的包容和开放性。可进一步提升元数据性能,降低运维成本。
K8s超大规模机器学习平台实践和基于ONNX Runtime训练加速
lead of AI product in Azure Office of CTO Asia Henry Zeng
As AI and ML demands and application keep booming, the requirements for AI platform is growing to facilitate AI practitioners to experiment with state-of-art ideas, build and deploy production ready models to create business values. A highly stable, scalable, resilient and user friendly AI platform will accelerate the research and landing of AI. Furthermore, with the advancement of large foundation model, training performance becomes critical for both time to value and carbon emission.
In this presentation, we will share the experience and best practices on how we develop and operate a super large scale and highly reliable GPU and CPU AI platform based on Kubernetes, including,
1.Stability of super scale Kubernetes clusters on nodes, service and applications
2.Scheduler for different AI workloads to balance utilization and fairness
3.Best practice to run large scale distributed AI workload
4.Accelerate large foundation model training with ONNX runtime
腾讯:全场景在离线混部系统Caelus项目
腾讯高级工程师陈东东
主流的容器编排在实际应用中会遇到诸多挑战,例如资源分配不高效、调度不够合理等等。在离线混部系统,可以在线作业运行过程中填充离线作业,来提高资源利用率。但也存在很多难题,系统庞大、组件众多,需要多团队配合等等。借助Caelus方案,可以有效提升资源利用率,强化共享能力,满足更丰富的应用需求。
国开启科:当量子计算遇上人工智能
国开启科量子技术(北京)有限公司首席算法工程师 陈健明
量子计算拥有原生的随机数生成、更快的模型训练、减少优化过程时间复杂度、处理更复杂网络的优点。他认为,嘈杂中兴量子机器将成为未来若干年内原生量子硬件的主流。而如何在现有经典硬件上提高量子模拟器的可扩展性及效率,也将成为量子计算产业化的主要课题。
华为:基于Volcano的离在线业务混部技术探索
华为昇腾开源生态总监黄之鹏
在目前单集群规模大、资源冗余大、需求波动大、利用率低的情境下。云原生基础设施已成为混部主流方案。借助Volcano混部技术,可以实现统一调度、资源隔离,统一用户体验。最后对混部技术未来做简单展望。
KubeCon论道:AI + 云原生的机遇与挑战
LF AI & DATA基金会主席 堵俊平、CNCF亚太区首席战略官 陈泽辉、华为昇腾开源生态总监 黄之鹏 Linux Foundation 亚太区总监 杨轩
各位嘉宾就如何强化各协会之间的合作关系、开源社区运营中的趣事及云原生与AI之间的关系作精彩分享。例如:各协会应如何加强合作,怎样加强生态联系等等。独到的观点赢得与会观众热烈的掌声。
DAY2
主持人开场
新华三网络产品线开源联络官 马乐
今天的活动是CNCF、LF Networking、LF Edge三个社区的融合,也是来自基金会、运营商、厂商等行业专家们分享观点的舞台,更是我们线上线下参与此次活动的每一位社区伙伴们畅所欲言的最佳平台。
协同共进:CNCF与开放网络和边缘计算
CNCF亚太区首席战略官 陈泽辉致辞
数据显示,2025年,四分之三的企业级数据在边缘创建和处理。边缘计算、云原生为我们提供了更多的容错率。陈泽辉通过上汽大通的案例,详细展示了云原生所带来的效益提升。未来云原生进一步加强与5G融合,势必带来更大的收益。
中国移动:从XGVela项目及网络云云原生研究中获得的经验
中国移动研究院项目经理 赵奇慧
中国移动网络云主要承载4G/5G等核心网网元,以虚拟机为主要基础设施形态,网元虚拟化比例超75%,但存在敏捷性不足等问题。中国移动探索使用云原生理念及技术解决此类问题,从网元、云平台、组织流程三方面同步着手挖掘网络云云原生演进方法,当前已在UPF微服务化及云原生设计方面积累经验,并沉淀部分网元通用的管理类Telco PaaS能力开源至XGVela项目。中国移动希望进一步强化产学研多方合作,共同在网络云中推进云原生技术。
华为:Kubernetes性能优化实践分享
华为电信云开源软件专家 梁胜展
通过峰值波动优化、 watch 链路优化、dockershim瓶颈优化等等,可以有效解决边缘场景的多个痛点。他认为,开源社区是一个很好的技能学习平台;依托开源软件,可以迅速补齐产品能力差距。但更重要的是,作为其中一份子,应该主动储备技能,深入了解;不做拿来主义。
中国电信:ONAP意图驱动网络闭环自治
中国电信研究院研发工程师 王栋
随着电信运营商、有线运营商、云服务提供商以及他们的方案提供商对通用自动化平台需求的增加,随愿意图网络变得愈发重要,ONAP项目作为一个为网络运营商、云服务商和企业的网络及边缘计算提供编排、管理和自动化服务的综合平台,可以帮助企业解决诸多难题。目前,中国电信已在随愿网络技术领域实现“学术研究-标准制定-国际开源开发”完整闭环研发链。未来将继续解决跨云、多云的管理。
中国移动:意图网络管理研究
中国移动研究院软件架构师 何克光
进一步就意图网络展开讨论。他认为,意图网络的出现将会加速技术创新、提升效率、降低成本,最终实现增加商业价值的目的。但目前意图研究依旧处于初步阶段,难点主要在于运营商与制造商难以达成一致、对接口、意图表达模型缺乏共识以及缺乏对意图信息模型和数据模型的定义。这些都造成了意图网络研究的缓慢进展。目前中国移动正在通过增强功能、应用新技术以及丰富用例,强化意图研究。最终实现2025年建立L4级意图自智网络。
ZTE:网络质量仿真在网络自动化应用
ZTE的资深网管软件工程师 黄卓垚
TMF自治网络成为目前重要课题,但如何保证系统参与环节的正确性,又成为新难题。通过网络仿真可以解决难题,但无论离散事件模型还是图神经网络模型,都有各自缺点。但图神经网络依旧就有更强操作性,中兴AI技术团队也解决了各类难题,为意图驱动的网络自动化贡献了自己的力量。
KubeCon论道:边缘计算产业对话
CNCF亚太区首席战略官 陈泽辉、华为首席开源联络官 任旭东、Linux Foundation 亚太区总监 杨轩
三位就自身从事边缘+云原生领域的经验,展开对目前所面临的挑战与机遇展开讨论。就社区如何帮助开发者把握住这个万亿产业新机遇和如何帮助他们应对挑战、两个开源社区如何开展合作,两者整合能激发怎样火花作精彩分享。
PPIO:5G时代的边缘智能与云边协同
PPIO边缘云首席科学家、天津大学计算机科学与技术学院教授、博士生导师 王晓飞
在5G时代,目前AI技术面临包括带宽限制、存储受限、AI算力受限、时延等众多挑战,边缘智能开始提上议程,成为解决问题的关键。PPIO边缘云可实现广覆盖、成本低等目标。目前已服务了包括传统云厂商、创业公司等多类别客户。但目前,复杂性、动态性、实践性,都是边云协同的困难,机遇与挑战并存。
EdgeGallery新版本特性以及与eKuiper深度联合提供边缘数据流处理服务
华为边缘计算资深技术专家、EdgeGallery TSC主席、DPDK社区董事 于洋
EMQ资深软件工程师 黄济泳
EdgeGallery不断迭代,只为让5G能力在边缘触手可及。全新的F版本中,进一步优化Edge Native架构、E2E边缘应用自助订购以及开发集成以及模块增强。让EdgeGallery更加易用。作为边缘流式计算引擎,LF Edge eKuiper则可以提供轻量化、高性能、易扩展、丰富的源和目标支持等优势,为我们提供更丰富的应用场景。
中国联通:5G MEC基础设施共建共享关键技术分析
中国联通研究院未来网络研究中心移动网室主任 黄蓉
在算力从中心云延展到边缘,同时网络和算力在边缘加速融合的当下, 移动通信网络共建共享已经是趋势。电信运营商可提供端到端网络SLA保障,互联网厂商则拥有深厚的IT技术基础及强大的云研发能力。两者合作才能形成“统一”的边缘算力资源池,成为连接万物,赋能业务的社会化信息基础设施。目前中国联通已取得一定成绩,但未来如何实现真正去中心化依旧值得探讨。
KubeEdge:基于KubeEdge的云原生边缘计算架构设计与实践
KubeEdge社区核心开发者 许世威
目前边缘计算难题众多,无论是复杂的细分领域还是边云通信质量低等,始终困扰着边缘计算的发展。KubeEdge的开放生态、支持复杂边云网络环境等核心理念,在很大程度上解决上述难题,目前社区拥有众多用户及合作伙伴。未来将在基础架构、平台能力、领域场景三大方面继续深化,为边缘云计算及云原生添砖添瓦。
VMware:EdgeXFoundry与基于Kubernetes的、中立的云边协同探索
VMware中国研发总监 路广
数据显示,云边协同时代的经济规模,有望达到四万亿。云原生平台如何扩展到边缘,成为行业热议话题。Kubernetes将成为新的基础设施管理标准。为此,对云边协同提出了更多要求,例如云边协同的安全性与一致性、对开发人员的经验及能力有更高要求、不同云管理程序的性能变化与成本控制等等。最终目标为进一步优化安装与升级过程、强化多云协作等等。
新华三:5G边缘计算和云原生融合实践
新华三技术有限公司系统架构师 谢瑞涛
H3C 5G边缘计算系统是以EdgeGallery为基础,以支持云原生应用和物联网设备为目标的边缘应用接入平台。具备架构兼容性、简单易用、平滑系统对接、DNS自学习及均衡负载等优点。可与区块链、AI多领域进行融合对接。
Juniper Network:Tungsten Fabric在边缘计算场景中的应用
Juniper Network中国区创新事业部资深架构师 范桂飓
分布式云是未来主流。但无论如何,都需要解决云与云之间的关系构建问题。Tungsten Fabric作为是多云统一的SDN方案,拥有比较悠久的开源历史。其设计理念包括集中式分布器、分布式网关、互联一切。在云网构建中,起到统一异构资源池,实现多云部署等作用。
结束致辞
Linux Foundation 亚太区总监 杨轩
5G时代,云计算与边缘计算将进一步融合。各开源社区、企业也应携手并进,尽可能展开深入合作,共同见证新时代的到来。
精彩展示
12月11日大合照
12月12日大合照
寻找Kube仔
Party time
至此,持续两天的Kubernetes on AI & Edge Day完美落幕,众多行业大咖为现场以及线上观众,奉献了一场场精彩的观点及经验分享。虽然有疫情影响,但丝毫没有影响大家的热情,也让我们对Kubernetes、AI、开源、边缘云有了更深一层的认知。也欢迎更多对开源等领域有兴趣的小伙伴加入到这个大家庭中。