直播预告:Mooncake 如何破解成本、吞吐与长上下文困局? |《AI 进化论》第五期

简介: 大模型推理成本高、长文本卡壳?

在 AI 与本土化双重浪潮之下,服务器操作系统正迎来历史性变革。由龙蜥社区理事长单位阿里云联合 InfoQ 打造的直播 IP 栏目《AI 进化论:智算时代操作系统的破局之路》,以云、AI、安全等技术与服务器操作系统如何融合演进为主线,聚焦服务器操作系统在智算时代的进化之路,特邀学术权威、行业专家、客户代表围绕原生智能、原生安全、软硬协同等热点议题展开深度对话。截至目前,已直播四期,线上观看人次达 25 万+。


大模型应用加速普及的当下,推理面临高成本、低吞吐、长上下文适配难的瓶颈,而底层 OS 的资源调度与 IO 优化是破局关键。《AI 进化论:智算时代操作系统的破局之路》系列直播第五期将于 10 月 9 日 14:00 开始,特别邀请到清华大学副教授章明星,阿里云高级技术专家、Mooncake 项目核心贡献者马腾,InfoQ 极客传媒总经理、总编辑王一鹏三位嘉宾,围绕 “推理革命——Mooncake 如何破解成本、吞吐与长上下文困局” 这一主题展开深度探讨,聚焦 Mooncake 核心技术解析、企业落地实践及未来规划,共探大模型推理高效化路径。


更多直播亮点,可点击下方海报了解,欢迎大家打开微信,扫描二维码预约直播:

 

—— 完 ——


相关文章
|
19天前
|
存储 人工智能 OLAP
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
AI 上下文工程是管理大模型输入信息的系统化框架,解决提示工程中的幻觉、上下文溢出与信息冲突等问题。通过上下文的采集、存储、加工与调度,提升AI推理准确性与交互体验。AnalyticDB PostgreSQL 版提供增强 RAG、长记忆、Supabase 等能力,助力企业构建高效、稳定的 AI 应用。
|
2月前
|
存储 人工智能 Java
AI 超级智能体全栈项目阶段二:Prompt 优化技巧与学术分析 AI 应用开发实现上下文联系多轮对话
本文讲解 Prompt 基本概念与 10 个优化技巧,结合学术分析 AI 应用的需求分析、设计方案,介绍 Spring AI 中 ChatClient 及 Advisors 的使用。
944 133
AI 超级智能体全栈项目阶段二:Prompt 优化技巧与学术分析 AI 应用开发实现上下文联系多轮对话
|
17天前
|
存储 人工智能 OLAP
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
AI上下文工程是优化大模型交互的系统化框架,通过管理指令、记忆、知识库等上下文要素,解决信息缺失、长度溢出与上下文失效等问题。依托AnalyticDB等技术,实现上下文的采集、存储、组装与调度,提升AI Agent的准确性与协同效率,助力企业构建高效、稳定的智能应用。
|
24天前
|
机器学习/深度学习 人工智能 算法
拔俗AI智能营运分析助手:用技术破解企业“数据焦虑”
AI智能营运分析助手破解企业“数据多却难洞察”难题,通过自动化集成、定制化模型、可视化输出,助力中小企业实现低门槛数据驱动决策,提升营运效率与精准度。
|
24天前
|
机器学习/深度学习 人工智能 自然语言处理
拔俗AI评审管理系统:用技术破解“评审难”
AI评审系统破解效率低、标准不一、信息遗漏难题,通过多格式解析、智能打分、数据校验与人机协同,实现评审标准化、自动化,提升公平性与效率。
|
24天前
|
传感器 人工智能 搜索推荐
智慧AI群体化体格检查教学系统:破解体检教学“僧多粥少”难题
智慧AI体格检查教学系统,破解传统体检教学难题。支持20+学生同步实操指导,AI实时纠错、虚拟病例丰富、流程智能导航,提升教学效率与规范性,助力医教数字化升级。(238字)
|
1月前
|
人工智能 定位技术 数据库
工具设计+动态检索:上下文工程如何让AI智能体像人类一样思考?
本文深入解析AI Agent时代的上下文工程,阐述其从提示工程的演进逻辑,剖析系统提示、工具设计与示例策划三大核心,并探讨长时程任务应对策略,揭示高效信息流管理对构建可靠Agent的关键作用。建议收藏细读。
204 0
|
17天前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
249 29
|
1月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
322 19