🌟 本月重点速览
三大引擎齐发:多模态模型矩阵全面升级 × MCP生态极速扩容 × 电商/AI生图应用模板落地。
✅多模态模型大上新:本月发布 9款Qwen3-VL系列新模型,覆盖32B/30B/8B等多尺寸,支持思考模式、超长视频理解、2D/3D空间定位,并推出统一多模态向量模型 Qwen2.5-VL-Embedding 与 高精度多语种语音识别模型 Qwen3-ASR-Flash-Realtime。
✅MCP生态再扩容:本月新增17个云部署MCP服务,包括 AIVPP虚拟电厂、通义万相2.5图像视频生成、Vidu AI生视频、VideoCreationTools视频合成工具箱 等,智能体能力边界持续拓展。
✅成本优化新机制:Qwen-Doc-Turbo、Qwen3-Max等主流模型支持上下文缓存(Cache),命中缓存输入最低享1折优惠,显著降低高频调用成本。
✅开箱即用应用模板上线:本月上线专为电商卖家设计的应用模板有👉一键生成电商组图、宠物店数字人视频。
一、模型动态
🚀 全新多模态模型矩阵发布
模型名称 |
类型 |
核心能力 |
适用场景 |
多模态模型 |
单次请求返回多张图片、缩短响应时间 |
图片生成、单次生成多张图片 |
|
开源Dense模型 |
文档理解、空间感知、2D检测、万物识别 |
复杂视觉感知任务 |
|
小尺寸高效模型 |
融合思考/非思考模式,响应快,支持长视频/长文档 |
实时交互、边缘部署 |
|
开源MoE模型 |
强多模态推理 + 2D/3D定位,超长上下文支持 |
视觉智能体、AR/VR |
|
轻量级模型 |
低显存占用,保留核心视觉理解能力 |
移动端、低成本场景 |
|
统一多模态向量 |
支持文本/图/视频混合输入,输出统一向量 |
跨模态检索、图搜、视频聚类 |
|
语音识别 |
自动语种识别,支持11语种,高鲁棒性 |
会议转录、客服质检、多语种内容生产 |
🔍 其他重要模型更新
- Qwen3-Rerank:基于Qwen底座的文本排序模型,支持100+语种与长文本,专为RAG/搜索优化。
- GLM-4.6:智谱新一代旗舰模型,3550亿总参数,200K上下文,综合能力全面超越GLM-4.5。
- Cache计费上线:
Qwen-Doc-Turbo:新增Cache计费,在原价的基础上命中缓存的输入享受2折优惠。🔗上下文缓存Qwen3-Max、Qwen-Plus、Qwen-Flash、Qwen3-Coder-Flash: 增加显式缓存Cache功能,命中缓存的输入最低可享受1折优惠。🔗上下文缓存
二、产品动态
🌐 MCP市场
本月上架 17个云部署MCP Server,覆盖能源、创意、工具等场景:
- 一方服务:AIVPP虚拟电厂、通义万相2.5(图像/视频生成)
- 三方服务:Vidu AI生视频、VideoCreationTools视频合成工具箱
✅ 支持 一键开通、即开即用,快速扩展Agent能力。🔗MCP市场
🎯 应用模板
本月上架2个电商类应用模板,包含一键生成电商组图、宠物店内容营销。更多内容详见🔗应用模板
三、热门活动
→ 专为电商设计,一键生成电商场景Agent,完成任务有机会领取礼品哦,快来参与吧~
四、精选好文推荐
- 《通义Qwen3-Max:大就是好》
→ 深度解析Qwen3-Max在复杂任务中的“涌现能力”。 - 《实训Agent创客:一键生成电商场景Agent》
→ 手把手教你用阿里云百炼搭建电商场景Agent。 - 《Agent创客「是花子呀」:用Wan2.5打造电商AI生图机器》
→ 真实用户案例:日均生成500+商品图,转化率提升22%。 - 【MCP实战】LangChain + Qwen3-Max 构建商品详情页应用
→ 从0到1集成自定义MCP,打造端到端AI应用。 - 《阿里云AI基础设施成果入选顶级学术会议》
→ GPU利用率提升40%,支撑千卡级大模型训练。