阿里云CTO周靖人:通义开源模型下载量破2000万,百炼实现150%增长!

本文涉及的产品
多模态交互后付费免费试用,全链路、全Agent
简介: 阿里云CTO周靖人:通义开源模型下载量破2000万,百炼实现150%增长!


今日,在上海世界人工智能大会上,阿里云CTO周靖人公布近期通义大模型和阿里云百炼平台的最新进展。近2个月,通义千问开源模型下载量增长2倍,突破2000万次,阿里云百炼服务客户数从9万增长至23万,涨幅超150%


周靖人重申了阿里云拥抱开源开放的坚定立场,“两年前,我们在世界人工智能大会上发布通义大模型系列,当时我们公布,通义核心模型将开源开放。到今天,通义千问已经实现真正意义上的全尺寸、全模态开源,拉平了开源、闭源模型之间的差距。”




受开发者欢迎的通义开源大模型:

总下载量2个月内增长2倍


近一年来,通义模型系列持续进化,基础模型性能不断提升,引领国产大模型进入全球AI竞技场。根据权威基准OpenCompass的测评结果,通义千问-Max得分追平GPT-4 Turbo,是该基准首次录得国产大模型取得如此佳绩。


去年8月,通义率先加入开源行列,沿着“全模态、全尺寸”开源路线陆续推出了数十款模型,包括语言大模型、多模态大模型、混合专家模型、代码大模型等,在权威榜单多次创造中国大模型的“首次”。



19572c21c2a30d33e671090ce6888532.jpg


通义千问最新推出的开源模型Qwen2-72B更是风靡全球。在模型匿名PK、8000多位开发者参与投票的中文大模型竞技场Compass Arena上,Qwen2-72B-instruct以1090的总分取得国产大模型最高分,总分仅次于GPT-4o。在国际开源社区Hugging Face组织的Open LLM Leaderboard模型测评中,Qwen2-72B-instruct再度登顶,力压Llama-3、Mixtral、Phi-3等海外模型。



HuggingFace联合创始人兼CEO Clem发文表示:“Qwen2是王者,中国在全球开源大模型领域处于领导地位。”


d7f9059f569072253b47109d65f6f9dd.png


大模型的训练和迭代成本极高,绝大部分的AI开发者和中小企业都无法负担。周靖人表示,“阿里云主动开源性能达到GPT4级、超越众多闭源模型的大模型版本,真正拉平了开源、闭源模型之间的差距,让普通开发者也能用上最好的AI模型,大大加速了大模型的应用落地进程。”


通义千问Qwen系列开源模型在全球深受开发者群体欢迎,总下载量在近两个月内增长2倍,已突破2000万次。开源社区中还出现了超过3100款基于Qwen二次开发的模型和应用。


大模型的训练和迭代成本极高,绝大部分的AI开发者和中小企业都无法负担。周靖人表示,“阿里云主动开源性能达到GPT4级、超越众多闭源模型的大模型版本,真正拉平了开源、闭源模型之间的差距,让普通开发者也能用上最好的AI模型,大大加速了大模型的应用落地进程。”


通义千问Qwen系列开源模型在全球深受开发者群体欢迎,总下载量在近两个月内增长2倍,已突破2000万次。开源社区中还出现了超过3100款基于Qwen二次开发的模型和应用。


通义千问大降价后,

阿里云百炼服务客户数已从9万增长至23万


今年5月,百炼大模型平台全面升级为阿里云承载云+AI能力的重要平台,提供一站式、全托管的大模型定制与应用服务。


阿里云百炼平台主动拥抱社区生态,率先兼容LlamaIndex等开源框架,支持最大程度的开放性和自由度,让企业像搭乐高一样搭应用。开发者5到10行代码即可快速构建RAG应用,让大模型拥有“最强外挂”。


e2e4fe051395828fe8ff9bc26edb0ca0.png


在模型服务上,阿里云百炼同样坚持打造开放生态。目前,百炼平台集成了上百款大模型API,除了通义、Llama、ChatGLM等系列,还首家托管零一万物、百川智能等大模型,覆盖国内外主流厂商,联动魔搭开源社区,还支持企业上架通用或行业模型,给开发者提供足够多样化的模型选择。


a69ccca95ccdf79acb446a3be0e1a410.png


为了最大程度降低模型使用门槛、加速AI应用爆发,5月21日,通义千问系列模型大幅降价,GPT-4级主力模型直降97%,低至百万tokens仅0.5元。


周靖人介绍,降价后大批客户在阿里云上直接调用大模型。近2个月,百炼服务企业客户数从9万增长至23万,增长超150%。一汽、微博、金山、完美世界、央视网、蓝凌科技等众多知名企业都是阿里云百炼客户。


80103a917f828f48929e09759985aaa8.png


开源开放战略正为阿里云带来新的商业增长。周靖人强调,阿里云会将坚持拥抱开源开放,打造一朵“AI时代最开放的云”。阿里云将携手业界伙伴,持续通过开放的算力平台、开源的自研模型、优质的模型服务,帮助中国企业和开发者抓住大模型时代的机遇。


/ END /

目录
相关文章
|
2月前
|
分布式计算 测试技术 Spark
科大讯飞开源星火化学大模型、文生音效模型
近期,科大讯飞在魔搭社区(ModelScope)和Gitcode上开源两款模型:讯飞星火化学大模型Spark Chemistry-X1-13B、讯飞文生音频模型AudioFly,助力前沿化学技术研究,以及声音生成技术和应用的探索。
199 2
|
2月前
|
人工智能 Java API
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
本文介绍AI大模型的核心概念、分类及开发者学习路径,重点讲解如何选择与接入大模型。项目基于Spring Boot,使用阿里云灵积模型(Qwen-Plus),对比SDK、HTTP、Spring AI和LangChain4j四种接入方式,助力开发者高效构建AI应用。
1083 122
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
|
21天前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
213 120
|
2月前
|
自然语言处理 机器人 图形学
腾讯混元图像3.0正式开源发布!80B,首个工业级原生多模态生图模型
腾讯混元图像3.0,真的来了——开源,免费开放使用。 正式介绍一下:混元图像3.0(HunyuanImage 3.0),是首个工业级原生多模态生图模型,参数规模80B,也是目前测评效果最好、参数量最大的开源生图模型,效果可对…
604 2
腾讯混元图像3.0正式开源发布!80B,首个工业级原生多模态生图模型
|
19天前
|
缓存 物联网 PyTorch
使用TensorRT LLM构建和运行Qwen模型
本文档介绍如何在单GPU和单节点多GPU上使用TensorRT LLM构建和运行Qwen模型,涵盖模型转换、引擎构建、量化推理及LoRA微调等操作,并提供详细的代码示例与支持矩阵。
222 2
|
2月前
|
机器学习/深度学习 人工智能 数据安全/隐私保护
阿里云 Qwen3 全栈 AI 模型:技术解析、开发者实操指南与 100 万企业落地案例
阿里云发布Qwen3全栈AI体系,推出Qwen3-Max、Qwen3-Next等七大模型,性能全球领先,开源生态超6亿次下载。支持百万级上下文、多模态理解,训练成本降90%,助力企业高效落地AI。覆盖制造、金融、创作等场景,提供无代码与代码级开发工具,共建超级AI云生态。
579 6
|
1月前
|
存储 机器学习/深度学习 人工智能
54_模型优化:大模型的压缩与量化
随着大型语言模型(LLM)的快速发展,模型规模呈指数级增长,从最初的数亿参数到如今的数千亿甚至万亿参数。这种规模扩张带来了惊人的能源消耗和训练成本,同时也给部署和推理带来了巨大挑战。2025年,大模型的"瘦身"已成为行业发展的必然趋势。本文将深入剖析大模型压缩与量化的核心技术、最新进展及工程实践,探讨如何通过创新技术让大模型在保持高性能的同时实现轻量化部署,为企业和开发者提供全面的技术指导。

相关产品

  • 大模型服务平台百炼