Claude 4来了，与DeepSeek/Qwen/Hunyuan 谁更强？-阿里云开发者社区

Claude 4来了，与DeepSeek/Qwen/Hunyuan 谁更强？

2025-05-23 575

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Claude 4发布，号称多项突破与超越。本文通过国内首款办公提效AI牛马智能体AiPy，在端午旅游规划场景下测评Claude 4、DeepSeek v3、Qwen-Plus和HunYuan-Turbos的表现。测评任务为制定1500元内端午旅行计划，并生成HTML报告。结果显示，Claude 4表现卓越但价格昂贵，是国产大模型的十倍以上；DeepSeek性价比高，值得称赞。国产大模型虽有亮点，但仍需努力追赶国际水平。测评结果附有各模型生成的报告截图对比。

Claude 4发布了，号称有无数个突破，无数个超越，那实际效果到底怎么样？是不是像传说中那么神？今天我们用国内首款办公提效AI牛马智能体AiPy来测评下，在端午旅游规划这个场景下，谁更强！

提示词：

租住在西二旗地铁站旁，一个月后计划结束北漂了，想留个念想，怎么趁今年端午节好好游玩下，给我做个规划，花销控制在1500元以内，结果保存成一份精美HTML报告，放在当前目录下。

测评智能体：

智能体：爱派（AiPy） v0.1.28

下载地址：www.aipy.app

项目特点：项目免费、开源，内置大模型种类丰富，搭配大模型，可操控电脑上任意软件/文件、手机APP、智能家居设备等。

测评大模型：

Claude Opus 4

DeepSeek v3 0324

qwen-plus-latest

hunyuan-turbos-latest

测评结论：

测评实际结果显示，Claude果然有过人之处，国产大模型需要加油了！当然Claude也贵，高于国产大模型十倍以上的差距，不得不为DeepSeek开创的高性价比模式点赞！
评价2.png

最后看实际生成的报告内容：

以下为AiPy使用Claude 4生成报告

claude旅行2.png

以下为AiPy使用Deepseek生成报告

ds旅行.png

以下为AiPy使用Qwen生成报告

qw旅行.png

以下为AiPy使用Hunyuan生成报告

qw旅行.png

Claude 4来了，与DeepSeek/Qwen/Hunyuan 谁更强？

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Claude 4来了 ，与DeepSeek/Qwen/Hunyuan 谁更强？

热门文章

最新文章

相关课程

相关电子书

相关实验场景

Claude 4来了，与DeepSeek/Qwen/Hunyuan 谁更强？