Claude 4来了 ,与DeepSeek/Qwen/Hunyuan 谁更强?

简介: Claude 4发布,号称多项突破与超越。本文通过国内首款办公提效AI牛马智能体AiPy,在端午旅游规划场景下测评Claude 4、DeepSeek v3、Qwen-Plus和HunYuan-Turbos的表现。测评任务为制定1500元内端午旅行计划,并生成HTML报告。结果显示,Claude 4表现卓越但价格昂贵,是国产大模型的十倍以上;DeepSeek性价比高,值得称赞。国产大模型虽有亮点,但仍需努力追赶国际水平。测评结果附有各模型生成的报告截图对比。

Claude 4发布了,号称有无数个突破,无数个超越,那实际效果到底怎么样?是不是像传说中那么神?今天我们用国内首款办公提效AI牛马智能体AiPy来测评下,在端午旅游规划这个场景下,谁更强!

提示词:

租住在西二旗地铁站旁,一个月后计划结束北漂了,想留个念想,怎么趁今年端午节好好游玩下,给我做个规划,花销控制在1500元以内,结果保存成一份精美HTML报告,放在当前目录下。

测评智能体:

智能体:爱派(AiPy) v0.1.28

下载地址:www.aipy.app

项目特点:项目免费、开源,内置大模型种类丰富,搭配大模型,可操控电脑上任意软件/文件、手机APP、智能家居设备等。

测评大模型:

Claude Opus 4

DeepSeek v3 0324

qwen-plus-latest

hunyuan-turbos-latest

测评结论:

测评实际结果显示,Claude果然有过人之处,国产大模型需要加油了!当然Claude也贵,高于国产大模型十倍以上的差距,不得不为DeepSeek开创的高性价比模式点赞!
评价2.png

最后看实际生成的报告内容:

以下为AiPy使用Claude 4生成报告

claude旅行2.png

以下为AiPy使用Deepseek生成报告

ds旅行.png

以下为AiPy使用Qwen生成报告

qw旅行.png

以下为AiPy使用Hunyuan生成报告

qw旅行.png

相关文章
|
2月前
|
人工智能 IDE 开发工具
CodeGPT AI代码狂潮来袭!个人完全免费使用谷歌Gemini大模型 超越DeepSeek几乎是地表最强
CodeGPT是一款基于AI的编程辅助插件,支持代码生成、优化、错误分析和单元测试,兼容多种大模型如Gemini 2.0和Qwen2.5 Coder。免费开放,适配PyCharm等IDE,助力开发者提升效率,新手友好,老手提效利器。(238字)
280 1
CodeGPT AI代码狂潮来袭!个人完全免费使用谷歌Gemini大模型 超越DeepSeek几乎是地表最强
|
6月前
|
传感器 人工智能 算法
场景入选|TsingtaoAI基于DeepSeek的具身智能实训入选河北省垂直大模型应用场景名单
河北省网络社会组织联合会正式公布《垂直大模型应用场景征集结果名单》,TsingtaoAI自主研发的“基于DeepSeek的具身智能高校实训解决方案——从DeepSeek+机器人到通用具身智能”成功入选河北省15个标杆应用场景。这一成果标志着TsingtaoAI在具身智能与大模型融合领域的技术创新与落地能力获得政府及行业权威认可,同时也为人工智能技术与实体产业深度融合提供了可复制的示范案例。
186 0
|
7月前
|
人工智能 Linux API
119K star!无需GPU轻松本地部署多款大模型,DeepSeek支持!这个开源神器绝了
"只需一行命令就能在本地运行Llama 3、DeepSeek-R1等前沿大模型,支持Windows/Mac/Linux全平台,这个开源项目让AI开发从未如此简单!"
386 0
|
8月前
|
人工智能 自然语言处理 数据可视化
DeepSeek使用终极指南:解锁国产大模型的隐藏实力
DeepSeek作为国产大语言模型的佼佼者,支持多模态交互,在编码、数学和逻辑推理等方面表现卓越。本文从基础操作到进阶技巧全面解析其高效使用方法,涵盖精准提问法则、文件交互技巧、高级指令应用等,并提供智能客服、数据分析、教育培训等典型场景实战案例。同时提醒用户注意提问禁忌与安全规范,帮助开发者和普通用户充分挖掘DeepSeek的潜能,提升工作效率,探索智能解决方案。
638 0
|
4月前
|
人工智能 缓存 数据可视化
手把手玩转本地大模型:Ollama+DeepSeek+Dify 零门槛全流程指南
本文提供从零搭建本地AI工作站的完整指南,详解本地化部署大模型的核心优势(数据隐私/离线可用/成本可控),涵盖Ollama安装、DeepSeek-Coder模型部署、Dify可视化操作及API调用实战,助你打造安全高效的私有AI开发环境。
|
4月前
|
人工智能 搜索推荐 Linux
ollama部署本地DeepSeek大模型
本地部署大模型具有省钱省心、数据安全、使用自由、无需联网、量身定制及响应高效等优势。DeepSeek 提供满血版与多种蒸馏版模型,适配不同硬件条件。通过 Ollama 可便捷部署,并结合客户端工具如 AnythingLLM 提升交互体验,打造个性化本地 AI 助手。
499 0
|
5月前
|
人工智能 自然语言处理 机器人
盘点集成DeepSeek大模型的智能语音机器人,看看哪款更适合你
对话式AI将降低高达25%的客服座席离职率,集成DeepSeek等大模型的智能语音机器人正成企业标配。其核心是实现7x24小时高效服务、优化成本并提供人性化交互。选型需聚焦AI模型能力、业务场景匹配度与数据安全。合力亿捷、阿里云等是市场主流选择,选对智能语音机器人是企业提升沟通效率、构筑核心竞争力的战略投资。
220 0
|
7月前
|
Kubernetes 调度 异构计算
生产环境 K8S + Deepseek 实现大模型部署 和 容器调度(图解+史上最全)
生产环境 K8S + Deepseek 实现大模型部署 和 容器调度(图解+史上最全)
生产环境 K8S + Deepseek 实现大模型部署 和 容器调度(图解+史上最全)
|
8月前
|
人工智能 JavaScript 前端开发
一个支持阿里云百炼平台DeepSeek R1大模型(智能体)的Wordpress插件,AI Agent or Chatbot.
这是一个将阿里云DeepSeek AI服务集成到WordPress的聊天机器人插件,支持多轮对话、上下文记忆和自定义界面等功能。用户可通过短代码轻松添加到页面,并支持多种配置选项以满足不同需求。项目采用MIT协议授权,代码仓位于GitHub与Gitee。开发者Chi Leung为长期境外工作,代码注释以英文为主。适合需要在WordPress网站中快速部署AI助手的用户使用。
|
8月前
|
机器学习/深度学习 人工智能 NoSQL
JAVA接入DeepSeek大模型接口开发---阿里云的百炼模型
随着大模型的越来越盛行,现在很多企业开始接入大模型的接口,今天我从java开发角度来写一个demo的示例,用于接入DeepSeek大模型,国内的大模型有很多的接入渠道,今天主要介绍下阿里云的百炼模型,因为这个模型是免费的,只要注册一个账户,就会免费送百万的token进行学习,今天就从一个简单的可以执行的示例开始进行介绍,希望可以分享给各位正在学习的同学们。
1416 3
JAVA接入DeepSeek大模型接口开发---阿里云的百炼模型

热门文章

最新文章