阿里云PAI部署DeepSeek及调用

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 本文介绍如何在阿里云PAI EAS上部署DeepSeek模型,涵盖7B模型的部署、SDK和API调用。7B模型只需一张A10显卡,部署时间约10分钟。文章详细展示了模型信息查看、在线调试及通过OpenAI SDK和Python Requests进行调用的步骤,并附有测试结果和参考文档链接。

概述

本文主要演示如果在阿里云PAI EAS上面部署DeepSeek模型,以及部署模型后的SDK和API调用。

操作步骤

1、选择7B模型部署

目前7B模型一张A10卡即可满足,部署时间10分钟左右,阿里云A10卡相对充足。

图片.png

图片.png

2、模型信息查看及在线调试

图片.png

图片.png

图片.png

  • 请求body
{
  "messages": [
    {
      "role": "user",
      "content": "你是谁?"
    }
  ],
  "max_tokens": 2000
}

3、SDK&PostMan调用

  • OpenAI SDK
from openai import OpenAI

client = OpenAI(
    base_url="http://1991************.cn-beijing.pai-eas.aliyuncs.com/api/predict/quickstart_20250206_pbxi/v1",
    api_key="ZDEyMjc0ZTFh***************"
)

# Chat completion
response = client.chat.completions.create(
    model='default',
    messages=[
        {"role": "system", "content": "You are a helpful AI assistant"},
        {"role": "user", "content": """请介绍一下deepseekr1"""},
    ],
    max_tokens=2000,
    stream=True
)

for chunk in response:
    print(chunk.model_dump_json())

图片.png

  • Python Requests
import requests
import json

url = "http://19912********.cn-beijing.pai-eas.aliyuncs.com/api/predict/quickstart_20250206_pbxi/v1/chat/completions"

payload = json.dumps({
  "messages": [
    {
      "role": "user",
      "content": "你是谁?"
    }
  ],
  "max_tokens": 2000
})
headers = {
  'Content-Type': 'application/json',
  'Authorization': 'Bearer ZDEyMjc0ZTFhNGI***********=='
}

response = requests.request("POST", url, headers=headers, data=payload)

print(response.text)
  • 测试结果
{"id":"26a3f338-b328-4bb0-b03a-d266b7bd0ea9","choices":[{"finish_reason":"stop","index":0,"logprobs":null,"message":{"role":"assistant","content":"<think>\n\n</think>\n\n您好!我是由中国的深度求索(DeepSeek)公司开发的智能助手DeepSeek-R1。如您有任何任何问题,我会尽我所能为您提供帮助。"}}],"object":"chat.completion","usage":{"prompt_tokens":7,"completion_tokens":40,"total_tokens":47},"error_info":null}
  • PostMan

图片.png

图片.png

参考地址

OpenAI Chat接口兼容

一键部署DeepSeek-V3、DeepSeek-R1模型


相关文章
|
3月前
|
人工智能 自然语言处理 运维
【新模型速递】PAI-Model Gallery云上一键部署Kimi K2模型
月之暗面发布开源模型Kimi K2,采用MoE架构,参数达1T,激活参数32B,具备强代码能力及Agent任务处理优势。在编程、工具调用、数学推理测试中表现优异。阿里云PAI-Model Gallery已支持云端部署,提供企业级方案。
243 0
【新模型速递】PAI-Model Gallery云上一键部署Kimi K2模型
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
Cosmos on PAI系列一:PAI-Model Gallery云上一键部署NVIDIA Cosmos Reason-1
本篇文章介绍 Cosmos 最新世界基础模型 Cosmos Reason-1 如何在阿里云人工智能平台 PAI 上进行快速部署使用。
|
6月前
|
人工智能 JSON 算法
【解决方案】DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
DistilQwen 系列是阿里云人工智能平台 PAI 推出的蒸馏语言模型系列,包括 DistilQwen2、DistilQwen2.5、DistilQwen2.5-R1 等。本文详细介绍DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践。
|
7月前
|
人工智能 运维 API
PAI-Model Gallery云上一键部署阶跃星辰新模型Step1X-Edit
4月27日,阶跃星辰正式发布并开源图像编辑大模型 Step1X-Edit,性能达到开源 SOTA。Step1X-Edit模型总参数量为19B,实现 MLLM 与 DiT 的深度融合,在编辑精度与图像保真度上实现大幅提升,具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持文字替换、风格迁移等11 类高频图像编辑任务类型。在最新发布的图像编辑基准 GEdit-Bench 中,Step1X-Edit 在语义一致性、图像质量与综合得分三项指标上全面领先现有开源模型,比肩 GPT-4o 与 Gemin。PAI-ModelGallery 支持Step1X-Edit一键部署方案。
|
3月前
|
人工智能 自然语言处理 运维
【新模型速递】PAI-Model Gallery云上一键部署gpt-oss系列模型
阿里云 PAI-Model Gallery 已同步接入 gpt-oss 系列模型,提供企业级部署方案。
|
6月前
|
PyTorch 调度 算法框架/工具
阿里云PAI-DLC任务Pytorch launch_agent Socket Timeout问题源码分析
DLC任务Pytorch launch_agent Socket Timeout问题源码分析与解决方案
290 18
阿里云PAI-DLC任务Pytorch launch_agent Socket Timeout问题源码分析
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
阿里云人工智能平台 PAI 开源 EasyDistill 框架助力大语言模型轻松瘦身
本文介绍了阿里云人工智能平台 PAI 推出的开源工具包 EasyDistill。随着大语言模型的复杂性和规模增长,它们面临计算需求和训练成本的障碍。知识蒸馏旨在不显著降低性能的前提下,将大模型转化为更小、更高效的版本以降低训练和推理成本。EasyDistill 框架简化了知识蒸馏过程,其具备多种功能模块,包括数据合成、基础和进阶蒸馏训练。通过数据合成,丰富训练集的多样性;基础和进阶蒸馏训练则涵盖黑盒和白盒知识转移策略、强化学习及偏好优化,从而提升小模型的性能。
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
【新模型速递】PAI-Model Gallery云上一键部署MiniMax-M1模型
MiniMax公司6月17日推出4560亿参数大模型M1,采用混合专家架构和闪电注意力机制,支持百万级上下文处理,高效的计算特性使其特别适合需要处理长输入和广泛思考的复杂任务。阿里云PAI-ModelGallery现已接入该模型,提供一键部署、API调用等企业级解决方案,简化AI开发流程。
|
6月前
|
缓存 并行计算 测试技术
阿里云PAI-全模态模型Qwen2.5-Omni-7B推理浅试
阿里云PAI-全模态模型Qwen2.5-Omni-7B推理浅试
1344 12
|
5月前
|
机器学习/深度学习 人工智能 JSON
DistilQwen-ThoughtX 蒸馏模型在 PAI-ModelGallery 的训练、评测、压缩及部署实践
通过 PAI-ModelGallery,可一站式零代码完成 DistilQwen-ThoughtX 系列模型的训练、评测、压缩和部署。

热门文章

最新文章

相关产品

  • 人工智能平台 PAI