Vector Search 和专用 Search Nodes:现已正式发布

本文涉及的产品
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
Redis 开源版,标准版 2GB
推荐场景:
搭建游戏排行榜
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: MongoDB系列技术文章精选

我们非常高兴地推出了 Atlas Vector Search 和 Search Nodes 的正式发布版本 (GA),为 Atlas 平台增添了更多价值。

自从在公开预览版中发布 Atlas Vector Search 和带有 Search Nodes 的专用基础架构以来,我们注意到,对于使用向量优化搜索节点,执行更多工作负载,客户热情高涨,需求旺盛。这一新的可扩展性和性能水平确保了工作负载隔离性,并能更好地优化矢量搜索用例的资源。

利用Atlas Vector Search ,开发者对任何数据类型均可以构建由语义搜索和生成式 AI 驱动的智能应用程序。即便用户不知道自己要查找内容的确切名称,Atlas Vector Search 也能提供相关结果,它可以使用机器学习模型为几乎任何类型的数据找到相似的结果,成功地解决了上述难题。

根据 Retool 的《人工智能现状》报告,Atlas Vector Search在推出公开预览版后的短短五个月内,已经获得了最高的开发者净推荐分数 (NPS),并成为使用第二广泛的矢量数据库。

Image

Atlas Vector Search 有两个关键用例来构建下一代应用程序:

1.语义搜索:基于语义相似度从非结构化数据中搜索并找到相关结果。

2.检索增强生成 (RAG):利用您自己的实时数据源,将大型语言模型的推理能力提升到令人赞叹的程度,从而创建专为您的业务需求量身定制的 GenAI 应用程序。

Atlas Vector Search 可以充分发挥数据的潜力,无论是结构化数据还是非结构化数据,随着人工智能和大型语言模型的普及和使用率不断攀升的势头,解决关键的业务挑战。之所以能够做到这一点,是因为 Vector Search 是 MongoDB Atlas 开发者数据平台的一部分,该平台从我们灵活的文档数据模型和统一的应用程序接口开始,提供一致的体验。为了确保您从 Atlas Vector Search 中获得最大价值,我们建立了一个强大的人工智能集成生态系统,允许开发者使用他们最喜欢的大型语言模型或框架进行构建。
image.png

Atlas Vector Search 还利用了我们新的 Search Nodes 专用架构,能够更好地优化资源配置水平,以满足特定的工作负载需求。Search Nodes 为 Atlas Search 和 Vector Search 工作负载提供专用基础架构,使您能够优化计算资源,并独立于数据库全面扩展搜索需求。Search Nodes 可提供更高的性能,实现工作负载隔离、更高的可用性,并能更好地优化资源使用。在某些情况下,利用 Search Nodes 的并发查询功能,我们发现一些用户的工作负载的查询时间缩短了 60%。

除了我们在公开预览版中提供的计算量大的搜索节点外,这个 GA 版本还包括一个内存优化的低 CPU 选项,是生产中 Vector Search 的最佳选择。这使得资源争用或导致服务中断的可能性(由于您的数据库和搜索之前共享相同的基础架构)成为过去。
image.png

"我们将其视为 Atlas Search 和 Vector Search 架构的下一次演变,进一步提升 MongoDB 开发者数据平台提供的价值。目前,Search Nodes 在 AWS 单区域集群上提供(在 Google Cloud 和 Azure 上即将提供),客户可继续使用 Google Cloud 和 Microsoft Azure 的共享基础架构。"

您可以在MongoDB官网找到关于Atlas Vector Search的介绍、教程和打开Search Nodes的步骤。

相关文章
|
3月前
|
人工智能 自然语言处理 搜索推荐
AI Compass前沿速览:Qoder Agentic编程、vivo Vision头显、AIRI桌面伴侣、RM-Gallery奖励模型平台
AI Compass前沿速览:Qoder Agentic编程、vivo Vision头显、AIRI桌面伴侣、RM-Gallery奖励模型平台
AI Compass前沿速览:Qoder Agentic编程、vivo Vision头显、AIRI桌面伴侣、RM-Gallery奖励模型平台
|
数据库连接 数据库 Python
Python中的上下文管理器(Context Managers):优雅地管理资源
在Python编程中,上下文管理器是一种用于管理资源的强大机制。通过上下文管理器,你可以确保在代码块的进入和退出时资源得到正确的分配和释放,从而使你的代码更加优雅、可读性更强。本文将深入探讨上下文管理器的基本概念、使用方法以及如何自定义上下文管理器。
|
9月前
|
机器学习/深度学习 算法 PyTorch
DeepSeek 背后的技术:GRPO,基于群组采样的高效大语言模型强化学习训练方法详解
强化学习(RL)是提升大型语言模型(LLM)推理能力的重要手段,尤其在复杂推理任务中表现突出。DeepSeek团队通过群组相对策略优化(GRPO)方法,在DeepSeek-Math和DeepSeek-R1模型中取得了突破性成果,显著增强了数学推理和问题解决能力。GRPO无需价值网络,采用群组采样和相对优势估计,有效解决了传统RL应用于语言模型时的挑战,提升了训练效率和稳定性。实际应用中,DeepSeek-Math和DeepSeek-R1分别在数学推理和复杂推理任务中展现了卓越性能。未来研究将聚焦于改进优势估计、自适应超参数调整及理论分析,进一步拓展语言模型的能力边界。
1380 8
DeepSeek 背后的技术:GRPO,基于群组采样的高效大语言模型强化学习训练方法详解
软考证书如何申报抵税?详细教程来了!
本文介绍了软考证书如何申报个税抵扣的详细教程。根据规定,取得相关证书的当年可按3600元定额扣除。具体步骤包括下载并注册“个人所得税”APP、选择继续教育并填写扣除年度、选择职业资格继续教育类型及填写继续教育信息。未领取纸质证书者也可通过“中国人事考试网”查询信息后申报。
|
前端开发 Java 数据库连接
Spring 框架:Java 开发者的春天
Spring 框架是一个功能强大的开源框架,主要用于简化 Java 企业级应用的开发,由被称为“Spring 之父”的 Rod Johnson 于 2002 年提出并创立,并由Pivotal团队维护。
648 1
Spring 框架:Java 开发者的春天
|
敏捷开发
怎么理解基于架构的软件开发
理解基于架构的软件开发
474 1
|
弹性计算 编解码 运维
飞天技术沙龙回顾:业务创新新选择,倚天Arm架构深入探讨
基于「倚天710自研芯片+CIPU云原生基础设施处理器」组合的倚天ECS实例为解决算力挑战提供新思路。
|
人工智能 NoSQL atlas
Atlas Vector Search:借助语义搜索和 AI 针对任何类型的数据构建智能应用
一切才刚刚开始,MongoDB 致力于提供优秀的开发者数据平台,助力开发者打造新一代 AI 赋能的应用
3056 2
|
安全 机器人 测试技术
宇树Unitree Z1机械臂使用教程
本文是宇树Unitree Z1机械臂的使用教程,包括建立机械臂通信、基本运行demo、ROS Gazebo仿真demo、键盘控制demo、手柄控制demo、moveit真实机械臂demo以及其他高级控制demo的详细步骤和注意事项。教程涵盖了软件安装、环境配置、代码下载、编译运行等内容,并提供了机械臂操作的实用技巧。
1532 1