方案介绍|基于百炼生成向量数据并使用阿里云Milvus存储和检索

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
实时数仓Hologres,5000CU*H 100GB 3个月
实时计算 Flink 版,1000CU*H 3个月
简介: 阿⾥云Milvus是⼀款云上全托管服务,提供⼤规模向量数据的相似性检索服务。100%兼容开源Milvus,在开源版本的基础上增强了可扩展性,具备易⽤性、可⽤性、安全性、低成本与⽣态优势。阿⾥云Milvus可以⽀持⼏乎所有涉及到向量搜索的场景。例如检索增强⽣成RAG,以及经典的搜索推荐、多模态检索等。阿里云Milvus可存储百炼产生的向量数据,并进行大规模向量数据的检索。本文将重点介绍这一过程的方案。

引言:当数据洪流遇上秒级决策


凌晨1点,某电商平台的推荐系统突然告急——每秒涌入的10万次用户点击,让原本精准的搜索推荐陷入混乱。商品库中上亿张图片和描述文本,如何在毫秒内找到与用户行为最匹配的商品?另一边,一家汽车公司的自动驾驶团队正为如何用千万份单日PB级的仿真驾驶多模态数据的预训练发愁;同时还有更多企业在思考如何进一步提高智能客服回答问题的准确度并给用户提供相应参考信息。


这些场景背后,是一个共同的挑战:多模态数据的处理效率,正成为企业智能化转型的关键。

现在,百炼+向量检索服务Milvus版这对组合为多模态数据的处理和利用提供了高效的解决方案。


方案背景

阿里云的大模型服务平台百炼是一站式的大模型开发及应用构建平台。不论是开发者还是业务人员,都能深入参与大模型应用的设计和构建。您可以通过简单的界面操作,在5分钟内开发出一款大模型应用,或在几小时内训练出一个专属模型,从而将更多精力专注于应用创新。


其中,在生成式AI场景中(如大模型训练、知识库构建等),百炼平台可提供多款向量模型,如通用多模态向量、通用文本向量等,能够根据用户的输入生成高维连续向量,这些输入可以是文本、图片或视频。多模态向量在可应用于图片搜索、文搜图、视频搜索、图片分类和视频内容审核等下游任务中。


image.png


那么这些生成的向量数据需要:

  • 高效存储:支持海量向量持久化存储
  • 快速检索:实现毫秒级相似性搜索
  • 灵活扩展:适应业务快速增长的数据规模


阿里云向量检索服务Milvus版(简称阿里云Milvus)作为云原生向量数据库,能完美匹配以上需求。用户可以调用百炼的Embedding向量模型API将文本图片、视频等其他多模态数据转换为向量,并将这些向量数据存入阿里云Milvus的向量数据库中进行检索。


简而言之,阿里云Milvus可存储百炼产生的向量数据,并进行大规模向量数据的检索。本文将重点介绍这一过程的方案。


方案介绍

方案描述

用户核心痛点:

  • 多模态数据处理挑战
  • 文本、图像等高维数据难以直接用于AI计算,传统关系型数据库无法高效存储和检索向量
  • 自建向量检索系统成本高(硬件投入超百万/年)、性能差(亿级数据查询延迟>1秒)
  • 规模化扩展瓶颈
  • 数据量激增导致存储扩容困难,传统方案需停机分片
  • 多模态混合检索(文本+图像+视频)缺乏统一技术栈支持
  • 业务连续性风险
  • 开源向量数据库运维复杂,故障恢复耗时(RTO>30分钟)
  • 缺乏企业级数据安全保护(传输/存储加密、权限管控)


本方案构建了一套从多模态数据向量化到高效检索的完整链路:通过百炼平台的多模态AI向量模型生成高维向量数据,并借助阿里云Milvus向量数据库实现海量向量的存储、索引与毫秒级检索。方案覆盖数据预处理、向量生成、分布式存储、混合检索等全流程,为AI场景提供开箱即用的向量数据管理能力,支撑推荐系统、内容相似性搜索等业务场景的快速落地。

image.png


实现步骤(以文本数据为例):

资源准备:


请确保您的运行环境中已安装Python 3.8或以上版本,以便顺利安装并使用DashScope。

  1. 准备输入数据借助LangChain SDK对文本进行分割,作为Embedding向量模型的输入数据。
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1024, chunk_overlap=0)
# 使用LangChain将输入文档安照chunk_size切分
all_splits = text_splitter.split_documents(docs)
  1. 创建Milvus集合Collection用于存储和管理向量数据
# 设置Milvus Collection名称。
COLLECTION_NAME = 'doc_qa_db'
# 设置向量维度。
DIMENSION = 768
  1. 选定的Embedding模型(DashScope)负责将输入文本转换为向量,并将这些向量存入阿里云Milvus的向量数据库中。
# 设置embedding模型为DashScope(可以替换成自己模型)。
embeddings = DashScopeEmbeddings(
    model="text-embedding-v2", dashscope_api_key="your_api_key"
)
# 创建connection,host为阿里云Milvus的访问域名。
connection_args = {"host": "c-xxxx.milvus.aliyuncs.com", "port": "19530", "user": "your_user", "password": "your_password"}
# 创建Collection
vector_store = Milvus(
    embedding_function=embeddings,
    connection_args=connection_args,
    collection_name=COLLECTION_NAME,
    drop_old=True,
).from_documents(
    all_splits,
    embedding=embeddings,
    collection_name=COLLECTION_NAME,
    connection_args=connection_args,
)
  1. 向量相似性检索:Embedding模型处理查询输入,并将其向量化。
# 利用Milvus向量数据库进行相似性检索。
query = "What are the main components of Milvus?"
docs = vector_store.similarity_search(query)
print(len(docs))


方案特点

  • 架构角度
  • 全托管云原生服务,无缝对接,开箱即用,入门门槛低
  • 阿里云Milvus作为AI专业向量检索引擎,支持超大规模向量数据处理
  • 性能角度
  • 检索秒级响应
  • 支持跨模态混合检索,兼顾召回率和精确度
  • 成本角度(和自建相比)
  • 无需预先购买GPU等硬件成本
  • 百炼和阿里云Milvus均可全托管,运维0成本
  • 分布式架构存储千亿级别向量数据,存储效率提升


应用场景

阿里云Milvus存储百炼产生的向量数据并进行检索的产品组合方案,可广泛并灵活运用于以下典型场景:

  • 多模态数据搜索与推荐:
  • 电商或零售跨模态商品搜索:用户通过上传图片搜索相似商品
  • 医疗影像检索:输入CT或B超等影响,检索相似病例及治疗方案
  • 文化媒体内容搜索:“听一听”识曲等
  • 搭建基于RAG的智能问答系统
  • 智能客服:通过问答机器人自动回复用户问题,降低人工成本
  • 法律咨询服务:精准匹配法律条例和判例,生成法律意见书草案等
  • 电商导购:根据用户提出的需求自动推荐相关商品
  • 企业知识管理:员工可通过自然语言提问,直接获取跨系统文档中的关键信息
  • 自动驾驶
  • 自动驾驶数据预训练


立即体验

如果您想体验阿里云Milvus的相关能力,欢迎在阿里云官网搜索向量检索服务Milvus版进行体验。

产品新用户也可免费领取1个月试用资格

此外,阿里云为了回馈新老用户,推出了重大优惠

阿里云向量检索服务 Milvus 版  限时年付5折! 新购续费均可|每个uid仅限参与1次(非同人)购买地址



相关文章
|
11月前
|
API 数据库 决策智能
基于百炼平台qwen-max的api 打造一套 检索增强 图谱增强 智能工具调用决策的智能体
本文介绍了一种基于阿里云百炼平台的`qwen-max` API构建的智能体方案,该方案集成了检索增强、图谱增强及智能工具调用决策三大模块,旨在通过结合外部数据源、知识图谱和自动化决策提高智能回答的准确性和丰富度。通过具体代码示例展示了如何实现这些功能,最终形成一个能灵活应对多种查询需求的智能系统。
766 11
|
8月前
|
自然语言处理 测试技术 决策智能
让RAG更聪明,ViDoRAG开启视觉文档检索增强生成新范式,上阿里云百炼可直接体验
视觉丰富文档的高效检索与生成是自然语言处理领域的重大挑战。ViDoRAG(Visual Document Retrieval-Augmented Generation via Dynamic Iterative Reasoning Agents)由阿里巴巴通义实验室、中国科学技术大学和上海交通大学联合提出,通过多智能体框架和动态迭代推理机制解决此问题。其核心包括多模态混合检索策略和多智能体生成流程,同时发布的ViDoSeek数据集,专为大规模文档集合设计,提供复杂推理与精准问答的评估基准。实验表明,ViDoRAG在准确率和效率上优于传统方法,未来将优化系统性能并降低计算成本。
894 63
|
11月前
|
自然语言处理 NoSQL API
基于百炼平台qwen-max的api 打造一套 检索增强 图谱增强 基于指令的智能工具调用决策 智能体
基于百炼平台的 `qwen-max` API,设计了一套融合检索增强、图谱增强及指令驱动的智能工具调用决策系统。该系统通过解析用户指令,智能选择调用检索、图谱推理或模型生成等工具,以提高问题回答的准确性和丰富性。系统设计包括指令解析、工具调用决策、检索增强、图谱增强等模块,旨在通过多种技术手段综合提升智能体的能力。
744 5
阿里云CloudOps MCP正式上架百炼平台MCP市场
阿里云CloudOps MCP现已集成至百炼平台官方MCP市场,用户可便捷使用并将其集成到智能体应用中。配置方法包括登录百炼平台,在MCP市场找到阿里云CloudOps MCP,完成开通、角色创建与权限设置,选择部署模式及地域后确认开通。随后可通过“添加到智能体”或在应用管理中集成到现有智能体或工作流应用。更多示例与权限细则详见文档,欢迎加入钉钉交流群获取支持。
|
8月前
|
机器学习/深度学习 人工智能 NoSQL
JAVA接入DeepSeek大模型接口开发---阿里云的百炼模型
随着大模型的越来越盛行,现在很多企业开始接入大模型的接口,今天我从java开发角度来写一个demo的示例,用于接入DeepSeek大模型,国内的大模型有很多的接入渠道,今天主要介绍下阿里云的百炼模型,因为这个模型是免费的,只要注册一个账户,就会免费送百万的token进行学习,今天就从一个简单的可以执行的示例开始进行介绍,希望可以分享给各位正在学习的同学们。
1422 3
JAVA接入DeepSeek大模型接口开发---阿里云的百炼模型
|
人工智能 弹性计算 JSON
在阿里云百炼平台配置您的自定义阿里云MCP Server
alibaba-cloud-ops-mcp-server 是阿里云资源管理的专用工具,集成阿里云 Open API 和系统运维管理(OOS),支持 ECS、RDS 等资源的全生命周期管理。通过百炼平台部署,用户可结合 AI 助手实现自然语言交互式运维,简化复杂任务操作。部署方式简单,包括创建 MCP 服务、配置 JSON 文件并选择极速模式,最后在百炼平台新增智能体应用,完成技能绑定即可使用专属智能运维工具。
|
9月前
|
人工智能 负载均衡 数据可视化
阿里云出手了,基于百炼一键部署DeepSeek满血版,告别服务器繁忙1
阿里云百炼平台推出一键部署DeepSeek-R1满血版671B模型,提供100万免费Token,无需编码,新手5分钟内即可完成部署。通过Chatbox客户端配置API,轻松实现模型调用,解决服务器繁忙问题,支持自动弹性扩展,降低硬件成本。详情及教程见阿里云百炼官网。
710 5
|
10月前
|
存储 人工智能 OLAP
云端问道10期方案教学-百炼融合AnalyticDB,10分钟创建网站AI助手
本次分享由阿里云产品经理陈茏久介绍,主题为“百炼融合 AnalyticDB,10 分钟创建网站 AI 助手”。内容涵盖五个部分:大模型带来的行业变革、向量数据库驱动的 RAG 服务化探索、方案及优势与典型场景应用案例、产品选型配置介绍以及最新发布。重点探讨了大模型在各行业的应用,AnalyticDB 的独特优势及其在构建企业级知识库和增强检索服务中的作用。通过结合通义千问等产品,展示了如何在短时间内创建一个高效的网站 AI 助手,帮助企业快速实现智能化转型。
191 0
|
10月前
|
人工智能 算法 搜索推荐
云端问道11期方案教学-创建专属AI助手-阿里云百炼产品能力分享
阿里云百炼产品能力分享旨在帮助用户深入了解百炼的核心功能,并快速将大模型与系统结合。主要内容包括:1. 百炼的产品定位和能力简介,涵盖模型推理、应用搭建等;2. 知识检索RAG智能体的应用能力和优势,介绍其高效构建知识库的步骤及常见问题;3. 最佳落地案例实践,如宠物行业AI助手和产业分析类互联网企业的Copilot机器人。通过这些内容,用户可以全面掌握百炼在实际业务中的应用方法和效果。
322 0
|
2月前
|
人工智能 缓存 自然语言处理
阿里云百炼大模型收费说明:模型推理、模型训练和模型部署费用整理
阿里云百炼平台开通免费,且每模型享100万Token免费额度。费用产生于模型推理、训练(调优)和部署,超出免费额度后按量计费。推理按输入/输出Token阶梯计价,训练按数据量和循环次数计费,部署支持按时长或调用量两种模式。
1256 65

热门文章

最新文章