Dify x Tablestore 构建低成本、Serverless 知识库

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
RDS PostgreSQL Serverless,0.5-4RCU 50GB 3个月
推荐场景:
对影评进行热评分析
简介: 本文介绍如何基于Dify与阿里云Tablestore构建检索增强生成(RAG)系统,解决大模型知识时效性和领域适配性问题,该方案具备低代码、Serverless免运维、高可靠、弹性扩展及低成本等优势。文章通过答疑助手的案例,详细说明了创建Tablestore实例、配置Dify、构建与验证知识库的步骤。

概述

知识库

在大模型时代,如何高效应用领域知识、解决大模型的幻觉等问题,成为大模型渗透到每个行业需要解决的核心问题。随着生成式人工智能技术的快速发展,大型语言模型(LLM)虽然在语言理解和生成能力上展现出显著优势,但其知识局限性与幻觉问题(即生成不实或无根据信息的倾向)始终制约着其在专业领域的实际应用。为突破这一瓶颈,检索增强生成(Retrieval-Augmented Generation, RAG) 通过融合检索技术与生成式模型,构建了动态的知识获取与融合框架,成为解决行业落地关键问题的有效路径。

RAG 的核心是构建一个供大模型动态参考的知识库,知识库的应用具备几个特性:

  • 知识时效性保障:传统大模型的训练数据截止时间固定,而RAG通过接入实时更新的知识库,可动态引入新知识,避免因知识滞后导致的错误。

  • 领域适配性增强:通过构建垂直领域的知识图谱或专用语料库,RAG能够显著提升模型对专业术语、行业规则的理解能力。

  • 多模态知识整合:现代RAG系统支持文本、表格、图像等多模态知识源的融合。

Dify x Tablestore

Dify 为开发者提供了健全的应用模版和编排框架,你可以基于它们快速构建大型语言模型驱动的生成式AI 应用,将创意变为现实,也可以随时按需无缝扩展,驱动业务增长。 通过可视化的提示词编排和数据集嵌入,零代码即可快速构建对话机器人或AI 助理,并可持续优化对话策略,革新人机交互体验;

阿里云表格存储 Tablestore 是一款 Serverless 的分布式结构化数据存储服务,主要特点是分布式、Serverless 开箱即用、按量付费、水平扩展、支持向量/标量检索、查询功能丰富和性能优秀等。

本文将基于Dify x Tablestore 的向量/标量检索能力,以表格存储官网文档为知识库,搭建一个“表格存储技术支持聊天助手”。

系统优势

通过结合 Dify 和 Tablestore 去实现一个知识库 RAG 系统,这套架构相比本地部署向量数据库有何优点?

  • 低代码、Serverless 免运维:Dify 作为一个 AI 低代码平台,支持快速构建、部署应用;而 Tablestore 具备一键开通、Serverless 特性,无需关注数据库运维,降低应用复杂度;

  • 共享知识库:基于Tablestore搭建的知识库,跨地域可共享,可同时被多个Dify RAG系统访问;

  • 数据稳定可靠:Tablestore 默认提供数据跨地域多副本存储(3AZ),数据可靠性高达99.999999999%(11个9),为数据保驾护航;

  • 规模增长无上限:Tablestore基于阿里云自研存储引擎,支持数据量从GB到PB级无缝扩展,业务增长无需关注系统容量;

  • 低成本:Tablestore 按量付费,灵活可控;按实际使用付费,避免资源闲置。

Dify x Tablestore 构建知识库

创建Tablestore实例

  1. 登录阿里云控制台
  2. 创建实例

    • 在Tablestore控制台中,点击“创建实例”按钮。
    • 选择合适的区域(Region),并为实例命名,例如 dify-ots-rag

      控制台创建实例
  3. 获取访问信息

    • 在阿里云控制台中获取AccessKey ID、AccessKey Secret、实例访问地址、实例名。这些信息将用于Dify连接TableStore。

Dify 使用 Tablestore

部署流程参考:Dify Community;Tablestore 已接入 Dify vdb,并在v1.2.0版本中发布。部署过程中修改.env 配置文件,使用 Tablestore 作为向量数据库,并配置访问实例信息。

VECTOR_STORE=tablestore
# 下面配置填写Tablestore控制台获取的实例配置信息
TABLESTORE_ENDPOINT=xxxx
TABLESTORE_INSTANCE_NAME=instance-name
TABLESTORE_ACCESS_KEY_ID=xxxx
TABLESTORE_ACCESS_KEY_SECRET=xxx

构建知识库

本节将基于上面搭建的系统,创建私有知识库,并上传表格存储官方文档信息。通过该知识库,演示 Dify x Tablestore 搭建的 RAG 系统功能;

创建知识库

创建空白知识库,名称【TableStore-Rag】

image.png

数据导入

导入本地知识文件,经过文本清洗、embedding 后写入 Tablestore 向量数据库中。

  • 本地文件导入

image.png

  • 文本清洗与处理

image.png

  • 文本上传

image.png

  • 处理结果验证

    • 知识库数据列表

通过文档列表,获取文档是否导入成功;失败文档可重试。

image.png

  • Tablestore 控制台

导入过程中,Dify 自动在表格存储上创建表和索引,并将数据 embedding 后写入表内

image.png

RAG 检索验证

  1. 召回测试

召回测试中支持向量检索、全文检索、混合检索;可根据匹配相似度排序,获取 TopK 相似文档。

image.png

  1. RAG 检索
  • 配置 LLM 大模型

从大模型供应商处获取 API Key,添加至 dify

image.png

  • 效果验证

未使用 RAG:提问大模型关于用户使用表格存储的相关细节问题,大模型根据训练知识,给出回答。

image.png

使用 RAG: 输入提示词,选择知识库【Tablestore-Rag】,再次提问大模型。

image.png

对比使用知识库前后大模型对同一问题的回答,大模型+知识库能给出更加精确的回答。因此通过知识库,弥补了大模型知识的时效性、领域适配性的问题。

大模型 大模型 大模型+知识库 大模型+知识库

总结

本文基于Dify x Tablestore 的向量/标量检索能力,演示了如何使用 RAG 实现一个技术支持助手,避免大模型乱说问题,提升大模型载垂直领域的准确性;Dify x Tablestore 这套系统具有包括低代码、Serverless免运维、跨地域共享知识库、高数据可靠性、弹性无限扩展及低成本等优点,是构建 RAG 系统的一个很好的选择。

最后,欢迎加入我们的钉钉公开群,与我们一起探讨 AI 技术。

表格存储技术交流群
相关实践学习
【AI破次元壁合照】少年白马醉春风,函数计算一键部署AI绘画平台
本次实验基于阿里云函数计算产品能力开发AI绘画平台,可让您实现“破次元壁”与角色合照,为角色换背景效果,用AI绘图技术绘出属于自己的少年江湖。
从 0 入门函数计算
在函数计算的架构中,开发者只需要编写业务代码,并监控业务运行情况就可以了。这将开发者从繁重的运维工作中解放出来,将精力投入到更有意义的开发任务上。
目录
相关文章
|
22天前
|
API 开发者
百宝箱开放平台 ✖️ 查询知识库文件的构建状态
本接口用于查询目标文件在知识库中的构建状态,需提供documentId并配置有效token。支持查看初始化、处理中、成功、失败等状态,并返回详细错误信息以便排查问题。
|
1月前
|
缓存 边缘计算 运维
基于 Cloudflare Workers 构建高性能知识库镜像服务:反向代理与 HTML 动态重写实践
基于Cloudflare Workers构建的边缘计算镜像服务,通过反向代理、HTML动态重写与智能缓存,优化维基百科等知识平台的访问性能。支持路径映射、安全头清理与容错回退,实现免运维、低延迟、高可用的Web加速方案,适用于教育、科研等合规场景。
332 8
数据采集 Web App开发 人工智能
146 0
|
2月前
|
存储 数据采集 人工智能
切块、清洗、烹饪:RAG知识库构建的三步曲
大语言模型明明已经喂了大量文档,为什么还是答非所问?就像米其林厨师需要精心处理食材,RAG系统也需要巧妙处理文档。从文本分块、清洗到结构化索引,这些不起眼的处理步骤决定了AI回答质量的上限。掌握这些技巧,让你的RAG系统从「路边摊」蜕变为「米其林餐厅」。
|
2月前
|
数据采集 Web App开发 人工智能
基于函数计算FC构建 Browser Tool Sandbox 详解与实操
本文介绍了如何基于阿里云函数计算(FC)构建一个安全、可控的 Browser Tool Sandbox,支持多种浏览器自动化操作方式,包括 Playwright、Puppeteer、Browser Use 和 REST API 等,为 AI Agent 安全高效地操作浏览器提供了完整的技术方案。
|
3月前
|
存储 自然语言处理 前端开发
百亿级知识库解决方案:从零带你构建高并发RAG架构(附实践代码)
本文详解构建高效RAG系统的关键技术,涵盖基础架构、高级查询转换、智能路由、索引优化、噪声控制与端到端评估,助你打造稳定、精准的检索增强生成系统。
580 2
|
3月前
|
人工智能 监控 算法
构建时序感知的智能RAG系统:让AI自动处理动态数据并实时更新知识库
本文系统构建了一个基于时序管理的智能体架构,旨在应对动态知识库(如财务报告、技术文档)在问答任务中的演进与不确定性。通过六层设计(语义分块、原子事实提取、实体解析、时序失效处理、知识图构建、优化知识库),实现了从原始文档到结构化、时间感知知识库的转化。该架构支持RAG和多智能体系统,提升了推理逻辑性与准确性,并通过LangGraph实现自动化工作流,强化了对持续更新信息的处理能力。
397 5
|
3月前
|
存储 人工智能 文字识别
从零开始打造AI测试平台:文档解析与知识库构建详解
AI时代构建高效测试平台面临新挑战。本文聚焦AI问答系统知识库建设,重点解析文档解析关键环节,为测试工程师提供实用技术指导和测试方法论
|
4月前
|
分布式计算 Serverless OLAP
实时数仓Hologres V3.1版本发布,Serverless型实例从零开始构建OLAP系统
Hologres推出Serverless型实例,支持按需计费、无需独享资源,适合新业务探索分析。高性能查询内表及MaxCompute/OSS外表,弹性扩展至512CU,性能媲美主流开源产品。新增Dynamic Table升级、直读架构优化及ChatBI解决方案,助力高效数据分析。
实时数仓Hologres V3.1版本发布,Serverless型实例从零开始构建OLAP系统