手把手带你5分钟搭建企业级AI问答知识库

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
简介: 【8月更文挑战第3天】手把手带你5分钟搭建企业级AI问答知识库

配置过程

在正式开始本次体验前,我们需要进行一下环境的准备,比如确保已经拥有阿里云账号,并开通了Hologres、PAI-EAS(机器学习平台)和计算巢服务。下面就以如何开通人工智能平台PAI为例,阐述如何开通服务。

登录PAI控制台,如果你是首次使用PAI,会需要先开通个默认的工作空间。如下:

为了方便,这里地域就直接选择了杭州。如下:

由于本次体验不涉及其他服务,所以组合服务这里不需要勾选,以免产生不必要的费用。首次开通需要授权,点击授权前往RAM访问控制。如下:

点击同意授权即可。如下:

完成授权后返回点击刷新,继续点击“确认开通并创建默认工作空间”。如下:

这里需要等待一小会,即可完成服务的开通。如下:

这里需要注意的是,如果您已领取PAI-EAS免费试用权益,整个实验费用大约为每小时4.634元。如果您无免费试用额度或免费试用机型无库存,整个实验费用大约为每小时12.704元。

接着,我们前往计算巢控制台,在左侧导航栏,选择服务目录。

在搜索框中输入并搜索Hologres+PAI一键部署企业级问答知识库,在Hologres+PAI一键部署企业级问答知识库服务卡片下,单击正式创建。

在计算巢服务为第三方服务对话框中,选中我已阅读并同意《计算巢服务协议》,单击确定。

在创建服务实例页面,需要注意如下几点:

1、若已领取PAI-EAS免费试用权益,地域请您选择与开通PAI-EAS相同的地域。若无免费试用额度或免费试用机型无库存,可随意选择。

2、付费类型,可按需进行选择。但需要注意的是ECS和Hologres实例支持按量付费和包年包月,PAI-EAS实例只支持按量付费。

3、Hologres推荐开通32核版本,以华东1(杭州)为例,每小时11.334元,性能更好。如需要更低规格,可以开通8核版本,以华东1(杭州)为例,每小时2.834元,注意8核仅用于体验,不适合用于生产。

4、选择您希望部署的LLM大模型和PAI-EAS部署大模型的实例规格。大模型选择通义千问-7b(开源)。如果已领取PAI-EAS免费试用权益,请选择试用活动分类下的ecs.gn7i-c8g1.2xlarge.limit机型,免费试用额度内无需付费。

5、PAI-EAS部署WebUI的实例规格。这里选择选择机型ecs.c7.2xlarge 8核16GB。

6、VPC配置,选择开启新建VPC。开启新建VPC会自动生成对应的专有网络VPC实例ID和交换机实例ID,在创建计算巢服务实例时,创建对应的VPC信息。如果不开启,这里就需要手动选择专有网络VPC实例ID和交换机实例ID信息。

其他配置保持默认,点击下一步:确认订单。在确认订单页面,确认订单费用后,选中我已阅读并同意《计算巢服务协议》,然后单击立即创建。

在依赖检查这里会发现一个异常,点击开通权限即可。

这里需要耐心等待部署完成。

部署过程中可以通过点击服务实例ID进入详情,通过日志管理可查看部署详情以及进度。

等待11分钟后,服务实例的状态变为已部署后,我们就可以开始使用知识库。

在服务实例详情页面,您可以获取到endpoint以访问服务,单击endpoint后面的链接。

接下来我们需要配置并连接知识库,在Hologres+大模型WebUI的设置页签,配置user和password。这里的user需要填入阿里云账号或RAM用户的AccessKey ID,AccessKey ID对应的AccessKey Secret。所以需要先创建一个AccessKey。

进入RAM控制台,点击创建AccessKey。

填入手机验证码,并复制保存好AccessKey。

将生成的AccessKey填入配置中并点击连接。

在连接信息中返回连接Hologres成功内容,即说明连接成功。

在上传页签,选择您的专属语料数据文件,然后单击上传。这里直接使用了官网提供的文件。

上传完成后在状态区域,返回“成功上传1个文件 [ example_data.txt, ] !”内容,即说明上传成功。

接下来就可以配置聊天相关的参数了,在聊天页签进行配置即可。

聊天模式有三种可选,他们的区别如下:

  • 向量数据库:使用您在Hologres中上传的语料数据进行向量近似查询问答。
  • 大语言模型:使用原始的预训练大语言模型进行问答。
  • 向量数据库+大语言模型:使用您在Hologres中上传的语料数据进行向量近似查询,然后通过大模型对查询结果进行进一步完善和调整,最终反馈优化后的结果。

完成配置后,我们就可以和模型进行对话了。如下:

输出结果

比如我输入“Hologres是啥”,“Hologres能做什么”,对话如下:

你可以对刚才的对话进行总结,直接点击总结按钮即可。

释放资源

完成体验后,非常且必要的一步就是将部署资源进行释放或者删除,以免产生不必要的费用扣除。操作如下:在服务实例管理页面的私有部署服务页签,找到您创建的Hologres+PAI一键部署企业级问答知识库服务服务实例,单击右侧操作列下的删除。

在您确定要删除当前服务实例吗对话框中,选中我确认删除服务实例及包含的云资源,单击确定删除。

该操作将一键清理掉部署所创建的所有资源,如果你需要保留,这一步操作需要慎重。

使用体验

通过上述部署体验,我总结如下:

  • 通过计算巢服务,可以一键完成Hologres与大规模问答知识库所需的硬件资源与软件资源部署,大大缩短了部署时间,提高了效率。PAI-EAS作为模型在线服务平台,支持用户将模型一键部署为在线推理服务或AI-Web应用,进一步简化了部署流程。
  • Hologres作为一站式实时数据仓库引擎,支持海量数据实时写入、实时更新、实时分析,能够处理PB级数据的多维分析和即席查询,满足企业级应用对数据处理能力的需求。PAI-EAS适用于实时推理、近实时异步推理等多种AI推理场景,具备自动扩缩容和完整运维监控体系等能力,确保系统的稳定性和可靠性。
  • LangChain是一个开源框架,可以将大模型、向量数据库、定制语料结合,高效完成专属问答知识库的搭建。Hologres现已被LangChain作为向量数据库集成,进一步丰富了问答知识库的功能。
  • 计算巢服务是一个开放给服务商和用户的服务管理PaaS平台,为服务商和用户提供了高效、便捷、安全的服务使用体验。用户可以根据业务需求灵活调整资源配置,实现资源的最大化利用。

除了上述的优点外,其实在体验中还能看到些许不足:

  • 企业级AI问答知识库的构建和运维需要投入大量的资金和资源。除了购买Hologres、PAI-EAS等产品的费用外,还需要考虑人员培训、系统维护、数据存储和传输等方面的成本。
  • 系统依赖于阿里云提供的Hologres、PAI-EAS和计算巢等外部服务,如果外部服务出现故障或中断,可能会对系统的正常运行造成影响。因此,用户需要关注外部服务的稳定性和可靠性,并制定相应的应急预案。
  • 上传语料数据文件耗时较长,官网提供的一个不到8kb的文件,上传硬是花费了2分钟。此外,号称5分钟的部署,实际耗时是11分钟。体验耗时就如此,那正式环境岂不是需要更久,非常期待后期优化。
  • 虽然一键部署简化了操作流程,但整个系统的构建和运维仍然需要较高的技术门槛。用户需要具备一定的云计算、大数据处理、AI算法等方面的知识和技能,才能充分发挥系统的全部优势。
相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
目录
相关文章
|
1月前
|
存储 人工智能 Java
AI 超级智能体全栈项目阶段四:学术分析 AI 项目 RAG 落地指南:基于 Spring AI 的本地与阿里云知识库实践
本文介绍RAG(检索增强生成)技术,结合Spring AI与本地及云知识库实现学术分析AI应用,利用阿里云Qwen-Plus模型提升回答准确性与可信度。
692 90
AI 超级智能体全栈项目阶段四:学术分析 AI 项目 RAG 落地指南:基于 Spring AI 的本地与阿里云知识库实践
|
2月前
|
数据采集 存储 人工智能
拆解AI-Agentforce企业级智能体中台:如何让企业AI落地从“噱头”到“实效”
在GDMS峰会上,迈富时集团尹思源指出41.3%中国企业尚未布局AI Agent,已应用者亦陷“Demo化、孤岛化”困局。其发布的AI-Agentforce智能体中台,以“冰山模型”重构架构,打通认知、价值、能力三重鸿沟,覆盖内容、获客、销售、陪练、分析五大场景,助力企业实现AI从“工具”到“数字员工”的全链路协同升级。
|
2月前
|
存储 人工智能 运维
AI 网关代理 RAG 检索:Dify 轻松对接外部知识库的新实践
Higress AI 网关通过提供关键桥梁作用,支持 Dify 应用便捷对接业界成熟的 RAG 引擎。通过 AI 网关将 Dify 的高效编排能力与专业 RAG 引擎的检索效能结合,企业可在保留现有 Dify 应用资产的同时,有效规避其内置 RAG 的局限,显著提升知识驱动型 AI 应用的生产环境表现。
1463 83
|
22天前
|
机器学习/深度学习 人工智能 JSON
PHP从0到1实现 AI 智能体系统并且训练知识库资料
本文详解如何用PHP从0到1构建AI智能体,涵盖提示词设计、记忆管理、知识库集成与反馈优化四大核心训练维度,结合实战案例与系统架构,助你打造懂业务、会进化的专属AI助手。
151 6
|
29天前
|
存储 人工智能 前端开发
超越问答:深入理解并构建自主决策的AI智能体(Agent)
如果说RAG让LLM学会了“开卷考试”,那么AI智能体(Agent)则赋予了LLM“手和脚”,使其能够思考、规划并与真实世界互动。本文将深入剖析Agent的核心架构,讲解ReAct等关键工作机制,并带你一步步构建一个能够调用外部工具(API)的自定义Agent,开启LLM自主解决复杂任务的新篇章。
259 6
|
2月前
|
存储 人工智能 数据可视化
企业级 AI 模型无代码落地指南:基于阿里云工具链,从 0 到 1 实现业务价值
某汽车零部件厂商通过阿里云PAI、OSS等工具,实现无代码AI质检落地:仅用控制台操作完成数据治理到部署,质检效率提升3倍,模型周期从2月缩至2周。本文详解全栈可视化方案,助力企业零代码落地AI。
277 1
|
1月前
|
机器学习/深度学习 人工智能 监控
Java与AI模型部署:构建企业级模型服务与生命周期管理平台
随着企业AI模型数量的快速增长,模型部署与生命周期管理成为确保AI应用稳定运行的关键。本文深入探讨如何使用Java生态构建一个企业级的模型服务平台,实现模型的版本控制、A/B测试、灰度发布、监控与回滚。通过集成Spring Boot、Kubernetes、MLflow和监控工具,我们将展示如何构建一个高可用、可扩展的模型服务架构,为大规模AI应用提供坚实的运维基础。
183 0
|
2月前
|
存储 人工智能 安全
企业级 AI Agent 开发指南:基于函数计算 FC Sandbox 方案实现类 Chat Coding AI Agent
通过 Sandbox 与 Serverless 的深度融合,AI Agent 不再是“黑盒”实验,而是可被企业精准掌控的生产力工具。这种架构不仅适配当前 AI Agent 的动态交互特性,更为未来多模态 Agent、跨系统协作等复杂场景提供了可复用的技术底座。若您的企业正面临 AI Agent 规模化落地的挑战,不妨从 Sandbox 架构入手,结合函数计算 FC 的能力,快速验证并构建安全、高效、可扩展的 AI 应用系统。
|
2月前
|
存储 人工智能 Serverless
企业级 AI Agent 开发指南:基于函数计算 FC Sandbox 方案实现类 Chat Coding AI Agent
本文深入解析AI Agent系统架构,特别是以Sandbox为核心的落地实践。聚焦泛Chat模式下AI应用的挑战与解决方案,涵盖会话亲和性、隔离性、存储机制、会话恢复、资源弹性等关键技术点,阿里云函数计算(FC)为 AI Agent 系统在企业中的落地实践提供实际解决方案,展示了如何高效、安全地构建可扩展的 AI 应用系统。
|
3月前
|
人工智能 编解码 安全
阿里云服务器上新,第9代AMD企业级实例g9ae,提升企业AI业务创新与性能突破
近日,阿里云推出的服务器ECS第9代AMD企业级实例-g9ae实例已开启邀测阶段,g9ae实例基于CIPU 2.0架构,搭载AMD Turin处理器,为国内首创物理核设计的“性能旗舰型”算力产品,专为AI时代企业离线数据处理打造。本文为大家介绍g9ae实例的性能及适用场景,以供了解与参考。