Redis 与 AI:从缓存到智能搜索的融合之路

简介: Redis 已从传统缓存系统发展为强大的 AI 支持平台,其向量数据库功能和 RedisAI 模块为核心,支持高维向量存储、相似性搜索及模型服务。文章探讨了 Redis 在实时数据缓存、语义搜索与会话持久化中的应用场景,并通过代码案例展示了与 Spring Boot 的集成方式。总结来看,Redis 结合 AI 技术,为现代应用提供高效、灵活的解决方案。

Redis 与 AI:从缓存到智能搜索的融合之路

在当今数字化时代,Redis 不仅是一个高性能的缓存系统,更是一个强大的 AI 支持平台。Redis 通过其向量数据库功能和 AI 工具,为现代应用提供了独特的技术优势。

一、Redis 的 AI 能力

(一)向量数据库功能

Redis 的向量数据库功能是其 AI 能力的核心。它支持以下功能:

  1. 存储高维向量数据:Redis 可以存储向量及其相关的元数据,这些数据可以存储在哈希或 JSON 文档中。
  2. 执行相似性搜索:通过向量搜索(KNN 查询),Redis 可以快速找到与目标向量最相似的向量。
  3. 支持向量范围查询:允许用户基于向量距离进行范围查询。
  4. 元数据过滤功能:在执行向量搜索时,可以结合其他条件进行筛选,例如根据用户 ID 或类别过滤结果。

(二)RedisAI 模块

RedisAI 是 Redis 的一个模块,旨在将机器学习和深度学习带入 Redis 生态系统。它的主要特性包括:

  1. 张量存储:支持存储多维数组(张量),这些张量可以直接用作模型的输入或输出。
  2. 模型服务:支持加载和执行来自 TensorFlow、PyTorch 和 ONNX 的预训练模型。
  3. 脚本执行:通过 TorchScript 提供在 CPU 或 GPU 上执行预处理和后处理操作的能力。
  4. DAG 执行:允许定义和执行包含多个操作的有向无环图(DAG),实现复杂的推理管道。
  5. GPU 加速:支持 GPU 执行,充分利用硬件加速能力。

(三)Redis for AI

Redis for AI 是 Redis 提供的一套工具,旨在帮助开发者更高效地构建和部署 AI 应用。它包括:

  1. 向量数据库:提供世界上最快的向量数据库,支持高效的相似性搜索。
  2. 缓存解决方案:提供先进的缓存功能,减少对大型语言模型的依赖,降低成本并提升性能。
  3. 实时架构(RAG):支持基于检索增强生成(Retrieval Augmented Generation)的应用,提升智能体的推理能力和响应速度。

二、Redis 作为向量数据库的运行测试代码

(一)环境准备

  1. 安装 Redis Stack
    使用 Docker 安装 Redis Stack:

    docker run -d --name redis-stack -p 6379:6379 redis/redis-stack:latest
    
  2. 准备数据
    下面的代码展示了如何将数据存储到 Redis 中,并创建向量字段:

    import redis
    import numpy as np
    from redis.commands.search.field import TextField, VectorField
    from redis.commands.search.indexDefinition import IndexDefinition, IndexType
    from redis.commands.search.query import Query
    from sentence_transformers import SentenceTransformer
    
    # 连接 Redis
    client = redis.Redis(host="localhost", port=6379, decode_responses=True)
    
    # 存储向量数据
    keys = ["doc:1", "doc:2"]
    embeddings = np.array([[0.1, 0.2, 0.3], [0.4, 0.5, 0.6]], dtype=np.float32)
    for key, embedding in zip(keys, embeddings):
        client.hset(key, mapping={
         "embedding": embedding.tobytes()})
    
    # 创建索引
    schema = (
        TextField("id", no_stem=True, as_name="id"),
        VectorField(
            "embedding",
            "FLAT",
            {
         "TYPE": "FLOAT32", "DIM": 3, "DISTANCE_METRIC": "L2"},
            as_name="embedding",
        ),
    )
    definition = IndexDefinition(prefix=["doc:"], index_type=IndexType.HASH)
    client.ft("idx:docs").create_index(fields=schema, definition=definition)
    

(二)向量搜索测试

以下代码展示了如何执行向量搜索:

# 查询向量
query_embedding = np.array([0.1, 0.2, 0.3], dtype=np.float32)
query = (
    Query("(*)=>[KNN 2 @embedding $query_embedding AS score]")
    .sort_by("score")
    .return_fields("id", "score")
    .dialect(2)
)
results = client.ft("idx:docs").search(query, query_params={
   "query_embedding": query_embedding.tobytes()})
for doc in results.docs:
    print(doc)

三、Spring Boot 集成 Redis 向量数据库的代码案例

(一)环境准备

  1. 添加依赖
    pom.xml 文件中添加以下依赖:

    <dependency>
        <groupId>org.springframework.ai</groupId>
        <artifactId>spring-ai-redis-store-spring-boot-starter</artifactId>
    </dependency>
    
  2. 配置 Redis
    application.properties 文件中配置 Redis:

    spring.ai.vectorstore.redis.uri=redis://localhost:6379
    spring.ai.vectorstore.redis.index=default-index
    spring.ai.vectorstore.redis.prefix=default:
    

(二)使用 Redis 向量数据库

以下代码展示了如何在 Spring Boot 应用程序中使用 Redis 向量数据库:

@Autowired
private VectorStore vectorStore;

@PostMapping("/embedding")
public ResultEntity<Boolean> embedding(@RequestParam MultipartFile file) throws Exception {
   
    TikaDocumentReader tikaDocumentReader = new TikaDocumentReader(new InputStreamResource(file.getInputStream()));
    List<Document> splitDocuments = new TokenTextSplitter().apply(tikaDocumentReader.read());
    vectorStore.add(splitDocuments);
    return ResultUtils.success(true);
}

@GetMapping("/query")
public List<Document> query(@RequestParam String query) {
   
    return vectorStore.similaritySearch(query);
}

四、Redis 的 AI 应用场景

(一)实时数据缓存

Redis 的内存存储特性使其能够快速缓存 API 返回值,提高响应速度。例如,使用 LangChain 的 RedisCache 实现 LLM(大语言模型)的缓存功能:

set_llm_cache(RedisCache(redis_client));

(二)语义搜索与检索

Redis 的向量数据库功能可以用于语义搜索。例如,结合 LangChain 的 RedisVectorStore,可以实现智能搜索功能:

vector_store = RedisVectorStore(redis_client);

(三)会话持久化

Redis 可以记录和检索会话历史,增强对话系统的持续性。例如,使用 LangGraph 的 langgraph-checkpoint-redis,可以实现跨会话的持久化记忆。

五、总结

Redis 的 AI 能力和缓存功能的结合,为现代应用架构提供了强大的支持。通过合理配置和使用,可以在单一实例中同时满足缓存和向量搜索的需求,既节省了资源,又简化了系统架构。

相关文章
|
4月前
|
人工智能 安全 Nacos
Nacos 3.0:微服务与AI融合的技术新纪元
Nacos 3.0:微服务与AI融合的技术新纪元
284 83
|
4月前
|
人工智能 自然语言处理 安全
Nacos 3.0:微服务与AI融合的新一代动态治理平台
Nacos 3.0:微服务与AI融合的新一代动态治理平台
290 2
|
4月前
|
人工智能 运维 监控
聚焦“AI+运维”深度融合,龙蜥系统运维联盟 MeetUp 圆满结束
现场 40 多位开发者进行了深入的技术交流,探索 AI 与运维深度融合的未来路径。
|
1月前
|
缓存 负载均衡 监控
135_负载均衡:Redis缓存 - 提高缓存命中率的配置与最佳实践
在现代大型语言模型(LLM)部署架构中,缓存系统扮演着至关重要的角色。随着LLM应用规模的不断扩大和用户需求的持续增长,如何构建高效、可靠的缓存架构成为系统性能优化的核心挑战。Redis作为业界领先的内存数据库,因其高性能、丰富的数据结构和灵活的配置选项,已成为LLM部署中首选的缓存解决方案。
|
2月前
|
存储 缓存 NoSQL
Redis专题-实战篇二-商户查询缓存
本文介绍了缓存的基本概念、应用场景及实现方式,涵盖Redis缓存设计、缓存更新策略、缓存穿透问题及其解决方案。重点讲解了缓存空对象与布隆过滤器的使用,并通过代码示例演示了商铺查询的缓存优化实践。
155 1
Redis专题-实战篇二-商户查询缓存
|
1月前
|
缓存 运维 监控
Redis 7.0 高性能缓存架构设计与优化
🌟蒋星熠Jaxonic,技术宇宙中的星际旅人。深耕Redis 7.0高性能缓存架构,探索函数化编程、多层缓存、集群优化与分片消息系统,用代码在二进制星河中谱写极客诗篇。
|
4月前
|
人工智能 自然语言处理 Nacos
Nacos 3.0:微服务与AI融合的全新治理平台
Nacos 3.0:微服务与AI融合的全新治理平台
233 46
|
2月前
|
存储 人工智能 关系型数据库
阿里云AnalyticDB for PostgreSQL 入选VLDB 2025:统一架构破局HTAP,Beam+Laser引擎赋能Data+AI融合新范式
在数据驱动与人工智能深度融合的时代,企业对数据仓库的需求早已超越“查得快”这一基础能力。面对传统数仓挑战,阿里云瑶池数据库AnalyticDB for PostgreSQL(简称ADB-PG)创新性地构建了统一架构下的Shared-Nothing与Shared-Storage双模融合体系,并自主研发Beam混合存储引擎与Laser向量化执行引擎,全面解决HTAP场景下性能、弹性、成本与实时性的矛盾。 近日,相关研究成果发表于在英国伦敦召开的数据库领域顶级会议 VLDB 2025,标志着中国自研云数仓技术再次登上国际舞台。
273 0
|
2月前
|
缓存 NoSQL 关系型数据库
Redis缓存和分布式锁
Redis 是一种高性能的键值存储系统,广泛用于缓存、消息队列和内存数据库。其典型应用包括缓解关系型数据库压力,通过缓存热点数据提高查询效率,支持高并发访问。此外,Redis 还可用于实现分布式锁,解决分布式系统中的资源竞争问题。文章还探讨了缓存的更新策略、缓存穿透与雪崩的解决方案,以及 Redlock 算法等关键技术。

热门文章

最新文章