一、Redis 7.2 简介
Redis 7.2 是最具有深远影响的版本。它包含了一系列广泛的新特性,并在支持人工智能计划的功能方面进行了重大投入。在所有这些增强的功能中,一个明显的主题贯穿其中:让开发人员更轻松地使用 Redis,让 Redis 运行得更快,让创新成果更轻松地实现。
不止是懂你的需求,我们有足够的创新能力满足你的需求:
我们曾有一家大型金融服务客户。该公司在 Redis 上专门运行多个机器学习(Machine Learning, ML)工作负载,数据量达到数百TB,可实现 99.999%的可用性。企业正在寻找一种经过验证的、企业级的向量数据库,其应当具有 Active-Active 地理分布、多租户、基于标签的混合搜索、基于角色的访问、嵌入式对象(如 JSON)、文本搜索功能和索引别名等能力。我们在 Redis Enterprise 上内置了所有这些功能,并通过了实战验证。
二、Redis7.2,令人工智能领域的创新更易实现
大语言模型(Large Language Model, LLM)和生成式人工智能的广泛应用,正以惊人的速度改变计算机软件行业,而Redis一直在努力提供功能使这些应用变得更轻松。我们一直在为全球顶尖客户(包括 OpenAI)提供支持,并致力于实现机器学习(ML)无缝且易用的体验,特别是现在的向量数据库领域。
Redis通过多种策略支持其数据库服务中的生成式AI工作任务,旨在提高效率、降低成本、增强可扩展性和性能。Redis 的矢量数据库支持两种矢量索引类型: FLAT(暴力搜索)和 HNSW(近似搜索),以及三种常用的距离度量: 余弦距离、内积距离和欧氏距离。其他功能还包括范围查询、混合搜索(结合过滤器和语义搜索)、JSON 对象支持等。
有人问,Redis是如何帮助构建和部署 LLM 支持的应用程序的?
- 检索增强生成(Retrieval Augmented Generation,RAG):在RAG 框架中,响应是使用预先训练好的 LLM 和客户自己的数据生成的。许多企业希望利用生成式人工智能的强大能力,而不是构建自己的模型或对现有模型进行微调。此外,他们也不愿意与商业 LLM共享自己的私有数据,而这正是 Redis Enterprise 发挥作用的地方。作为一个矢量数据库,它具有强大的混合语义搜索功能,可精确定位相关数据。此外,它还可以部署为外部的特定领域知识库。这确保了通用型LLM获得最相关和最新的上下文信息,从而提高结果质量。
- LLM 语义缓存:Redis Enterprise 常被用作可扩展的缓存,用于存储以前回答过的用户问题和结果。Redis 还使用语义缓存来识别和检索与输入问题语义足够相似的缓存响应,从而显著提高缓存命中率。这大大减少了发送到 LLM 服务的请求和令牌数量,从而通过缩短生成响应的时间来提高性能并降低成本。
- 推荐系统:LLM 可作为复杂的电子商务虚拟购物助手的支撑。Redis Enterprise 的上下文理解和语义搜索功能使应用程序能够理解客户的问题,提供个性化的产品推荐,甚至模拟实时对话交互。
- 文档搜索:在企业需要分析大量文件的情况下,由 LLM 驱动的应用程序可作为强大的文件发现和检索工具。Redis Enterprise 的混合语义搜索功能使其能够精确定位相关信息,并从这些文档中生成新内容。
Redis已与最流行的应用程序开发框架集成,用于创建由LLM驱动的聊天机器人、代理和流水线。其中包括 LlamaIndex、Langchain、RelevanceAI、DocArray、MantiumAI 和 ChatGPT retrieval plugin。 此外,Redis还与英伟达在一些领先的人工智能项目上开展了密切合作,如英伟达™(NVIDIA®)的 AI 工作流(Merlin 和 Morpheus)、工具(Triton 和 RAPIDS),以及英伟达™(NVIDIA®)正在开发中的为提供更高的每秒查询次数(QPS)的先进索引技术 RAPIDS RAFT。
这些案例需要更高性能的搜索能力。在 Redis Enterprise 7.2 中,我们推出了可扩展搜索功能的预览版。它允许在集群间以最佳的分布式处理方式,运行高 QPS、低延迟的工作任务。与以前的 Redis Enterprise 搜索和查询引擎相比,它可将查询吞吐量提高多达 16 倍。
三、Redis拥有更好的开发者生态
在上百个社区开发的客户端库中,哪个库支持最新的 Redis 功能?其安全和性能水平如何?
随着Redis 7.2的发布,我们为Redis客户端带来了全新的指导和支持。我们与五个客户端库的社区维护者直接合作——Jedis(Java)、node-redis(NodeJS)、redis-py(Python)、NRedisStack(.Net)和Go-Redis(Go),以求在文档、用户界面、管理和安全性等方面保持一致性。我们还在Redis Stack 和 Redis Enterprise(云和软件)中支持 RESP3 协议。