亚马逊云科技Bedrock知识库自定义语义搜索配置教程

news/2025/2/11 13:15:47/
aidu_pl">

借助亚马逊云科技的Amazon Bedrock知识库功能,我们可以安全地将Amazon Bedrock中的基础模型连接到我们的私有数据,实现检索增强生成(RAG)。给知识库挂载额外的数据有助于模型生成更相关、基于上下文的准确响应,而无需重新训练AI模型。

在本文中我们将介绍Amazon Bedrock知识库在用于生成响应的RetrieveAndGenerate API中的两项新功能:配置最大检索结果数量和使用知识库提示词模板创建自定义提示词。现在大家可以将这些选项作为查询参数,在知识库搜索中使用。

新功能概述及优势

Bedrock知识库的最大检索结果数量选项,允许大家调整从向量存储中检索并传递给AI模型生成答案的搜索结果数量。这使AI模型在回答用户问题时,能够根据复杂问题提供更多背景信息,或者对于简单问题减少不必要的信息量。大家利用知识库最多可以检索100条结果,这个选项可以提供更多的相关上下文的搜索结果,从而提高准确性,并减少模型生成幻觉的情况。

自定义知识库提示模板允许大家替换默认的提示模板,以自定义发送给模型的提示词。这使大家可以自定义模型的语气、输出格式和行为,以适应不同的用户需求。有了这个选项大家可以调整术语,使其更符合特定行业或领域(如医疗或法律)。此外还可以添加自定义指令和示例,以更好地匹配特定的工作流程。在接下来的部分,我们将介绍如何通过亚马逊云科技管理控制台或SDK来实现这些功能。

通过控制台配置最大检索结果数量

要跟随本文示例操作,大家需要一个已创建的知识库。在建好知识库后,如果要在控制台上使用最大检索结果数量选项,请按照以下步骤操作:

  1. 在亚马逊云科技Bedrock控制台左侧导航栏中,选择知识库(Knowledge bases)。
  2. 选择已创建的知识库
  3. 选择测试知识库(Test knowledge base)。
  4. 选择配置图标(Configuration)。
  5. 在开始测试知识库之前,选择同步数据源(Sync data source)。

      6. 在配置(Configurations)部分中的搜索类型(Search Type)下,根据业务需求选择搜索类型。本文为了简化安利的演示,使用了默认搜索(Default Search)。大家还可以根据业务需求使用语义搜索(Semantic Search)或混合搜索(Hybrid Search)。要了解更多关于混合搜索的信息,请参阅亚马逊云科技 Bedrock 知识库现在支持混合搜索。

      7. 展开最大源搜索数据源块数量(Maximum number of source chunks) 选项,并设置最大检索结果数量。

为了展示Bedrock这一功能的价值,我们提供了一些案例展示,以说明如何提高知识库生成响应的准确性。我们使用了亚马逊的年度财报和股东信(包括2023年亚马逊10-K文档、2022年股东信、2021年股东信、2020年股东信、2019年股东信)作为知识库的数据源。然后我们使用以下查询进行实验:“亚马逊的年收入是在哪一年从2450亿美元增长到4340亿美元?”

对于这个查询,正确的答案应该是“亚马逊的年收入从2019年的2450亿美元增长到2022年的4340 亿美元”,这一结论是基于知识库中的文档得出的。我们使用Claude v3作为AI 模型来生成最终的响应,该响应基于知识库检索到的上下文信息。此外Claude 3 Sonnet和Claude 3 Haiku也支持作为知识库AI模型。

下面我们开始进行另一项查询实验,以比较不同配置下的检索情况。我们使用相同的查询输入(“亚马逊的年收入是在哪一年从2450亿美元增长到4340亿美元?”),并将最大检索结果数量设置为5。如下图所示生成的响应是:“对不起,我无法帮助处理您的请求。”

然后我们将最大检索结果数量设置为12,并再次提出相同的问题。这次生成的响应是:“亚马逊的年收入从2019年的2450亿美元增长到2022年的4340亿美元。”

如本示例所示,通过调整最大检索结果数量,我们才能够正确检索到答案。如果大家想要了解生成答案所依据的来源信息,可以选择显示来源详情(Show source details) 以验证知识库的检索结果。

在本篇中,我们介绍了如何在亚马逊云科技上为Bedrock知识库功能,并通过调整知识库进行内容搜索时的最大检索结果数量,更精准地检索到我们希望得到的结果。在本系列下篇中,我们将继续介绍如何配置自定义的知识库提示词模板,使知识库按大家的业务需求进行更定制化的回复。欢迎大家继续关注小李哥的亚马逊云科技前沿AI解决方案介绍系列,关注我不要错过未来更多高质量内容。


http://www.ppmy.cn/news/1571161.html

相关文章

Ajax:重塑Web交互体验的人性化探索

在数字化时代,网页的交互性和响应速度已成为衡量用户体验的关键指标。Ajax(Asynchronous JavaScript and XML),作为前端与后端沟通的桥梁,凭借其异步通信的能力,极大地提升了网页的动态性和用户友好度&…

02.10 TCP之文件传输

1.思维导图 2.作业 服务器代码&#xff1a; #include <stdio.h> #include <string.h> #include <unistd.h> #include <stdlib.h> #include <sys/types.h> #include <sys/stat.h> #include <fcntl.h> #include <pthread.h> …

1.2 项目初始化实战

1.2 项目初始化实战 1.2.1 Maven多模块项目构建&#xff08;企业级标准&#xff09; 项目结构规范&#xff1a; parent-project&#xff08;父模块&#xff09; ├── pom.xml ├── common-core&#xff08;通用工具模块&#xff09; │ ├── src/main/java │ └─…

深度学习框架PyTorch

一、框架概览 深度学习框架&#xff1a;是一个针对深度学习的科学计算库&#xff0c;在深度学习领域&#xff0c;以下是当前市场上几个主流的深度学习框架&#xff1a; TensorFlow 上一代框架&#xff1a;起始于静态图时代&#xff0c;为早期深度学习的发展做出了巨大贡献。特…

适用于 Windows 的 Zed 编辑器的非官方稳定版。通过 scoop 或 pwsh 脚本轻松安装。不隶属于 Zed Industries

一、软件介绍&#xff08;文末提供下载&#xff09; Zed&#xff0c;这是一款由 Atom 和 Tree-sitter 的创建者提供的高性能多人 Atom and Tree-sitter.。 二、macOS 和 Linux安装 在 macOS 和 Linux 上&#xff0c;您可以直接下载 Zed 或通过本地包管理器安装 Zed。 本地包…

解决Ubuntu20.04安装curl,出现报错的问题

1.备份原来的源文件&#xff0c;如果没有&#xff0c;需要新建 sudo cp /etc/apt/sources.list /etc/apt/sources.list02.0 查看Ubuntu版本 lsb_release -a 3.0 登录源网站&#xff0c;复制源相关的数据信息 提供清华源 https://mirrors.tuna.tsinghua.edu.cn/help/ubuntu/…

【学术投稿-第六届新材料与清洁能源国际学术会议(ICAMCE 2025)】组织与结构:HTML中的<fieldset>与<legend>标签解析

官网&#xff1a;www.icceam.com 简介 第六届新材料与清洁能源国际学术会议&#xff08;ICAMCE 2025&#xff09;将于2025年2月21-23日在郑州隆重举行。清洁能源、新材料是当今工业发展中最重要、最有潜力的领域之一。而新型材料又是新能源的基础和保证。本会议主要围绕“清洁…

oracle: 事务,视图

事务 事务是数据库的最小逻辑单元&#xff0c;就是数据库中的一个最小的操作单位。 事务是由多条SQL语句组成的一个集合&#xff0c;有事务统一控制这些SQL语句的执行。 事务的属性 被简称为ACID属性, 是4个属性单词的首字母 脏读,幻读,不可重复读 是三种常见的并发问题&…