在不到 5 分钟的时间内将威胁情报 PDF 添加为 AI 助手的自定义知识

news/2025/1/8 2:56:59/

作者:来自 Elastic jamesspi

安全运营团队通常会维护威胁情报报告的存储库,这些报告包含由报告提供商生成的大量知识。然而,挑战在于,这些报告的内容通常以 PDF 格式存在,使得在处理安全事件或调查时难以检索和引用相关信息,或者难以利用其中的威胁指标(indicators of compromise - IoC)进行威胁狩猎。通过将这些报告作为知识在 Elastic AI Assistant 中使用,这种情况将完全改变。

让我们以 2024 年 Elastic 全球威胁报告为例。

更多阅读,请参阅 “利用 Elastic AI Assistant 的自定义知识源增强威胁响应”。

步骤 1:启用和设置知识库

这是一个非常简单的步骤,它处理了 Elastic AI Assistant 使用知识库内容所需的一些先决条件。它是助手管理设置中的一个按钮。该过程只需几分钟即可完成。

步骤二:上传 PDF

知识库设置完成后,我们可以继续上传 PDF。为此,我们可以使用集成页面中名为 “Upload a file” 的集成。

你可以从下一个屏幕中选择 PDF。

出现提示时单击 Import

下一步,我们需要转到 “Advanced” 选项卡。上传后,此 PDF 将保存在其自己的索引中,因此请随意命名索引。无需创建数据视图。

在单击导入按钮之前还有最后一步。我们需要添加一个 semantic text 字段。这允许助手从报告中检索正确的信息。

单击 Add additional field,然后单击 Add semantic text field

你可以保留单击 “Add semantic text field” 后出现的默认设置。

你现在可以单击 “Import”。

当文件导入成功后,你应该看到以下状态:

值得注意的是,虽然我们使用文件上传用户界面来添加此 PDF,但可以使用附件处理器(attachment processor)将此功能作为任何摄取过程的一部分自动执行。

步骤 3:将 PDF 索引添加为自定义知识

返回 AI 设置页面,选择新建以添加新知识条目,然后从列表中选择索引。

然后,系统会要求你选择刚刚创建的索引(在我们的示例中为 “global-threat-report-kb”)、我们刚刚创建的语义文本字段(内容)以及助手应如何以及何时使用这些知识的描述。这应该是一个简单的句子描述,说明数据是什么以及何时以及如何查询数据。你还可以从此视图中设置此知识条目的相关权限。准备就绪后,点击 Save

添加后,你应该在列表中看到新的知识条目:

威胁报告现已作为知识提供,可供助手使用。

比较结果

如果我们比较添加知识库条目之前和之后助手的结果,我们可以看到明显的差异。

在添加知识之前

补充完知识之后

我们的 PDF 从一堆无用的重要但难以使用的信息变成了我们的安全运营团队可以立即访问的信息。知识源的优点在于,Elastic AI Assistant 可以根据所提出的问题组合使用它们。请记住,默认情况下,Elastic AI Assistant 还可以将 500 条最新警报作为知识提取,从而可以提出强大的问题组合。

这个示例清楚地强调了为助手提供自定义知识源的实用性。正如我们之前强调的那样,还有许多其他场景和示例,其中自定义知识源很有用。

有关如何添加不同类型知识源的更多信息,您可以参考我们的详细文档。

原文:Dec 7th, 2024: [EN] Add a threat intelligence PDF as custom knowledge for the AI Assistant in less than 5 minutes - Advent Calendar - Discuss the Elastic Stack


http://www.ppmy.cn/news/1561152.html

相关文章

F.interpolate函数

F.interpolate 是 PyTorch 中用于对张量(通常是图像数据)进行插值操作的函数,常用于调整张量的大小,例如改变图像的分辨率。它支持多种插值方法,包括最近邻插值、双线性插值和三次插值等。 语法 torch.nn.functional…

【杂谈】-DeepSeek如何以560万美元突破成本障碍

DeepSeek如何以560万美元突破成本障碍 文章目录 DeepSeek如何以560万美元突破成本障碍1、高效人工智能的经济学2、实现不可能的工程3、人工智能生态系统的连锁反应 传统的人工智能观点认为,构建大型语言模型 (LLM)需要大量资金——通常需要数十亿美元的投资。但中国…

Eclipse 内容辅助

Eclipse的内容辅助(Content Assist)功能是一项核心特性,它通过提供代码提示和自动完成建议来提高开发效率。这个功能能够在用户编写代码时自动显示可能的代码补全选项,如变量名、方法名、类名和关键字等。它还能根据用户的输入和上…

「下载」智慧文旅运营综合平台解决方案:整体架构,核心功能设计

智慧文旅运营综合平台,旨在通过集成大数据、云计算、物联网、人工智能等先进技术,为景区、旅游企业及相关管理机构提供一站式的智慧化运营服务。 智慧文旅运营综合平台不仅能够提升游客的游览体验,还能帮助景区管理者实现资源的优化配置和业务…

Unity的四种数据持久化方式

目录 什么是数据持久化 数据持久化之PlayerPrefs 概述 API及用法 电脑中存放的位置 优缺点 主要用处 封装PlayerPrefs 数据持久化之XML XML是什么 读取XML信息 C#读取XML的方法有几种 读取xml文件信息 读取元素和属性信息 总结 写入XML信息 选择存储目录 存储…

从RNN循环神经网络到长短时记忆网络LSTM

前言 本文从一个简单的例子出发,介绍了RNN及其两种变体LSTM和GRU的基本原理,了解循环神经网络能够解决什么问题,以及能够应用在哪些领域。 1)本文重点:本文重点研究RNN及其变体的原理和解决的问题; 2)本文缺陷:本文为有倾向性的知…

《ChatGPT 数据分析实践》——人人都是数据分析高手!

文章目录 零、前言一、深入探索 ChatGPT 的潜力二、书中亮点概览从零开始应用案例丰富全面覆盖数据分析流程跨行业适用 三、学习 ChatGPT 数据分析的价值四、读者对象五、作者介绍六、感受七、粉丝福利福利0福利1福利2 零、前言 我是虚竹哥,目标是带十万人玩转Chat…

Selenium和WebDriver的安装与配置

1、Selenium的安装 直接黑窗口执行:pip install selenium3.141.0 可能遇到的问题: 解决方法配置环境变量: 找到目录:(以自己电脑为准) C:\Users\Administrator\AppData\Local\Programs\Python\Python38-…