Elasticsearch:redact processor - 编辑处理器

news/2024/10/23 5:50:10/

警告:此功能处于技术预览阶段,可能会在未来版本中更改或删除。 Elastic 将尽最大努力解决任何问题,但技术预览版中的功能不受官方 GA 功能的支持 SLA 的约束。

Redact 处理器使用 Grok 规则引擎来模糊输入文档中与给定 Grok 模式匹配的文本。 该处理器可用于通过配置检测电子邮件或 IP 地址等已知模式来隐藏个人识别信息 (PII)。 与 Grok 模式匹配的文本将替换为可配置的字符串,例如匹配电子邮件地址的 <EMAIL>,或者如果愿意,只需将所有匹配项替换为文本 <REDACTED>。

Elasticsearch 附带了许多有用的预定义模式,Redact 处理器可以方便地引用这些模式。 如果其中之一不满足您的需求,请使用自定义模式定义创建新模式。 Redact 处理器会替换每次出现的匹配项。 如果有多个匹配项,所有匹配项都将替换为模式名称。

Redact 处理器与弹性通用架构 (ECS) 模式兼容。 不支持旧版 Grok 模式。

在管道中使用 Redact 处理器

Redact 选项
名称必要项默认
fieldyes-要编辑的字段
patternsyes-用于匹配和编辑命名捕获的 grok 表达式列表
pattern_definitionsno-模式名称和模式元组的映射,定义处理器要使用的自定义模式。 匹配现有名称的模式将覆盖预先存在的定义
prefixno<使用此标记开始编辑部分
suffixno>使用此标记结束编辑部分
ignore_missingnotrue如果 true 并且字段不存在或为 null,则处理器安静退出而不修改文档
descriptionno-处理器的描述。 对于描述处理器或其配置的用途很有用。
if no-有条件地执行处理器。 请参阅有条件地运行处理器。
ignore_failurenofalse忽略处理器的故障。 请参阅处理管道故障。
on_failureno-

 忽略处理器的故障。 请参阅处理管道故障。

tagno-处理器的标识符。 对于调试和指标很有用。

示例

在此示例中,预定义的 IP Grok 模式用于匹配和编辑消息文本字段中的 IP 地址。 使用 Simulate API 测试管道。

POST _ingest/pipeline/_simulate
{"pipeline": {"description" : "Hide my IP","processors": [{"redact": {"field": "message","patterns": ["%{IP:client}"]}}]},"docs":[{"_source": {"message": "55.3.244.1 GET /index.html 15824 0.043"}}]
}

上面命令显示的结果为:

{"docs": [{"doc": {"_index": "_index","_id": "_id","_version": "-3","_source": {"message": "<client> GET /index.html 15824 0.043"},"_ingest": {"timestamp": "2023-06-24T01:53:44.906188Z"}}}]
}

响应中的文档仍然包含 message 字段,但现在 IP 地址 55.3.244.1 被文本 <client> 替换。

IP 地址被替换为单词 client,因为这是 Grok 模式 %{IP:client} 中指定的内容。 模式名称周围的 < 和 > 标记可以使用前缀和后缀选项进行配置。

下一个示例定义了多个模式,这两个模式都被单词 REDACTED 替换,并且前缀和后缀标记设置为 *

POST _ingest/pipeline/_simulate
{"pipeline": {"description": "Hide my IP","processors": [{"redact": {"field": "message","patterns": ["%{IP:REDACTED}","%{EMAILADDRESS:REDACTED}"],"prefix": "*","suffix": "*"}}]},"docs": [{"_source": {"message": "55.3.244.1 GET /index.html 15824 0.043 test@elastic.co"}}]
}

在响应中,IP 55.3.244.1 和电子邮件地址 test@elastic.co 均已替换为 *REDACTED*。

上面命令运行的结果为:

{"docs": [{"doc": {"_index": "_index","_id": "_id","_version": "-3","_source": {"message": "*REDACTED* GET /index.html 15824 0.043 *REDACTED*"},"_ingest": {"timestamp": "2023-06-24T01:56:07.547294Z"}}}]
}

定制 patterns

如果现有 Grok 模式之一不符合你的要求,可以使用 pattern_definitions 选项添加自定义模式。 新模式定义由模式名称和模式本身组成。 该模式可以是正则表达式或引用现有的 Grok 模式。

此示例定义自定义模式 GITHUB_NAME 以匹配 GitHub 用户名。 该模式定义使用现有的 USERNAME Grok 模式,并以文字 @ 为前缀。

提示:Grok 调试器对于构建自定义模式来说是一个非常有用的工具。

POST _ingest/pipeline/_simulate
{"pipeline": {"processors": [{"redact": {"field": "message","patterns": ["%{GITHUB_NAME:GITHUB_NAME}"],"pattern_definitions": {"GITHUB_NAME": "@%{USERNAME}"}}}]},"docs": [{"_source": {"message": "@elastic-data-management the PR is ready for review"}}]
}

username 在响应中被编辑。

{"docs": [{"doc": {"_index": "_index","_id": "_id","_version": "-3","_source": {"message": "<GITHUB_NAME> the PR is ready for review"},"_ingest": {"timestamp": "2023-06-24T01:59:15.427469Z"}}}]
}

Grok watchdog

Watchdog 会中断执行时间过长的表达式。 当中断时,Redact 处理器会失败并出现错误。 控制 Grok Watchdog 超时的相同设置也适用于 Redact 处理器。


http://www.ppmy.cn/news/545641.html

相关文章

北交大计算机老师夏嘉楠,北京交通大学院系部处文件-馆档网.DOC

北京交通大学院系部处文件-馆档网 馆档网 专业文档检索与下载 HYPERLINK "/" /  本文档下载自HYPERLINK "/"馆档网&#xff0c;如果排版有问题&#xff0c;您也可以点击以下网址在线阅读&#xff1a; HYPERLINK "/doc/4542805.html" /doc/4542…

精品展柜,展示柜

佛山嘉艺专业从事佛山展柜的设计制作&#xff0c;再这几年里我们拥有自己的专业技术理念&#xff0c;现在为您介绍一下展示柜&#xff1a; 精品展柜,展示柜主要用于摆放贵重且体积不大&#xff0c;需有较好的展示空间的商品&#xff0c;达到展示商品和储货的功能。  精品展…

【转】javascript里的document.all用法

【转】javascript里的document.all用法 1 、理解document.all [] 从IE4开始IE的object model才增加了 document.all [],来看看 document.all []的Description: Array of all HTML tags in the document.Collection of all elements contained by the object. 也就是说 docu…

一人得道鸡犬升天 盘点苹果产业链的156家供应商

从3000亿美元到5000亿美元&#xff0c;再到6333亿美元&#xff0c;苹果公司一跃成为有史以来全球最值钱公司&#xff0c;可谓富可敌国。随着新一代苹果iPhone5即将面世&#xff0c;6000亿美元的市值或将更上一层楼。   近日&#xff0c;苹果首次公布供应商名单&#xff0c;涵…

刘首岐将演电影《谁的青春不叛逆》 叛逆少女转型成演员

电影《谁的青春不叛逆》宣传一出便备受关注&#xff0c;聚星嘉艺影视公司微博粉丝量更是一夜爆涨。主演阵容强大&#xff0c;继湖南卫视《变形记》第六季第一期之《横漂生活》城市主人公盛运煌的加入后&#xff0c;不久前&#xff0c;第八季第三期之《青春契约》城市主人公王晨…

2016年中山市信息学竞赛暨全国信息学联赛成绩表(普及组)

这一次比赛的成绩出来啦&#xff0c;考的还是不错的&#xff0c;至少近复赛了。加油&#xff01; 2016年中山市信息学竞赛暨全国信息学联赛成绩表&#xff08;普及组&#xff09; 序号 姓名 性别 学校 年级 参赛语种 指导教师 成绩 32 徐熠伟 男 中山市中山纪念中学 初一 pas…

noip2016普及组初赛中山市成绩表及分数线

广东中山初赛分数线63分~ 2016年中山市信息学竞赛暨全国信息学联赛成绩表&#xff08;普及组&#xff09; 排名 姓名 性别 学校 年级 参赛语种 指导教师 成绩 1 徐熠伟 男 中山市中山纪念中学 初一 pascal 熊超 97 2 冯飞扬 男 中山市中山纪念中学 初二 C 熊超 97 3 汤子轩 男…

Jquery-UI—制作选项卡(tabs)

先看一下效果&#xff1a; Jquery-UI 选项卡的制作实际上是利用锚点链接的原理&#xff0c;实现起来非常的简单。 第一步&#xff1a;引入 jquery 和 jquery-ui 文件。 以下是我的head部分的代码&#xff1a; <head><meta charset"UTF-8"><title&…