PM4PY - Handling Event Data

news/2025/2/19 17:07:20/

摘要:导入导出CSV文件、事件日志数据类型转换

随笔

trace(轨迹):从头部到尾部走一次路径就算一次trace
Variants(变体):不同的路径为一个变体
process execution(流程执行)
stochastic(随机)
parameter(参数)
i.e.=that is / in other,用来进一步解释前面所表明的观点。i.e. 是拉丁语 id est 的缩写,意思是“那就是说、换句话说”,相当于that is / in other,用来进一步解释前面所表明的观点。
e.g. 是拉丁语 exempli gratia 的缩写,意思是“举个例子,比如”,等同于for example、 for the sake of example、such as

读文档先一整句看下来把握句子大意,再去翻译不认识的单词。

导入CSV文件

先用pandas读取csv文件为dataframe对象
再用pm4py.objects.conversion包将dataframe文件转换为正确类型

在这里插入图片描述

示例代码中,将csv文件转为pm4py内部的event data类型
(示例代码在很多情况下都不能直接工作。原因:有许多参数需要我们去设置 ,在convertor中CASE_ID_KEY默认值为’case:concept:name’,因此示例代码中csv文件值至少要有’case:concept:name’列)

import pandas as pd
from pm4py.objects.log.util import dataframe_utils
from pm4py.objects.conversion.log import converter as log_converterlog_csv = pd.read_csv('<path_to_csv_file.csv>', sep=',')
log_csv = dataframe_utils.convert_timestamp_columns_in_df(log_csv)
log_csv = log_csv.sort_values('<timestamp_column>')
event_log = log_converter.apply(log_csv)

正确转换示例如下:
将dataframe的rename修改clientID列为case:clientID。因为转换参数parameter的CASE_ATTRIBUTE_PREFIX(CASE属性字首)默认为"case:"。CASE_ID_KEY指定哪列来标识区分case。

import pandas as pd
from pm4py.objects.conversion.log import converter as log_converterlog_csv = pd.read_csv('<path_to_csv_file.csv>', sep=',')
log_csv.rename(columns={'clientID': 'case:clientID'}, inplace=True)
parameters = {log_converter.Variants.TO_EVENT_LOG.value.Parameters.CASE_ID_KEY: 'case'}
event_log = log_converter.apply(log_csv, parameters=parameters, variant=log_converter.Variants.TO_EVENT_LOG)

转换EVENT DATA

pm4py.objects.convertion.log.converter是用来对事件日志(event logs)进行转换的。我们可以在Event Log, Event Stream 和 Data Frame 类型之间进行转换。

converter.apply(用法参考上面示例代码)变体与参数:
在这里插入图片描述

导出日志成CSV文件

导出event log(事件日志)为CSV文件。首先将event log转换成dataframe,再用pandas.to_csv生成csv文件。

import pandas as pd
from pm4py.objects.conversion.log import converter as log_converter
dataframe = log_converter.apply(log, variant=log_converter.Variants.TO_DATA_FRAME)
dataframe.to_csv('<path_to_csv_file.csv>')

周任务

  1. 找到生成的trace最大能多少?32G内存最大50万为宜
  2. 根据生成树的参数控制流程树的结构?见Process Tree一文

*若对本文有疑问(例如:笔记中知识点或表达有误),欢迎指出,共同学习进步。


http://www.ppmy.cn/news/514414.html

相关文章

网安笔记--整合

文章目录 1 intro威胁因素 2 加密密码体制分类安全性 3 DESDES工作模式多重DES和安全性加密策略 4 RSA PKCS保密系统体制分类单向函数用处 RSAElgamal 5 SHAHASHSHA-1SHA-2 6 数字签名基本概念签名体系MAC 消息认证码 7 密码协议协议距离协议分类密钥建立协议认证建立协议认证的…

Pytorch数据类型Tensor张量操作(操作比较全)

文章目录 Pytorch数据类型Tensor张量操作一.创建张量的方式1.创建无初始化张量2.创建随机张量3.创建初值为指定数值的张量4.从数据创建张量5.生成等差数列张量 二.改变张量形状三.索引四.维度变换1.维度增加unsqueeze2.维度扩展expand3.维度减少squeeze4.维度扩展repeat 五.维度…

推广一下小黑论坛

感觉我的用的t400不错&#xff0c;就推广一下这个论坛&#xff1a; http://www.xiaoheiclub.com/?fromuid20075

极家汇家居生活馆来讲解热胶和冷胶墙布哪个好?

热胶和冷胶墙布哪个好&#xff1f;极家汇家居生活馆来说说。对于热胶和冷胶墙布&#xff0c;网络上一直存在争议&#xff0c;目前暂时还没有定论。下面&#xff0c;极家汇家居生活馆就来与大家分享一下热胶和冷胶墙布的相关知识 先来看看热胶和冷胶分别是什么墙布。热胶是一种用…

小黑老师python_小黑课堂小黑老师 - 主页

${content} 你输入的邮件地址曾经通过${type}激活了本站帐号&#xff0c;请使用${type}帐号直接登录。 课程习题 &#xff1a; 提示 请选择一个答案 提交 查看正确答案 下一题 ${option}: ${content} {if multiple} {else} {/if} {if defined("xlist")&&!!xl…

冬季慎用电热毯

今年新买了电热毯&#xff0c;通宵开着&#xff0c;睡着很暖和。和朋友聊天的时候&#xff0c;他惊讶的说&#xff0c;电热毯怎么可以通宵开呢&#xff1f; 在网上查了一下电热毯的危害&#xff0c;发现还真是严重。 【转载】&#xff1a;http://wenwen.soso.com/z/q168420935…

电热膜地暖的优缺点分析,这款御寒“神器”越来越受青睐

电热膜地暖是世界上最先进的采暖方法之一。它是一种新型的电采暖&#xff0c;它利用电能作为能源通过远红外辐射传递热量。大家都知道有多种类型的电地暖&#xff0c;但电热膜主要是舒适&#xff0c;节能&#xff0c;不需要维护&#xff0c;因此&#xff0c;它已慢慢进入各个家…

小熊电器失宠,小家电市场不背锅

当“小而美”成为小家电市场的主旋律时&#xff0c;在很短的时间内就成为了消费者的新宠。尤其是疫情期间&#xff0c;当大家电受此影响销售量骤降时&#xff0c;小家电市场却逆势增长。 然而&#xff0c;随着疫情的消退&#xff0c;当消费者回归理性之时&#xff0c;市场也恢…