- 使用面向对象思想完成数据读取和处理
- 基于面向对象思想重新认知第三方库使用(PyEcharts)
数据分析案例
某公司,有2份数据文件,现需要对其进行分析处理,计算每日的销售额并以柱状图表的形式进行展示。
数据内容
综合案例(面向对象)数据资料https://pan.baidu.com/s/1nMOeuck5Q4Gp7TkKkU70nQ?pwd=6zt6
提取码:6zt6
- 1月份数据是普通文本,使用逗号分割数据记录,从前到后分别是(日期,订单id,销售额,销售省份)
- 2月份数据是JSON数据,同样包含(日期,订单id,销售额,销售省份)
需求分析
作为面向对象的程序员
我们全程将使用面向对象的思想来进行任务的开发
数据的定义
data_define.py
"""
数据定义的类
"""class Record:def __init__(self, date, order, money, province):self.date = date # 订单日期self.order = order # 订单IDself.money = money # 订单金额self.province = province # 订单省份def __str__(self): # 将地址数据转换为字符串return f"{self.date}, {self.order}, {self.money}, {self.province}"
和文件相关的类定义
file_define.py
"""
和文件相关的类定义
"""
import jsonfrom data_define import Record# 先定义一个抽象类用来做顶层设计,确定有哪些功能要实现
class FileReader:def read_data(self) -> list[Record]:"""读取文件的数据,读到的每一条数据都转为Record对象,将它们都封装到list内返回即可:return:"""passclass TextFileReader(FileReader):def __init__(self, path):self.path = path # 定义成员变量记录文件的路径# 复写(实现抽象方法)父类的方法def read_data(self) -> list[Record]:f = open(self.path, "r", encoding="UTF-8")read_list: list[Record] = []for line in f.readlines():line = line.strip() # 消除读取到的每一行数据中的\ndata_list = line.split(",")record = Record(data_list[0], data_list[1], int(data_list[2]), data_list[3])read_list.append(record)f.close()return read_listclass JsonFileReader(FileReader):def __init__(self, path):self.path = path # 定义成员变量记录文件的路径# 复写(实现抽象方法)父类的方法def read_data(self) -> list[Record]:f = open(self.path, "r", encoding="UTF-8")read_list: list[Record] = []for line in f.readlines():data_dict = json.loads(line)record = Record(data_dict["date"], data_dict["order_id"], int(data_dict["money"]), data_dict["province"])read_list.append(record)f.close()return read_listif __name__ == '__main__':text_file_reader = TextFileReader("D:/2011年1月销售数据.txt")json_file_reader = JsonFileReader("D:/2011年2月销售数据JSON.txt")list1 = text_file_reader.read_data()list2 = json_file_reader.read_data()for l in list1:print(l)for l in list2:print(l)
整合使用
main.py
"""
面向对象,数据分析案例,主
业务逻辑代码实现步骤:
1. 设计一个类,可以完成数据的封装
2. 设计一个抽象类,定义文件读取的相关功能,并使用子类实现具体功能
3. 读取文件,生产数据对象
b. 进行数据需求的逻辑计算《计算每一天的销售额)
5. 通过PyEcharts进行图形会制"""
from file_define import FileReader, JsonFileReader, TextFileReader
from data_define import Record
from pyecharts.charts import Bar # 柱状图
from pyecharts.options import * # 图表的选项
from pyecharts.globals import ThemeType # 图表的主题
text_file_reader = TextFileReader("D:/2011年1月销售数据.txt")
json_file_reader = JsonFileReader("d:/2011年2月销售数据JSON.txt")jan_data: list[Record] = text_file_reader.read_data()
feb_data: list[Record] = json_file_reader.read_data()# 将俩个月份的数据合并为一个list来存储
all_data: list[Record] = jan_data + feb_data# 开始进行数据计算
# 创建一个字典,存储{日期:销售额}
data_dict = {}
for record in all_data:if record.date in data_dict.keys():# 当前日期已经有记录了,所以和老记录累加即可data_dict[record.date] += record.moneyelse:# 新一天的创建操作data_dict[record.date] = record.money# 可视化图表开发
bar = Bar(init_opts=InitOpts(theme=ThemeType.LIGHT)# 设置图表主题
)
bar.add_xaxis(list(data_dict.keys())) # 添加X轴数据
bar.add_yaxis( # 添加y轴数据"销售图",list(data_dict.values()),label_opts=LabelOpts(is_show=False) # 不显示每个柱子的数字)
bar.set_global_opts(title_opts=TitleOpts(title="每日销售额", pos_left="center", pos_bottom="1%"), #标题居中yaxis_opts=AxisOpts(name="销售额(元)"), # 纵轴名称xaxis_opts=AxisOpts(name="日期(年-月-日)") # 横轴名称
)
bar.render("每日销售额柱状图.html")
结果: