小白一只,想转行互联网行业的数据分析,通过寒假的佛系学习对python有了一定的了解。记录一下第一个小玩意儿。
在刷crossin论坛的时候突然看到一篇关于NBA的数据分析,因为本身自己也非常喜欢打球,顿时就有了兴趣。
由于对python的url不是特别了解,找了一堆资料也没能把数据从网上爬下来(差点劝退),后面又通过找资料有现成的csv,终于让我跨出了第一步。
先将下载过来的CSV数据文件打开
import matplotlib.pyplot as plt
import pandas as pd
from matplotlib.patches import Circle, Rectangle, Arc
from matplotlib.offsetbox import OffsetImage
data1 = pd.read_csv('shots-2019Aaron.csv',encoding='utf-8')
data1
然后在通过matplotlib 将其中的文件设置成散点图,通过确定四个要素来绘制。
made = data1[data1['outcome']==1]
missed = data1[data1['outcome']==0]
plt.scatter(missed.y, missed.x,color='r', marker='.', alpha=0.3)
plt.scatter(made.y, made.x,color='b', marker='.', alpha=0.3)
#删除边框就用它
#plt.tick_params(labelbottom=False, labelleft=False)
第一点是确定一位球员的名字
第二点是球员X轴的位置。
第三点是球员Y轴的位置。
第四点是球有没有进。
最后绘制出来是这个样子。
。
再把球场画上去就完成啦。
通过matplotlib 中的三个工具 Arc,Rectangle,Circle。分别来绘制圆弧、矩形、圆形。
#首先确定画布大小尺寸
fig = plt.figure(figsize=(12, 10))
#再确定划分区域
ax = fig.subplots(1,1)
接下来就有可以开始再画布中绘制球场了,在这里要注意绘制的坐标。
#球筐45厘米 再进行等比缩放
circle = Circle((240,40), radius=7.5, linewidth=2, fill=False)
# 整个球场
outer_box = Rectangle((-10, 0), 500,437 , linewidth=2,fill=False)
#篮板框
backboard = Rectangle((210, 32.5), 60, -2, linewidth=2,color ='k')
# 绘制里面的小矩形, widt=12ft, height=19ft
inner_box = Rectangle((160, 0), 160, 190, linewidth=2, color='k',fill=False)
inner_box2 = Rectangle((180, 0), 120, 190, linewidth=2, color='k',fill=False)
# 三分线
three_point = Rectangle((19,0),0,130,linewidth=2,color='k')
three_point2 = Rectangle((460,0),0,130,linewidth=2,color='k')
three_arc = Arc((240, 40), 475, 475, theta1=22, theta2=158, linewidth=2,color='k')
# 绘制罚球顶弧
top_free_throw = Arc((240, 190), 120, 120, theta1=0, theta2=180,linewidth=2, color='k', fill=False)
bottom_free_throw = Arc((240, 190), 120, 120, theta1=180, theta2=0,linewidth=2, color='k', linestyle='--')
# 限制区
restricted = Arc((240, 40), 80, 80, theta1=0, theta2=180, linewidth=2,color='k')rectangle_list=[circle,outer_box,backboard,inner_box,top_free_throw,bottom_free_throw,restricted,inner_box2,three_point,three_point2,three_arc]
# roof filled color
for rect in rectangle_list:ax.add_patch(rect)
# 利用for循环,向画布中添加图像
plt.ylim(-10,500)
# y 轴值从下到上依次递减
# 便于将球筐至于图的顶部
plt.xlim(-50, 550)
plt.show
球场就出来了,然后将散点图和球场一结合,就是这个效果啦。
但是做完这一个数据分析,发现很多资料都是到处拼拼凑凑,实际自己也没有敲下来多少,说没有收获把也不全是没有收获,说有收获把感觉收获的可能就是大概对数据分析有了一个思路,需要通过获取数据才是最关键的地方,有了数据才可能进行下一步的分析,可视化。
如果有错误,希望各位大佬多多指教。最后希望有大佬再就业上,或者是方向能给点建议。