Python程序设计字典

教学案例十字典

1. 判断出生地

sfz.txt文件中存储了地区编码和地区名称

身份证的前6位为地区编码，可以在sfz.txt文件中查询到地区编号对应的地区名称

编写程序，输入身份证号，查询并显示对应的地区名称若该地区编码不在文件中，显示地区名称未知

文件操作

例

注意：字符串.strip(指定字符)方法，返回去除字符串尾部的指定字符后的字符串。若不指定字符，则去除尾部的空格和换行符。

字典的建立

若要建立以地区编码为键，地区名称为值的字典，可以打开文件，读取一行，将前六个字符（地区编号）作为键，第七个字符到最后（地区名称）作为值，建立字典。

对所有的行循环，就可以建立所有地区编号和名称的字典。

字典的查找

<字典>.get(<键>,<默认值>) 在字典中，若存在该键，则返回相应的值，否则返回默认值如果地区字典dqzd已经建立，通过get方法可以查找编码对应的地区名称，若无法找到，则返回未知

python">sfzh=input("请输入身份证号")
#代码开始
f1=open("step6//sfz.txt","r",encoding='GBK')
dq = {}
for i in f1.readlines():i = i.strip()dq[i[:6]]=i[6:]print("地区名称",dq.get(sfzh[:6],"未知"))
#代码结束

2. 统计文档中作者作品数量

编写一个能计算文档《唐诗.txt》中各位作者作品数量的程序。遍历文档中每一行，提取作者的姓名，将其作为键加入到字典中，字典的值为作品数量。然后将字典转换为二维列表，按作品数量的降序排列。

字典的操作

字典是另一种可变容器模型，且可存储任意类型对象。字典的每个键值 key=>value 对用冒号 : 分割，每个键值对之间用逗号 , 分割，整个字典包括在花括号 {} 中 ,格式如下所示 d = {key1 : value1, key2 : value2 } 建立空字典 d={} 向字典添加新内容的方法是增加新的键/值对 d["范仲淹"]=1 则d为{"范仲淹":1} 修改键值对的方法为 d["范仲淹"]=2 则d为{"范仲淹":2} d["范仲淹"]的值为2

d.get(key,default)键存在则返回相应值，否则返回默认值

字典转换为二维列表

lt = list(d.items()) 可将字典转换为二维列表，二维列表的每项值为列表，列表的第一项为字典的键，第二项为字典的值

python">f1=open("sy9//唐诗.txt","r",encoding='GBK')
#代码开始
zd = {}
for i in f1.readlines():i = i.strip()if i[:3].isdigit()==True:n = i.split(":")[0][3:]zd[n]=zd.get(n,0)+1lb = list(zd.items())
lb.sort(key=lambda x:x[1],reverse=True)
#代码结束
for i in lb:print("诗人{}作品{}".format(i[0],i[1]))
f1.close()

3. 计算成绩及排序

成绩.csv如下所示，记录了同学的语数外的成绩、综合测评和体育成绩

综合测评有ABCD四个等级，体育成绩有优秀良好及格不及格四个等级 ABCD折算为100、80、60、0。优秀良好及格不及格折算为100、80、60、0 现计算每个人的总分并从高到低的排序，显示姓名和总分。

python">f1=open("sy9//成绩.csv","r",encoding="utf8")
zh={"A":100,"B":80,"C":60,"D":0}
ty={"优秀":100,"良好":80,"及格":60,"不及格":0}
#代码开始
xx = []
for i in f1.readlines():i = i.strip().split(",")cj = int(i[1])+int(i[2])+int(i[3])+zh[i[4]]+ty[i[5]]xx.append([i[0],cj])xx.sort(key=lambda x:x[1],reverse=True)
#代码结束
for mm in xx:print("姓名{}成绩{}".format(mm[0],mm[1]))
f1.close()

4. 统计语文成绩各等级人数

成绩.csv如下所示，记录了同学的语数外的成绩、综合测评和体育成绩

现要统计语文科目优秀（90分及以上）、良好（80分-90分）、及格（60分-80分）、不及格人数

python">f1=open("sy9//成绩.csv","r",encoding="utf8")
yw={"优秀":0,"良好":0,"及格":0,"不及格":0}
#代码开始
for i in f1.readlines():i = i.strip().split(",")n = int(i[1])if n >= 90:yw["优秀"] += 1elif n >= 80:yw["良好"] += 1elif n >= 60:yw["及格"] += 1else:yw["不及格"] += 1#代码结束
print("语文")
for mm in yw:print("{}人数{}".format(mm,yw[mm]))
f1.close()

5. 统计语数外成绩各等级人数

成绩.csv如下所示，记录了同学的语数外的成绩、综合测评和体育成绩

现要统计语数外各科目成绩优秀（90分及以上）、良好（80分-90分）、及格（60分-80分）、不及格人数。

python">f1=open("sy9//成绩.csv","r",encoding="utf8")
djrs=[]
km="语文","数学","英语"
for i in range(3):djrs.append({"优秀":0,"良好":0,"及格":0,"不及格":0})
#代码开始for i in f1.readlines():i = i.strip().split(",")for j in range(3):n = int(i[j+1])if n >= 90:djrs[j]["优秀"] += 1elif n >= 80:djrs[j]["良好"] += 1elif n >= 60:djrs[j]["及格"] += 1else:djrs[j]["不及格"] += 1#代码结束
for i in  range(3):print(km[i])for mm in djrs[i]:print("{}人数{}".format(mm,djrs[i][mm]))
f1.close()

6. 统计文件词语的词频

编写一个能统计文档中词语词频小程序。

统计文件中词频最高的15个词语（除了词牌名和作者）注意：标题行的空格是全角空格"　"(可复制此空格) 由于有一个词牌名为东风第一枝，需要将文件中的词牌名删除。(否则会多一个东风)

jieba库分词

jieba是Python中一个重要的第三方中文分词函数库 Jieba库的分词原理是利用一个中文词库，将待分词的内容与分词词库进行比对，通过图结构和动态规划方法找到最大概率的词组。 jieba.lcut(s) 精确模式对字符串s分词,产生一个列表

python">import jieba
f1= open("sy9//唐诗.txt", "r",encoding="GBK")
#代码开始
lb = []
for i in f1.readlines():i = i.strip()if i[:3].isdigit()==True:i = i.split(":")[1]if i[3:5]=="二首":i = i[:3]n = jieba.lcut(i)for j in n:lb.append(j)zd = {}
for i in lb:if len(i) == 1:continueelse:zd[i]=zd.get(i,0)+1zd["东风"]=zd.get("东风",0)-1
items=list(zd.items())
items.sort(key=lambda x:x[1],reverse=True)
#代码结束
for i in range(15):print("{} {}".format(items[i][0],items[i][1]))

7. 唐诗文件词云图片

根据唐诗文件生成一个词云图片文件，存放在sy9文件夹的pict文件夹下的sc1.png ，要求图片宽1000，高700背景颜色白色，最多300个词，注意：字体使用sy9文件夹下的simhei.ttf字体文件

生成词云图片

wordcloud库概述 wordcloud是python的一个三方库,称为词云也叫做文字云,是根据文本中的词频,对内容进行可视化的汇总.

wordcloud.WordCloud(参数）

font_path : string #字体路径，需要展现什么字体就把该字体路径+后缀名写上，

如：font_path = 'sy9//simhei.ttf’

width : int (default=400) #输出的画布宽度，默认为400像素

height : int (default=200) #输出的画布高度，默认为200像素

background_color : color value (default=”black”) #背景颜色，如background_color='white',背景颜色为白色

max_words : number (default=200) #要显示的词的最大个数

python">import jieba
import wordcloud
f1= open("sy9//唐诗.txt", "r",encoding="GBK")
#代码开始
txt = f1.read()
pc = set()
f1.seek(0,0)
for line in f1:if " " in line:cp=line[:line.find(" ")]pc.add(cp)xm=line[line.find(" ")+1:].split("\n")pc.add(xm[0])for i in pc:txt = txt.replace(i,"")
zd = {}
words = jieba.lcut(txt)
for i in words:if len(i) > 1:zd[i] = zd.get(i,0)+1
print(zd)
f1.close()
w=wordcloud.WordCloud(font_path="sy9//simhei.ttf",background_color="white",max_words=300,width=1000,height=700)
w.generate_from_frequencies(zd)#代码结束
w.to_file("sy9//pict//sc1.png")