re.split简单的使用方法: result=re.split('表达式','字符串',re.S)根据表达式拆分字符串并返回数组
如果拆分文本,比如拆分一本小说内容如下
ss='''第一章 第一章标题\n fadfasdfasdfadafd\n 第二章 第二章标题\n adfafdasdfasdfadsfasd\n
第三章 第三章标题\n adfadfadsfadfasdf\n'''
1,例如: re.split(r'第.*章.*?\n',ss,re.S)
运行结果:['', ' fadfasdfasdfadafd\n ', ' adfafdasdfasdfadsfasd\n', ' adfadfadsfadfasdf\n']
以上结果根据正则表达式拆分内容放到列表中,此处不包含拆分表达式内容
2,例如: re.split(r(第.*章.*)\n',ss,re.S)
运行结果:['', '第一章 第一章标题', ' fadfasdfasdfadafd\n ', '第二章 第二章标题', ' adfafdasdfasdfadsfasd\n', '第三章 第三章标题', ' adfadfadsfadfasdf\n']
使用子表达式可以把章节和标题取出来