python-分享篇-英文短文自动分词写入文本文件

ops/2024/10/11 7:31:39/

文章目录

  • 准备
  • 代码
  • 效果

准备

在这里插入图片描述

代码

python">import string
f = open('./data/split.txt')
s=f.read()
str1=s.title()
print(str1)
print("".join([s for s in str1.splitlines(True) if s.strip()]))
list1 = str1.split() # 采用默认分隔符进行分割
#字符串列表去重
l1=list(set(list1))
l1.sort(key=list1.index)
for i in l1:#去掉特殊符号i1=i.translate(str.maketrans('', '', string.punctuation))i2=i1.strip(' \t\n\r')# 去除字符串中头尾的空格#print(i1.strip(' \t\n\r')) # 去除字符串中头尾的空格if not i2.isnumeric():   #滤除数字i3=i2f1 = open('./data/split副本.txt','a')f1.write('\n'+i3)

效果

在这里插入图片描述


http://www.ppmy.cn/ops/90176.html

相关文章

.Net6通过依赖注入和服务注册的方式管理和连接Oracle数据库

使用到的Nuget包和技术: 1.ODBC(System.Data.Odbc):用于数据库的连接,支持操作不同类型的数据库。 2. Dapper:一个轻量级的ORM库,用于访问数据库进行数据的增删改查等操作。 3. Oracle.Managed…

Istio 金丝雀发布

转载:备考ICA-Istio 金丝雀实验4 环境清理 kubectl delete gw/helloworld-gateway vs/helloworld dr/helloworld-destination #测试 kubectl get svc,pods for i in {1..10};do curl $(kubectl get svc helloworld|grep helloworld|awk {print $3":"$5}|a…

智算新风向丨趋动科技获中国信通院泰尔实验室首张智算资源池化能力泰尔测评证书

近日,趋动科技“OrionX AI算力资源池化软件”经中国泰尔实验室依据《FG-Z14-0172-01智算资源池化平台测试方案》评估测试,获得智算资源池化能力泰尔测评证书,成为该领域首个完成此评价的产品。 图1.OrionX通过智算资源池化平台评测 随着AI大…

如何用密码保护你的 WordPress 管理员 (wp-admin) 目录

在维护 WordPress 网站时,确保 wp-admin 目录安全是非常重要的。为该目录添加密码保护可以有效提高网站安全性,防止未经授权的访问。这篇文章将介绍实现这一目标的两种方法。 1.为什么要为 wp-admin 目录添加密码保护 WordPress 管理员后台是网站的核心…

利用 IP 地址进行社交工程攻击?

社交工程攻击是网络安全的主要威胁之一。现在攻击者不再仅依赖技术漏洞,而是想利用人性的弱点来获取有价值的信息或实现非法目的。 IP 地址在社交工程攻击中的作用 定位和伪装获取目标用户的 IP 地址,大致确定目标用户地理位置,然后伪装成当…

C++空指针(nullptr)

C空指针(nullptr) ​ 在C语言中我们把空指针定义成NULL,但是这在C中会有所问题,因为C对指针类型转换比较严格。下面让我来深入了解一下NULL与nullptr。 NULL实际就是一个宏,在C头文件(stddef.h)中,可以看到如下代码:…

qaxobject 插入图片 excel

要在Excel中使用QAxObject插入图片&#xff0c;你需要使用Qt的ActiveX支持。以下是一个简单的例子&#xff0c;展示如何使用QAxObject插入图片到Excel工作表的指定位置。 请确保你的系统上安装了Excel&#xff0c;并且你的Qt版本支持ActiveX。 #include <QAxObject> vo…

[kimi笔记].net平台

.NET 是一个由微软公司开发的软件开发平台&#xff0c;它的历史可以追溯到2000年左右。.NET 框架最初是为Windows操作系统设计的&#xff0c;但随着时间的发展&#xff0c;微软逐步扩展了.NET 的应用范围&#xff0c;使其可以在多个平台上运行。以下是.NET 几个平台的历史和平台…