大语言模型分词器

server/2025/1/16 14:00:55/

语言模型分词器

代码

python">import transformers
import tokenizersfrom transformers import AutoTokenizertokenizers = AutoTokenizer.from_pretrained("data/bert-base-uncased")text = "This is a test sentence."tokens = tokenizers.encode(text)
token_count = len(tokens)print("Tokens:", tokens)
print("len of Tokens:", len(tokens))

直接运行会报错
在这里插入图片描述

需要先导入包

pip install transformers tokenizers

在这里插入图片描述
再次运行
执行结果如下
在这里插入图片描述


http://www.ppmy.cn/server/158250.html

相关文章

初阶数据结构【栈及其接口的实现】

目录 前言一、栈的概念及结构二、栈的实现方式三、栈的实现3.1 基本结构3.2 栈的基本功能接口栈的初始化栈的销毁 3.3 入栈接口3.4 出栈接口3.5 栈的其它接口获取数据的个数接口栈判断是否为空接口获取栈顶数据接口 注:为什么要实现这些简单的接口,直接调…

springboot国际化

使用springboot开发程序时,如果有国际市场的需求,一般要考虑国际化,在spring中本身对国际化就有很好的支持,下面介绍如何使用springboot开发国际化服务。 正常来说,引入 spring-boot-starter-web 模块后自动就会包括了…

Springboot内置Apache Tomcat 安全漏洞(CVE-2024-50379)

背景 大家都知道我们使用Springboot开发后,无需再额外配置tomcat,因为Springboot已经帮我们内置好了tomcat。 这次在线上安全团队就扫出来了我们Springboot服务的tomcat漏洞: 可以看到这是2023年的洞,Apache Tomcat 安全漏洞(…

STM32标准库学习笔记(十)SPI

前言 学习永无止境!本篇是嵌入式开发之片上外设SPI,了解基本硬件原理以及通信协议。 注:本文章为学习笔记,部分图片与文字来源于网络/江协科技课程/手册,如侵权请联系!谢谢! 一、SPI通信概述 1.…

Node.js——path(路径操作)模块

个人简介 👀个人主页: 前端杂货铺 🙋‍♂️学习方向: 主攻前端方向,正逐渐往全干发展 📃个人状态: 研发工程师,现效力于中国工业软件事业 🚀人生格言: 积跬步…

基于Android的校园自助打印系统的设计与实现

博主介绍:java高级开发,从事互联网行业多年,熟悉各种主流语言,精通java、python、php、爬虫、web开发,已经做了多年的设计程序开发,开发过上千套设计程序,没有什么华丽的语言,只有实…

使用 Python 实现自动化办公(邮件、Excel)

目录 一、Python 自动化办公的准备工作 1.1 安装必要的库 1.2 设置邮件服务 二、邮件自动化处理 2.1 发送邮件 示例代码 注意事项 2.2 接收和读取邮件 示例代码 三、Excel 自动化处理 3.1 读取和写入 Excel 文件 示例代码 3.2 数据处理和分析 示例代码 四、综合…

docker的学习

理解 我对docker的理解:docker其实就是一个服务,需要进行启动还有关闭。 对镜像的理解:镜像相当于一个安装包(可以理解为压缩文件,所以需要从网络上进行下载),镜像下载完之后就要对其运行。运…