NLP实践——使用Llama-2进行中文对话

news/2024/11/8 18:43:04/

NLP实践——使用Llama-2进行中文对话

  • 1. 前言
  • 2. 利用prompt
  • 3. 利用Logit Processor
    • 3.1 修改1
    • 3.2 修改2
    • 3.3 修改3
    • 3.4 修改4

1. 前言

在之前的博客 NLP实践——Llama-2 多轮对话prompt构建中,介绍了如何构建多轮对话的prompt,本文将介绍如何使用Llama-2进行中文对话。

现有的很多项目,在开源的Llama-2基础上,进行了中文场景的训练,然而Llama-2本身就具有多语种的能力,理论上是可以直接运用于中文场景的。

本文所举例使用的模型为Llama-2-7b-chat-hf。

2. 利用prompt

首先可以想到的是,使用prompt。可是即便是在prompt中添加了要求模型回答中文的提示,模型仍然回答的是英文。

从对话内容可以看到,模型可以理解用户的问题,却没有输出中文:

>> '你好'
>> "Hello! 😊 I'm here to help answer any questions you may have. Is there something specific you'd like to know or discuss? Please feel free to ask, and I'll do my best to assist you. 🤖"

3. 利用Logit Processor

在之前另一篇博客 以Llama-2为例,在生成模型中使用自定义LogitsProcessor中,介绍了怎样使用logits processor来改变生成过程中的概率,进而改变生成的结果。那么可以直接想到的是,把tokenizer中所有中文字符的概率调大一些,就可以强行要求模型生成中文了。

3.1 修改1

首先利用unicode范围获取常见的汉字:

import re
def is_chinese(word):"""判断一个字符串是否为汉字"""if re.match('[\u4e00-\u9fff]', word):return Trueelse:return FalseCHINESE_TOKEN_IDS = [token_id for token, token_id in tokenizer.vocab.items() if is_chinese(token)]

然后就可以实现一个processor来提高这些token对应的概率:

from transformers.generation.logits_process import LogitsProcessor, LogitsProcessorListclass ChineseLogitsProcessor(LogitsProcessor):"""生成中文字符---------------ver: 2023-08-02by: changhongyu"""def __init__(self, chinese_token_id_list: List[int] = None,alpha: float = 5):""":param chinese_token_id_list: 中文token的token的id列表:param alpha: 放大倍数"""self.chinese_token_id_list = chinese_token_id_listself.alpha = alphadef __call__(self, input_ids: torch.LongTensor, scores: torch.FloatTensor) -> torch.FloatTensor:for id_ in self.chinese_token_id_list:scores[:, id_] *= self.alphareturn scores

在生成之前,按照之前博客中介绍的方法,创建processor:

logits_processor = LogitsProcessorList()
logits_processor.append(ChineseLogitsProcessor(CHINESE_TOKEN_IDS))

3.2 修改2

然而,模型却生成起来停不下了。这是因为没有将EOS token的概率也做相应的放大。

CHINESE_TOKEN_IDS.append(tokenizer.eos_token_id)

这下,模型可以输出中文了:

>> '你好'
>> '好的好的大家好的我是一个智能问题机器人我可以回应你的问题请问你有任何问题或需要我的服务'

可是看起来好像哪里怪怪的,原来是没有标点。

3.3 修改3

既然没有标点,那我们再把标点符号的概率也放大就好了:

puncs = [',', '。', '?', '!', '“', '”', ':', ',', '.', '?', '!', '"', "'", ':']
CHINESE_TOKEN_IDS = [token_id for token, token_id in tokenizer.vocab.items() if is_chinese(token)]
CHINESE_TOKEN_IDS.extend(tokenizer.convert_tokens_to_ids(puncs))
CHINESE_TOKEN_IDS.append(tokenizer.eos_token_id)

现在,eos也有了,标点符号也有了,然而还是出意外了:

>> '你好'
>> '::你好!我是一个智能问题机器人,我的任务是回应用户的问题。请问你有任何问题?'

3.4 修改4

现在模型倒是可以说中文,也带标点了,但标点出现在了最开头。这样的话,我们可以再添加一个processor,不让这些标点出现在最开始就可以了。

class SuppressSpecificBOSTokenLogitsProcessor(LogitsProcessor):"""防止生成的第一个token是某些特定的token---------------ver: 2023-08-02by: changhongyu"""def __init__(self, bad_bos_token_id_list: List[int] = None):""":param bad_bos_token_id_list: 不可以作为第一个token的token的id列表"""self.bad_bos_token_id_list = bad_bos_token_id_listdef __call__(self, input_ids: torch.LongTensor, scores: torch.FloatTensor) -> torch.FloatTensor:new_token_len = input_ids.shape[-1] - current_token_lenif new_token_len == 0:for id_ in self.bad_bos_token_id_list:scores[:, id_] = -float('inf')return scores

将两个processor放在一起:

logits_processor = LogitsProcessorList()
logits_processor.append(ChineseLogitsProcessor(CHINESE_TOKEN_IDS))
logits_processor.append(SuppressSpecificBOSTokenLogitsProcessor([tokenizer.convert_tokens_to_ids(punc) for punc in puncs]))

终于,可以让模型实现中文对话了:

>> '你好'
>> '好的,好的!你好!对不起,我不知道你问的问题,请问你想问些事情?'

虽然回答的还是有点奇怪,但使用中文与模型进行对话的目的,也的的确确是达到了。


http://www.ppmy.cn/news/1007874.html

相关文章

8.5day06 框架基础--反射+注解

文章目录 反射获取类的各种信息获取类的字节码文件 注解元注解 复习redis两道算法题 摆烂了,不想学啦!!! 反射 反射主要用来做框架; 学习内容 获取类的各种信息 第一步 加载类,获取类的字节码文件 第二步 获取类的…

uni-app:实现列表单选功能

效果图&#xff1a; 核心解析&#xff1a; 一、 <view class"item_all" v-for"(item, index) in info" :key"index"><view classposition parameter-info text-over :classitem.checked?"checked_parameter":""…

在线课堂,视频点播,springboo+vue

springbootvue三端&#xff08;管理后台&#xff0c;教师端&#xff0c;用户端&#xff09;端可提供源码&#xff0c;可远程安装&#xff0c;需要的加微信&#xff1a; 体验地址&#xff1a;http://edu.dgrxs.com/ 用户端&#xff1a; 管理端&#xff1a; 教师端&#xff1a;

23款奔驰GLE450加装迈巴赫GLS600同款电动踏板,家人上下车更方便

新款奔驰GLE级车型原厂都没有电动踏板&#xff0c;都是固定踏板&#xff0c;或者没有踏板。这次安装的迈巴赫款式电动踏板是副厂的&#xff0c;虽然是副厂&#xff0c;但是脚下面积大&#xff0c;外观整洁大气&#xff0c;非常适合GLE。

SpringCloud深度学习(在更)

微服务简介 微服务是什么&#xff1f; 微服务是一种架构风格&#xff0c;将一个大型应用程序拆分为一组小型、自治的服务。每个服务都运行在自己独立的进程中&#xff0c;使用轻量级的通信机制&#xff08;通常是HTTP或消息队列&#xff09;进行相互之间的通信。这种方式使得…

linux监控java进程的cpu和线程快照脚本

java进程的cpu和线程快照一般都会接入监控平台进行监控和查看&#xff0c;也可以通过命令在服务器查看&#xff1a;top -b -n 1 -Hp pid > 1.top && jstack pid > 1.stack&#xff0c;当然也可以通过shell脚本的方式将cpu和jstack指标记录输出到文件。 #每隔5秒…

python入门常用操作

python常用操作 1、ndarry数组的切片2、print用法2.1格式化输出format2.2字符串格式化输出 3、均值滤波函数 1、ndarry数组的切片 例如一个5列的ndarry数组&#xff0c;想要获取第2列和第3列数据&#xff0c;可以用 #&#xff08;1&#xff09;用法1 data[:,1:3]&#xff0c;…

dijkstra算法相关(使用邻接表和优先队列两种方法)力扣题:743. 网络延迟时间(有向图);1334. 阈值距离内邻居最少的城市(无向图)

具体dijkstra算法就不展开说了&#xff0c;因为太多帖子来解释了&#xff0c;并且这也只是我的个人总结/记录&#xff0c;我会把自己的思考过程写在代码的注释中。 743. 网络延迟时间&#xff08;有向图&#xff09; 有 n 个网络节点&#xff0c;标记为 1 到 n。 给你一个列…