运行loader()函数时,出现UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xd4 in position

news/2025/1/16 5:44:40/

文章目录

    • 代码调用演示
    • 效果实例
    • 硬件要求
    • 模型信息
    • 问题
    • 场景说明
    • 解决

ChatGLM-6B是一个由清华大学和智谱AI联合研发的开源对话语言模型。它是一个支持中英双语问答的对话系统,并在中文方面进行了特别的优化。
该模型基于General Language Model (GLM)架构,具有62亿参数。借助模型量化技术,用户可以在消费级的显卡上进行本地部署,INT4量化级别下最低只需6GB显存。ChatGLM-6B使用了和ChatGLM相同的技术,针对中文问答和对话进行了优化经过约1T标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62亿参数的ChatGLM-6B已经能生成相当符合人类偏好的回答。
总之,ChatGLM-6B在语言生成和对话方面表现出了非常出色的能力,可以广泛应用于人机交互、自然语言处理、智能客服等领域。

代码调用演示

from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("THUDM/chatglm-6b", trust_remote_code=True).half().cuda()
model = model.eval()
response, history = model.chat(tokenizer, "你好", history=[])
print(response)
你好👋!我是人工智能助手 ChatGLM-6B,很高兴见到你,欢迎问我任何问题。
response, history = model.chat(tokenizer, "介绍一下你自己", history=history)
print(response)
我是人工智能助手 ChatGLM-6B,由清华大学 KEG 实验室和智谱 AI 公司于 2023年 共同训练开发而成,
具有语言理解、文本生成和对话等功能。我的任务是针对用户的问题和要求提供适当的答复和支持。
response, history = model.chat(tokenizer, "推荐一部电影", history=history)
print(response)
如果喜欢动作片,可以推荐《速度与激情》系列。
这是一部非常经典的电影,讲述了一群高速赛车手在赛车世界中的奋斗和冒险,同时也展现了他们的友谊、家庭和人生价值观。
这部电影非常引人入胜,具有非常强烈的情感色彩,同时也具有非常精彩的动作场面。

效果实例

你好
你好,我是人工智能助手 ChatGLM-6B,很高兴见到你,欢迎问我任何问题。
给李华写一封信,介绍中国景点并邀请他来
亲爱的李华:
希望这封信能够找到你,希望你一切都好。
我想向你介绍中国的一些景点,希望你能有机会来中国旅游。中国是一个拥有悠久历史和丰富文化的国家,有很多值得一游的景点。
首先,我推荐你前往中国的长城。长城是中国最著名的景点之一,也是世界文化遗产。它是一道巨大的城墙,横跨中国北部的山脉和沙漠。你可以在不同的季节来参观,感受它的历史和美丽。
其次,我建议你前往中国的故宫。故宫是中国明清两代的皇宫,也是世界文化遗产。它有着 echoes of the past 的建筑风格和巨大的宫殿,是展示中国历史文化的重要场所。 另外,中国还有很多其他的景点,如黄山、张家界、九寨沟等。每个景点都有它独特的魅力,希望你能找到适合自己的景点来体验。
如果你有机会来到中国,我希望你能在我的城市——成都——留下美好的回忆。成都是一个有着悠久历史AWS 8.0 文化的城市,有着许多著名的景点,如宽窄巷子、锦里古街、大熊猫繁育研究基地等。我期待着你的到来,我们可以一起探索这座城市,享受美食和文化活动。
希望你能尽快回信告诉我你是否有机会来中国旅游,我们可以约定一个时间见面。 祝 学习进步
[[模型名称]]

硬件要求

量化等级GPU显存
无量化13GB
int88GB
int46GB

模型信息

[2023/06/14] 发布 WebGLM,一项被接受于KDD 2023的研究工作,支持利用网络信息生成带有准确引用的长回答。

[2023/05/17] 发布 VisualGLM-6B,一个支持图像理解的多模态对话语言模型。

可以通过本仓库中的 cli_demo_vision.py 和 web_demo_vision.py 来运行命令行和网页 Demo。注意 VisualGLM-6B 需要额外安装 SwissArmyTransformer 和 torchvision。更多信息参见 VisualGLM-6B。

[2023/05/15] 更新 v1.1 版本 checkpoint,训练数据增加英文指令微调数据以平衡中英文数据比例,解决英文回答中夹杂中文词语的现象。

问题

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd4 in position

场景说明

在运行以下代码时

loader=CSVLoader(filepath)

出现error

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd4 in position

解决

将loader=CSVLoader(filepath)修改为

loader=CSVLoader(filepath,encoding="GBK")

http://www.ppmy.cn/news/970552.html

相关文章

timeError: Internal: src/sentencepiece_processor.cc(1101) [model_proto->ParseFromArray(serialized.da

文章目录 代码调用演示效果实例硬件要求模型信息问题解决方法一方法二 ChatGLM-6B是一个由清华大学和智谱AI联合研发的开源对话语言模型。它是一个支持中英双语问答的对话系统,并在中文方面进行了特别的优化。 该模型基于General Language Model (GLM)架构&#xff…

ChatGLM-6B does not appear to have a file named config.json.

文章目录 代码调用演示效果实例一、问题二、场景说明三、error说明四、解决解决一解决二 ChatGLM-6B是一个由清华大学和智谱AI联合研发的开源对话语言模型。它是一个支持中英双语问答的对话系统,并在中文方面进行了特别的优化。 该模型基于General Language Model (…

【CHATGPT】利用该chatgpt使用可视化界面配置查询语句

利用该chatgpt使用可视化界面配置查询语句 提问: 帮我利用建造者设计模式设计一个图形化的界面配置数据查询的功能, 其中包括字段的选择、为字段取别名,表之间的关联关系,分组以及排序。 在传入这些内容之后生成一条可执行的sql…

AttributeError:‘list’对象没有属性’endswith’ (AttributeError: ‘list’ object has no attribute ‘endswith’)

文章目录 代码调用演示效果实例问题场景描述解决方法一方法二 ChatGLM-6B是一个由清华大学和智谱AI联合研发的开源对话语言模型。它是一个支持中英双语问答的对话系统,并在中文方面进行了特别的优化。 该模型基于General Language Model (GLM)架构,具有6…

从BERT到ChatGPT!97页全面综述:那些年一起追过的预训练基础模型

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>【计算机视觉】微信技术交流群 转载自:新智元 | 编辑:LRS 【导读】2023年了,还有人从头开始训模型吗?追踪一下从Bert以来的那些…

ChatGPT引爆AI火出圈?人工智能AI在云计算中到底起什么作用?

​  近两个月,ChatGPT引爆AI新时代,话题热度不断上升。其实,随着技术的发展,AI已被广泛用于云计算,以提升云计算的智能水平。同样地,云计算技术对人工智能的发展提供了强大的支持,也为人工智能…

为什么ChatGPT引爆的AI浪潮与迅速盖过了Web3的风头,读这篇文章就够了

你是不是也觉得Web3的声音渐渐变小,而AI大模型领域日渐壮大,每天都有新事物诞生。AI 和 Web3技术都是非常重要的技术领域,都有着广阔的发展前景和潜力。笔者我虽然没有从事Web3,但一直保持着对Web3、区块链发展的关注,…

热点解读:大模型的突现能力和ChatGPT引爆的范式转变

来源:机器之心 作者:符尧、Tushar Khot、彭昊、李如寐等 符尧(yao.fued.ac.uk),爱丁堡大学 (University of Edinburgh) 博士生,本科毕业于北京大学。他与 Tushar Khot、彭昊在艾伦人工智能研究院 (Allen In…