书生大模型实战营第三期基础岛第六课——OpenCompass 评测 InternLM-1.8B 实践

server/2024/10/22 18:36:02/

OpenCompass 评测 InternLM-1.8B 实践

      • 基础作业:
        • 创建虚拟环境
        • 下载并安装opencompass
        • 安装相关依赖
        • 复制测评数据集到当前目录下并解压
        • 测评前环境变量配置
        • 使用命令行配置参数法进行评测

基础作业:

  • 使用 OpenCompass 评测 internlm2-chat-1.8b 模型在 ceval 数据集上的性能,记录复现过程并截图。
创建虚拟环境
conda create -n opencompass python=3.10
conda activate opencompass
conda install pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=12.1 -c pytorch -c nvidia -y

在这里插入图片描述
新建文件夹 opencompass用于存放课程相关文件

mkdir opencompass
cd opencompass
下载并安装opencompass
git clone -b 0.2.4 https://github.com/open-compass/opencompass
cd opencompass
pip install -e .

在这里插入图片描述

安装相关依赖
apt-get update
apt-get install cmake
pip install -r requirements.txt
pip install protobuf

在这里插入图片描述

复制测评数据集到当前目录下并解压
cp /share/temp/datasets/OpenCompassData-core-20231110.zip /root/opencompass/opencompass/
unzip OpenCompassData-core-20231110.zip

在这里插入图片描述
解压完成,目录下会出现一个data文件夹

测评前环境变量配置
export MKL_SERVICE_FORCE_INTEL=1
export MKL_THREADING_LAYER=GNU
使用命令行配置参数法进行评测

打开 opencompass文件夹下configs/models/hf_internlm/的hf_internlm2_chat_1_8b.py ,贴入以下代码

python">from opencompass.models import HuggingFaceCausalLMmodels = [dict(type=HuggingFaceCausalLM,abbr='internlm2-1.8b-hf',path="/share/new_models/Shanghai_AI_Laboratory/internlm2-chat-1_8b",tokenizer_path='/share/new_models/Shanghai_AI_Laboratory/internlm2-chat-1_8b',model_kwargs=dict(trust_remote_code=True,device_map='auto',),tokenizer_kwargs=dict(padding_side='left',truncation_side='left',use_fast=False,trust_remote_code=True,),max_out_len=100,min_out_len=1,max_seq_len=2048,batch_size=8,run_cfg=dict(num_gpus=1, num_procs=1),)
]

运行评测命令

python run.py --datasets ceval_gen --models hf_internlm2_chat_1_8b --debug

在这里插入图片描述
看到这行就说明一切正常,开始评测

在这里插入图片描述

从27号测到28号,等待十几个小时后,测评终于完成了
上图就是internlm2-chat-1.8b 模型在 ceval 数据集上的性能


http://www.ppmy.cn/server/110522.html

相关文章

<C++> 红黑树

目录 1. 红黑树的概念 2. 红黑树的性质 3. 红黑树节点的定义 4. 红黑树的插入操作 5. 红黑树的验证 6. 红黑树与AVL树的比较 7. 红黑树的删除 红黑树比AVL树更优一些,因为AVL要求太严格,左右高度差不超过1,而红黑树采用颜色来控制&#xff0c…

git安装及常用命令

一、安装 1、安装依赖 yum install -y curl-devel expat-devel gettext-devel openssl-devel zlib-devel gcc perl-ExtUtils-MakeMaker package 2、下载git wget https://mirrors.edge.kernel.org/pub/software/scm/git/git-2.9.5.tar.gz 3、解压git tar -zxf git-2.9.5.…

ESP32应用开发-Webserver

文章目录 库调用实例实现思路技术要点1. 前端涉及的文件需要包装再发送2. http-GET路由3. http-POST路由 开发环境&#xff1a;Arduino 库调用 #include <WebServer.h> #include <ArduinoJson.h> //IDE没有自带&#xff0c;需自行安装实例 WebServer server(80);…

每天一个数据分析题(五百零六)- 装袋方法

装袋方法(bagging)也叫做bootstrap aggregating,是在原始 数据集有放回地重采样S次后得到新数据集的一种技术&#xff0c;其代表算法有&#xff1f; A. Adaboost B. GBDT C. XGBOOST D. 随机森林 数据分析认证考试介绍&#xff1a;点击进入 题目来源于CDA模拟题库 点击此…

LeetCode1732.找到最高海拔

有一个自行车手打算进行一场公路骑行&#xff0c;这条路线总共由 n 1 个不同海拔的点组成。自行车手从海拔为 0 的点 0 开始骑行。 给你一个长度为 n 的整数数组 gain &#xff0c;其中 gain[i] 是点 i 和点 i 1 的 净海拔高度差&#xff08;0 < i < n&#xff09;。请…

STM32H750+CubeIDE+FreeRTOS+ETH(LAN8720A)+LWIP

文章目录 STM32H750CubeIDEFreeRTOSETH(LAN8720A)LWIPCubeIDE配置RCC时钟树SYSETH串口MPUFreeRTOSLWIPGPIO然后就可以点击生成代码了&#xff01; 代码修改printf重定向补充硬件复位更改补充链接文件然后就可以编译下载ping成功了&#xff01; socket网络编程 STM32H750CubeIDE…

云计算概述

云计算的产生以及发展 分布式计算&#xff1a;包含了云计算和网格计算 云计算&#xff1a;以数据为中心进行的计算 网格计算&#xff1a;以计算为中心进行的计算 诞生-1999 初期的发展-2007-2008 加速发展-2009-2014 日渐成熟阶段-2015-目前 云计算的种类 公有云-第三方提供…

C语言 | Leetcode C语言题解之第387题字符串中的第一个唯一字符

题目&#xff1a; 题解&#xff1a; struct hashTable {int key;int val;UT_hash_handle hh; };int firstUniqChar(char* s) {struct hashTable* position NULL;int que[26][2], left 0, right 0;int n strlen(s);for (int i 0; i < n; i) {int ikey s[i];struct has…