[论文笔记] megatron 大模型超参搜索pipeline

devtools/2024/9/23 15:07:58/

一、批量生成配比

# 保证element + "en"的总体占比不变
# 从element_min_ratio到element_max_ratio,生成element在这个范围内的超参搜索配比。
import pandas as pd
import numpy as np
pd.set_option('display.max_colwidth', None)df = pd.read_csv("qwen2_data_ratio_lan17_dclm_code.csv", dtype={'dir': str, 'lang': str, 'size': float})
df_grouped = df.groupby(['lang']).sum().rename(columns={"size":"total_size"})
df_grouped.reset_index()initial_lang = ['en','zh','es','fr','pt','ko','ja','tr','vi','th','ms','id','ar','it','de','pl','ur','sft','edu'

http://www.ppmy.cn/devtools/100820.html

相关文章

idea 项目更新jdk版本 jdk8-jdk17需要配置的变量

文件编码格式修改为UTF-8 java 编译版本 File -> settings -> Build,Execution,Deployment->Compiler->Java Compiler 项目jdk版本 File -> Project Struncture 添加jdk17 Maven settings.xml 指定编译版本 Maven pom.xml 中配置 <properties><j…

【计算机网络】网络基础

&#x1f466;个人主页&#xff1a;Weraphael ✍&#x1f3fb;作者简介&#xff1a;目前正在学习c和算法 ✈️专栏&#xff1a;Linux &#x1f40b; 希望大家多多支持&#xff0c;咱一起进步&#xff01;&#x1f601; 如果文章有啥瑕疵&#xff0c;希望大佬指点一二 如果文章对…

elementUI在事件中传递自定义参数

在使用ElementUI的时候&#xff0c;组件的事件会返回一些参数&#xff0c;有的时候我们想在这个事件中传入自己代码中的参数&#xff0c;因此在这里记录一下传递自定义参数的方式。 方式一&#xff1a;利用回调函数 // 闭包写法 <el-input v-model"input" place…

此站点的连接不安全,解决方法

在浏览网页时&#xff0c;有时我们会遇到一个令人不安的提示&#xff1a;“此站点的连接不安全”。这种情况可能会让我们感到困惑和担忧&#xff0c;因为它可能意味着我们的个人信息和浏览数据面临风险。但别担心&#xff0c;本文将为您提供一套详尽的解决方案&#xff0c;让您…

产品经理如何提升系统思考能力

很多工作年限比较短的产品经理&#xff0c;分析问题的时候最初看到的都是单点&#xff0c;只有积累了足够的经验和阅历后&#xff0c;才能看到单点之外的“全局”&#xff0c;才会慢慢形成自己的系统思考能力&#xff0c;才会提高自己的认知能力。 产品经理如果想往更高层面发…

OSPF 开放式最短路径优先协议

什么是OSPF&#xff1f; 开放式最短路径优先OSPF&#xff0c;在大型网络结构当中路由器对IP的路由需要使用到RIP或者OSPF协议实现对链路的收敛&#xff0c;使得路由器能够准确的将IP数据包路由到准确的下一跳地址&#xff0c;接下来介绍一下OSPF实现链路收敛的原理方式。 OSP…

前端面试宝典【CSS篇】【9】

在前端开发的世界里,每一次面试都是一次机遇,也是一次挑战。 你是否曾因技术深度不够而错失良机? 或是面对最新的技术趋势感到迷茫? 我们的【前端面试宝典】正是为此而来。 由拥有多年一线实战经验的资深工程师亲自授课,结合最新的行业动态与实战案例,旨在全面提升你的技…

C语言小项目源码大全(60套)

C语言小项目源码大全60套 目录源码文件 目录 纯c语言迷宫源码.exe . c语言五子棋源码.exe c语言24点游戏源码.exe c语言万年历源码.exe c语言别踩白块儿(双人版)源码.exe c语言奔跑的火柴人游戏源码.exe c语言吃逗游戏源码.exe C语言超市管理系统.exe c语言对对碰游戏…