【AI实战】开源可商用的中英文大语言模型baichuan-7B,从零开始搭建

news/2024/12/2 23:25:31/

【AI实战】开源可商用的中英文大语言模型baichuan-7B,从零开始搭建

  • baichuan-7B 简介
  • baichuan-7B 中文评测
  • baichuan-7B 搭建
  • 参考

在这里插入图片描述

baichuan-7B 简介

baichuan-7B 是由百川智能开发的一个开源可商用的大规模预训练语言模型。基于 Transformer 结构,在大约1.2万亿 tokens 上训练的70亿参数模型,支持中英双语,上下文窗口长度为4096。在标准的中文和英文权威 benchmark(C-EVAL/MMLU)上均取得同尺寸最好的效果。

  • GitHub:
    https://github.com/baichuan-inc/baichuan-7B

  • Hugging Face:
    https://huggingface.co/baichuan-inc/baichuan-7B/tree/main

baichuan-7B 中文评测

  • C-Eval
    在这里插入图片描述

  • Gaokao
    在这里插入图片描述

baichuan-7B 搭建

  • 1、拉取docker镜像

    docker pull nvcr.io/nvidia/pytorch:21.08-py3
    

    【】需要 cuda 11.1 及以上版本

  • 2、创建docker

    nvidia-docker run -it -d \--name baichuan_llm \-v /llm:/notebooks \-e TZ='Asia/Shanghai' \--shm-size 16G \nvcr.io/nvidia/pytorch:21.08-py3
    

    进入容器内:

    docker exec -it baichuan_llm env LANG=C.UTF-8 /bin/bash
    
  • 3、下载代码

    cd /notebooks/
    git clone https://github.com/baichuan-inc/baichuan-7B.git
    
  • 4、下载模型权重文件

    cd baichuan-7B/
    git clone https://huggingface.co/baichuan-inc/baichuan-7B
    
  • 5、按照依赖库

    pip install -r requirements.txt
    
  • 6、推理

    from transformers import AutoModelForCausalLM, AutoTokenizertokenizer = AutoTokenizer.from_pretrained("baichuan-7B", trust_remote_code=True)
    model = AutoModelForCausalLM.from_pretrained("baichuan-7B", device_map="auto", trust_remote_code=True)
    inputs = tokenizer('登鹳雀楼->王之涣\n夜雨寄北->', return_tensors='pt')
    inputs = inputs.to('cuda:0')
    pred = model.generate(**inputs, max_new_tokens=64,repetition_penalty=1.1)
    print(tokenizer.decode(pred.cpu()[0], skip_special_tokens=True))
    
    • 输出

      在这里插入图片描述

  • 7、训练

    • 准备数据
      用户将训练语料按总rank数的倍数均匀切分成多个 UTF-8 文本文件,放置在语料目录(默认为 data_dir )下。各个rank进程将会读取语料目录下的不同文件,全部加载到内存后,开始后续训练过程。以上是简化的示范流程,建议用户在正式训练任务中,根据需求调整数据生产逻辑。

    • 配置 DeepSpeed
      修改 config/hostfile ,如果是多机多卡,需要修改 ssh 中各个节点的 IP 配置。

    • 训练

      sh scripts/train.sh
      

参考

https://huggingface.co/baichuan-inc/baichuan-7B/tree/main
https://github.com/baichuan-inc/baichuan-7B


http://www.ppmy.cn/news/471336.html

相关文章

【深入浅出 Spring Security(十)】权限管理的概述和使用详情

权限管理 一、授权的核心概念二、权限管理策略权限表达式(SpEL Spring EL)1. 基于 URL 的权限管理(过滤器)基本用法 2. 基于 方法 的权限管理(AOP)EnableGlobalMethodSecurity基本用法 三、权限管理之版本问…

寻找牛人了

③具备移动端页面和小程序开发经验; ④熟悉 Es6/css3/html5 最新规范; ⑤对用户体验、交互操作及用户需求分析等有一定了解,有产品或界面设计经验者优先。

python牛啊

测试测试进行一些测试发布了

大牛书单 | 搜索大牛都读什么书?

导语:读书,伴随技术人的一生。技术的发展日新月异,技术人应该永远在学习的路上,才能始终跟紧时代的步伐。阅读,是学习最重要的途径之一。 又到了新的一期《大牛书单》推荐,今天来和大家分享鹅厂几位搜索大牛…

机器学习、计算机视觉神犇/大牛主页

原文链接: http://www.cnblogs.com/zhanjxcom/p/4151855.html 转贴:看到的一个来源是http://blog.sina.com.cn/s/blog_631a4cc40101d00t.html,不确定是否是最原始版本。 牛人主页(主页有很多论文代码) Serge Belongie …

深度学习-聊天机器人

1、聊天机器人的类型 从应用目的或者技术手段进行抽象,可以有以下两种划分方法: 目标驱动(Goal –Driven)VS 无目标驱动(Non-Goal Driven)聊天机器人 目标驱动的聊天机器人指的是聊天机器人有明确的服务目…

永远的金大侠-人工智能的江湖

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。 书的购买链接书的勘误,优化,源代码资源 金庸先生已离我们远去,笔…

牛人主页

 牛人主页(主页有很多论文代码) Serge Belongie at UC San Diego Antonio Torralba at MIT Alexei Ffros at CMU Ce Liu at Microsoft Research New England Vittorio Ferrari at Univ.of Edinburgh Kristen Grauman at UT …