算法训练 | 使用JAX训练CLIP算法_支持fine-tuning

ops/2024/9/24 13:21:05/
  • 项目应用场景
  • 项目细节 ==> 具体参见项目 README.md
    • (1) 安装
pip install clip-jax
# clone and install datacomp# download data
python download_upstream.py \--scale small --data_dir gs://my_bucket/datacomp/small metadata_dir metadata \--image_size 256 --resize_mode center_crop --skip_bbox_blurring --no_resize_only_if_bigger \--encode_format webp --output_format tfrecord
python train.py \--assert_TPU_available \--config_name ../configs/small-patch16.json --dtype float32 \--do_train --train_folder gs://my_bucket/datacomp/small/shards \--output_dir gs://my_bucket/clip_model/$(date +"%Y%m%d%H%M%S") \--num_train_epochs 10 \--tokenizer_name openai/clip-vit-base-patch32 \--batch_size_per_node 4096 --gradient_accumulation_steps 1 \--learning_rate 0.00001 --warmup_steps 2000 --lr_offset 0 \--optim distributed_shampoo --beta1 0.9 --beta2 0.99 --weight_decay 0.0 \--block_size_text 512 --block_size_vision 512 --nesterov \--graft_type rmsprop_normalized --preconditioning_compute_steps 20 \--mp_devices 1 --shard_shampoo_across 2d \--activation_partitioning_dims 1 --parameter_partitioning_dims 1 \--loss_type sigmoid \--gradient_checkpointing \--unroll 100 \--logging_steps 100 --save_steps 5000
  • 项目获取
    • https://download.csdn.net/download/weixin_42405819/89100901

http://www.ppmy.cn/ops/10974.html

相关文章

掉落回弹问题(C语言)

一、N-S流程图&#xff1b; 二、运行结果&#xff1b; 三、源代码&#xff1b; # define _CRT_SECURE_NO_WARNINGS # include <stdio.h>int main() {//初始化变量值&#xff1b;float b 100;float sum 0;int i 0;//运算&#xff1b;for (i 1; i < 10; i){//运算&…

53、图论-课程表

思路&#xff1a; 其实就是图的拓扑排序&#xff0c;我们可以构建一个图形结构&#xff0c;比如[0,1]表示1->0&#xff0c;对于0来说入度为1。 遍历结束后&#xff0c;从入度为0的开始遍历。引文只有入度为0的节点没有先决条件。然后依次减少1。直到所有节点入度都为0.然后…

ESP32-Thonny 拍摄图片到SD卡

前言&#xff1a; 代码运行在Thonny 添加main.py到单片机中&#xff1a; 可以先运行一下试试&#xff1a;会输出以下信息&#xff1a; 没有问题的话&#xff08;SD卡挂载成功&#xff0c;摄像头初始化成功&#xff09;运行一次主程序后&#xff0c;闪光灯会闪烁一下。 代码&…

机器学习——逻辑回归

逻辑回归损失函数选择 逻辑回归通常采用交叉熵损失&#xff08;也称为对数损失&#xff09;而不是均方误差损失的原因主要有以下几点&#xff1a; 概率解释 逻辑回归模型的输出可以被解释为属于某个类别的概率。交叉熵损失直接衡量的是模型预测概率分布与真实标签的概率分布之…

服务器基本故障和排查方法

前言 服务器运维工作中遇到的问题形形色色&#xff0c;无论何种故障&#xff0c;都需要结合具体情况&#xff0c;预防为主的思想&#xff0c;熟悉各种工具和技术手段&#xff0c;养成良好的日志分析习惯&#xff0c;同时建立完善的应急预案和备份恢复策略&#xff0c;才能有效…

代码随想录算法训练营第三十五天| LeetCode860.柠檬水找零、LeetCode406.根据身高重建队列、LeetCode452.用最少数量的箭引爆气球

LeetCode 860 柠檬水找零 题目链接&#xff1a;860. 柠檬水找零 - 力扣&#xff08;LeetCode&#xff09; 【解题思路】 情况1、客户支付5元的钞票——直接收下&#xff0c;不用找零 情况2、客户支付10元钞票&#xff1a; 如果手里有5元钞票&#xff0c;进行找零 如果手里没…

最新AI创作系统ChatGPT网站源码Midjourney-AI绘画系统,Suno-v3-AI音乐生成大模型。

一、前言 SparkAi创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统&#xff0c;支持OpenAI-GPT全模型国内AI全模型。本期针对源码系统整体测试下来非常完美&#xff0c;那么如何搭建部署AI创作ChatGPT&#xff1f;小编这里写一个详细图文教程吧。已支持GPT…

MyBatis<foreach>标签的用法

文章目录 1. foreach 标签2. MyBatis&#xff1c;foreach&#xff1e;标签的使用2.1 批量插入2.2 批量编辑2.3 批量查询2.4 使用 foreach 遍历 map 1. foreach 标签 foreach 可以在 SQL 语句中进行迭代一个集合。foreach元素的属性主要有 item&#xff0c;index&#xff0c;co…