【第十二届“泰迪杯”数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索—更新(正式比赛)

embedded/2024/10/18 9:23:47/

【第十二届“泰迪杯”数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索—更新(正式比赛)

往期链接:

【第十二届“泰迪杯”数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索—解题全流程(持续更新)
【第十二届“泰迪杯”数据挖掘挑战赛】【2024泰迪杯】B题基于多模态特征融合的图像文本检索—解题全流程(论文更新)

全家桶更新内容:

全部代码,制作数据、训练权重,结果,视频:

在这里插入图片描述

其中,LXS文件夹,代表所有的jupyter代码以及Chinese clip模型代码,基于服务器就可以直接运行,(找我分享服务器镜像,不用再配置环境了)

视频为边做边录制,全程记录训练预测、验证过程。

在这里插入图片描述

全家桶获取

可以微信:zgr421136咨询 (微信优惠-5)
可以QQ交流群:458351399可以直接爱发电平台:
https://afdian.net/item/8cc7f3dae8d111eeb7b05254001e7c00

良心制作,质量保证,售后解答。

单品一:

单品一包含全套代码(找我分享服务器镜像,无需配置环境,一键运行),教程视频,训练的权重与提交结果
获取链接:

https://afdian.net/item/e579256ceead11ee9b7352540025c377

单品二:

单品二包含需要提交结果(28号的提交测试结果csv也会更新)与完结论文
获取链接:

https://afdian.net/item/4a9d076aeeae11ee908b52540025c377

训练、预测展示:

训练,

(基于小的base16,预训练权重模型训练的,4w条为训练集,1w条为验证集)

只训练了44轮,一轮训练花费15分钟,显存只占6GB左右。

在这里插入图片描述

预测结果:

说明:这是训练了44轮,验证效果不算太理想的第一版模型的预测结果。

(对问题二,文本预测检索图片,问题三,图片预测检索文本的部分结果展示),此时验证集的召回验证recall@k5值为60。

在这里插入图片描述

在这里插入图片描述

图片检索文本结果部分展示:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

后续计划:

今晚将进行选择最大最全面的中文预训练模型,对正式数据再进行训练(很费时间,很费资源。本地电脑是一定搞不了的,或服务器或者学校实验室服务器。)

  1. 选择最大预训练权重文件进行训练
  2. 训练50轮
  3. 论文编写改进方向优化指导.txt

第二版更新将直接上传售后群qq文件夹里,以及百度网盘链接的方式。


http://www.ppmy.cn/embedded/6939.html

相关文章

LeetCode hot100-29-Y

19. 删除链表的倒数第 N 个结点给你一个链表,删除链表的倒数第 n 个结点,并且返回链表的头结点。这题比较简单,我的想法和官方一是一样的,剩下的不想看了。 就是要注意一下删除的是第一个节点的情况,单独处理一下。 我…

Avalonia 捕获全局异常(UI线程 和 非UI线程),增加客户端的稳定性

在 App.axaml.cs 中,App类添加下列事件; 1.重写 OnFrameworkInitializationCompleted ,会在程序初始化完成后触发 2. 绑定AppDomain中当前域的事件 AppDomain.CurrentDomain.UnhandledException HandleGlobalException; //UI线程 …

文心一言vsGPT-4全面对比

文心一言和GPT-4都是当前非常先进的人工智能语言模型,它们各自具有独特的特点和优势。以下是对这两款工具的全面比较: 文心一言是由百度开发的一款大型人工智能语言模型,它基于强大的深度学习技术和海量的数据资源,具备出色的语言…

从C到JAVA之学习JAVA的第一周笔记

文章目录 java语言概述JDK与JRE编写执行过程第一份java代码解读编写编译运行其他 注释三种注释方法 java API文档关键字标识符数据类型基本数据类型自动类型提升规则引用数据类型 string概述String与基本数据类型的变量间的运算 运算符键盘录入运行控制语句数组定义与静态初始化…

ElasticSearch 集群添加用户安全认证功能(设置访问密码)

前言 在6.8之前免费版本并不包含安全认证功能,之后版本有开放一些基础认证功能;为了防止各种事故,一般都会设置es集群的访问密码;但是在我尝试设置访问密码的时候发现,设置访问密码的前提必须要设置集群证书&#xff0…

排序之插入排序:从斗地主到插入排序

目录 1.斗地主如何摸牌 2.从摸牌想到插入排序 3.完成插入排序 4.结束语 1.斗地主如何摸牌 不知道各位是否玩过几乎人人都玩过的斗地主游戏呢?相必各位或多或少都玩过一点,再没玩过也看别人打过。今天博主就将从这个游戏为大家讲解我们的插入排序。 在…

【linux】centos7 开机 进单用户模式修改root密码

本站以分享各种运维经验和运维所需要的技能为主 《python零基础入门》:python零基础入门学习 《python运维脚本》: python运维脚本实践 《shell》:shell学习 《terraform》持续更新中:terraform_Aws学习零基础入门到最佳实战 《k8…

实时角色控制:基于相位函数神经网络的研究

引言 计算机动画和虚拟现实技术在现代数字娱乐和仿真中扮演着越来越重要的角色。实现自然流畅、符合用户意图的角色控制是这些技术成功的关键。近年来,随着深度学习技术的快速发展,基于数据驱动的角色控制方法备受关注。本文介绍了一种新颖的基于相位函…