BERT与CNN结合实现糖尿病相关医学问题多分类模型

devtools/2025/1/20 21:35:40/

完整源码项目包获取→点击文章末尾名片!

使用HuggingFace开发的Transformers库,使用BERT模型实现中文文本分类(二分类或多分类
首先直接利用transformer.models.bert.BertForSequenceClassification()实现文本分类
然后手动实现BertModel + FC 实现上边函数。其中可以方便的更改参数和结构
然后实验了论文中将bert最后四层进行concat再maxpooling的方法,
最后实现了bert + CNN实现文本分类
模型使用的是哈工大chinese-bert-wwm,可以完全兼容BERT
下载:
git clone https://huggingface.co/hfl/chinese-bert-wwm

结果
除了第一个实验dropout_bert是0.1,其余是0.2. 剩下参数都一样。
训练3个epoch

模型
train/val acc
val acc
test acc
链接
会用内建BertForSequenceClassification
0.982
0.950
0.950
链接
自己实现Bert+fc 一层全连接层
0.982
0.948
0.954
链接
将Bert最后四层相concat然后maxpooling
0.977
0.946
0.951
链接
BERT+CNN
0.984
0.947
0.955
链接

  1. 官方的transformer.models.bert.BertForSequenceClassification()就是直接使用BertModel 再接一层全连接层实现的。第二个项目是为了方便自己修改网络结构,进行手动实现。效果差不多,可以自己修改接几层线形结构,但是实验了一层就够了。
  2. 根据参考2的论文,将BERT最后四层的CLS向量concat然后取max pooling可以让bert分类问题上有更好的效果。在THUNews上测试可以提高0.4%相比bert。已经很大了相比其他方法而言。
  3. 我一直觉得bert后面接CNN和RNN等都不好,毕竟transformer就是改善这两类模型的,再接一层也好不到哪去。如果我理解不到位可以告诉我。我还实验了bert使用前四层的输出进行concat,效果acc也能达到0.80+,层数越深效果感觉真的不明显。bert+cnn/rnn等这个模型在参考3 中两年前就有人做过实验,写出来过,他实验的效果也是不如单纯的BERT。调了调cnn的大小,其实都差不多。

标签定义:

  • 0: Diagnosis(诊断)
  • 1: Treatment(治疗)
  • 2: Common Knowledge(常识)
  • 3: Healthy lifestyle(健康生活方式)
  • 4: Epidemiology(流行病学)
  • 5: Other(其他)
    [图片]

模型的实现包括以下几个部分:

  1. 数据处理与加载:如何加载文本数据并进行必要的预处理。
  2. 模型架构:
  • bert_lr:一个基于BERT的线性分类器模型。
  • bert_cnn:一个基于BERT与卷积神经网络(CNN)结合的模型。
  1. 训练过程:如何设置训练循环、优化器和损失函数。
  2. 评估与预测:模型在验证集和测试集上的评估,以及如何进行推理。

http://www.ppmy.cn/devtools/152195.html

相关文章

C# 数据结构全面解析

在 C# 编程的世界里,数据结构是构建高效程序的基石。合理运用数据结构,能够优化数据的存储和访问方式,显著提升程序的性能。本文将深入探讨 C# 中常见的数据结构及其应用场景。 一、数据结构基础概念 数据结构是一种组织和存储数据的方式&a…

算法分析与设计之贪心算法

文章目录 前言一、Greedy Algorithms1.1 贪心选择性质1.2 最优子结构性质1.3 正确性证明 二、典型例题2.1 Interval Scheduling间隔调度2.2 Interval Partitioning最少间教室排课2.3 Selecting Breakpoints选择加油站停靠点2.4 硬币找零2.5 Scheduling to Minimizing Lateness2…

Redis系列之底层数据结构整数集IntSet

Redis系列之底层数据结构整数集IntSet 什么是IntSet IntSet,整数集合,是Redis集合类型的一种底层数据结构,当一个集合只包含整数值元素,并且这个集合的元素数量不多时,redis就会选用intset作为底层实现。 IntSet的数…

Python脚本搬运当前文件夹及其子文件夹中所有的.c格式的文件到当前新建的文件夹中

写一个Python脚本,用来搬运当前文件夹及其子文件夹中所有的.c格式的文件到当前新建的SourceLib文件夹中,并排除搬运isnocopyname.txt中定义的c文件。新建Lib_Log.txt文本,开头打印当前计算器名和时间,并将搬运的文件的路径及文件名…

PostCSS安装与基本使用?

1. 安装PostCSS及其CLI工具 在全局环境中安装PostCSS CLI工具以便从命令行运行PostCSS: npm install -g postcss postcss-cli如果你想在项目中局部安装: npm install --save-dev postcss postcss-cli2. 创建PostCSS配置文件 在项目根目录下创建一个名…

lvm快照备份

前提 数据文件要在逻辑卷上; 此逻辑卷所在卷组必须有足够空间使用快照卷; 数据文件和事务日志要在同一个逻辑卷上; 前提:MySQL数据lv和将要创建的快照要在同一vg,vg要有足够的空间存储 优点 几乎是热备&…

Nature Microbiology | John C. Alverdy组-肠杆菌素抑制芳香烃受体促进小鼠细菌性败血症...

研究论文 ● 期刊:Nature Microbiology (IF:20.5) ● DOI:https://doi.org/10.1038/s41564-024-01882-9 ●原文链接: https://www.nature.com/articles/s41564-024-01882-9 ● 第一作者:Robert C. Keskey ● 通讯作者:Robert C. …

深入探索Go语言中的临时对象池:sync.Pool

深入探索Go语言中的临时对象池:sync.Pool 在当前的编程世界中,Go语言以其简洁的语法、高效的并发支持以及强大的标准库而受到开发者们的青睐。对于那些追求极致性能的程序员来说,Go语言的sync.Pool提供了一个理想的工具集来加速开发过程并优化程序性能。本文旨在全面深入地…