#随机种子固定,随机结果也固定
def seed_everything(seed):torch.manual_seed(seed)torch.cuda.manual_seed(seed)torch.cuda.manual_seed_all(seed)torch.backends.cudnn.benchmark = Falsetorch.backends.cudnn.deterministic = Truerandom.seed(seed)np.random.seed(seed)os.environ['PYTHONHASHSEED'] = str(seed)#################################################################
seed_everything(0)
###############################################
#seed_everything(0)这一行调用了上述函数并传入了种子值0,
# 这意味着所有的随机操作都将基于这个种子值来进行初始化,从而确保了实验的可重复性。
固定随机种子:
首先,通过seed_everything(seed)
函数设置所有随机数生成器的种子,确保实验结果的可重复性。这对于调试和复现实验结果非常重要。
---------------------------------------------------------------------------------------------------------------------------------
train_transform = transforms.Compose( #进行模型变换[transforms.ToPILImage(), #就是把224,224,3模型 -> 3,224,22transforms.RandomResizedCrop(224), #对图片放大裁剪,裁切出来224*224transforms.RandomRotation(50), #在50度以内进行旋转transforms.ToTensor()#变为张量]
)val_transform = transforms.Compose( #进行模型变换[transforms.ToPILImage(), #就是把224,224,3模型 -> 3,224,22 验证集的话就不用进行transforms模型变换# transforms.RandomResizedCrop(224), #对图片放大裁剪,裁切出来224*224# transforms.RandomRotation(50), #在50度以内进行旋转transforms.ToTensor()#变为张量]
)
图像变换:
定义了两种不同的图像变换方法train_transform
和val_transform
。训练集使用了包括随机裁剪、旋转等在内的数据增强技术,以增加模型的泛化能力;而验证集只进行了基本的转换操作,如调整大小和转为张量。
---------------------------------------------------------------------------------------------------------------------------------
class food_Dataset(Dataset):def __init__(self,path,mode="train"):self.mode=modeif mode == "semi":self.X=self.read_file(path)else:self.X,self.Y=self.read_file(path) #给一个路径,读出来X,Yself.Y = torch.LongTensor(self.Y) #将标签转化成长整型if mode=="train":self.transform = train_transformelse:self.transform = val_transformdef read_file(self,path):#读semi文件(没有标签的)if self.mode=="semi":file_list = os.listdir(path) # 列出文件下所有文件名字xi = np.zeros((len(file_list), HW, HW, 3), dtype=np.uint8)for j, img_name in enumerate(file_list): # enumerate既可以读到下表,也可以读到下表里的东西img_path = os.path.join(path, img_name)img = Image.open(img_path) # 可以把图片读进来img = img.resize((HW, HW))xi[j, ...] = imgprint("读到了%d个训练数据" % len(xi))return xielse:for i in tqdm(range(11)):file_dir = path + "/%02d" % ifile_list = os.listdir(file_dir) # 列出文件下所有文件名字xi = np.zeros((len(file_list), HW, HW, 3), dtype=np.uint8)yi = np.zeros(len(file_list), dtype=np.uint8)for j, img_name in enumerate(file_list): # enumerate既可以读到下表,也可以读到下表里的东西img_path = os.path.join(file_dir, img_name)img = Image.open(img_path) # 可以把图片读进来img = img.resize((HW, HW))xi[j, ...] = imgyi[j] = iif i == 0:X = xiY = yielse:X = np.concatenate((X, xi), axis=0)Y = np.concatenate((Y, yi), axis=0)print("读到了%d个训练数据" % len(Y))return X, Ydef __getitem__(self, item): #这个函数的作用就是retuen X[item],Y[item]的值if self.mode=="semi":return self.transform(self.X[item]),self.X[item]#返回transform后的X和原始的Xelse:return self.transform(self.X[item]),self.Y[item] #加上transform是为了对图片进行函数增广def __len__(self):return len(self.X)
自定义数据集类:
food_Dataset: 自定义的数据集类,用于从指定路径读取图片及其标签(或无标签),并应用相应的变换。它支持三种模式:训练(train)、验证(val)和半监督学习(semi)。该类实现了__getitem__
和__len__
方法,使得它可以被PyTorch的数据加载器(DataLoader)使用。
---------------------------------------------------------------------------------------------------------------------------------
class semiDataset(Dataset):def __init__(self,no_label_loder,model,device,thres=0.99):x,y=self.get_label(no_label_loder,model,device,thres)if x==[]:self.flag=Falseelse:self.flag=Trueself.X=np.array(x) #转化成矩阵self.Y=torch.LongTensor(y)self.transform=train_transform #定义损失函数def get_label(self,no_label_loder,model,device,thres):model=model.to(device)pred_prob=[]#用一个列表存概率值labels=[]#用一个列表存对应的标签x=[]#把无标签的x存进去y=[]#把半监督学习后x对应的y存进去soft =nn.Softmaxwith torch.no_grad(): #半监督学习,对模型梯度不产生作用,因此加上with torch.no_grad()for bat_x, _ in no_label_loder: #no_label_loder返回两个值,不需要后面的,所以用_表示bat_x=bat_x.to(device)pred=model(bat_x)#预测值pred_soft=soft(pred)#转化为了概率pred_max,pred_value=pred_soft.max(1)#既可以返回最大概率值,又可以返回最大概率值下标 、1表示横着读pred_prob.extend(pred_max.cpu().numpy().tolist())#extend可以合并两个列表,append不行 对应概率的数组labels.extend(pred_value.cpu().numpy().tolist()) #对应的标签的数组for index,prob in enumerate(pred_prob):if prob>thres:x.append(no_label_loder.dataset[index][1])#取到原始数据y.append(labels[index])return x,ydef __getitem__(self, item):return self.transform(self.X[item]),self.Y[item]def __len__(self):return len(self.X)
自定义数据集类:
semiDataset: 另一个自定义数据集类,专门用于从未标记的数据中筛选出高置信度的样本及其预测标签,以便将其加入到训练集中。这个过程是通过调用模型对未标记数据进行预测来实现的。
---------------------------------------------------------------------------------------------------------------------------------
def get_semi_loader(no_label_loder,model,device,thres):semiset=semiDataset(no_label_loder,model,device,thres)if semiset.flag==False:return Noneelse:semi_loader=DataLoader(semiset,batch_size=16,shuffle=False)return semi_loader
半监督学习数据加载器:
get_semi_loader
函数根据给定的无标签数据加载器、模型、设备和阈值来创建一个新的数据加载器,其中包含由模型预测并认为是可靠的样本。这允许模型从未标记的数据中学习,从而在有限的标记数据情况下提高性能。
---------------------------------------------------------------------------------------------------------------------------------
#模型框架
class myModel(nn.Module):def __init__(self,num_class):super(myModel, self).__init__()#3*224*224 -> 512*7*7 -> 拉直 -> 全连接self.conv1=nn.Conv2d(3,64,3,1,1) # -> 64*224*224 (卷积)self.bn1=nn.BatchNorm2d(64) #针对具有64个通道的二维数据的批量归一化层,目的是在训练过程中对该层输入数据进行归一化处理,以加快训练速度和提高模型性能。self.relu1=nn.ReLU() #激活函数self.pool1=nn.MaxPool2d(2) # 64*112*112 (池化)self.layer1=nn.Sequential(nn.Conv2d(64, 128, 3, 1, 1), # -> 128*112*112 (卷积)nn.BatchNorm2d(128),nn.ReLU(),nn.MaxPool2d(2) # 128*56*56)self.layer2 = nn.Sequential(nn.Conv2d(128, 256, 3, 1, 1), # -> 256*56*56 (卷积)nn.BatchNorm2d(256),nn.ReLU(),nn.MaxPool2d(2) # 256*28*28)self.layer3 = nn.Sequential(nn.Conv2d(256, 512, 3, 1, 1), # -> 512*28*28 (卷积)nn.BatchNorm2d(512),nn.ReLU(),nn.MaxPool2d(2) # 512*14*14)self.pool2=nn.MaxPool2d(2) #512*7*7self.fc1=nn.Linear(25088,1000) #拉直self.relu2=nn.ReLU()self.fc2=nn.Linear(1000,num_class)#1000->分类的类别def forward(self,x):x=self.conv1(x)x=self.bn1(x)x=self.relu1(x)x=self.pool1(x)x=self.layer1(x)x = self.layer2(x)x = self.layer3(x)x = self.pool2(x)x=x.view(x.size()[0],-1) #拉直x=self.fc1(x)x=self.relu2(x)x=self.fc2(x)return x
CNN模型架构:
myModel
是一个简单的卷积神经网络(CNN),设计用于分类任务。它包含了多个卷积层、批量归一化层、ReLU激活函数和最大池化层,最后通过全连接层输出分类结果。
---------------------------------------------------------------------------------------------------------------------------------
def train_val(model,train_loader,val_loader,no_label_loader,device,epochs,optimizer,loss,thres,save_path):model = model.to(device)semi_loader=Noneplt_train_loss = [] #记录所有轮次的lossplt_val_loss = []plt_train_acc = []plt_val_acc = []max_acc=0.0for epoch in range(epochs): #冲锋的号角train_loss = 0.0val_loss = 0.0semi_loss = 0.0train_acc = 0.0val_acc = 0.0semi_acc = 0.0start_time = time.time()model.train() #模型调为训练模式for batch_x, batch_y in train_loader:x, target = batch_x.to(device), batch_y.to(device)pred = model(x)train_bat_loss = loss(pred, target)train_bat_loss.backward()optimizer.step() #更新模型的作用,更新参数 之后要梯度清零,否则会积累梯度optimizer.zero_grad()train_loss += train_bat_loss.cpu().item()train_acc += np.sum(np.argmax(pred.detach().cpu().numpy(),axis=1)==target.cpu().numpy())#pred.detach().cpu().numpy()取张量数据,np.argmax(),axis=1 的意思是取一行最大的坐标,#也就是取概率最大的坐标,与标签相对比,相等就是Ture,反之Falseplt_train_loss.append(train_loss / train_loader.__len__())plt_train_acc.append(train_acc/train_loader.dataset.__len__()) #记录准确率if semi_loader!=None:for batch_x, batch_y in semi_loader:x, target = batch_x.to(device), batch_y.to(device)pred = model(x)semi_bat_loss = loss(pred, target)semi_bat_loss.backward()optimizer.step() #更新模型的作用,更新参数 之后要梯度清零,否则会积累梯度optimizer.zero_grad()semi_loss += train_bat_loss.cpu().item()semi_acc += np.sum(np.argmax(pred.detach().cpu().numpy(),axis=1)==target.cpu().numpy())#pred.detach().cpu().numpy()取张量数据,np.argmax(),axis=1 的意思是取一行最大的坐标,#也就是取概率最大的坐标,与标签相对比,相等就是Ture,反之Falseprint("半监督数据集的训练准确率为",semi_acc/semi_loader.dataset.__len__())model.eval()with torch.no_grad():for batch_x, batch_y in val_loader:x, target = batch_x.to(device), batch_y.to(device)pred = model(x)val_bat_loss = loss(pred, target)val_loss += val_bat_loss.cpu().item()val_acc += np.sum(np.argmax(pred.detach().cpu().numpy(), axis=1) == target.cpu().numpy())plt_val_loss.append(val_loss/ val_loader.dataset.__len__())plt_val_acc.append(val_acc / val_loader.dataset.__len__()) # 记录准确率if plt_val_acc[-1]>0.7:semiloader=get_semi_loader(no_label_loader,model,device,thres) #如果正确率达到0.7,就可以训练if val_acc > max_acc:torch.save(model, save_path)max_acc = val_lossprint('[%03d/%03d] %2.2f sec(s) Trainloss: %.6f |Valloss: %.6f Trainacc: %.6f | Valacc: %.6f'% \(epoch, epochs, time.time() - start_time, plt_train_loss[-1], plt_val_loss[-1],plt_train_acc[-1],plt_val_acc[-1]))plt.plot(plt_train_loss)plt.plot(plt_val_loss)plt.title("loss")plt.legend(["train", "val"])plt.show()plt.plot(plt_val_acc)plt.plot(plt_val_acc)plt.title("acc")plt.legend(["train", "val"])plt.show()
训练与验证流程 (train_val
函数)
-
初始化:将模型移动到GPU(如果可用),准备记录损失和准确率的列表。
-
循环遍历epochs:对于每个epoch:
- 执行训练阶段:计算训练损失和准确率。
- 如果存在半监督数据,则对其进行处理。
- 执行验证阶段:计算验证损失和准确率,检查是否需要保存最佳模型。
- 根据验证准确率达到阈值,更新半监督数据加载器。
- 输出当前epoch的信息,包括时间消耗、损失和准确率。
-
绘图:使用matplotlib绘制训练和验证的损失与准确率变化曲线,帮助直观了解模型的学习过程。
---------------------------------------------------------------------------------------------------------------------------------
train_path=r"D:\python_data\classify\food_classification\food-11_sample\training\labeled"
val_path=r"D:\python_data\classify\food_classification\food-11_sample\validation"
no_label_path=r"D:\python_data\classify\food_classification\food-11_sample\training\unlabeled\00"
train_set = food_Dataset(train_path,"train")
val_set = food_Dataset(val_path,"val")
no_label_set = food_Dataset(no_label_path ,"semi")
train_loader = DataLoader(train_set,batch_size=16,shuffle=True) #数据加载器
val_loader = DataLoader(val_set,batch_size=16,shuffle=True)
no_label_loader = DataLoader(no_label_set,batch_size=16,shuffle=False)#False是因为没有标签的照片不能打乱
#batch_size=4:此参数指定了每个批次(batch)中包含的数据样本数量
#为4。这意味着每次迭代过程中,DataLoader都会从train_set中取出4
#个样本组成一个批次返回给用户。选择合适的batch_size对模型训练的
#速度和性能都有影响。
#shuffle=True:在每个epoch开始前,如果设置为True,则DataLoader会将数据集中的数据顺序打乱。# model = myModel(11)from torchvision.models import resnet18
model=resnet18(pretrained=True) #pretrained=True 就是不仅用大佬的架构,还用大佬的参数 False 只用架构,不用参数
in_fetures=model.fc.in_features #提取模型分类的输出头
model.fc= nn.Linear(in_fetures,11)lr=0.001 #学习率
loss = nn.CrossEntropyLoss() #直接调用交叉熵损失
optimizer = torch.optim.AdamW(model.parameters(),lr=lr,weight_decay=1e-4) #优化器AdamW
#model.parameters(): 这个方法会返回一个生成器,包含了模型中所有可学习参数(即网络层的权重和偏置等)
# 。通过传递这个生成器给优化器,告诉优化器需要更新哪些参数。
#weight_decay=1e-4: 权重衰减系数,用于指定L2正则化的强度。L2正则化是一种防止过拟合的技术,通过对损
# 失函数添加一个与权重大小成比例的惩罚项来实现。1e-4意味着对于每个权重w,都会在损失函数中加上权重衰减有
# 助于控制模型复杂度,避免模型过度拟合训练数据。
device="cuda" if torch.cuda.is_available() else "cpu" #如果满足就是cude 否则就是CPU
save_path = "model_save/best_model.pth" #保存最好的模型
epochs=4
thres =0.1
train_val(model,train_loader,val_loader,no_label_loader,device,epochs,optimizer,loss,thres,save_path)