python本科毕业设计基于神经网络的虚假评论识别系统源码,含模型及数据

news/2024/11/2 3:43:56/

主要函数:
1.corpusprocess原始语料处理函数
2.train_word2vec生成word2vec向量
3.generate_id2wec获得索引的w2id,和嵌入权重embedding_weights
4.prepare_data 数据预处理

完整代码下载地址:python本科毕业设计基于神经网络的虚假评论识别系统源码
代码流程:
训练过程:
1.train_word2vec生成word2vec词向量模型,train_word2vec中会调用corpusprocess(对中文文本进行预处理和切词操作)
2.generate_id2wec会根据此向量模型,生成w2id,和嵌入权重embedding_weights
3.prepare_data根据w2id,划分训练集x_train, y_trian和验证集 x_val , y_val
4.w2id和embedding_weights根据定义LSTM模型Senti
5.调用train()方法训练,保存算法模型。

预测过程:
1.加载已经生成word2vec模型
2.generate_id2wec会根据此向量模型,生成w2id,和嵌入权重embedding_weights
3.定义 Sentiment,设置参数
4.加载训练好的LSTM模型
5.调用predict方法预测结果

基于神经网络的虚假评论识别系统
备注:
数据处理时,应该以utf-8编码,不然读出来的数据较乱,修改数据形式,读取Excel文件,以utf-8编码
打乱数据集使得最后的结果更加合理
添加测试集验证模型
测试集:训练集=2:8
在训练集的过程中添加验证集,比例为1:9
最后的下面如下图所示。

数据比例:
在这里插入图片描述

模型结构:

在这里插入图片描述

模型指标:

在这里插入图片描述
在这里插入图片描述

建议:
词向量的维度太大,句子太短,导致句子向量比较稀疏,可以修改句子维度大小;
同时可以修改代码生成训练过程中的acc和loss折线图,类似下面的loss图(80块钱优化上述建议代码)

在这里插入图片描述


http://www.ppmy.cn/news/20155.html

相关文章

MyBatis-Plus知识快速入门

文章目录1.MyBatis-Plus简介2.入门案例2.1开发环境2.2创建测试数据库和表2.3创建SpringBoot工程2.4创建实体类以及lombok的使用2.5添加mapper2.6加入日志功能3.基本的CRUD3.1BaseMapper3.2插入3.3删除3.4修改3.5查询4.通用Service4.1创建Service接口和实现类5.常用注解5.1Table…

Android OpenCV(二)主体识别 位置检测

前言 工作中遇到需要通过OpenCV找到图片主体体积占图片百分比的比例,这里做一个问题解决思路的记录。该方面新手小白,有不对的地方可以评论指出哈 。 重要API Sobel算法 Sobel 计算参考文章 索贝尔算子是计算机视觉领域的一种重要处理方法。 主要用于…

基于Java+SpringBoot+Vue前后端分离小区管理系统设计与实现

博主介绍:✌全网粉丝3W,全栈开发工程师,从事多年软件开发,在大厂呆过。持有软件中级、六级等证书。可提供微服务项目搭建与毕业项目实战✌ 博主作品:《微服务实战》专栏是本人的实战经验总结,《Spring家族及…

【华为上机真题】密码要求

🎈 作者:Linux猿 🎈 简介:CSDN博客专家🏆,华为云享专家🏆,Linux、C/C、云计算、物联网、面试、刷题、算法尽管咨询我,关注我,有问题私聊! &…

PHP反序列化新手入门学习总结

最近写了点反序列化的题,才疏学浅,希望对CTF新手有所帮助,有啥错误还请大师傅们批评指正。 php反序列化简单理解 首先我们需要理解什么是序列化,什么是反序列化? PHP序列化:serialize() 序列化是将变量…

如何炼就数据分析的思维?

目录 前言结构化思维假说演绎思维指标化思维维度分析思维 前言 面对数据异常,我们经常会出现“好像是A原因引起的?”“貌似和B原因也相关?““有可能是 C操作不当“的主观臆测。 或者,拿到一个分析议题,分析”11 月销售…

单板硬件设计:存储器

在单板设计中,无论是涉及到一个简易的CPU、MCU小系统或者是复杂的单板设计,都离不开存储器设计: 1、存储器介绍 存储器的分类大致可以划分如下: ROM和RAM指的都是半导体存储器,ROM在系统停止供电的时候仍然可以保持…

Linux操作系统使用git提交代码

引言: 北京时间 2023/1/27/9:50,今天的起床时间9:05,可以看出我们是提前了一些些,但是不是我的功劳,当然也不是我的闹钟的功劳,毕竟我的闹钟是8:20和8:50的,因为我亲爱的老妈……懂…