纯规则的文本匹配

news/2024/12/14 21:41:55/

如果要计算两文本匹配度的规则匹配分数

不能根据几个badcase去调,会造成 解了这个badcase,出了另一个badcase的情况!针对几个badcase在那改规则(尤其是 有哪些 规则/特征 还没定,就开始改 规则/特征 的权重),就是XJBG。

要归并到一个 可加和 的公式上,最后发现还是这样最好的,比如:

两文本匹配分数 = 前缀匹配汉字数 + 后缀匹配汉字数 + 前缀匹配拼音数 + 后缀匹配拼音数

规则,其实也是设计特征,上面匹配分数为例,就是4个特征,这4个特征有如下特点:
对于每条数据,4个特征都是有默认值的,也就是对所有数据都生效的;
对于每条数据,4个特征明显是可加和的,在同一个量级的;


http://www.ppmy.cn/news/1555117.html

相关文章

vue常用命令汇总

nvm 一个nodejs版本管理工具,解决node.js各种版本存在不兼容现象可以通过它可以安装和切换不同版本的node.js。 npm 可以管理 nodejs 的第三方插件。 vue-cli 是Vue提供的一个官方cli,专门为单页面应用快速搭建繁杂的脚手架。 nginx 是一个高性能的HTTP和反向代理we…

【深度学习进阶】CNN-VGG

介绍 VGG网络是由牛津大学计算机视觉组(Visual Geometry Group, VGG)的研究人员设计的一系列深度卷积神经网络。这些网络在2014年的ImageNet大规模视觉识别挑战赛(ILSVRC-2014)中表现出色,虽然不是当年的冠军&#xf…

Plugin [id: ‘flutter‘] was not found in any of the following sources解决方法

文章目录 错误描述解决方法修正方案:继续使用 apply from修正后的 build.gradle说明警告的处理进一步验证 错误描述 Plugin [id: ‘flutter’] was not found in any of the following sources: Gradle Core Plugins (not a core plugin, please see https://docs…

spark connector部分更新写starrocks 出现磁盘暴涨

问题描述: 对starrocks中的主键模型表中的亿级大表中的部分字段进行更新操作,但是更新过程中发现sr集群磁盘出现暴涨,直接导致其他业务数据写入报错。 基础信息: spark: 3.3.2 starrocks: 3.2 更新字段数:5列4亿行 数…

The Past, Present and Future of Apache Flink

摘要:本文整理自阿里云开源大数据负责人王峰(莫问)在 Flink Forward Asia 2024上海站主论坛开场的分享,今年正值Flink开源项目诞生的第10周年,借此时机,王峰回顾了Flink在过去10年的发展历程以及 Flink社区…

【React】ant-design 重置表单

官网中的所在位置&#xff1a; 1、在组件中配置&#xff1a; const [form] Form.useForm(); 2、在点击重置按钮的函数中配置&#xff1a; form.resetFields() 3、在表单中配置&#xff1a; <Form form{form}>...</Form>

【人脸检测】OpenCV调用深度学习模型实现人脸检测-java

介绍 这个Dome是利用OpenCV加载Tensorflow训练的模型&#xff0c;然后返回图片中人脸的位置信息&#xff0c;然后再显示出来 效果&#xff0c;大家可以参考这里7.46 复制打开抖音&#xff0c;看看【写的一手烂代码的作品】人脸检测 java也能用深度学习模型&#xff0c;识别率…

基于决策树方法的心脏病患者患病因子的可视化分析

1 概述 心脏病作为全球范围内的主要健康问题,其患病因素分析与可视化研究具有重要的公共卫生意义。心脏病的发病机制复杂,涉及遗传、环境、生活方式等多种因素。随着社会的发展和生活方式的变化,心脏病的患病率在全球范围内持续上升,特别是在发展中国家,这一趋势更加明显…