MYSQL5.7 全文检索中文无返回数据

news/2025/1/19 12:24:50/

在MySQL 5.7.6之前,全文索引只支持英文全文索引,不支持中文全文索引,需要利用分词器把中文段落预处理拆分成单词,然后存入数据库。
从MySQL 5.7.6开始,MySQL内置了ngram全文解析器,用来支持中文、日文、韩文分词。
本文使用的MySQL 版本是5.7.22,InnoDB数据库引擎。

1.修改my.ini文件,增加ngram 解析器,增加ngram_token_size= 2,然后重启MYSQL服务

[mysql]
# 设置mysql客户端默认字符集
default-character-set=utf8
[mysqld]
# 设置3306端口
port = 13306
#mysql-5.7.43-winx64的路径
basedir = D:\install\mysql\mysql-5.7.44-winx64  #修改为自己的数据库解压路径
#mysql-5.7.43-winx64的路径+\data
datadir = D:\install\mysql\mysql-5.7.44-winx64\data   #修改为自己的数据库存储路径
# 允许最大连接数
max_connections=20
# 服务端使用的字符集默认为8比特编码的latin1字符集
character-set-server=utf8
# 创建新表时将使用的默认存储引擎
default-storage-engine=INNODB
# 创建模式
sql_mode = NO_ENGINE_SUBSTITUTION,STRICT_TRANS_TABLES
ft_min_word_len = 1
ngram_token_size= 2

2.创建带索引表:

CREATE TABLE articles (id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,title VARCHAR (200),body TEXT,FULLTEXT (title) WITH PARSER ngram
) ENGINE = INNODB;

或修改表添加索引

drop index ft_title on articles;create fulltext index ft_title  on articles(title)  WITH PARSER ngram;

3.查询验证

SELECT * FROM articles WHERE MATCH (title) AGAINST ('上海 故事' IN NATURAL LANGUAGE MODE);SELECT * FROM articles WHERE MATCH (title) AGAINST ('上海 故事' IN BOOLEAN MODE);


http://www.ppmy.cn/news/1564408.html

相关文章

数据库高安全—openGauss安全整体架构安全认证

openGauss作为新一代自治安全数据库,提供了丰富的数据库基础安全能力,并逐步完善各类高阶安全能力。这些安全能力涵盖了访问登录认证、用户权限管理、审计与追溯及数据安全隐私保护等。本章节将围绕openGauss安全机制进行源码解读,以帮助数据…

Flask学习入门笔记

Flask学习入门笔记 前言1. 安装Flask2. 创建一个简单的Flask应用3. 路由与视图函数3.1 基本路由3.2 动态路由3.3 HTTP方法 4. 请求与响应4.1 获取请求数据4.2 返回响应 5. 模板渲染5.1 基本模板渲染5.2 模板继承 6. 静态文件6.1 静态文件的目录结构6.2 在模板中引用静态文件6.2…

【Linux系统编程】—— 深入理解Linux进程优先级与调度机制

文章目录 进程优先级的基本概念如何查看系统进程PRI和NI:优先级与Nice值查看和调整进程优先级补充概念-竞争、独⽴、并⾏、并发进程切换Linux2.6内核进程O(1)调度队列⼀个CPU拥有⼀个runqueue优先级活动队列及其优化过期队列过期队列与活动队列的结构active指针与ex…

【汇编语言】直接定址表(一)—— 「从单元标号到跨段数据:解锁汇编语言的隐藏技巧」

文章目录 前言1. 描述了单元长度的标号1.1 旧的示例代码1.2 新的示例代码1.3 将标号当作一个段中的内存单元1.4 注意事项 2. 在其他段中使用数据标号2.1 前提说明2.2 示例代码2.3 段与段寄存器的关联2.4 将标号当作数据来定义2.4.1 示例1—— 字型数据2.4.2 示例2——双字型数据…

FIDO2密码钥匙与无密码认证:打造安全便捷的数字世界

在数字化时代,密码曾被视为网络安全的基石,但随着网络攻击手段日益复杂,传统的密码认证方法越来越无法抵御这些挑战。对于用户来说,登录密码不仅繁琐易忘,而且一旦泄露,往往会导致数据泄露,造成…

PDF工具箱 PDF24 ,免费下载,非常好用

这是一套免费无限制的PDF 处理工具合集。 包含了 27 个 PDF 工具。涵盖了PDF 合并、分割、编辑、压缩、格式转换(Word、Excel、图片等)、OCR 文本识别、添加水印等诸多功能! 而且所有功能都可以免费使用,没有文件大小等任何限制…

C# 获取PDF文档中的字体信息(字体名、大小、颜色、样式等

在设计和出版行业中,字体的选择和使用对最终作品的质量有着重要影响。然而,有时我们可能会遇到包含未知字体的PDF文件,这使得我们无法准确地复制或修改文档。获取PDF中的字体信息可以解决这个问题,让我们能够更好地处理这些文件。…

Java线程全解析:从创建到同步的终极指南

哈喽,各位小伙伴们,你们好呀,我是喵手。运营社区:C站/掘金/腾讯云/阿里云/华为云/51CTO;欢迎大家常来逛逛 今天我要给大家分享一些自己日常学习到的一些知识点,并以文字的形式跟大家一起交流,互…