数据库教程:MySQL 全文索引的原理与缺陷分享-计算机技术网

数据库教程:MySQL 全文索引的原理与缺陷分享

2021年10月22日下午10:17 • 数据库教程教学 • 阅读 0

MySQL全文索引一种特殊的索引，它会把某个数据表的某个数据列出现过的所有单词生成一份清单。

altertabletablenameaddfulltext(column1,column2)

说明：

只能在MyISAM数据表中创建

全文索引是以空格或标点隔开才能搜到的，搜中文是搜不到（有专门的应用支持中文分词可以搜中文，但都不理想）

少于3个字符的单词不会被包含在全文索引里，可以通过修改my.cnf修改选项

ft_min_word_len=3

重新启动MySQL服务器，用repairtabletablenamequick为有关数据表重新生成全文索引

select*fromtablenamewherematch(column1,column2)against('word1word2word3')>0.001

match…against把column1,column2数据列中至少包含word1,word2,word3三个单词之一的数据记录查找到，在关键字match后的数据列必须跟创建全文索引的数据列相同，检索词不区分大小写和先后顺序，少于3个字符的单词通常被忽略。match…against…表达式返回一个浮点数作为它本身的求值结果，这个数字反映了结果记录与被检索单词的匹配程度。如果没有匹配到任何记录，或者匹配到的结果记录太多反而被忽略，表达式将返回0，表达式>0.001的作用是排除match的返回值太小的结果记录。

select*,match(column1,column2)against('word1word2word3')asmtch fromtablename havingmtch>0.01 orderbymtchdesc limit5

找出最匹配的5条记录，在where字句中不能使用假名，所以用having

布尔全文搜索的性能支持以下操作符：

+word:一个前导的加号表示该单词必须出现在返回的每一行的开头位置。

-word:一个前导的减号表示该单词一定不能出现在任何返回的行中。

(无操作符)：在默认状态下(当没有指定+或–的情况下)，该单词可有可无，但含有该单词的行等级较高。这和MATCH()…AGAINST()不使用INBOOLEANMODE修改程序时的运作很类似。

><这两个操作符用来改变一个单词对赋予某一行的相关值的影响。>操作符增强其影响，而<操作符则减弱其影响。请参见下面的例子。

()括号用来将单词分成子表达式。括入括号的部分可以被嵌套。

~word:一个前导的代字号用作否定符，用来否定单词对该行相关性的影响。这对于标记“noise（无用信息）”的单词很有用。包含这类单词的行较其它行等级低。

word*:搜索以word开头的单词，只允许出现在单词的末尾

“word1word”:给定单词必须出现在数据记录中，先后顺序也必须匹配，区分字母大小写

select*fromtablenamewherematch(column1,column2)against('+word1+word2-word3'inbooleanmode')

布尔检索只能返回1或者0，不再返回表示匹配程度的浮点数

全文索引的缺陷：

1.数据表越大，全文索引效果好，比较小的数据表会返回一些难以理解的结果。

2.全文检索以整个单词作为匹配对象，单词变形(加上后缀，复数形式)，就被认为另一个单词。

3.只有由字母，数字，单引号，下划线构成的字符串被认为是单词，带注音符号的字母仍是字母，像C++不再认为是单词

4.不区分大小写

5.只能在MyISAM上使用

6.全文索引创建速度慢，而且对有全文索引的各种数据修改操作也慢

7.不支持中文

上述就是数据库技术:MySQL 全文索引的原理与缺陷分享的全部内容，如果对大家有所用处且需要了解更多关于mysql数据库学习教程，希望大家多多关注—计算机技术网(www.ctvol.com)!

本文来自网络收集，不代表计算机技术网立场，如涉及侵权请联系管理员删除。

ctvol管理联系方式QQ:251552304

本文章地址：https://www.ctvol.com/dtteaching/908771.html

数据库教程:MySQL 全文索引的原理与缺陷分享

精彩推荐