SQL 匹配 _ 和 %
SQL的模式匹配允许你使用“”匹配任何单个字符,而“%”匹配任意数目字符(包括零个字符)。在 MySQL中,SQL的模式缺省是忽略大小写的。 注意在你使用SQL模式时,你不能使用=或!=;而使用LIKE或NOT LIKE比较操作符。 语法:SELECT 字段 FROM 表 WHERE 某字段 Like 条件 其中关于条件,SQL提供了两种种匹配模式: 1. 百分号(%):示任意个或多个字符,可匹配任意类型和长度的字符。 示例1:SELECT * FROM character WHERE name LIKE ‘%孙%';即匹配e姓名为“孙行者”,“行者孙,“行者孙”三行数据 示例2:SELECT * FROM character WHERE name LIke '%孙%' and name like '%行%'; 即匹配姓名为“孙行者”,“行者孙,“行者孙”三行数据 示例3:SELECT * FROM character WHERE name LIke '%孙%行%‘;只能匹配姓名为“孙行者”一行数据 注意示例2和示例3的区别 2.下划线(_):表示任意单个字符。匹配单个任意字符,它常用来限制表达式的字符长度语句:(可以代表一个中文字符) 示例1:SELECT * FROM character WHERE name LIKE ‘_三';即把姓名为“唐三藏”的一行数据 示例2:SELECT * FROM character WHERE name LIKE ‘_三';即把姓名为“唐三”一行数据
拆词 API
使用正则表达式代替 like or
下面的方式效率较低,要对 TT.tt 列进行多次的 like 查询
SELECT * FROM TT WHERE tt.tt LIKE '%钢筋%' or TT.tt LIKE '%混凝土%' or TT.tt LIKE '%预应力%' or TT.tt like '%管桩%'
Mysql 支持对列的正则表达式方式查询。
SELECT * FROM TT WHERE tt.tt regexp '钢筋|混凝土|预应力'
权重搜索
权重搜索涉及到几个Mysql 函数。
LOCATE('钢筋',tt.tt) : 查询钢筋在 TT.tt 列出现的位置,0 表示未找到。否则返回 坐标位置,坐标位置从1开始。
Mysql 中 0 可以理解为 false 。 非0 数字可以理解为true
IF( 表达式 , 1 , 0) : 判断表达式结果, TRUE 则返回 1 , FALSE 则返回0
demo
SELECT * , ( IF(LOCATE('钢筋',tt.tt) , 1, 0) + IF(LOCATE('混凝土',tt.tt) , 1, 0) + IF(LOCATE('预应力',tt.tt) , 1, 0) ) AS weight FROM TT WHERE
TT.tt regexp '钢筋|混凝土|预应力' order by weight desc
上面的查询中,每个关键词的权重都是1,所以 关键词出现最多的 标题出现在第一位。
如果权重增加,那么权重高的关键词将会影响排序规则。如下例子,将 管桩 的权重改为9
SELECT * , ( IF(LOCATE('钢筋',tt.tt) , 1, 0) + IF(LOCATE('管桩',tt.tt) , 9, 0) + IF(LOCATE('预应力',tt.tt) , 1, 0) ) AS weight FROM TT WHERE
TT.tt regexp '钢筋|混凝土|预应力' order by weight desc
关键词样式
通过 replace ,将关键字 改为 关键字 即可。