mysql的这几个坑你踩过没?真是防不胜防

Wesley13
• 阅读 680

一、前言

对于从事互联网开发的同学来说,mysql可谓是再熟悉不过的了。无论是DBA、开发或测试,基本上天天要跟它打交道,很多同学可能已经身经百战了。但是,笔者遇到过的这些坑不知道你们都经历过没?

二、有符号和无符号

以前我们公司在项目开发之初制定开发规范时,对mysql的int类型字段定义成有符号,还是无符号问题专门讨论过。

观点一:

对于能够确定里面存的值一定是正数的字段,定义成UNSIGNED无符号的,可以节省一半的存储空间。创建无符号字段的语句如下:

create table test_unsigned(a int UNSIGNED, b int UNSIGNED);

观点二:

建议都定义成有符号的,使用起来比较简单,mysql默认int类型就是有符号的,创建有符号字段的语句如下:

create table test_signed(a int);

执行结果:

mysql的这几个坑你踩过没?真是防不胜防

在字段a中插入-1,我们看到是可以操作成功的。

这两个方案,经过我们激烈讨论之后,选择了使用有符号定义int类型字段。为什么呢?

create table test_unsigned(a int UNSIGNED, b int UNSIGNED);

先创建test_unsigned表,里面包含两个无符号字段a和b,再插入一条数据a=1,b=2

select b - a from test_unsigned;

没有问题,返回1

但是如果sql改成这样:

select a - b from test_unsigned;

执行结果:mysql的这几个坑你踩过没?真是防不胜防

报错了。。。

所以,在使用无符号字段时,千万要注意字段相减出现负数的坑,建议还是使用有符号字段,避免不必要的问题。

三、自动增长

建过表的同学都知道,对于表的主键可以定义成自动增长的,这样一来,就可以交给数据库自己生成主键值,而无需在代码中指定,而且生成的值是递增的。一般情况下,创建表的语句如下:

create table test_auto_increment (a int auto_increment primary key);

但如果改成这样的会怎样?

create table test_auto_increment (a int auto_increment);

执行结果:

mysql的这几个坑你踩过没?真是防不胜防

报错了。。。

截图中没有全部显示出来,完整的提示语是这样的:

1075 - Incorrect table definition; there can be only one auto column and it must be defined as a key, Time: 0.006000

意思是自动增长字段,必须被定义成key,所以我们需要加上primary key。

此外,还有一个有趣的实验:

insert into test_auto_increment(a) values (null),(50),(null),(8),(null);

大家猜猜执行结果会是什么样的?

mysql的这几个坑你踩过没?真是防不胜防

第一个null插入1,然后按真实的数字大小排序后插入,后面两个null,是在最大的数字上面加1。

再看看这条sql主键中插入负数,能执行成功吗?

insert into test_auto_increment values(-3);

答案是可以,主键可以插入负数。

mysql的这几个坑你踩过没?真是防不胜防

还有这条sql呢,主键中插入0?

insert into test_auto_increment values(0);

执行结果:

mysql的这几个坑你踩过没?真是防不胜防

也可以执行成功,但是没有插入数据

四、字段长度

我们在创建表的时候,给字段定义完类型之后,紧接着需要指定字段的长度,比如:varchar(20),biginit(20)等。那么问题来了,varchar代表的是字节长度,还是字符长度呢?

create table test_varchar(a varchar(20));

执行后的结果:

mysql的这几个坑你踩过没?真是防不胜防

我们看到中文的5个字length函数统计后长度为15,代表占用了15个字节,而使用charcter_length函数统计长度是5,代表有5个字符。所以varchar代表的是字符长度,因为有些复杂的字符或者中文,一个字节表示不了,utf8编码格式的一个中文汉字占用3个字节。不同的数据库编码格式,占用不同的字节数对照表如下:

mysql的这几个坑你踩过没?真是防不胜防

mysql除了varchar和char是代表字符长度之外,其余的类型都是代表字节长度。

int(n) 这个n表示什么意思呢?从一个列子出发:

create table test_bigint (a bigint(4) ZEROFILL);

ZEROFILL表示长度不够填充0

执行结果:

mysql的这几个坑你踩过没?真是防不胜防

mysql常用数字类型字段占用字节数对照表:

mysql的这几个坑你踩过没?真是防不胜防

从表中可以看出bigint实际长度是8个字节,但是我们定义的a显示4个字节,所以在不满4个字节时前面填充0。满了4个字节时,按照实际的长度显示,比如:123456。但是,需要注意的是,有些mysql客户端即使满了4个字节,也可能只显示4个字节的内容,比如显示:1234。

所以bigint(4),这里的4表示显示的长度为4个字节,实际长度还是8个字节。

五、忽略大小写

我们知道在英文字母中有大小写问题,比如:a 和 A 是一样的吗?我们认为肯定是不一样的,但是数据库是如何处理的呢?

create table test_a(a varchar(20));

执行结果是什么呢?

mysql的这几个坑你踩过没?真是防不胜防

本以为只会返回a,但是实际上把A也返回了,这是为什么呢?

mysql的这几个坑你踩过没?真是防不胜防

该表默认的Collation是utf8_general_ci,这种Collation会忽略大小写,所以才会出现查询小写字母a的值,意外把大写字母A的值也查询出来了。

那么如果我们只想查询出小写a的值该怎么办?先看看mysql支持哪些Collation?

show collation;

mysql的这几个坑你踩过没?真是防不胜防

从上图中我们可以找到utf8_bin,这个表示二进制格式的数据,我们设置成种类型的试试。

mysql的这几个坑你踩过没?真是防不胜防

修改一下字段类型

ALTER TABLE test_a MODIFY COLUMN a VARCHAR(20) BINARY CHARACTER SET utf8 COLLATE utf8_bin DEFAULT NULL;

再查看一下数据

select * from test_a where a = 'a';

执行结果:

mysql的这几个坑你踩过没?真是防不胜防

果然,结果对了。

===========

六、特殊字符

笔者之前做项目的时候,提供过一个留言的功能,结果客户端用户输入了一个emoji表情,直接导致接口报错了。

mysql的这几个坑你踩过没?真是防不胜防

最后定位原因是由于当时数据库和表的字符编码都是用的utf8,mysql的utf8编码的一个字符最多3个字节,但是一个emoji表情为4个字节,所以utf8不支持存储emoji表情。

该如何解决这个问题呢?

将字符编码改成utf8mb4,utf8mb4最多能有4字节,不过,在mysql5.5.3或更高的版本才支持。

在mysql 的配置文件 my.cnf 或 my.ini 配置文件中修改如下:

[client]

重启MySQL,然后使用以下命令查看编码,应该全部为utf8mb4,这是修改整个数据库的编码方式。

SHOW VARIABLES WHERE Variable_name LIKE 'character_set_%' OR Variable_name LIKE 'collation%';ji

结果为:

mysql的这几个坑你踩过没?真是防不胜防

也可以单独修改某张表的编码方式:

alter table test_a convert to character set utf8mb4 collate utf8mb4_bin;

以及修改某个字段的编码方式:

ALTER TABLE test_a CHANGE a a VARCHAR(20) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin;

此外,建议同学们在创建数据库和表的时候字符编码都定义成utf8mb4,避免一些不必要的问题。

     如果这篇文档对您有所帮助的话,麻烦关注一下我的公众账号:苏三说技术,或者帮忙点赞或转发,坚持原创不易,您的支持是我坚持最大的动力。后面我会分享更多更实用的干货,谢谢大家的支持。

mysql的这几个坑你踩过没?真是防不胜防

本文分享自微信公众号 - 苏三说技术(gh_9f551dfec941)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Stella981 Stella981
3年前
KVM调整cpu和内存
一.修改kvm虚拟机的配置1、virsheditcentos7找到“memory”和“vcpu”标签,将<namecentos7</name<uuid2220a6d1a36a4fbb8523e078b3dfe795</uuid
Easter79 Easter79
3年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
为什么mysql不推荐使用雪花ID作为主键
作者:毛辰飞背景在mysql中设计表的时候,mysql官方推荐不要使用uuid或者不连续不重复的雪花id(long形且唯一),而是推荐连续自增的主键id,官方的推荐是auto_increment,那么为什么不建议采用uuid,使用uuid究
Python进阶者 Python进阶者
1年前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这