mysql存储emoji表情问题

2018-01-11 12:48:34来源:oschina作者:技术缘人点击

分享

mysql的utf8编码的一个字符最多3个字节,但是一个emoji表情为4个字节,所以utf8不支持存储emoji表情。但是utf8的超集utf8mb4一个字符最多能有4字节,所以能支持emoji表情的存储。下面介绍了关于如何修改mysql数据库的编码格式变为utf8mb4的具体方法。


Linux系统中mysql的配置文件为my.cnf。


Winows中的配置文件为my.ini。


1.修改mysql的配置文件

找到/etc/mysql路径下的my.cnf文件,通过vi命令打开该文件并进行编辑,需添加如下所示配置:


[client]


default-character-set=utf8mb4


[mysqld]


character-set-client-handshake = FALSE


character-set-server = utf8mb4


collation-server = utf8mb4_unicode_ci


init_connect=’SET NAMES utf8mb4'

[mysql]


default-character-set=utf8mb4

修改完毕之后,通过wq保存退出


2.修改database/table和column的字符集

1) 修改database的字符集:


ALTER DATABASE 数据库名 CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci;


示例:


ALTER DATABASE xxxdb CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci;


2) 步骤1)执行完成之后,需要执行use 数据库名,指明当前需要进行字符集修改的数据库;示例:use xxxdb;


3)修改table的字符集:


ALTER TABLE 表名 CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;


示例:


ALTER TABLE user_comments CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;


4) 修改column的字符集:


ALTER TABLE表名CHANGE字段名字段名该字段原来的数据类型CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;


示例:


ALTER TABLE user_comments CHANGE content content TEXT CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

上述修改完毕,exit退出mysql


3.重启mysql

这里重启的时候我一开始用的是service mysql restart,最后发现这条命令并不管用,重启没有成功,导致后面查看字符集的时候,并没有达到想要的字符集的状态。


所以采用下面的方法才可以正确的重启mysql.


3.1停止msql的运行

通过/etc/init.d/mysql执行stop命令


3.2启动mysql

通过/etc/init.d/mysql执行start命令


4.检查字符集:

进入mysql中,用SHOW VARIABLES WHERE Variable_name LIKE 'character/_set/_%' OR Variable_name LIKE 'collation%';命令查看字符集的情况


上述步骤实现之后便可成功使用emoji表情存储进mysql数据库的功能了。


由于mysql数据库是需要备份和还原的,所以带有emoji表情的.sql文件的导入和导出的时候需要注意执行时的编码格式,以下为导入与导出的具体操作:

5.带有emoji表情的sql文件的导入与导出(主要为windows中的导出)

(若是在服务端的代码中的导出为:mysqldump –default-character-set-utf8mb4 –u 用户名 –p 数据库名 > 导出该文件的物理路径;导入的命令不需要指明编码格式,只需要正常的执行命令便可)


5.1导出

在进行把后缀名为.sql的文件,且文件数据中包含emoji表情的数据,进行备份导出的时候,此时不要使用第三方软件进行导出,而是使用命令行的形式执行该导出动作,其主要原因是使用第三方导出该文件时,由于其默认的导出的编码格式为utf-8,该编码格式最多只支持3个字节,而一个emoji表情有4个字节,这将导致emoji表情的数据变成乱码。所以在本地导出的时候具体操作步骤如下:


一、 打开cmd,先找到mysqldump这个执行文件所在的路径;


二、 在路径后输入mysqldump –default-character-set-utf8mb4 –u 用户名 –p 数据库名 > 导出该文件的物理路径,按“Enter”,即可完成导出功能,在导出的物理路径中即可找到已被导出的该文件。


5.2导入

把Linux系统中的.sql文件导入到本地的时候,不要使用Navicat Premium来进行导入,而是使用如下所示的命令行中的source .sql文件的物理路径,来进行如下的导入。


6.数据库后期添加支持 emoji 表情


只需要把数据表中对应的column(字段)改为 utf8mb4 格式,然后代码中临时切换表结构为 utf8mb4 。


mysql_query("set names utf8mb4");


TP3 框架中 可以使用


M('User')->execute("set names utf8mb4");
$res = M('User')->field('id,nickname,portrait,sex')->where(['uid'=>2])->find();
M('User')->execute("set names utf8");

M('User')->execute("set names utf8"):


TP5 框架中 可以使用


Db::connect("db_topic")->execute("set names utf8mb4");//临时更改数据库字符集
$res = Db::connect("db_topic")->table('zww_topic_user')->insert($data);
Db::connect("db_topic")->execute("set names utf8"); //还原数据库字符集

最新文章

123

最新摄影

微信扫一扫

第七城市微信公众平台