当前位置:首页 > 文章列表 > 数据库 > MySQL > 一文搞定MySQL乱码情况

一文搞定MySQL乱码情况

来源:SegmentFault 2023-01-17 17:08:42 0浏览 收藏

对于一个数据库开发者来说,牢固扎实的基础是十分重要的,golang学习网就来带大家一点点的掌握基础知识点。今天本篇文章带大家了解《一文搞定MySQL乱码情况》,主要介绍了MySQL、db,希望对大家的知识积累有所帮助,快点收藏起来吧,否则需要时就找不到了!

先着重介绍一下mysql的字符集,这样能对产生mysql的根源有一个了解。
mysql 的字符集支持有两个方面:字符集(Character set)和排序方式(Collation)。另外对于字符集的支持细化到四个层次: 服务器(server),数据库(database),数据表(table)和连接(connection)。

连上mysql 后使用status 命令,可以看到类似如下输出:

>mysql status Connection id:          305 Current database: Current user:           root@localhost SSL:                    Not in use Current pager:          stdout Using outfile:          '' Using delimiter:        ; Server version:         5.6.23 MySQL Community Server (GPL) Protocol version:       10 Connection:             Localhost via UNIX socket Server characterset:    utf8 Db     characterset:    utf8 Client characterset:    utf8 Conn.  characterset:    utf8

Server characterset 就是mysql默认字符集,当创建数据库没有指定字符集时数据库就采用此默认值。可以在mysql的配置文件中的 mysqld 段中对此值进行修改

[mysqld] port        = 3306 socket      = /tmp/mysql.sock character-set-server = utf8 collation-server = utf8_general_ci

Db     characterset:是当前数据库默认的字符集,当创建表时没有指定字符集,此表就使用当前默认值。例如创建一个 db_test 数据库,字符集使用 latin1

CREATE DATABASE `db_test` CHARACTER SET 'latin1' COLLATE 'latin1_swedish_ci'; use db_test;

然后再使用 status 命令,可以看到这个时候 Db     characterset 变为 latin1 了

>mysql status Connection id:          305 Current database:       db_test Current user:           root@localhost SSL:                    Not in use Current pager:          stdout Using outfile:          '' Using delimiter:        ; Server version:         5.6.23 MySQL Community Server (GPL) Protocol version:       10 Connection:             Localhost via UNIX socket Server characterset:    utf8 Db     characterset:    latin1 Client characterset:    utf8 Conn.  characterset:    utf8

在数据库中分别创建两种表 test1 和 test2,其中 test1 使用默认字符集, test2 指定字符集为GBK

create table test1 (name varchar(20)); create table test2 (name varchar(20)) default charset=GBK;

使用 show create table 命令查看上述两张表,可以看到 test1 使用了当前数据库的默认字符集latin1,而test2使用的字符集是GBK。

mysql> show create table test1; +-------+-------------------------------------------------------------------------------------------------+ | Table | Create Table                                                                                    | +-------+-------------------------------------------------------------------------------------------------+ | test1 | CREATE TABLE `test1` (  `name` varchar(20) DEFAULT NULL ) ENGINE=InnoDB DEFAULT CHARSET=latin1 | +-------+-------------------------------------------------------------------------------------------------+ mysql> show create table test2; +-------+----------------------------------------------------------------------------------------------+ | Table | Create Table                                                                                 | +-------+----------------------------------------------------------------------------------------------+ | test2 | CREATE TABLE `test2` (  `name` varchar(20) DEFAULT NULL ) ENGINE=InnoDB DEFAULT CHARSET=gbk | +-------+----------------------------------------------------------------------------------------------+

mysql 存储信息最终是已二进制的形式来存储的。所以在存储之前就需要对信息进行编码,同时从数据库读取信息后需要解码。具体使用那种编码、解码方式就是根据Client characterset以及表对应的字符集,如果没有显示的指定,那么会有一个默认值。当使用命令行的方式连接mysql,可以在mysql 配置中 mysql 段来指定默认Client characterset。例如:

[client] port        = 3306 socket      = /tmp/mysql.sock default-character-set   = utf8

也可以使用在连接时候指定

mysql -uroot -p --default-character-set=utf8

另外在登录mysql 后也可以使用 set names 来指定

set names utf8

关于优先级,set names utf8 最高,mysql -uroot -p --default-character-set=utf8 其次、my.cnf 最后。

上面对字符集做了一个简单的介绍,建议大家也把上面的mysql 命令试一下,这样理解或更加深刻。现在再来说一下乱码的情况,一般出现乱码就是因为字符集(编码)不同,换句话说就是当字符集(编码)一致时就不会出现乱码。前面介绍了一下字符集,所以知道了好几种,那到底是需要什么字符集一致呢?答案是:Client characterset 与 数据库表的字符集。 下面还是通过例子来说明,使用上面创建的表 test1。

由于test1使用的字符集是 latin1,那么使用下面的方式连上mysql

mysql -uroot -p  db_test --default-character-set=latin1

再次确认一下Client characterset 与 数据库表的字符集

mysql> status -------------- mysql  Ver 14.14 Distrib 5.6.23, for osx10.8 (x86_64) using  EditLine wrapper Connection id:          310 Current database:       db_test Current user:           root@localhost SSL:                    Not in use Current pager:          stdout Using outfile:          '' Using delimiter:        ; Server version:         5.6.23 MySQL Community Server (GPL) Protocol version:       10 Connection:             Localhost via UNIX socket Server characterset:    utf8 Db     characterset:    latin1 Client characterset:    latin1 Conn.  characterset:    latin1 ------------------------- mysql> show create table test1; +-------+-------------------------------------------------------------------------------------------------+ | Table | Create Table                                                                                    | +-------+-------------------------------------------------------------------------------------------------+ | test1 | CREATE TABLE `test1` (  `name` varchar(20) DEFAULT NULL ) ENGINE=InnoDB DEFAULT CHARSET=latin1 | +-------+-------------------------------------------------------------------------------------------------+

可以看到Client characterset与表的字符集是一致的,然后插入一条含有中文的记录,同时查询看看。

mysql> insert into test1(name) values('中test文1234测试'); mysql> select * from test1; +----------------------+ | name                 | +----------------------+ | 中test文1234测试 | +----------------------+

现在证明当Client characterset与表的字符集一致时,没有出现乱码。那现在使用set names 来修改一下 Client characterset 看看效果。

mysql> set names utf8; Query OK, 0 rows affected (0.00 sec) mysql> status -------------- mysql  Ver 14.14 Distrib 5.6.23, for osx10.8 (x86_64) using  EditLine wrapper Connection id:          310 Current database:       db_test Current user:           root@localhost SSL:                    Not in use Current pager:          stdout Using outfile:          '' Using delimiter:        ; Server version:         5.6.23 MySQL Community Server (GPL) Protocol version:       10 Connection:             Localhost via UNIX socket Server characterset:    utf8 Db     characterset:    latin1 Client characterset:    utf8 Conn.  characterset:    utf8 mysql> select * from test1; +--------------------------------------+ | name                                 | +--------------------------------------+ | 中testæ–‡1234测试 | +--------------------------------------+

utf8 出现乱码,再试试gbk

mysql> set names gbk; Query OK, 0 rows affected (0.00 sec) mysql> status -------------- mysql  Ver 14.14 Distrib 5.6.23, for osx10.8 (x86_64) using  EditLine wrapper Connection id:          310 Current database:       db_test Current user:           root@localhost SSL:                    Not in use Current pager:          stdout Using outfile:          '' Using delimiter:        ; Server version:         5.6.23 MySQL Community Server (GPL) Protocol version:       10 Connection:             Localhost via UNIX socket Server characterset:    utf8 Db     characterset:    latin1 Client characterset:    gbk Conn.  characterset:    gbk mysql> select * from test1; +------------------------+ | name                   | +------------------------+ | ???test?1234???? | +------------------------+

上面把Client characterset 设置分别设置为 utf8 或 GBK 后,然后查询都出现了乱码,而且乱码显示还不一样。下面再测试一样不同Client characterset字符集先插入在读取的情况。

mysql -uroot -p  db_test --default-character-set=utf8 mysql> status -------------- mysql  Ver 14.14 Distrib 5.6.23, for osx10.8 (x86_64) using  EditLine wrapper Connection id:          312 Current database:       db_test Current user:           root@localhost SSL:                    Not in use Current pager:          stdout Using outfile:          '' Using delimiter:        ; Server version:         5.6.23 MySQL Community Server (GPL) Protocol version:       10 Connection:             Localhost via UNIX socket Server characterset:    utf8 Db     characterset:    latin1 Client characterset:    utf8 Conn.  characterset:    utf8 mysql> truncate table test1; Query OK, 0 rows affected (0.01 sec) mysql> select * from test1; Empty set (0.00 sec) mysql> insert into test1(name) values('中test文1234测试');                                                                                                                                             Query OK, 1 row affected, 1 warning (0.00 sec) mysql> select * from test1; +--------------+ | name         | +--------------+ | ?test?1234?? | +--------------+

上面的例子说明当字符集不一致出现乱码了。 如果再把Client characterset 修改为和数据库表一致,然后看看刚刚插入的记录是否还是显示乱码

mysql> set names latin1; Query OK, 0 rows affected (0.00 sec) mysql> select * from test1; +--------------+ | name         | +--------------+ | ?test?1234?? | +--------------+ 1 row in set (0.00 sec)

还是乱码,也就是通过字符集设置也无法把乱码还原了。

通过上面这些例子可以得出结论,只有当Client characterset与表的字符集一致才不会出现乱码

到这里,我们也就讲完了《一文搞定MySQL乱码情况》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于mysql的知识点!

版本声明
本文转载于:SegmentFault 如有侵犯,请联系study_golang@163.com删除
详解Mac OS用brew安装LAMP开发环境的步骤详解Mac OS用brew安装LAMP开发环境的步骤
上一篇
详解Mac OS用brew安装LAMP开发环境的步骤
一文分析并总结MySQL安全管理
下一篇
一文分析并总结MySQL安全管理
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 笔灵AI生成答辩PPT:高效制作学术与职场PPT的利器
    笔灵AI生成答辩PPT
    探索笔灵AI生成答辩PPT的强大功能,快速制作高质量答辩PPT。精准内容提取、多样模板匹配、数据可视化、配套自述稿生成,让您的学术和职场展示更加专业与高效。
    23次使用
  • 知网AIGC检测服务系统:精准识别学术文本中的AI生成内容
    知网AIGC检测服务系统
    知网AIGC检测服务系统,专注于检测学术文本中的疑似AI生成内容。依托知网海量高质量文献资源,结合先进的“知识增强AIGC检测技术”,系统能够从语言模式和语义逻辑两方面精准识别AI生成内容,适用于学术研究、教育和企业领域,确保文本的真实性和原创性。
    35次使用
  • AIGC检测服务:AIbiye助力确保论文原创性
    AIGC检测-Aibiye
    AIbiye官网推出的AIGC检测服务,专注于检测ChatGPT、Gemini、Claude等AIGC工具生成的文本,帮助用户确保论文的原创性和学术规范。支持txt和doc(x)格式,检测范围为论文正文,提供高准确性和便捷的用户体验。
    37次使用
  • 易笔AI论文平台:快速生成高质量学术论文的利器
    易笔AI论文
    易笔AI论文平台提供自动写作、格式校对、查重检测等功能,支持多种学术领域的论文生成。价格优惠,界面友好,操作简便,适用于学术研究者、学生及论文辅导机构。
    46次使用
  • 笔启AI论文写作平台:多类型论文生成与多语言支持
    笔启AI论文写作平台
    笔启AI论文写作平台提供多类型论文生成服务,支持多语言写作,满足学术研究者、学生和职场人士的需求。平台采用AI 4.0版本,确保论文质量和原创性,并提供查重保障和隐私保护。
    40次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码