共計(jì) 6673 個(gè)字符,預(yù)計(jì)需要花費(fèi) 17 分鐘才能閱讀完成。
本篇文章給大家分享的是有關(guān) mysql 中字符集亂碼如何解決,丸趣 TV 小編覺得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著丸趣 TV 小編一起來看看吧。
解決 mysql 字符集亂碼的問題
character-set-server/default-character-set:服務(wù)器字符集,默認(rèn)情況下所采用的。
character-set-database:數(shù)據(jù)庫字符集。
character-set-table:數(shù)據(jù)庫表字符集。
優(yōu)先級依次增加。所以一般情況下只需要設(shè)置 character-set-server,而在創(chuàng)建數(shù)據(jù)庫和表時(shí)不特別指定字符集,這樣統(tǒng)一采用 character-set-server 字符集。
character-set-client:客戶端的字符集。客戶端默認(rèn)字符集。當(dāng)客戶端向服務(wù)器發(fā)送請求時(shí),請求以該字符集進(jìn)行編碼。 www.2cto.com
character-set-results:結(jié)果字符集。服務(wù)器向客戶端返回結(jié)果或者信息時(shí),結(jié)果以該字符集進(jìn)行編碼。
在客戶端,如果沒有定義 character-set-results,則采用 character-set-client 字符集作為默認(rèn)的字符集。所以只需要設(shè)置 character-set-client 字符集。
要處理中文,則可以將 character-set-server 和 character-set-client 均設(shè)置為 GB2312,如果要同時(shí)處理多國語言,則設(shè)置為 UTF8。
關(guān)于 MySQL 的中文問題
解決亂碼的方法是,在執(zhí)行 SQL 語句之前,將 MySQL 以下三個(gè)系統(tǒng)參數(shù)設(shè)置為與服務(wù)器字符集 character-set-server 相同的字符集。
character_set_client:客戶端的字符集。
character_set_results:結(jié)果字符集。
character_set_connection:連接字符集。
設(shè)置這三個(gè)系統(tǒng)參數(shù)通過向 MySQL 發(fā)送語句:set names gb2312
關(guān)于 GBK、GB2312、UTF8
UTF- 8:Unicode Transformation Format-8bit,允許含 BOM,但通常不含 BOM。是用以解決國際上字符的一種多字節(jié)編碼,它對英文使用 8 位(即一個(gè)字節(jié)),中文使用 24 為(三個(gè)字節(jié))來編碼。UTF- 8 包含全世界所有國家需要用到的字符,是國際編碼,通用性強(qiáng)。UTF- 8 編碼的文字可以在各國支持 UTF8 字符集的瀏覽器上顯示。如,如果是 UTF8 編碼,則在外國人的英文 IE 上也能顯示中文,他們無需下載 IE 的中文語言支持包。
GBK 是國家標(biāo)準(zhǔn) GB2312 基礎(chǔ)上擴(kuò)容后兼容 GB2312 的標(biāo)準(zhǔn)。GBK 的文字編碼是用雙字節(jié)來表示的,即不論中、英文字符均使用雙字節(jié)來表示,為了區(qū)分中文,將其最高位都設(shè)定成 1。GBK 包含全部中文字符,是國家編碼,通用性比 UTF8 差,不過 UTF8 占用的數(shù)據(jù)庫比 GBD 大。
GBK、GB2312 等與 UTF8 之間都必須通過 Unicode 編碼才能相互轉(zhuǎn)換:
GBK、GB2312--Unicode--UTF8 www.2cto.com
UTF8--Unicode--GBK、GB2312
對于一個(gè)網(wǎng)站、來說,如果英文字符較多,則建議使用 UTF-8 節(jié)省空間。不過現(xiàn)在很多論壇的插件一般只支持 GBK。
GB2312 是 GBK 的子集,GBK 是 GB18030 的子集
GBK 是包括中日韓字符的大字符集合
如果是中文的網(wǎng)站 推薦 GB2312 GBK 有時(shí)還是有點(diǎn)問題
為了避免所有亂碼問題,應(yīng)該采用 UTF-8,將來要支持國際化也非常方便
UTF- 8 可以看作是大字符集,它包含了大部分文字的編碼。
使用 UTF- 8 的一個(gè)好處是其他地區(qū)的用戶(如香港臺灣)無需安裝簡體中文支持就能正常觀看你的文字而不會出現(xiàn)亂碼。
gb2312 是簡體中文的碼
gbk 支持簡體中文及繁體中文
big5 支持繁體中文
utf- 8 支持幾乎所有字符
首先分析亂碼的情況
1. 寫入數(shù)據(jù)庫時(shí)作為亂碼寫入
2. 查詢結(jié)果以亂碼返回
究竟在發(fā)生亂碼時(shí)是哪一種情況呢?
我們先在 mysql 命令行下輸入
show variables like %char%
查看 mysql 字符集設(shè)置情況:
mysql show variables like %char%
+————————–+—————————————-+
| Variable_name | Value |
+————————–+—————————————-+
| character_set_client | gbk |
| character_set_connection | gbk |
| character_set_database | gbk |
| character_set_filesystem | binary |
| character_set_results | gbk |
| character_set_server | gbk |
| character_set_system | utf8 |
| character_sets_dir | /usr/local/mysql/share/mysql/charsets/ |
+————————–+—————————————-+
在查詢結(jié)果中可以看到 mysql 數(shù)據(jù)庫系統(tǒng)中客戶端、數(shù)據(jù)庫連接、數(shù)據(jù)庫、文件系統(tǒng)、查詢
結(jié)果、服務(wù)器、系統(tǒng)的字符集設(shè)置
在這里,文件系統(tǒng)字符集是固定的,系統(tǒng)、服務(wù)器的字符集在安裝時(shí)確定,與亂碼問題無關(guān)
亂碼的問題與客戶端、數(shù)據(jù)庫連接、數(shù)據(jù)庫、查詢結(jié)果的字符集設(shè)置有關(guān)
* 注:客戶端是看訪問 mysql 數(shù)據(jù)庫的方式,通過命令行訪問,命令行窗口就是客戶端,通
過 JDBC 等連接訪問,程序就是客戶端 www.2cto.com
我們在向 mysql 寫入中文數(shù)據(jù)時(shí),在客戶端、數(shù)據(jù)庫連接、寫入數(shù)據(jù)庫時(shí)分別要進(jìn)行編碼轉(zhuǎn)
換
在執(zhí)行查詢時(shí),在返回結(jié)果、數(shù)據(jù)庫連接、客戶端分別進(jìn)行編碼轉(zhuǎn)換
現(xiàn)在我們應(yīng)該清楚,亂碼發(fā)生在數(shù)據(jù)庫、客戶端、查詢結(jié)果以及數(shù)據(jù)庫連接這其中一個(gè)或多
個(gè)環(huán)節(jié)
接下來我們來解決這個(gè)問題
在登錄數(shù)據(jù)庫時(shí),我們用 mysql –default-character-set= 字符集 -u root -p 進(jìn)行連接,這時(shí)我們
再用 show variables like %char% 命令查看字符集設(shè)置情況,可以發(fā)現(xiàn)客戶端、數(shù)據(jù)庫連接、
查詢結(jié)果的字符集已經(jīng)設(shè)置成登錄時(shí)選擇的字符集了
如果是已經(jīng)登錄了,可以使用 set names 字符集; 命令來實(shí)現(xiàn)上述效果,等同于下面的命令:
set character_set_client = 字符集
set character_set_connection = 字符集
set character_set_results = 字符集
如果是通過 JDBC 連接數(shù)據(jù)庫,可以這樣寫 URL:
URL=jdbc:mysql://localhost:3306/abs?useUnicode=true characterEncoding= 字符集
JSP 頁面等終端也要設(shè)置相應(yīng)的字符集
數(shù)據(jù)庫的字符集可以修改 mysql 的啟動配置來指定字符集,也可以在 create database 時(shí)加上
default character set 字符集來強(qiáng)制設(shè)置 database 的字符集
通過這樣的設(shè)置,整個(gè)數(shù)據(jù)寫入讀出流程中都統(tǒng)一了字符集,就不會出現(xiàn)亂碼了
為什么從命令行直接寫入中文不設(shè)置也不會出現(xiàn)亂碼?
可以明確的是從命令行下,客戶端、數(shù)據(jù)庫連接、查詢結(jié)果的字符集設(shè)置沒有變化
輸入的中文經(jīng)過一系列轉(zhuǎn)碼又轉(zhuǎn)回初始的字符集,我們查看到的當(dāng)然不是亂碼
但這并不代表中文在數(shù)據(jù)庫里被正確作為中文字符存儲
舉例來說,現(xiàn)在有一個(gè) utf8 編碼數(shù)據(jù)庫,客戶端連接使用 GBK 編碼,connection 使用默認(rèn)
的 ISO8859-1(也就是 mysql 中的 latin1),我們在客戶端發(fā)送“中文”這個(gè)字符串,客戶端
將發(fā)送一串 GBK 格式的二進(jìn)制碼給 connection 層,connection 層以 ISO8859-1 格式將這段
二進(jìn)制碼發(fā)送給數(shù)據(jù)庫,數(shù)據(jù)庫將這段編碼以 utf8 格式存儲下來,我們將這個(gè)字段以 utf8
格式讀取出來,肯定是得到亂碼,也就是說中文數(shù)據(jù)在寫入數(shù)據(jù)庫時(shí)是以亂碼形式存儲的,
在同一個(gè)客戶端進(jìn)行查詢操作時(shí),做了一套和寫入時(shí)相反的操作,錯誤的 utf8 格式二進(jìn)制
碼又被轉(zhuǎn)換成正確的 GBK 碼并正確顯示出來。
/****************java、中設(shè)置編碼 ***************************/
首先說在 java 里那些地方能夠設(shè)置編碼
下面兩種設(shè)置編碼格式方法適用于 jsp 頁面 (*.jsp)
%@ page language= java import= java.util.* pageEncoding= UTF-8 %
%@ page contentType= text/html; charset=UTF-8 %
下面方式適合于 jsp、servlet、action 中 (*.java)
request.setCharacterEncoding(UTF-8
response.setCharacterEncoding(UTF-8
下面適合 html 頁面 (*.htm;*.html)
meta http-equiv= content-type content= text/html; charset=UTF-8
www.2cto.com
Tomcate 設(shè)置編碼(server.xml)
Connector 其他省略 port= 80 URIEncoding= UTF-8
mysql 設(shè)置編碼命令
SET character_set_client = utf8;
SET character_set_connection = utf8;
SET character_set_database = utf8;
SET character_set_results = utf8;/* 這里要注意很有用 */
SET character_set_server = utf8;
SET collation_connection = utf8_bin;
SET collation_database = utf8_bin;
SET collation_server = utf8_bin;
my.ini 中配置默認(rèn)編碼
default-character-set=utf8
連接設(shè)置編碼
jdbc:://192.168.0.5:3306/test?characterEncoding=utf8
/*****************************************java 與 mysq 編碼對應(yīng) ****************************************/
java 中的常用編碼 UTF-8;GBK;GB2312;ISO-8859-1;
對應(yīng) my 中的編碼 utf8;gbk;gb2312;latin1
/******************************************** 過濾器使用 *********************************************/
// 過濾器設(shè)置編碼過濾 (SetCharacterEncodingFilter.java)
package com.sorc;
import java.io.*;
import javax.servlet.*;
import javax.servlet.http.*;
public class SetCharacterEncodingFilter extends HttpServlet implements Filter{
private FilterConfig filterConfig;
private String encoding=null;
//Handle the passed-in FilterConfig
public void init(FilterConfig filterConfig){
this.filterConfig=filterConfig;
encoding=filterConfig.getInitParameter(encoding
}
//Process the request/response pair
public void doFilter(ServletRequest request,ServletResponse response,FilterChain filterChain){
try{
request.setCharacterEncoding(encoding);
filterChain.doFilter(request,response);
} catch(ServletException sx){
filterConfig.getServletContext().log(sx.getMessage());
} catch(IOException iox){
filterConfig.getServletContext().log(iox.getMessage());
}
}
//Clean up resources
public void destroy(){
} www.2cto.com
}
//web.xml 配置過濾器方法(web.xmd)
filter
filter-name setcharacterencodingfilter /filter-name
filter-class com.sorc.SetCharacterEncodingFilter /filter-class
init-param
param-name encoding /param-name
param-value utf8 /param-value
/init-param
/filter
filter-mapping
filter-name setcharacterencodingfilter /filter-name
url-pattern /* /url-pattern
/filter-mapping
/*************** 有了上面的基礎(chǔ)下面試完滿解決方案 *****************************************/
1. 使用 GBK 編碼的解決方案
這個(gè)最簡單 遇到設(shè)置編碼的地方就是用 GBK 數(shù)據(jù)庫 gbk 然后在使用個(gè)過濾器過濾編碼為 gbk 一切搞定。
效果為添加數(shù)據(jù)無亂碼 讀出無亂碼 數(shù)據(jù)庫管理工具無亂碼 到處 sql 結(jié)構(gòu)和數(shù)據(jù)無亂碼
2. 使用 UTF- 8 編碼解決方案
所有編碼都設(shè)置為 UTF-8
數(shù)據(jù)庫編碼 utf8
設(shè)置過濾器編碼 utf8
數(shù)據(jù)庫連接?characterEncoding=utf8
然后在數(shù)據(jù)庫管理工具或 mysql 命令行 運(yùn)行 SET character_set_results = gbk;
效果為添加數(shù)據(jù)無亂碼 讀出無亂碼 數(shù)據(jù)庫管理工具無亂碼 到處 sql 結(jié)構(gòu)和數(shù)據(jù)時(shí)存在亂碼
3. 頁面使用 UTF8 數(shù)據(jù)庫使用 latin1 的解決方案
jap java tomcat 設(shè)置為 UTF-8 www.2cto.com
過濾器 utf8
數(shù)據(jù)庫連接?characterEncoding=latin1
數(shù)據(jù)庫其他 latin1
然后在數(shù)據(jù)庫管理工具或 mysql 命令行 運(yùn)行 SET character_set_results = gbk;
效果為添加數(shù)據(jù)無亂碼 讀出無亂碼 數(shù)據(jù)庫管理工具無亂碼 到處 sql 結(jié)構(gòu)和數(shù)據(jù)時(shí)存在亂碼
以上就是 mysql 中字符集亂碼如何解決,丸趣 TV 小編相信有部分知識點(diǎn)可能是我們?nèi)粘9ぷ鲿姷交蛴玫降摹OM隳芡ㄟ^這篇文章學(xué)到更多知識。更多詳情敬請關(guān)注丸趣 TV 行業(yè)資訊頻道。