共計 1965 個字符,預計需要花費 5 分鐘才能閱讀完成。
這篇文章給大家介紹 MySQL 中如何處理字符集,內容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。
MySQL 的字符集怎么處理
發送請求
客戶端 (character_set_client)=》數據庫連接 (character_set_connection)=》存儲 (table,column)
返回請求
存儲 (table,column)=》數據庫連接 (character_set_connection)=》客戶端 (character_set_results)
在每一個非初始節點,都會做一次從上一個結點到當前節點的字符集轉換操作。舉個例子,有如下環境:
character_set_connectionutf-8character_set_resultsgbkcharacter_set_clientgb2312 有表 A,字段字符集全部為 BIG5
發送請求的時候,首先數據從 gbk 轉換為 utf-8,再轉換為 BIG5,然后再存儲。
返回請求的時候,首先數據從 BIG5 轉換為 utf-8,再轉換為 gb2312,然后再發送給客戶端。
MySQL 字符集架構作用有哪些
1. 允許不同的客戶端具有不同的字符集。典型的例子就是,我有一個 utf- 8 的站點,這個站點就是一個 charsetclient 為 utf- 8 的客戶端。與此同時,我有可能需要在一個 gbk 的終端上讀寫數據庫,這又是一個客戶端,不過它的字符集是 gbk。
2. 通過數據庫操作文件系統的時候,需要把文件路徑轉為文件系統的字符集。例如我的客戶端是 gbk,而服務器文件系統是 utf-8。操作”/ A 片 /Rina.rmvb”,發送過去的數據里,“片”的數據和服務器是不一樣的。這時候就需要有個辦法可以把轉換 GBK 的“片”到 utf-8。在這里 MySQL 引入了一個叫 character_filesystem 的東西來完成這個事情。
除此之外,我暫時想不到其他的作用了。但是仔細想想,我們真的需要這樣的處理嗎很多網站,無非就是希望自己的數據能怎么進去就怎么出來。這里又有兩種情況了。
1. 希望可以根據數據進行排序或者做 like 操作。首先說排序,對于包含中文的字段來說,根據字符集排序的概念如同雞肋。簡體中文排序,一般都是希望按拼音來排序。我沒有去真正了解過 MySQL 里的校驗,但是從我接觸過的程序來看,需要做此類排序,都是專門建一個存放拼音的字段來排序。而拼音又存在多音字的情況。如果是 UTF-8,還存在某個區間的中文同時被中日韓三國共用的情況。實現起來不是這么容易,所以 MySQL 無論的 GBK 還是 UTF- 8 的校驗集應該都沒有實現拼音。我敢說,現在國內使用 MySQL 的大多數網站,所用到的校驗集,只是一個 byte 排序而已。而 byte 排序,根本不需要使用什么字符集。所以說對于中文站點,MySQL 字符校驗在排序上沒任何意義。
但是在 like 操作上,倒是有了一點點意義。例如我 like‘%a%’,就有可能匹配到某個中文某個部分含有 a。當然這種情況在 utf- 8 下不會遇到,因為 utf- 8 的存儲格式導致 a 只可能是 a,不可能是一個多字節字符的一部分。但是在其他字符集可能就會有這個問題了。說到最后,like 又變得和 order 一樣使得校驗沒意義了。
2. 如果完全不需要對數據進行排序,like 或者全文檢索,那么請停止使用 char,varchar,text 之類的吧。binary,varbinary,BLOB 才是正確的選擇。binary 之類的在存儲,取出的時候都不會進行字符集轉換,而在排序時候,只根據二進制內容排序,所以在效率上高出 char,varchar,text 很多。
這種情況更不需要字符集了。但是按照目前 MySQL 的架構,在 client 和 connection 之間的字符集操作,是忽略字段類型的,在這兩個節點之間,依然會進行字符集轉換。
另外提一下 PHP 里的設置字符集。大家請不要再使用 mysql_query(”setnamesutf8″) 這樣的語句了。mysql_set_charset() 才是最完整的字符集設置方式。后者比前者多一個設置,就是把 structMySQL 的 charset 成員也設置了。這個成員變量在 escape 的時候起著很重要的作用,特別是對于 GBK 這種運行把“”作為字符一部分的編碼格式。如果你只使用 mysql_query(”setnamesXXX”),那么在某些字符集,會有重大的安全漏洞,導致 mysql_real_escape_string 變得和 addslashes 一樣不安全。
計算機要準確的處理各種字符集文字,需要進行字符編碼,以便計算機能夠識別和存儲各種文字。
關于 MySQL 中如何處理字符集就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。