共計 2339 個字符,預計需要花費 6 分鐘才能閱讀完成。
自動寫代碼機器人,免費開通
這篇文章主要介紹 MySQL 統計信息的存儲有哪幾種,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!
MySQL 統計信息的存儲分為兩種,非持久化和持久化統計信息。
一、非持久化統計信息
非持久化統計信息存儲在內存里,如果數據庫重啟,統計信息將丟失。有兩種方式可以設置為非持久化統計信息:
1 全局變量,
INNODB_STATS_PERSISTENT=OFF
2 CREATE/ALTER 表的參數,
STATS_PERSISTENT=0
非持久化統計信息在以下情況會被自動更新:
1 執行 ANALYZE TABLE
2 innodb_stats_on_metadata=ON 情況下,執 SHOW TABLE STATUS, SHOW INDEX, 查詢 INFORMATION_SCHEMA 下的 TABLES, STATISTICS
3 啟用 –auto-rehash 功能情況下,使用 mysql client 登錄
4 表第一次被打開
5 距上一次更新統計信息,表 1 /16 的數據被修改
非持久化統計信息的缺點顯而易見,數據庫重啟后如果大量表開始更新統計信息,會對實例造成很大影響,所以目前都會使用持久化統計信息。
二、持久化統計信息
5.6.6 開始,MySQL 默認使用了持久化統計信息,即 INNODB_STATS_PERSISTENT=ON,持久化統計信息保存在表 mysql.innodb_table_stats 和 mysql.innodb_index_stats。
持久化統計信息在以下情況會被自動更新:
1 INNODB_STATS_AUTO_RECALC=ON
情況下,表中 10% 的數據被修改
2 增加新的索引
innodb_table_stats 是表的統計信息,innodb_index_stats 是索引的統計信息,各字段含義如下:
innodb_table_stats
database_name
數據庫名
table_name
表名
last_update
統計信息最后一次更新時間
n_rows
表的行數
clustered_index_size
聚集索引的頁的數量
sum_of_other_index_sizes
其他索引的頁的數量
innodb_index_stats
database_name
數據庫名
table_name
表名
index_name
索引名
last_update
統計信息最后一次更新時間
stat_name
統計信息名
stat_value
統計信息的值
sample_size
采樣大小
stat_description
類型說明
為更好的理解 innodb_index_stats,建一張測試表做說明:
CREATE TABLE t1 (
a INT, b INT, c INT, d INT, e INT, f INT,
PRIMARY KEY (a, b), KEY i1 (c, d), UNIQUE KEY i2uniq (e, f)
) ENGINE=INNODB;
寫入數據如下:
查看 t1 表的統計信息,需主要關注 stat_name 和 stat_value 字段
tat_name=size 時:stat_value 表示索引的頁的數量
stat_name=n_leaf_pages 時:stat_value 表示葉子節點的數量
stat_name=n_diff_pfxNN 時:stat_value 表示索引字段上唯一值的數量,此處做一下具體說明:
1、n_diff_pfx01 表示索引第一列 distinct 之后的數量,如 PRIMARY 的 a 列,只有一個值 1,所以 index_name= PRIMARY and stat_name= n_diff_pfx01 時,stat_value=1。
2、n_diff_pfx02 表示索引前兩列 distinct 之后的數量,如 i2uniq 的 e,f 列,有 4 個值,所以 index_name= i2uniq and stat_name= n_diff_pfx02 時,stat_value=4。
3、對于非唯一索引,會在原有列之后加上主鍵索引,如 index_name= i1 and stat_name= n_diff_pfx03,在原索引列 c,d 后加了主鍵列 a,(c,d,a) 的 distinct 結果為 2。
了解了 stat_name 和 stat_value 的具體含義,就可以協助我們排查 SQL 執行時為什么沒有使用合適的索引,例如某個索引 n_diff_pfxNN 的 stat_value 遠小于實際值,查詢優化器認為該索引選擇度較差,就有可能導致使用錯誤的索引。
三、統計信息不準確的處理
我們查看執行計劃,發現未使用正確的索引,如果是 innodb_index_stats 中統計信息差別較大引起,可通過以下方式處理:
1、手動更新統計信息,注意執行過程中會加讀鎖:
ANALYZETABLE TABLE_NAME;
2、如果更新后統計信息仍不準確,可考慮增加表采樣的數據頁,兩種方式可以修改:
a) 全局變量 INNODB_STATS_PERSISTENT_SAMPLE_PAGES,默認為 20;
b) 單個表可以指定該表的采樣:
ALTER TABLE TABLE_NAME STATS_SAMPLE_PAGES=40;
經測試,此處 STATS_SAMPLE_PAGES 的最大值是 65535,超出會報錯。
目前 MySQL 并沒有提供直方圖的功能,某些情況下(如數據分布不均)僅僅更新統計信息不一定能得到準確的執行計劃,只能通過 index hint 的方式指定索引。新版本 8.0 會增加直方圖功能,讓我們期待 MySQL 越來越強大的功能吧!
以上是“MySQL 統計信息的存儲有哪幾種”這篇文章的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注丸趣 TV 行業資訊頻道!
向 AI 問一下細節