共計 4548 個字符,預計需要花費 12 分鐘才能閱讀完成。
本篇內容介紹了“MySQL 索引創建原則是什么”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓丸趣 TV 小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
一、適合創建索引 1、字段的數值有唯一性限制
根據 Alibaba 規范,指明在業務上具有唯一特性的字段,即使是組合字段,也必須建成唯一索引。
例如,學生表中的學號時具有唯一性的字段,為該字段建立唯一性索引可以快速查詢出某個學生的信息,如果使用姓名的話,可能存在同名的情況,從而降低查詢速度。
2、頻繁作為 Where 查詢條件的字段
某個字段在 Select 語句的 Where 條件中經常被使用到,那么就需要給這個字段創建索引,尤其實在數據量大的情況下,創建普通索引就可以大幅提升查詢效率。
比如測試表 student_info 有 100 萬數據,假設查詢 student_id=112322 的用戶信息,如果沒有對 student_id 字段創建索引,查詢結果如下:
select course_id, class_id, name, create_time,student_id from student_info where student_id = 112322;# 花費 211ms
為 student_id 創建索引后,查詢結果如下:
alter table student_info add index idx_sid(student_id);
select course_id, class_id, name, create_time,student_id from student_info where student_id = 112322;# 花費 3ms
3、經常 Group by 和 Order by 的列
索引就是讓數據按照某種順序進行存儲或檢索,因此當使用 Group by 對數據進行分組查詢或使用 Order by 對數據進行排序的時候,就需要對分組或排序的字段進行索引。如果待排序的列有多個,那可以在這些列上建立組合索引。
比如,按照 student_id 對學生選秀的課程進行分組,顯示不同的 student_id 和課程的數量,顯示 100 條。如果不對 student_id 創建索引,查詢結果如下:
select student_id,count(*) as num from student_info group by student_id limit 100;# 花費 2.466s
為 student_id 創建索引后,查詢結果如下:
alter table student_info add index idx_sid(student_id);
select student_id,count(*) as num from student_info group by student_id limit 100;# 花費 6ms
對于既有 group by 又有 order by 的查詢語句,建議最好建立聯合索引,并且將 group by 中的字段放到 order by 字段的前邊,滿足 lsquo; 最左前綴匹配原則 rsquo;,這樣索引的利用率就會高,自然查詢的效率也就會高;同時 8.0 之后的版本支持降序索引,如果 order by 之后的字段時降序的,可以考慮直接創建降序索引,也會提高查詢效率。
4、Update、Delete 的 where 條件列
對數據按照某個條件進行查詢后再進行 Update 或 Delete 的操作,如果對 Where 字段創建了索引,就能答復提升效率。原因是因為需要先根據 Where 條件列檢索出來這條記錄,然后再對他進行更新或刪除。如果進行更新的時候,更新的字段是非索引字段,提升效率會更明顯,這是因為費索引字段更新不需要對所以進行維護。
比如對 student_info 表中的 name 字段為 sdfasdfas123123 的數據修改 student_id 為 110119,在沒有對 name 字段建立索引的情況下,執行情況如下:
update student_info set student_id = 110119 where name = sdfasdfas123123 #花費 549ms
添加索引后,執行情況如下:
alter table student_info add index idx_name(name);
update student_info set student_id = 110119 where name = sdfasdfas123123 #花費 2ms
5、Distinct 字段需要創建索引
有時候需要對某個字段進行去重,使用 Distinct,那么對這個創建索引也會提升查詢效率。
比如查詢課程表中不同 student_id 都有哪些,如果沒有為 student_id 創建索引,執行情況如下:
select distinct(student_id) from student_id;# 花費 2ms
創建索引后,執行情況如下:
alter table student_info add index idx_sid(student_id);
select distinct(student_id) from student_id;# 花費 0.1ms
6、多表 Join 連接操作時,創建索引注意事項
首先,連接表的數據量盡量不超過 3 張,因為每增加一張表就相當于增加了一次嵌套的循環,數量級增長非常快,嚴重影響查詢效率。其次,對 Where 條件創建索引,因為 Where 才是對數據條件的過濾,如果再數據量非常大的情況下,沒有 Where 條件過濾時非常可怕的,最后,對于連接的字段創建索引,并且改字段再多張表中類型必須一致。
比如,只對 student_id 創建索引,查詢結果如下:
select course_id, name, student_info.student_id,course_name
from student_info join course
on student_info.course_id = course.course_id
where name = aAAaAA # 花費 176ms
給 name 字段創建索引后,查詢結果如下:
alter table student_info add index idx_name(name);
select course_id, name, student_info.student_id,course_name
from student_info join course
on student_info.course_id = course.course_id
where name = aAAaAA # 花費 2ms
7、使用列的類型小的創建索引
這里所說的類型小值意思是該類型表示的數據范圍的大小。比如在定義表結構的時候要顯示的指定列的類型,以整數類型為例,有 TINYINT、MEDIUMINT、INT、BIGINT 等,他們占用的存儲空間依次遞增,能表示的數據范圍也是一次遞增。如果相對某個整數列建立索引的話,在表示的整數范圍允許的情況下,盡量讓索引列使用較小的類型,例如能使用 INT 不要使用 BIGINT,能使用 MEDIUMINT 不使用 INT,原因如下:
數據類型越小,在查詢時進行的比較操作越快
數據類型越小,索引占用的空間就越少,在一個數據頁內就可以存下更多的記錄,從而減少磁盤 I / O 帶來的性能損耗,也就意味著可以存儲更多的數據在數據頁中,提高讀寫效率。
上述對于主鍵來說很合適,因為在聚簇索引中既存儲了數據,也存儲了索引,可以很好的減少磁盤 I /O;而對于二級索引來說,還需要一次回表操作才能查到完整的數據,也就能加了一次磁盤 I /O。
8、使用字符串前綴創建索引
根據 Alibaba 開發手冊,在字符串上建立索引時,必須指定索引長度,沒有必要對全字段建立索引。
比如有一張商品表,表中的商品描述字段較長,在描述字段上建立前綴索引如下:
create table product(id int, desc varchar(120) not null);
alter table product add index(desc(12));
區分度的計算可以使用 count(distinct left( 列名, 索引長度))/count(*) 來確定。
9、區分度高的列適合作為索引
列的基數值得時某一列中不重復數據的個數,比如說某個列包含值 2,5,3,6,2,7,2,雖然有 7 條記錄,但該列的基數卻是 5,也就是說,在記錄行數一定的情況下,列的基數越大,該列中的值就越分散;列的基數越小,該列中的值就越集中。這里列的基數指標非常重要,直接影響是否能有效利用索引。最好為列的基數大的列建立索引,為基數太小的列建立索引效果反而不好。
可以使用公式 select count(distinct col)/count(*) from table 來計算區分度,越接近 1 區分度越好。
10、使用最頻繁的列放到聯合索引的左側
這條就是通常說的最左前綴匹配原則。通俗來講就是將 Where 條件后經常使用的條件字段放在索引的最左邊,將使用頻率相對低的放到右邊。
11、在多個字段都要創建索引的情況下,聯合索引由于單值索引二、不適合創建索引 1、在 where 中使用不到的字段不要設置索引
通常索引的建立是有代價的,如果建立索引的字段沒有出現在 where 條件(包括 group by、order by) 中,建議一開始就不要創建索引或將索引刪除,因為索引的存在也會占用空間。
2、數據量小的表最好不要使用索引 3、有大量重復數據的列上不要建立索引
在條件表達式中經常用到的不同值較多的列上建立索引,但字段中如果有大量重復數據,也不用創建索引。比如學生表中的性別字段,只有男和女兩種值,因此無需建立索引。如果建立索引,不但不會提高查詢效率,反而會嚴重降低數據更新速度。
4、避免對經常更新的表創建過多的索引
頻繁更新的字段不一定要創建索引,因為更新數據的時候,索引也要跟著更新,如果索引太多,更新的時候會造成服務器壓力,從而影響效率。
避免對經常更新的表創建過多的索引,并且索引中的列盡可能少。此時雖然提高了查詢速度,同時也會降低更新表的速度。
5、不建議用無序的值作為索引
例如身份證、UUID(在索引比較時需要轉為 ASCII,并且插入時可能造成頁分裂)、MD5、HASH、無序長字符串等。
6、刪除不在使用或很少使用的索引
表中的數據被大量更新或者數據的使用方式被改變后,原有的一些索引可能不會被使用到。DBA 應定期找出這些索引并將之刪除,從而較少無用索引對更新操作的影響。
7、不要定義冗余或重復的索引
例如身份證、UUID(在索引比較時需要轉為 ASCII,并且插入時可能造成頁分裂)、MD5、HASH、無序長字符串等。
8、刪除不在使用或很少使用的索引
表中的數據被大量更新或者數據的使用方式被改變后,原有的一些索引可能不會被使用到。DBA 應定期找出這些索引并將之刪除,從而較少無用索引對更新操作的影響。
9、不要定義冗余或重復的索引
“MySQL 索引創建原則是什么”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注丸趣 TV 網站,丸趣 TV 小編將為大家輸出更多高質量的實用文章!