共計 2754 個字符,預計需要花費 7 分鐘才能閱讀完成。
這篇文章主要講解了“mysql 的 join 查詢和多次查詢方法是什么”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著丸趣 TV 小編的思路慢慢深入,一起來研究和學習“mysql 的 join 查詢和多次查詢方法是什么”吧!
join 查詢和多次查詢比較
MySQL 多表關聯查詢效率高點還是多次單表查詢效率高?
在數據量不夠大的時候,用 join 沒有問題,但是一般都會拉到 service 層上去做
第一:單機數據庫計算資源很貴,數據庫同時要服務寫和讀,都需要消耗 CPU,為了能讓數據庫的吞吐變得更高,而業務又不在乎那幾百微妙到毫秒級的延時差距,業務會把更多計算放到 service 層做,畢竟計算資源很好水平擴展,數據庫很難啊,所以大多數業務會把純計算操作放到 service 層做,而將數據庫當成一種帶事務能力的 kv 系統來使用,這是一種重業務,輕 DB 的架構思路
第二:很多復雜的業務可能會由于發展的歷史原因,一般不會只用一種數據庫,一般會在多個數據庫上加一層中間件,多個數據庫之間就沒辦法 join 了,自然業務會抽象出一個 service 層,降低對數據庫的耦合。
第三:對于一些大型公司由于數據規模龐大,不得不對數據庫進行分庫分表,對于分庫分表的應用,使用 join 也受到了很多限制,除非業務能夠很好的根據 sharding key 明確要 join 的兩個表在同一個物理庫中。而中間件一般對跨庫 join 都支持不好。
舉一個很常見的業務例子,在分庫分表中,要同步更新兩個表,這兩個表位于不同的物理庫中,為了保證數據一致性,一種做法是通過分布式事務中間件將兩個更新操作放到一個事務中,但這樣的操作一般要加全局鎖,性能很捉急,而有些業務能夠容忍短暫的數據不一致,怎么做?讓它們分別更新唄,但是會存在數據寫失敗的問題,那就起個定時任務,掃描下 A 表有沒有失敗的行,然后看看 B 表是不是也沒寫成功,然后對這兩條關聯記錄做訂正,這個時候同樣沒法用 join 去實現,只能將數據拉到 service 層應用自己來合并了。。。
事實上,用分解關聯查詢的方式重構查詢具有如下優勢:
讓緩存的效率更高。
許多應用程序可以方便地緩存單表查詢對應的結果對象。另外對于 MySQL 的查詢緩存來說,如果關聯中的某個表發生了變化,那么就無法使用查詢緩存了,而拆分后,如果某個表很少改變,那么基于該表的查詢就可以重復利用查詢緩存結果了。
將查詢分解后,執行單個查詢可以減少鎖的競爭。
在應用層做關聯,可以更容易對數據庫進行拆分,更容易做到高性能和可擴展。
查詢本身效率也可能會有所提升
可以減少冗余記錄的查詢。
更進一步,這樣做相當于在應用中實現了哈希關聯,而不是使用 MySQL 的嵌套環關聯,某些場景哈希關聯的效率更高很多。
查詢語句 join、on、where 執行順序
MySQL 的執行順序
一、典型 SELECT 語句完整的執行順序
1)from 子句組裝來自不同數據源的數據;
2)使用 on 進行 join 連接的數據篩選
3)where 子句基于指定的條件對記錄行進行篩選;
4)group by 子句將數據劃分為多個分組;
5)cube,rollup
6)使用聚集函數進行計算;
7)使用 having 子句篩選分組;
8)計算所有的表達式;
9)計算 select 的字段;
10)使用 distinct 進行數據去重
11)使用 order by 對結果集進行排序。
12)選擇 TOPN 的數據
二、from
如果是采用的 關聯 from tableA, tableB,這 2 個表會先組織進行笛卡爾積,然后在進行下面的 where、group by 等操作。
三、on
如果使用 left join,inner join 或者 outer full join 的時候,使用 on 進行條件篩選后,在進行 join。
看下面的 2 個 sql 和結果。2 者的區別僅僅是在 on 后面的一個語句在 on 和 where 位置的不同。由此可以看出是先通過 on 進行條件篩選,然后在 join,最后在進行 where 條件篩選。
假如:是先進行 join,在進行 on 的話,會產生一個笛卡爾積,然后在篩選。這樣的 left join 和 直連接 沒有任何的區別。所以肯定是先 on 條件篩選后,在進行 join。
假如:是在進行 where 后,在 on,在進行 join,下面 2 個 sql 的返回結果應該是一樣的。由此可以見,where 是針對 join 后的集合進行的篩選。
綜上:先 執行 on 條件篩選,在進行 join,最后進行 where 篩選
SELECT DISTINCT a.domain , b.domain
FROM mal_nxdomains_raw a
LEFT JOIN mal_nxdomains_detail b ON a.domain = b.domain AND b.date = ‘20160403
WHERE a.date = ‘20160403
SELECT DISTINCT a.domain , b.domain
FROM mal_nxdomains_raw a
LEFT JOIN mal_nxdomains_detail b ON a.domain = b.domain #and b.date = ‘20160403
WHERE a.date = ‘20160403
AND b.date = ‘20160403
四、on 條件與 where 條件
1、使用位置
on 條件位置在 join 后面
where 條件在 join 與 on 完成的后面
2、使用對象
on 的使用對象是被關聯表
where 的使用對象可以是主表,也可以是關聯表
3、選擇與使用
主表條件篩選:只能在 where 后面使用。
被關聯表,如果是想縮小 join 范圍,可以放置到 on 后面。如果是關聯后再查詢,可以放置到 where 后面。
如果 left join 中,where 條件有對被關聯表的 關聯字段的 非空查詢,與使用 inner join 的效果后,在進行 where 篩選的效果是一樣的。不能起到 left join 的作用。
五、join 流程
tableA join tableB,從 A 表中拿出一條數據,到 B 表中進行掃描匹配。所以 A 的行數決定查詢次數,B 表的行數決定掃描范圍。例如 A 表 100 條,B 表 200 表,需要 100 次從 A 表中取出一條數據到 B 表中進行 200 次的比對。
相對來說從 A 表取數據消耗的資源比較多。所以盡量 tableA 選擇比較小的表。同時縮小 B 表的查詢范圍。
但是實際應用中,因為二者返回的數據結果不同,使用的索引也不同,導致條件放置在 on 和 where 效率是不一定誰更好。要根據需求來確定。
感謝各位的閱讀,以上就是“mysql 的 join 查詢和多次查詢方法是什么”的內容了,經過本文的學習后,相信大家對 mysql 的 join 查詢和多次查詢方法是什么這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是丸趣 TV,丸趣 TV 小編將為大家推送更多相關知識點的文章,歡迎關注!