MongoDB中使用JOIN操作的方法

144次閱讀

共計 3698 個字符，預計需要花費 10 分鐘才能閱讀完成。

自動寫代碼機器人，免費開通

這篇文章給大家分享的是有關 MongoDB 中使用 JOIN 操作的方法的內容。丸趣 TV 小編覺得挺實用的，因此分享給大家做個參考，一起跟隨丸趣 TV 小編過來看看吧。

前言

MongoDB 是由 C ++ 語言所編寫的一種面向文檔的非關系型數據庫 (是一種 NoSql 數據庫實現)，也是介于關系型數據庫和非關系型數據庫之間的數據存儲產品，而眾所周知 SQL 與 NoSQL 最大的不同之一就是不支持 JOIN，在傳統的數據庫中，SQL JOIN 子句允許你使用普通的字段，在兩個或者是更多表中的組合表中的每行數據。例如，如果你有表 books 和 publishers，你可以像下面這樣寫命令：

SELECT book.title, publisher.name
FROM book
LEFT JOIN book.publisher_id ON publisher.id;

換句話說，book 表中的 publisher_id 字段引用了 publishers 表中的 id 字典。這些都是很常見的例子：對于每個 publisher 都可以擁有成千上萬本書，如果你想更新 publisher 的信息的時候，我們只需要更改一條記錄。數據的冗余是很小的，因為我們不需要為每本書來重復更新他的 publisher 信息，這種技術已基本當做一種規范化的東西了。SQL 數據庫提供了一些列的規范與約束條件來保障數據關聯性。

——————————————————————————–

NoSQL == No JOIN?

并不都是這樣吧。。。。。

——————————————————————————–

面向文檔的數據庫，例如 MongoDB，被設計用來存儲非結構化的數據，理想情況下，這些數據是在數據集合中是相互沒有關聯的，如果一條數據包含兩次或者更多次，那數據就重復了。因為大部分情況下我們還是需要數據關聯的，只有很少的情況下才會不需要關聯數據，看來 NoSQL 這些特性看來讓人失望啊。幸運的是 MongoDB 3.2 介紹了一個新的 $lookup 操作，這個操作可以提供一個類似于 LEFT OUTER JOIN 的操作在兩個或者是更多的條件下。

——————————————————————————–

MongoDB Aggregation

$lookup 僅僅在 aggregation 操作中才被允許使用，想想他作為一個管道操作：查詢，過濾，組合結果。一個操作的輸出被作為下一個的輸入。Aggregation 比簡單的查詢操作更難于理解，而且這些操作通常運行很慢，然而他們很高效，Aggregation 可以使用一個很好的例子來解釋，假設我們使用 user 數據集合來創建一個社交平臺，在每個獨立的文檔中存儲沒個用戶的信息，例如：

{  _id : ObjectID( 45b83bda421238c76f5c1969),
  name :  User One ,
  email:  userone@email.com ,
  country :  UK ,
  dob : ISODate(1999-09-13T00:00:00.000Z)
}

我們可以向 user 這個集合中添加足夠多的用戶，但是每個 MongoDB 文檔都必須有一個為一個_id 字段值，這個_id 字段值就像 SQL 中的鍵，在我們沒有明確指定_id 的時候會被自動的加入到文檔中。我們的社交網站現在需要一個 post 集合，這個結合存儲用戶的評論，這個文檔存儲純文本，時間，評分，一個被寫到 user_id 字段的玩家引用。

{  _id : ObjectID( 17c9812acff9ac0bba018cc1),
  user_id : ObjectID(45b83bda421238c76f5c1969),
  date: ISODate(2016-09-05T03:05:00.123Z),
  text :  My life story so far ,
  rating :  important 
}

我們現在想要顯示最近具有 important 評論的二十條數據，這些數據來自所有的用戶，并且是按照時間排序的。每一個返回的文檔中應該包含評論的文本，發布評論的時間，以及相關的用戶的名字和國家。

MongoDB 數據庫的 aggregate 查詢是通過傳遞管道操作的數組，這個數組中順序的定了每個操作。首先，我們需要從所有的 post 集合中提取出所有的文檔，這些文檔使用 $match 記性準確 rating 過濾。

{  $match : {  rating :  important  } }

我們現在需要對過濾出來的文檔按照時間，使用 $sort 操作進行排序。

{  $sort : {  date : -1 } }

因為我們要僅僅返回二十條數據，我們可以使用 $limit 來限制我們需要處理的文檔數量。

{  $limit : 20 }

我們現在使用 $lookup 操作從 user 集合中連接數據，這個操作需要一個四個參數的對象：

1、localField：在輸入文檔中的查找字段

2、from：需要連接的集合

3、foreignField：需要在 from 集合中查找的字段

4、as：輸出的字段名字

所以我們的操作是這樣的：

{  $lookup : {
  localField :  user_id ,
  from :  user ,
  foreignField :  _id ,
  as :  userinfo 
} }

在我們的輸出中將會創建一個名為 userinfo 的新字段，他是一個數組，其中每個元素都是在 user 集合中匹配的元素。

userinfo : [ {  name :  User One , ... }
]

在 post.user_id 與 user._id 之間，我們具有一對一的關系，因為對于每一個 post 只有一個用戶。因此我們的 userinfo 數組將會僅僅包含一個元素，我們可以說使用 $unwind 操作來解構他并插入到一個自文檔中。

{  $unwind :  $userinfo  }

現在的輸出將會轉化成更加常用的結構：

userinfo : {
  name :  User One ,
  email:  userone@email.com ,
 …
}

最終我們可以在管道中使用 $project 操作返回評論信息，評論的時間，評論的用戶名，國家等。

{  $project : {
  text : 1,
  date : 1,
  userinfo.name : 1,
  userinfo.country : 1
} }

合并上面所有的操作

我們最終的聚合查詢匹配的評論，按照順序排序，限制最新的二十條信息，連接用戶的數據，扁平用戶數組，最后只返回我們需要的必須數據，總的命令如下：

db.post.aggregate([ {  $match : {  rating :  important  } },
 {  $sort : {  date : -1 } },
 {  $limit : 20 },
 {  $lookup : {
  localField :  user_id ,
  from :  user ,
  foreignField :  _id ,
  as :  userinfo 
 } },
 {  $unwind :  $userinfo  },
 {  $project : {
  text : 1,
  date : 1,
  userinfo.name : 1,
  userinfo.country : 1
 } }
]);

結果是一個擁有二十個文檔的集合，例如：

[
 {
  text :  The latest post ,
  date: ISODate(2016-09-27T00:00:00.000Z),
  userinfo : {
  name :  User One ,
  country :  UK 
 }
 },
 {
  text :  Another post ,
  date: ISODate(2016-09-26T00:00:00.000Z),
  userinfo : {
  name :  User One ,
  country :  UK 
 }
 }
 ...
]

MongoDB 的 $lookup 很好用而且很高效，但是上面這個基礎的例子只是一個組合的集合查詢。他不是一個對 SQL 中的更加高效的 JOIN 子句的替代。而且 MongoDB 也提供了一些限制，如果 user 集合被刪除了，post 文檔還是會保留。

理想情況下，這個 $lookup 操作應該不會經常使用，如果你需要經常使用它，那么你就使用了錯誤的數據存儲了（數據庫）：如果你有相關聯的數據，應該使用關聯數據庫（SQL）。

也就是說 $lookup 是一個 MongoDB 3.2 新加入的，他解決了當在 Nosql 數據庫中使用一些小的相關聯的數據查詢的時候一些令人失望的問題。

感謝各位的閱讀！關于“MongoDB 中使用 JOIN 操作的方法”這篇文章就分享到這里了，希望以上內容可以對大家有一定的幫助，讓大家可以學到更多知識，如果覺得文章不錯，可以把它分享出去讓更多的人看到吧！

向 AI 問一下細節

正文完