久久精品人人爽,华人av在线,亚洲性视频网站,欧美专区一二三

利用SQL語句怎么刪除重復的記錄

164次閱讀
沒有評論

共計 2135 個字符,預計需要花費 6 分鐘才能閱讀完成。

自動寫代碼機器人,免費開通

利用 SQL 語句怎么刪除重復的記錄?很多新手對此不是很清楚,為了幫助大家解決這個難題,下面丸趣 TV 小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。

如果要刪除手機 (mobilePhone),電話(officePhone),郵件(email) 同時都相同的數據,以前一直使用這條語句進行去重:

delete from  表  where id not in 
(select max(id) from  表  group by mobilePhone,officePhone,email ) 
or 
delete from  表  where id not in 
 (select min(id) from  表  group by mobilePhone,officePhone,email ) 
delete from  表  where id not in 
(select max(id) from  表  group by mobilePhone,officePhone,email ) 
or 
delete from  表  where id not in 
 (select min(id) from  表  group by mobilePhone,officePhone,email )

其中下面這條會稍快些。上面這條數據對于 100 萬以內的數據效率還可以,重復數 1 / 5 的情況下幾分鐘到幾十分鐘不等,但是如果數據量達到 300 萬以上,效率驟降,如果重復數據再多點的話,常常會幾十小時跑不完,有時候會鎖表跑一夜都跑不完。無奈只得重新尋找新的可行方法,今天終于有所收獲:

// 查詢出唯一數據的 ID, 并把他們導入臨時表 tmp 中  
select min(id) as mid into tmp from  表  group by mobilePhone,officePhone,email 
 // 查詢出去重后的數據并插入 finally 表中  
insert into finally select (除 ID 以外的字段) from customers_1 where id in (select mid from tmp) 
// 查詢出唯一數據的 ID, 并把他們導入臨時表 tmp 中  
select min(id) as mid into tmp from  表  group by mobilePhone,officePhone,email 
 // 查詢出去重后的數據并插入 finally 表中  
insert into finally select (除 ID 以外的字段) from customers_1 where id in (select mid from tmp)

效率對比:用 delete 方法對 500 萬數據去重(1/ 2 重復)約 4 小時。4 小時,很長的時間。

用臨時表插入對 500 萬數據去重(1/ 2 重復)不到 10 分鐘。

其實用刪除方式是比較慢的,可能是邊找邊刪除的原因吧,而使用臨時表,可以將沒有重復的數據 ID 選出來放在臨時表里,再將表的信息按臨時表的選擇出來的 ID,將它們找出來插入到新的表,然后將原表刪除,這樣就可以快速去重啦。

SQL 語句去掉重復記錄,獲取重復記錄

按照某幾個字段名稱查找表中存在這幾個字段的重復數據并按照插入的時間先后進行刪除,條件取決于 order by 和 row_num。

方法一按照多條件重復處理:

delete tmp from( 
select row_num = row_number() over(partition by  字段,字段  order by  時間  desc) 
 from  表  where  時間  getdate()-1 
 ) tmp 
 where row_num   1 
delete tmp from( 
select row_num = row_number() over(partition by  字段,字段  order by  時間  desc) 
 from  表  where  時間  getdate()-1 
 ) tmp 
 where row_num   1

方法二按照單一條件進行去重:

delete from  表  where  主鍵 ID not in( 
select max(主鍵 ID) from  表  group by  需要去重的字段  having count(需要去重的字段) =1 
 ) 
delete from  表  where  主鍵 ID not in( 
select max(主鍵 ID) from  表  group by  需要去重的字段  having count(需要去重的字段) =1 
 )

注意:為提高效率如上兩個方法都可以使用臨時表,not in 中的表可以先提取臨時表 #tmp,

然后采用 not exists 來執行,為避免數量過大,可批量用 Top 控制刪除量

delete top(2) from  表  
 where not exists (select  主鍵 ID 
 from #tmp where #tmp. 主鍵 ID= 表. 主鍵 ID)

看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注丸趣 TV 行業資訊頻道,感謝您對丸趣 TV 的支持。

向 AI 問一下細節

正文完
 
丸趣
版權聲明:本站原創文章,由 丸趣 2023-12-04發表,共計2135字。
轉載說明:除特殊說明外本站除技術相關以外文章皆由網絡搜集發布,轉載請注明出處。
評論(沒有評論)
主站蜘蛛池模板: 翁牛特旗| 大理市| 尼勒克县| 南溪县| 高清| 武邑县| 桓台县| 小金县| 白朗县| 平阴县| 南漳县| 浠水县| 闽侯县| 三河市| 龙口市| 耒阳市| 霍州市| 东安县| 万源市| 柘荣县| 沛县| 太康县| 文成县| 唐山市| 延津县| 娱乐| 井陉县| 调兵山市| 云浮市| 小金县| 永州市| 江都市| 克拉玛依市| 库尔勒市| 久治县| 焦作市| 舟曲县| 古蔺县| 同仁县| 芜湖市| 资源县|