久久精品人人爽,华人av在线,亚洲性视频网站,欧美专区一二三

Pandas中怎么實現SQL查詢數據操作

170次閱讀
沒有評論

共計 3092 個字符,預計需要花費 8 分鐘才能閱讀完成。

本篇文章給大家分享的是有關 Pandas 中怎么實現 SQL 查詢數據操作,丸趣 TV 小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著丸趣 TV 小編一起來看看吧。

1. 選擇行

SELECT * FROM

如果要選擇整個表,只需調用表的名稱:

# SQL SELECT * FROM table_df # Pandas table_df

SELECT a, b FROM

如果要從表中選擇特定列,請在雙括號中列出要的列:

# SQL SELECT column_a, column_b FROM table_df # Pandas table_df[[column_a ,  column_b]]

SELECT DISTINCT

只需使用 .drop\u duplicates() 即可獲得不同的值:

# SQL SELECT DISTINCT column_a FROM table_df # Pandas table_df[column_a].drop_duplicates()

SELECT a as b

如果要重命名列,請使用 .rename():

# SQL SELECT column_a as Apple, column_b as Banana FROM table_df # Pandas table_df[[column_a ,  column_b]].rename(columns={ column_a :  Apple ,  column_b : Banana})

SELECT CASE WHEN

對于 SELECT CASE WHEN 的等效項,可以使用 np.select(),其中首先指定每個選項的選擇和值。

# SQL SELECT CASE WHEN column_a   30 THEN  Large  WHEN column_a  = 30 THEN  Small  END AS Size FROM table_df # Pandas conditions = [table_df[ column_a] 30, table_df[column_b] =30] choices = [Large ,  Small] table_df[Size] = np.select(conditions, choices)

2. 組合表格

INNER/LEFT/RIGHT JOIN

只需使用 .merge() 來連接表,就可以使用“how”參數指定它是 LEFT、RIGHT、INNER 或者 OUTER 聯接。

# SQL SELECT * FROM table_1 t1 LEFT JOIN table_2 t1 on t1.lkey = t2.rkey # Pandas table_1.merge(table_2, left_on= lkey , right_on= rkey , how= left)

UNION ALL

只需使用 pd.concat():

# SQL SELECT * FROM table_1 UNION ALL SELECT * FROM table_2 # Pandas final_table = pd.concat([table_1, table_2])

3. 篩選表

SELECT WHERE

在篩選數據幀時,與在 SQL 中使用 WHERE 子句的方式相同時,只需在方括號中定義條件:

# SQL SELECT * FROM table_df WHERE column_a = 1 # Pandas table_df[table_df[ column_a] == 1]

SELECT column_a WHERE column_b

如果要從表中選擇某個列并篩選其他列,請按照以下格式操作:

# SQL SELECT column_a FROM table_df WHERE column_b = 1 # Pandas table_df[table_df[ column_b]==1][column_a]

SELECT WHERE AND

如果要按多個條件進行篩選,只需將每個條件換在括號中,并使用 分隔每個條件。

# SQL SELECT * FROM table_df WHERE column_a = 1 AND column_b = 2 # Pandas table_df[(table_df[ column_a]==1)   (table_df[ column_b]==2)]

SELECT WHERE LIKE

SQL 中的 LIKE 等效項是 .str.contains()。如果要應用大小寫不敏感,只需在參數中添加 case=False。

# SQL SELECT * FROM table_df WHERE column_a LIKE  %ball%  # Pandas table_df[table_df[ column_a].str.contains(ball)]

SELECT WHERE column IN()

SQL 中 IN() 的等效項為 .isin()。

# SQL SELECT * FROM table_df WHERE column_a IN(Canada ,  USA) # Pandas table_df[table_df[ column_a].isin([Canada ,  USA])]

4. 排序值

ORDER BY one column

在 SQL 中,ORDER BY 的等同于 .sort_values()。使用 ascending 參數指定是按升序還是降序對值排序,默認值與 SQL   一樣升序。

# SQL SELECT * FROM table_df ORDER BY column_a DESC # Pandas table_df.sort_values(column_a , ascending=False)

ORDER BY multiple columns

如果要按多個列排序,可以列出括號中的列,并在括號中的“ascending”參數中指定排序方向。請確保遵循列出的列的相應順序。

# SQL SELECT * FROM table_df ORDER BY column_a DESC, column_b ASC # Pandas table_df.sort_values([column_a ,  column_b], ascending=[False, True])

5. 聚合函數

COUNT DISTINCT

聚合函數有一個通用模式。

要復制 COUNT DISTINCT,只需使用 .groupby() 和.nunique()。

# SQL SELECT column_a, COUNT DISTINCT(ID) FROM table_df GROUP BY column_a # Pandas table_df.groupby(column_a)[ID].nunique()

SUM

# SQL SELECT column_a, SUM(revenue) FROM table_df GROUP BY column_a # Pandas table_df.groupby([column_a ,  revenue]).sum()

AVG

# SQL SELECT column_a, AVG(revenue) FROM table_df GROUP BY column_a # Pandas table_df.groupby(column_a)[revenue].mean()

以上就是 Pandas 中怎么實現 SQL 查詢數據操作,丸趣 TV 小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注丸趣 TV 行業資訊頻道。

正文完
 
丸趣
版權聲明:本站原創文章,由 丸趣 2023-08-03發表,共計3092字。
轉載說明:除特殊說明外本站除技術相關以外文章皆由網絡搜集發布,轉載請注明出處。
評論(沒有評論)
主站蜘蛛池模板: 陵川县| 咸宁市| 忻城县| 冀州市| 垦利县| 进贤县| 阜阳市| 时尚| 弥勒县| 昌平区| 远安县| 克东县| 龙陵县| 铁力市| 绥阳县| 云霄县| 微博| 禹州市| 聂荣县| 聂拉木县| 磐安县| 白山市| 柘荣县| 栖霞市| 五常市| 莱州市| 兴城市| 蚌埠市| 磐石市| 河间市| 马公市| 托里县| 天柱县| 阿坝县| 新蔡县| 庆安县| 嵩明县| 嘉荫县| 隆昌县| 牙克石市| 吉林省|