python中group by的用法是什么

215次閱讀

共計 1055 個字符，預計需要花費 3 分鐘才能閱讀完成。

在 Python 中，group by 是一種用于將數據集按照特定列進行分組的操作。它通常與聚合函數（如 sum、count、avg 等）一起使用，以便對每個組進行計算。

要使用 group by，你可以使用 pandas 庫中的 DataFrame 對象來處理數據。以下是一個示例：

import pandas as pd

# 創建一個示例數據集 
data = {'Name': ['John', 'Mike', 'Sarah', 'John', 'Mike'],
        'Age': [25, 30, 28, 25, 30],
        'City': ['New York', 'Chicago', 'Los Angeles', 'New York', 'Chicago'],
        'Salary': [50000, 60000, 55000, 50000, 55000]}

df = pd.DataFrame(data)

# 按照 Name 列進行分組，并計算每個組的平均薪資 
grouped = df.groupby('Name')['Salary'].mean()

print(grouped)

輸出結果為：

Name
John     50000.0
Mike     57500.0
Sarah    55000.0
Name: Salary, dtype: float64

在上述示例中，我們使用 group by 將數據按照 Name 列進行分組，并計算每個組的平均薪資。結果中的每個組都以組名（Name 列的唯一值）作為索引，并顯示了對應組的平均薪資。

你還可以對多個列進行分組，如以下示例所示：

grouped = df.groupby(['Name', 'City'])['Salary'].sum()

print(grouped)

輸出結果為：

Name   City       
John   New York      100000
Mike   Chicago       115000
Sarah  Los Angeles    55000
Name: Salary, dtype: int64

在該示例中，我們按照 Name 和 City 兩列進行分組，并計算每個組的薪資總和。結果中的每個組都以組名（Name 和 City 的唯一組合）作為索引，并顯示了對應組的薪資總和。

丸趣 TV 網 – 提供最優質的資源集合！

正文完

發表至： Python

2024-02-05

轉載說明：除特殊說明外本站除技術相關以外文章皆由網絡搜集發布，轉載請注明出處。

python中的write函數怎么使用

python memoryerror錯誤怎么解決

python怎么實現批量發送郵件

python的turtle如何使用

Python中json.dumps()函數怎么使用

久久精品人人爽,华人av在线,亚洲性视频网站,欧美专区一二三

python中group by的用法是什么