共計 837 個字符,預計需要花費 3 分鐘才能閱讀完成。
Python 可以使用多種庫來處理表格數據,其中最流行的是 pandas 庫。
使用 pandas 可以讀取、處理和分析表格數據。下面是一些常見的操作:
- 讀取表格數據:可以使用 pandas 的
read_csv()
函數來讀取 CSV 文件,也可以使用read_excel()
函數來讀取 Excel 文件。
import pandas as pd
# 讀取 CSV 文件
data = pd.read_csv('data.csv')
# 讀取 Excel 文件
data = pd.read_excel('data.xlsx')
- 查看數據:使用
head()
函數可以查看表格的前幾行數據,默認為前 5 行,也可以指定查看的行數。
# 查看前 5 行數據
data.head()
# 查看前 10 行數據
data.head(10)
- 篩選數據:可以使用條件語句來篩選數據,例如篩選某一列滿足特定條件的行。
# 篩選某一列滿足條件的行
filtered_data = data[data['column_name'] > 10]
- 排序數據:使用
sort_values()
函數可以對表格數據進行排序,可以指定排序的列和排序的順序。
# 按某一列進行升序排序
sorted_data = data.sort_values('column_name')
# 按某一列進行降序排序
sorted_data = data.sort_values('column_name', ascending=False)
- 數據統計:使用
describe()
函數可以對表格數據進行統計分析,包括計數、均值、標準差等。
# 對數值列進行統計分析
data.describe()
- 數據處理:可以使用 pandas 提供的各種函數對數據進行處理,例如刪除重復行、填充缺失值、計算列間的相關性等。
# 刪除重復行
data.drop_duplicates()
# 填充缺失值
data.fillna(value)
# 計算列間的相關性
data.corr()
以上是一些常見的表格數據處理操作,使用 pandas 可以靈活處理各種復雜的表格數據。
丸趣 TV 網 – 提供最優質的資源集合!
正文完