共計 404 個字符,預計需要花費 2 分鐘才能閱讀完成。
使用 Python 刪除異常值的一種常見方法是使用統計學中的標準差方法。具體步驟如下:
- 導入必要的庫:
import numpy as np
- 創建一個包含異常值的數據集:
data = np.array([1, 2, 3, 4, 5, 100])
- 計算數據集的平均值和標準差:
mean = np.mean(data)
std = np.std(data)
- 定義異常值的閾值。通常,可以將閾值設置為平均值加減 3 倍標準差:
threshold = 3 * std
- 使用 NumPy 的布爾索引來獲取不在閾值范圍內的值:
filtered_data = data[(data >= mean - threshold) & (data <= mean + threshold)]
- 打印輸出過濾后的數據集:
print(filtered_data)
上述代碼將刪除數據集中的異常值,并輸出過濾后的數據集。請注意,這只是一種常見的方法,具體的異常值處理方法可能因數據集的特性而異。
丸趣 TV 網 – 提供最優質的資源集合!
正文完