共計 646 個字符,預計需要花費 2 分鐘才能閱讀完成。
train_test_split 函數是用來將數據集劃分為訓練集和測試集的。在 Python 中,train_test_split 函數可以通過 sklearn 庫中的 model_selection 模塊來使用。下面是一個簡單的示例:
from sklearn.model_selection import train_test_split
import numpy as np
# 生成一些示例數據
X = np.array([[1, 2], [3, 4], [5, 6], [7, 8]])
y = np.array([0, 1, 0, 1])
# 將數據集劃分為訓練集和測試集,test_size 指定測試集比例,random_state 設置隨機種子
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 打印劃分后的訓練集和測試集
print(" 訓練集 X:", X_train)
print(" 測試集 X:", X_test)
print(" 訓練集 y:", y_train)
print(" 測試集 y:", y_test)
在這個示例中,我們生成了一個包含 4 個樣本的數據集 X 和對應的標簽 y。然后使用 train_test_split 函數將數據集劃分為訓練集和測試集,其中 test_size 參數指定了測試集的比例(這里是 0.2,即 20%),random_state 參數設置了隨機種子以確保劃分結果的一致性。最后打印出劃分后的訓練集和測試集。
丸趣 TV 網 – 提供最優質的資源集合!
正文完