把训练集train拆分成训练集 X_train, X_test, Y_train, Y_testd的时候,常常会用到这个方法——train_test_split
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size = 0.1, random_state = 0)
但是这个方法有一点不妥之处。
如果使用了这个方法去填充模型。model.fit(X_train,Y_train)
再使用model.predict()去预测结果,
那么会产生偏差(bias)。
原因很简单,因为没有使用全部数据X,Y去fit()
当然,这也仅仅是略微不足之处,当你的数据集很大的时候,细微的拆分与不拆分,没有太大的影响!
本文发布于:2024-01-31 05:58:50,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170665193326043.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |