机器学习:train

阅读: 评论:0

机器学习:train

机器学习:train

  把训练集train拆分成训练集 X_train, X_test, Y_train, Y_testd的时候,常常会用到这个方法——train_test_split

  X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size = 0.1, random_state = 0)

  但是这个方法有一点不妥之处。

  如果使用了这个方法去填充模型。model.fit(X_train,Y_train)

  再使用model.predict()去预测结果,

  那么会产生偏差(bias)。

  原因很简单,因为没有使用全部数据X,Y去fit()

  当然,这也仅仅是略微不足之处,当你的数据集很大的时候,细微的拆分与不拆分,没有太大的影响!

 

本文发布于:2024-01-31 05:58:50,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170665193326043.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:机器   train
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23