R语言缺失值探索的强大R包:naniar

阅读: 评论:0

R语言缺失值探索的强大R包:naniar

R语言缺失值探索的强大R包:naniar

简介

缺失值在数据中无处不在,需要在分析的初始阶段仔细探索和处理。在本次示例中,会详细介绍naniar包探索缺失值的方法和理念,它和ggplot2tidy系列使用方法非常相似,上手并不困难。

有时,解释缺失值出现的原因可能很简单,比如,可能是由于记录不全,各种意外等,但实现这一解释的过程可能并不简单,而且可能需要比开发探索性数据分析和模型所需的更多时间。

本次学习主要探讨3个问题:

  1. 开始探索缺失值

  2. 探索缺失值的机制

  3. 模型化缺失值

如何开始探索缺失值

当你面对新的数据时,可能首先会使用各种汇总函数查看数据的基本情况,比如:

  • summary()

  • str()

  • skimr::skim

  • dplyr::glimpse()

  • ...

但是当数据有缺失值时,就会影响接下来的分析。所以首先还要查看数据的缺失情况。

R包visdat可以展示缺失值数据,主要有2个函数:

  • vis_dat()

  • vis_miss()

vis_dat()

library(visdat)
vis_dat(airquality)

本文发布于:2024-01-28 22:48:56,感谢您对本站的认可!

本文链接:https://www.4u4v.net/it/170645334310851.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:缺失   强大   语言   naniar
留言与评论(共有 0 条评论)
   
验证码:

Copyright ©2019-2022 Comsenz Inc.Powered by ©

网站地图1 网站地图2 网站地图3 网站地图4 网站地图5 网站地图6 网站地图7 网站地图8 网站地图9 网站地图10 网站地图11 网站地图12 网站地图13 网站地图14 网站地图15 网站地图16 网站地图17 网站地图18 网站地图19 网站地图20 网站地图21 网站地图22/a> 网站地图23