成人糖尿病患者的平均年龄约为岁而未患糖尿病的人则要低得多。然而也有许多异常值。有一些没有糖尿病的老年人其中一位甚至超过岁这可以从箱线图中看到。和结果的可视化最后让我们可视化变量和看看这两个变量之间是否存在相关性。为此我们将使用库此处创建的箱线图与上面使用创建的箱线图类似。然而更擅长创建交互式可视化并且与制作的图表相比图表看起来更好。从上面的箱线图中我们可以看到较高的与阳性结果相关。患有糖尿病的人往往比没有糖尿病的人有更高的体重指数。
您可以通过简单地更改变量名称并执行相同的代码行来执行更多类似上面的视图。我将把这个作为练习让您更好地了解数据分析技能。数据返回最后我们可以围绕我们分析和可视化的数据讲述一个故事。我们的研究结 购买手机号码列表 果可细分如下患有糖尿病的人很可能比没有糖尿病的人年龄更大。他们也更有可能有较高的体重指数或肥胖。他们的血液中葡萄糖含量也更有可能更高。血糖水平较高的人也往往会服用更多的胰岛素这种正相关性表明糖尿病患者也可能具有较高的胰岛素水平可以通过创建散点图来验证这种相关性。
我们从这篇文章中学到了什么?一名优秀的数据分析专家需要具备什么?一个好的专业人士需要掌握分析领域编程技能统计数据可视化技能和讲故事的技能。使用进行良好的数据分析的先决条件是什么?已经安装了和几个数据可视化库。专业人士分析数据所需具备的主要特征是什么?在分析过程中保持开放的心态不要让你的先入之见影响你的决策。使用进行数据可视化的顶级库有哪些?库和。如何为数据可视化讲好故事?有必要知道如何总结和串联所获得的数据以便根据所获得的发现讲述一个简洁且相关的故事。
|
1、在论坛里发表的文章仅代表作者本人的观点,与本网站立场无关。
2、论坛的所有内容都不保证其准确性,有效性,时间性。阅读本站内容因误导等因素而造成的损失本站不承担连带责任。
3、当政府机关依照法定程序要求披露信息时,论坛均得免责。
4、若因线路及非本站所能控制范围的故障导致暂停服务期间造成的一切不便与损失,论坛不负任何责任。
5、注册会员通过任何手段和方法针对论坛进行破坏,我们有权对其行为作出处理。并保留进步追究其责任的权利。