蒲公英 - 制药技术的传播者 GMP理论的实践者

搜索
查看: 1680|回复: 2
收起左侧

[统计基础] 科研统计图汇总

[复制链接]
药徒
发表于 2023-10-18 11:20:52 | 显示全部楼层 |阅读模式

欢迎您注册蒲公英

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
一、常用统计图
常用统计图的适用情况和举例说明如下:
1.png
比如:散点图适用于展示两个变量之间的关系情况;直方图适用于展示连续变量的分布情况,判断是否符合正态分布等;箱线图展示一组数据的中位数、四分位数、最大值、最小值等信息,可以用于分析数据分布情况或者是否存在异常值等等。
二、作图思路
首先区分数据类型:画图通常是体现X和Y之间的关系情况。那么首先需要知道X和Y分别的数据类型是什么,下面总结一个表格说明如下:
2.png

按照X和Y的思维,先识别出X和Y分别的数据类型情况,然后找到适合的统计图作图即可。
举例说明:比如想要分析不同品种和不同施肥方式下,水稻产量的差异,希望通过图形直观展示差异情况。很明显这里2个X均为定类数据,而水稻产量为定量数据,所以可以使用“簇状图”进行可视化分析。
将数据上传至SPSSAU系统,选择“簇状图”,拖拽变量至右侧相应分析框,操作如下图:

3.png

得到簇状图结果如下:
簇状折线图

4.png

簇状柱形图

5.png

簇状条形图
6.png

SPSSAU当前提供累计共30类图形,分布于各个方法中自动生成,当然还有一些复杂或者特殊的图形需要自己作图。
三、SPSSAU自动出图
在使用SPSSAU进行数据分析时,选择相应方法进行分析得到分析结果的同时,SPSSAU会默认自动输出对应的统计图分析结果。
举例说1:定类数据进行频数分析时,SPSSAU会默认输出对应的饼状图、圆环图、柱状图、条形图。如果需要切换不同的统计图,点击图形右上角选择即可,如下图:


7.png

举例说明2:使用独立样本t检验研究不同组别空腹血糖下降值的差异时,SPSSAU会默认输出对应的柱形图、条形图、折线图。如下图:
8.png


举例说明3:使用卡方检验研究不同疗法治疗效果的差异时,SPSSAU会默认输出对应的堆积柱形图、堆积条形图等,如下图:

9.png

提示:SPSSAU可视化结合了数据分析方法的思想,默认提供准确的可视化图形展示,这是SPSSAU智能系统的一个组成部分。通常自动输出的第一个统计图是最优的即最合适的。
四、统计图详细说明
1、散点图
散点图用于考察定量数据之间的关联关系,即查看X和Y之间的关系情况。散点图通常用于探索性研究,直观展示出数据间的关联关系情况。
使用场景
(1) 相关分析之前,查看X和Y之间的关系情况。
(2) 回归分析后模型检验,查看残差分别与自变量间的关联性【回归模型假定残差不应该与自变量有关联性,即异方差性】。
(3) 其它用于直观展示数据关系的场景。
散点图示例

10.png
2、直方图
直方图用于直观展示数据分布情况,观察数据的正态分布特性,检验数据是否满足正态性。

使用场景
(1) 相关分析时,数据的正态性查看;(2) 回归分析后模型检验,将残差进行正态性检验,如果残差呈现出正态性意味着模型构建良好,反之说明模型构建较差。(3) 其他用于查看数据分布、检验正态性的场景等等。

直方图展示
11.png

3、箱线图
箱线图(也称盒图,箱盒图等)是在1977年由美国统计学家John Tukey发明,分析数据需要为定量数据。通过箱线图,可以直观的探索数据特征。
使用场景
(1) 查看可能的异常值数据情况;(2) 非参数检验时查看不同类别X时,Y的数据分布情况;(3) 其它涉及查看数据分布或者异常值查看时。
箱线图展示
12.png

4、词云图
词云图是由美国西北大学新闻学教授Rich Gordon提出,“词云”可对文字中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而使浏览者只要一眼扫过文本就可以领略文本的主旨。
使用场景
(1)直观地展示文本信息,并且突出展示关键信息;

(2)针对有权重的数据信息进行词云展示。

词云图展示
13.png

5、误差线图
误差线图用于展示数据的不确定性程度,显示潜在的误差或每个数据标志的不确定程度。样本数据的波动是通过标准差体现,因而样本均值不确定性程度为标准差。
误差线图展示
14.png

6、P-P图/Q-Q图
P-P图和Q-Q图常用于直观查看数据是否正态分布。P-P图和Q-Q图的目的性基本一致,但原理上有着区别。
使用场景
(1) 方差分析对应的Y值是否具有正态性特质的判断;(2) 回归分析前,对应的Y值是否具有正态性特质判断;回归分析后,使用P-P图和Q-Q图检查残差值是否有正态性特质;(3) 二元Logit回归后的残差值是否有正态性特质。(4) 其它用于直观展示数据正态性的场景。
P-P图/Q-Q图展示
15.png
16.png


7、ROC曲线
ROC曲线,也称受试者工作特征曲线;ROC曲线最初是运用在军事上,当前在医学领域使用非常广泛,用于研究X对于Y的预测准确率情况。
ROC曲线展示
17.png

8、象限图
象限图可对数据分类进行直观展示;使用水平和垂直分割线将图表区域划分成四个象限,而且每个象限呈现对应的数据。通常情况下,象限图呈现目的在于直接展示数据划分区域。
象限图展示
18.png

9、帕累托图
帕累托图是“二八原则”的图形化体现,80%的问题是由20%的原因所致;通常情况下帕累托图可用来展现某‘问题’的占比情况,通过图形找出最重要的原因。
帕累托图展示
19.png

10、簇状图
从展示的图形类型上,簇状图可分为簇状折线图、簇状柱形图和簇状条形图等,SPSSAU默认均提供;SPSSAU共提供平均值、计数、求和以及中位数四种汇总值。簇状图时,分类数据为0个,1个或2个,SPSSAU均提供对应的图形展示。
簇状图展示

20.png
11、组合图
组合图用于两类维度值之间有较大差异时的图形化展示,其有两个坐标轴,分别是主轴和次轴,通常情况下,主轴为数量较大项,次轴为数量较大项。比如展示GDP与GDP增长率,主轴为GDP,次轴为GDP增长率。
组合图展示
21.png

12、气泡图
气泡图可用于展示X和Y之间的关系情况,并且利用Z标识每个点的气泡大小。同时,SPSSAU支持直接在气泡中展示‘标签’,并且可使用不同颜色标识气泡。
气泡图展示
22.png

13、核密度图
核密度图是一种非参数检验方法,其是对直方图的进一步抽象化,但其更加直观,其曲线下面积为1,通常用于连续数据的直观展示,比如年龄的分布情况,身高的分布情况等。
核密度图展示
23.png

14、小提琴图
小提琴是是箱线图和核密度图的集合,其可通过箱线思维展示数据的各个百分位点,与此同时,还可使用核密度图展示数据分布的‘轮廓’效果,‘轮廓’越大,即意味着数据越集中于该处,反之则说明该处时数据越少。
小提琴图展示
24.png


回复

使用道具 举报

药徒
发表于 2024-10-2 16:38:52 | 显示全部楼层
总结得很好,谢谢!!
回复

使用道具 举报

发表于 2024-11-11 16:17:30 | 显示全部楼层
感谢分享,配色指导上面有所援助就好了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

×发帖声明
1、本站为技术交流论坛,发帖的内容具有互动属性。您在本站发布的内容:
①在无人回复的情况下,可以通过自助删帖功能随时删除(自助删帖功能关闭期间,可以联系管理员微信:8542508 处理。)
②在有人回复和讨论的情况下,主题帖和回复内容已构成一个不可分割的整体,您将不能直接删除该帖。
2、禁止发布任何涉政、涉黄赌毒及其他违反国家相关法律、法规、及本站版规的内容,详情请参阅《蒲公英论坛总版规》。
3、您在本站发表、转载的任何作品仅代表您个人观点,不代表本站观点。不要盗用有版权要求的作品,转贴请注明来源,否则文责自负。
4、请认真阅读上述条款,您发帖即代表接受上述条款。

QQ|手机版|蒲公英|ouryao|蒲公英 ( 京ICP备14042168号-1 )  增值电信业务经营许可证编号:京B2-20243455  互联网药品信息服务资格证书编号:(京)-非经营性-2024-0033

GMT+8, 2025-2-17 20:59

Powered by Discuz! X3.4运维单位:苏州豚鼠科技有限公司

Copyright © 2001-2020, Tencent Cloud.

声明:蒲公英网站所涉及的原创文章、文字内容、视频图片及首发资料,版权归作者及蒲公英网站所有,转载要在显著位置标明来源“蒲公英”;禁止任何形式的商业用途。违反上述声明的,本站及作者将追究法律责任。
快速回复 返回顶部 返回列表