蒲公英 - 制药技术的传播者 GMP理论的实践者

搜索
查看: 165430|回复: 9
收起左侧

[统计基础] 方差分析中的R-sq和 R-sq(调整)怎么看,什么意思?

[复制链接]
大师
发表于 2018-6-10 07:24:04 | 显示全部楼层 |阅读模式

欢迎您注册蒲公英

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
在用minitab 进行方差分析中,我们会得到一张方差分析表,除了去看P值大小是否小于0.05,从而判断相应因子是否显著外。我们还会看在方差分析表之后,还会看到另个一些参数,今天,我们就来说一下,两个比较重要的参数“R-sq和 R-sq(调整)”。具体如下面minitab输出的例子:
1.png
R2(在minitab 中使用的记号是R-sq),又叫拟合优度,它是衡量方差分析得到的回归方程优劣或合适与否的一个重要参数。它是回归平方和占总离差平方和的比率,其数值越接近于1,代表得到的回归方程越好或越适合(模型拟合越好)。
在简单的线性回归时,当只有一个自变量时,R2就是相关系数的平方,即R2=r2,这样一来,就好理解一些了。
但是,R2有一个缺点,它不是衡量回归方程拟合效果最好的指标参数。这是因为,从回归平方和的定义看,当多一个自变量加入模型时,不管这个变量影响是否显著,回归平方和都会增大,R2也同步会增大。
2.png
上面公式中,n为观测值总个数;p为回归方程中的总项数。也就是说,R-sq(调整)是扣除了回归方程中所受到的包含项数的相关系数,因而可以更准确地反映模型的好坏。因为R-sq(调整)总比R-sq要小一些,所以,这两者之间差距越小,说明模型就越好。

在上面的例子中,R-sq=68.01%,而R-sq(调整)=36.01%,仅从两者差距看,是很大了。说明模型不好。其实R-sq=68.01%,数据也是较低的,本身也说明模型不好。


回复

使用道具 举报

药徒
发表于 2018-6-10 12:51:10 | 显示全部楼层
一般R-sq大于80%以上,说明拟合度好。
回复

使用道具 举报

大师
 楼主| 发表于 2018-6-10 14:39:11 | 显示全部楼层
sunshineqa 发表于 2018-6-10 12:51
一般R-sq大于80%以上,说明拟合度好。

是的,通常是这样。
回复

使用道具 举报

药生
发表于 2018-6-10 17:10:22 | 显示全部楼层
本帖最后由 kslam 于 2018-6-10 17:12 编辑

Minitab 的信息

R-sq 是由模型解释的响应中的变异百分比。它由 1 减去误差平方和(未由模型解释的变异)与平方总和(模型的总变异)之比计算得出。

R-sq 值越高,模型拟合数据的优度越高。R-sq 始终介于 0% 和 100% 之间。

第一个图说明了解释响应中 85.5% 变异的简单回归模型。

第二个图说明了解释响应中 22.6% 变异的模型。

模型解释的变异越多,数据点距离拟合回归线越近。从理论上讲,如果模型可以解释 100% 的变异,则拟合值将始终等于观测值,并因此所有数据点都将落于拟合线上。但是,即便 R-sq 为 100%,模型也不需要准确地预测新观测值。




当解释 R-sq 值时,请考虑以下问题:

如果向模型添加其他预测变量,则 R-sq 会始终增加。例如,最佳的 5 预测变量模型的 R-sq 始终比最佳的 4 预测变量模型的高。因此,比较相同大小的模型时R-sq 最有效。

样本数量较小则不能提供对于响应变量和预测变量之间关系强度的精确估计。如果需要R-sq 更为精确,则应当使用较大的样本(通常为 40 或更多)。

R-sq 只是模型拟合数据优度的一种度量。即使模型具有高R-sq,您也应当检查残差图,以验证模型是否符合模型假设。

R-sq(调整)是由模型解释的响应中变异的百分比,相对于观测值个数,已调整了模型中的预测变量数。调整的R-sq 是用 1 减去均方误 (MSE) 和均方总和 (MS Total) 之比计算得出的。


在想要比较具有不同数量的预测变量的情况下,使用调整的R-sq。如果向模型添加预测变量,即使模型没有实际改善,R-sq 也会始终增加。调整的R-sq 值包含模型中的预测变量数,以选择正确的模型。

例如,公司正在检查影响每个包装内碎薯片百分比的因子。当添加预测变量时,将得到以下结果。


第一个模型会生成超过 50% 的R-sq。第二个模型会为自身增加冷却速率。调整的R-sq 增加,这表明冷却速率会改善模型。提高了加工温度的第三个模型会增加R-sq,但不会增加调整的R-sq。这些结果表明,加工温度不会改善模型。基于这些结果,您可以考虑从模型中删除加工温度。


R2.jpg

点评

谢谢了,补充的很全面了。尤其是样本数量的要求,给出了样本数量通常为40或更多。这个可以指导我们应用吧。minitab中提供的帮助,的确很有用。  详情 回复 发表于 2018-6-10 19:57
回复

使用道具 举报

大师
 楼主| 发表于 2018-6-10 19:57:32 | 显示全部楼层
kslam 发表于 2018-6-10 17:10
Minitab 的信息

R-sq 是由模型解释的响应中的变异百分比。它由 1 减去误差平方和(未由模型解释的变异) ...

谢谢了,补充的很全面了。尤其是样本数量的要求,给出了样本数量通常为40或更多。这个可以指导我们应用吧。minitab中提供的帮助,的确很有用。
回复

使用道具 举报

药神
发表于 2023-2-4 16:50:33 | 显示全部楼层
谢谢分享。
回复

使用道具 举报

发表于 2023-9-25 17:44:25 | 显示全部楼层
学习了!!!!!!!
回复

使用道具 举报

药徒
发表于 2023-10-7 10:02:59 | 显示全部楼层
谢谢分享学到了
回复

使用道具 举报

发表于 2024-4-16 09:27:32 | 显示全部楼层
kslam 发表于 2018-6-10 17:10
Minitab 的信息

R-sq 是由模型解释的响应中的变异百分比。它由 1 减去误差平方和(未由模型解释的变异) ...

请问如何理解预测R2呢,这个需要关注吗
回复

使用道具 举报

发表于 2024-4-16 09:28:25 | 显示全部楼层
请问如何理解预测R2呢,这个需要关注吗,看您的预测是0.0%?
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

×发帖声明
1、本站为技术交流论坛,发帖的内容具有互动属性。您在本站发布的内容:
①在无人回复的情况下,可以通过自助删帖功能随时删除(自助删帖功能关闭期间,可以联系管理员微信:8542508 处理。)
②在有人回复和讨论的情况下,主题帖和回复内容已构成一个不可分割的整体,您将不能直接删除该帖。
2、禁止发布任何涉政、涉黄赌毒及其他违反国家相关法律、法规、及本站版规的内容,详情请参阅《蒲公英论坛总版规》。
3、您在本站发表、转载的任何作品仅代表您个人观点,不代表本站观点。不要盗用有版权要求的作品,转贴请注明来源,否则文责自负。
4、请认真阅读上述条款,您发帖即代表接受上述条款。

QQ|手机版|蒲公英|ouryao|蒲公英 ( 京ICP备14042168号-1 )  增值电信业务经营许可证编号:京B2-20243455  互联网药品信息服务资格证书编号:(京)-非经营性-2024-0033

GMT+8, 2025-3-25 02:08

Powered by Discuz! X3.4运维单位:苏州豚鼠科技有限公司

Copyright © 2001-2020, Tencent Cloud.

声明:蒲公英网站所涉及的原创文章、文字内容、视频图片及首发资料,版权归作者及蒲公英网站所有,转载要在显著位置标明来源“蒲公英”;禁止任何形式的商业用途。违反上述声明的,本站及作者将追究法律责任。
快速回复 返回顶部 返回列表