欢迎您注册蒲公英
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
本帖最后由 蜗牛98 于 2016-6-14 08:59 编辑
以统计学角度看验证、确认和持续性确认的关系 北京首儿药厂-首儿数据统计分析群 王文建 在新版 GMP中最让人纠结的概念,大概非“验证与确认”莫属了,2015年总局又下发的新的“验证与确认”的附录,其中又提到“持续性确认”,这里我想从统计学的角度去看验证、确认和持续性确认的关系。 工业化制造的一个特点,就是大批量的、流水线式的工业化生产制造,它是对大批量多批次的各类原材料,经过生产线连续加工制造,生产出众多产品的过程。 为了保证工业化制造出的产品质量有保证,少生产出不合格品、次品,于是出现了最初的质量检验,对原材料进行来料检验,对生产的产品进行出厂检验。但是,仅靠一进一出、一头一尾的检验把关是不够的;为此,也需要同步对生产制造过程进行控制和管理,如何保证生产制造过程有效、可靠、持续稳定,这才是制造业的价值所在。 而生产制造过程,包括人、机、料、法、环、测(5M1E)6个方面,哪个方面出现问题都不保证产品制造过程有效、可靠和持续稳定。 生产制造某个产品之初,总是要对生产该产品的设备、用料、加工制造方法、操作人员、产品合格与否的判定方法、检测方法、生产环境要求进行约定,并需要试生产一下,看看是否能满足预期要求,是否可以放心的批量生产。 而以上的过程,要做到科学有效,而不是仅凭经验,则要依靠数据、依靠统计规律进行,实际上就是假设检验、检验功效和控制图(SPC)问题,如果需要和GMP中的概念做一个对应,可以理解为验证、确认和持续性确认。 验证 | | 假设检验 | 确认 | | 检验功效 | 持续性确认 | | 控制图(SPC) |
例题1: 一个新产品试生产,得到含量数据10组“99.11%、100.26%、99.03%、98.23%、101.34%、98.23%、98.36%、98.94%、99.16%、99.12%、”,而产品法定标准为90%~110%,工艺投料要求100%投料,含量范围控制要求在98%~102%之间。 问题: 1、根据得到的这10组数据,在95%的置信限下,这批产品的含量是否达到了预期要求的100%? 2、为了判断这批产品含量是否达到预期的100%(范围在98%~102%时),样品数量至少要有多少个才可以。(a=0.01) 解答:问题1:(假设检验): 这里就用到统计中的假设检验,得下图(使用minitab 17): 单样本 T: C1 原假设:μ = 100 备择假设:μ≠ 100 的检验: 变量 N 均值 标准差 均值标准误 95% 置信区间 T P C1 10 99.179 0.967 0.306 (98.488, 99.871) -2.69 0.025 从以上结果得: 1、P=0.025,小于0.05,则原假设不成立,备择假设成立。也就是这组数据均值在95%的置信限下,不等于100%。 2、这组数据95%的置信区间为(98.488, 99.871),100%这个值不在这个区间内,也说明含量这组数据均值不等于100%。 问题2:(检验功效): 这里就用到统计中检验功效,得下图(在minitab 17中叫“幂和样本数量”): 幂和样本数量 单样本 t 检验 正在检验均值 = 零 (与 ≠ 零) 计算功效的均值 = 零 + 差值 α = 0.01 假定标准差 = 0.9666 差值 样本数量 目标功效 实际功效 2 7 0.9 0.904881 从以上结果得: 1、 以10组数据所得标准差为0.9666,置信限为99%(a=0.01)的情况下,达到含量标准在98%~102%范围内时,有90%(b=0.1)的置信概率,只需抽取的样本数量为7个,就可以达到99%(a=0.01)的检验功效。 2、 根据以上分析,以后抽样量只需要7个就可以,而不需要抽取10个样本。 例题2: 例题1中的产品经过试生产后,转入商业批生产,为了保证产品稳定生产,需要对生产过程中的含量指标进行管控,要求在95%~105%,这时得到以下按生产顺序的25批次数据,97.52%、101.38%、100.31%、98.19%、97.22%、100.73%、98.38%、97.70%、97.58%、99.68%、98.20%、98.36%、100.93%、98.90%、98.64%、100.92%、101.58%、99.54%、99.54%、97.81%、100.68%、101.72%、98.04%、99.26%、102.82%。 问题: 1、以含量为控制指标,这25批次的生产过程是否稳定的?能力如何? 2、该产品投入商业批生产后,如何在现有数据基础上进行持续控制,以保证产品长期持续稳定生产。 解题:问题1:(控制图(SPC))使用minitab 17中的协助,得到下图: 从以上三张图可得:1、 从这25组数据分析看,所代表的该产品生产过程是稳定的。2、 但在95%~105%的标准范围内,该产品含量的过程能力低,Z=2.79<3;Ppk=0.94<1;3、 以目前的过程能力,预期的不合格批次概率约为0.27%。问题2:1、 将上控制限为104.12%和下控制限为94.73%的控制图(SPC),正式使用在该产品的生产控制中,进行监测诊断,每生产一批,将相应的含量数据描点到控制图(SPC)中。2、 如果有点超出上、下控制限的,则进行相应分析调查,即:张公绪提出的26字真言“点出界就判异,查出异因,采取措施,加以消除,不再出现,纳入标准。” 通过以上二个例子,可以对验证、确认和持续确认(控制图(SPC))三者之间的关系,列表如下进行理解,下表各项之间的关系,也体现出了“量化管理,风险决策”的思想:
统计概念 | GMP概念 | 实质内涵 | 适合批次 | 与数据排序 | 与规格限 | 彼此关系 | 正态、t、泊松分布 | --- | 数学公式;软件表达式;图形 | ―― | ―― | ―― | 根本和基础 | 假设检验 | 验证 | 总体检验 (第一类错误 α) | 单批或多批 | 无关 | 无关 | 必要性 | 检验功效 | 确认 | 总体检验 (第二类错误 β) | 单批或多批 | 无关 | 无关 | 充分性 | 控制图(SPC) | 持续性 确认 | 过程监控 | 连续多批 | 有关 | 无关 | 手段 | 过程能力分析 | 质量保证 | 连续多批 | 有关 | 有关 | 目标 |
注释:检验功效 在假设检验中,当存在显著效应或差异时找到这些效应或差异的可能性。功效是在原假设不成立时正确否定原假设的概率。 影响功效的因子很多: · 样本数量:增加样本数量可提供有关总体的更多信息,因此可以提高功效。 · a (类型 I 错误的概率):增大a 值可增加功效,因为否定 a 值较大的原假设的可能性更大。 · s(总体的变异性):当 s 较小时,更容易检测到差异,这有助于增加功效。 · 总体效应的量值:总体越相似,越难检测到差异。因此,功效降低。 可在收集数据之前计算功效(预期研究),以确保假设检验可以检测到显著差异或效应。例如,一家制药公司要确定其假设检验需要具有多大的功效,才能检测出三种不同糖尿病治疗之间的差异。为提高功效,他们增加了样本数量,以了解使用这些药物的糖尿病患者总体的更多信息。而且,他们还可通过遵循好的抽样做法来尝试降低误差方差。 也可以计算功效,以了解已经执行的检验的功效(回顾研究)。例如,汽车部件制造商进行了一项比较两种钢材配方重量的试验,所得结果没有显著的统计意义。使用 Minitab,制造商可以根据希望看到的最小差异来计算功效。如果检测此差异的功效低,可能需要修改试验设计以提高功效并继续评估相同问题。但是,如果功效高,他们可能断定两种钢材配方并无差异并且不再继续进行试验。 功效等于 1- b,其中 b 是发生类型 II 错误的概率(当原假设不成立时未能否定原假设)。随着a(显著性水平)的增加,b 会降低。因此,随着 a 的增加,功效也会提高。请记住,增大 a 同时会增大类型 I 错误(当原假设成立时否定原假设)的概率。
|