产品市场生存函数的一种非参数极大似然估计法

 2003 年 8 月

系统工程理论与实践

第 8 期 

文章编号: 100026788 ( 2003) 0820087204

产品市场生存函数的一种非参数极大似然估计法
苏越良1, 2 , 高 阳1

( 1. 中南大学商学院, 湖南 长沙 410083; 2. 中南大学数学科学与计算技术学院, 湖南 长沙 410083)

摘要:  通过产品市场生存数据, 定义了估计产品市场生存时间的三个重要函数, 讨论了三者之间的关 系Λ 在非参数条件下, 给出了一种极大似然修正估计法, 并进行了应用分析Λ 关键词:  产品市场生存数据; 产品市场生存时间; 产品市场生存函数; 极大似然估计法; 修正 中图分类号:  F 062. 4        文献标识码:  A    

1 引言

产品市场生存时间是企业非常关注的问题, 一般在产品研发时就会考虑Λ 由于市场因素复杂, 随机因 素多种多样, 因此, 产品市场生存时间实质上可以看作是随机变量, 它和其他任何随机变量一样都会形成 某种分布Λ 过去总是假设产品市场生存时间的分布符合正态分布, 然后用参数统计方法进行生存数据分 析Λ但是, 人们观测到的某些产品市场生存时间是删失时间 ( cen so red t im e ) , 并不是准确的市场生存时间, 而且生存分布常常与正态分布相差甚远Λ为了准确地解决这种问题, 本文首先定义了刻划其分布的三个函 数, 然后讨论在删失数据情形下估计它们的一种非参数极大似然修正估计方法Λ

2 产品市场生存函数的定义和性质, 以及与之相关的两个函数

用表示 T 个体产品市场生存时间, 下面简称为个体产品生存时间Ζ T 的分布可用下列三个函数来刻划Ζ 2. 1 生存函数 这个函数用 S ( t) 表示, 其定义是个体产品生存时间长于 t 的概率Ζ 即: S ( t) = P ( 个体产品生存时间长于 t) ( 2. 1) = P ( T > t)   从 T 的分布函数 F ( t) 的定义知:
收稿日期: 2002204215

资助项目: 国家自然科学基金 ( 70172015) ; 湖南省软件科学计划 ( 02ZRN 2014)

  作者简介: 苏越良 ( 1969- ) , 男, 湖南平江, 副教授, 硕士研究生, 主要研究方向: 技术经济, 管理理论及建模, 信息系统Λ 高阳 ( 1943- ) , 男, 湖南望城, 教授, 博士生导师, 硕士, 主要研究方向: 信息系统, 管理理论与建模 ? 1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.

Abstract:   In th is p ap er, con sidering the fo rce of m a rket and cen so red da ta, w e m ake a study on an i 2 m p roved likelihood m ethod on esti a ting p roduct2life 2function, and w e app ly it to p ractice. T he study no t m on ly can overcom e the d ifficu lties and d raw back s in the ex isting m ethod s of esti a ting m a rket2life of m . p roduct, bu t a lso p rovide a new m ethod and p rocedu re fo r decision m akers Key words:   m a rket 2life 2da ta of p roducts; m a rket 2life 2function of p roducts; likelihood m ethod; i 2 m p roved m ethod

A n I p roved L ikelihood M ethod m on E st im a t ing M a rket 2 ife 2Funct ion of P roduct s L
( Schoo l of B u siness, Cen tra l Sou th U n iversity, Chang sha 410083, Ch ina )

SU Yue 2liang, GAO Yang

88
S ( t) = 1 -

系统工程理论与实践

2003 年 8 月

P ( 个体产品在时间 t 前消失) = 1 -

F ( t)

( 2. 2)

f ( t) 的图形叫做密度曲线Ζ 图 2 给出了两种产品的密度曲线Ζ

易知, S ( t) 是 t 的不增函数且, t= 0 时, S ( t) = 1; t= ∞时, S ( ∞) = 0 即: 在时间 0 生存的概率是 1, 在无穷时间生存的概率是 0Ζ 另外, 由于 F ( t) 是右连续的, 所以: li + S ( t) = 1 - li + F ( t) = 1 - F ( t0 ) = S ( t0 ) m m
t→ t0 t→ t0

因此, S ( t) 也是右连续的Ζ 并且有: S ( a ) - S ( b) = P ( a < t Φ b) ;   S ( a - 0) - S ( a ) = P ( t = a )    为了更形象地描述 S ( t) , 我们将 S ( t) 的图形画出来, 称之为生存曲线, 它可以描述产品生存率的高 来估计:
图 1 两种产品的生存曲线

低, 也可以反映产品生存时间的长短Ζ如图 1 是两种产品的生存曲线, 生存曲线 a 较陡, 表示较低的生存率 或较短的生存时间, 生存曲线 b 较平缓, 表示较高的生存率或较长的生存 时间Ζ如果没有删失观测值, 生存函数可用生存时间长于 t 者所占的比例 生存时间长于 t 的产品数 ( 2. 3) 产品总数 这里 Sδ ( t) 表示 S ( t) 的估计Ζ但如果有删失数据, ( 2. 3) 的分子不能确定, 这 时用 ( 2. 3) 估计 S ( t) 不适合Ζ 为了更清楚地探讨 S ( t) 的本质, 我们再另外考察两个与之相关的函 数Ζ
( 2. 4)

2. 2 概率密度函数

失的条件概率Ζ 安全率函数也可用分布函数 F ( t) 和概率密度函数 f ( t) 来定义: f ( t) h ( t) = 1 - F ( t)

生存时间 T 的概率密度函数 f ( t) 的定义是: P ( 产品在区间 ( t, t + ? t) 中消失) f ( t) = li m ? t→0 ?t
2. 3 安全率函数
图 2 两种产品的密度曲线 图 3 两种产品的安全率函数 ? 1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.

在没有删失观测值时, 密度函数可用下列公式估计: δ f ( t) =

在时间 t 开始的一个小区间内消失的产品数 产品总数 × 小区间宽度 若有删失数据, 同样不能用 ( 5) 来估计 f ( t).

生存时间 T 的安全率函数 h ( t) 就是条件生存率, 其定义是: 1 h ( t) = li m P ( 年龄是 t 的产品在 ( t, t + ? t) 中消失) ? t→0 ? t 简单地说, h ( t) 是在时间 t 时存在的产品, 再往后的单位时间区间内消
( 2. 6)

如果无删失数据, 安全率函数可以如下估计: 在时间 t 开始的区间内消失的产品数 δ h ( t) = 在时间 t 存在的产品数 × 区间宽度
=

在时间 t 后单位时间内消失的产品数 ( 2. 7) 在时间 t 存在的产品数 安全率函数可以是增函数、 减函数、 常量函数或较复杂的函数Ζ 2. 4 三个函数之间的关系 1) 从 ( 2. 2) 和 ( 2. 6) 可得到:

δ S ( t) =

( 2. 5)

第8期

产品市场生存函数的一种非参数极大似然估计法

89 ( 2. 8)

h ( t) =

f ( t) S ( t)

  2) 因为概率密度函数是分布函数的导数, 所以有:
f ( t) =

d ( [ 1 - S ( t) ] = - S ′t) dt ( S ′t) = S ( t)
t

( 2. 9)

  3) 将 ( 2. 9) 代入 ( 2. 8) 得:
h ( t) = -

d [ log e S ( t ) ] dt

( 2. 10)

  4) 将 ( 2. 4) 从 0 到 t 积分并注意 S ( 0) = 1 有:
h ∫(x ) d x = log S ( t) h S ( t) = exp ∫(x ) dx

-

e

0


5) 从 ( 2. 8) 和 ( 2. 11) 得:

t

0

( 2. 11) ( 2. 12)

f ( t) = h ( t) exp {-

log eS ( t) }

从上可知: 给出产品生存函数、 概率密度函数、 安全率函数中的一个, 另两个就可以导出Ζ因此, 要知道生存 时间 T 的分布, 就只要探讨这三个函数中间的一个Ζ 下面讨论在删失数据情况下估计生存函数的方法Ζ

3 删失数据情形下估计生存函数的方法: 非参数极大似然估计法及其修正
由于某些产品在我们进行分析时还存在, 因而其精确生存时间未知Λ这时, 当合适的分布类型未知时, 采用非参数方法具有较高的效率Λ 下面首先将 Kap lan 和 M eier 所提出的估计生存函数的乘积限 ( PL ) 方 法应用在估计产品生存函数, 然后根据市场特性对其进行一种修正Λ 先考虑一种特殊情形: 假设某种产品观测到从市场消失, 因而产品生存时间是精确知道的Λ 设 t1 , t2 , …, tn 是研究某种产品中的 n 个产品的精确生存时间Ζ 将这 n 个时间从小到大排列得 t i1 Φ t t2 Φ …Φ t in Ζ 由 ( 2. 2) 和 ( 2. 3) , 生存函数在 t i i 的值可如下估计: n- i i δ ( 3. 1) S ( tii ) = = 1n n

上述方法显然是一种特例Ζ 如果在研究时间结束时, 产品依然还存在于市场, 此法就无法进行Ζ Ka 2 p lan 和 M eier 所提出的估计生存函数的乘积限 (PL ) 方法适用于该情形Ζ
PL 估计事实上就是非参数极大似然估计Ζ

这里 n - i 是样本中生存时间长于 t i i 的产品的数目Ζ如果有两个或更多的 t ii 相等, 则是用最大的 i 值Ζ例如: 如果 t i2 = t i3 = t i , 则 n- 4 δ δ δ S ( t i2 ) = S ( t i3 ) = S ( t i4 ) = 在相继不同的生存时间区间上让 Sδ ( t) 等于区间端点值, 或者更精确一点可用线性内插得出Ζ 从上可得: 于是, 设生存时间数据有 n 个, 将这些数据从小到大排成 t i1 Φ t i2 Φ …Φ t in , 则有: n- r δ S ( t) = 7 r+ 1 tr Φ t n ? 1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.

n

设 p 1 表示至少存在一个单位时间的产品所占的比例; p 2 表示已存在一个单位时间的产品中再存在 一单位时间者所占的比例; p k 表示已存在 k - 1 个单位时间的产品中再存在一单位时间所占的比例, 则从 研究开始已存在 k 个单位时间的概率是 k 个观测生存率的乘积: δ ( 3. 2) S (k ) = p 1 × p 2 × … × p k   由于市场特性的影响, 随着市场的不断成熟, 个体产品生存时间会愈来愈短; 当市场由成熟走向衰退 时, 个体产品生存时间相对会变得越来越长, 最后整个产品生存时间也随之结束Ζ由于 ( 3. 4) 是以一个单位 δ δ S ( t) = S ( t 1) p t ( 3. 3) ( 3. 4)

90

系统工程理论与实践

2003 年 8 月

时间为时间区间的, 为了得到更精确的估计, 应该充分考虑上述的产品生存时间的特性, 在这区间上, 应对 ( 3. 4) 进行修正如下: 在区间上的估计充分利用线性内插的基础上, 添上一个调整系数Ζ调整系数可以由专 家赋予Ζ

4 非参数极大似然修正估计法应用示例
某公司计划于 1998 年元月开始生产一种燃气型中央空调Ζ 为了更好地把握燃气型中央空调市场, 公 司在 1996 年元月初就开始对市场上 100 台同类型空调的市场生存时间进行追踪调查研究Ζ这 100 台空调 可以看作是整个市场中同类型空调的一个样本Ζ公司发现, 这 100 台空调在 1996 年元月就有 60 台销售完 毕, 还剩下 40 台Ζ 在元月底, 又有 20 台同类型空调投入市场Ζ 公司同时对其生存时间进行研究Ζ 在 2 月 份, 总共有 60 台空调进入研究Ζ 经发现, 2 月份中元月份生产的又有 20 台销售完成, 还剩 20 台; 2 月份生 产的有 15 台销售完成, 还剩 5 台Ζ 假定要在 2 月底估计在市场上生存时间在 2 个月以上的空调所占的比例Ζ这时, 第一组空调有 2 个月 的观测时间, 而第二组空调只有 1 个月的观测时间Ζ 如果只看第一组的数据, 于是有一种简化估计为 Sδ ( 2)
= 20 = 0. 2, 但这个估计忽略了 2 月份 20 台空调只观测了 1 个月的事实Ζ因为第二组样本对估计 S ( 2) 也 100

应该有作用Ζ 由于在市场上存在 2 个月的空调可以看作空调存在第 1 个月后又存在了 1 个月Ζ 于是, S ( 2) = P ( 空调在市场上存在第 1 个月后再存在 1 个月) = P ( 空调在市场上存在了第 1 个月的条件下存在了 2 个月) × P ( 存在了第 1 个月)

( 4. 1)

由 PL 估计法得: δ S ( 2) = ( 存在了第 1 个月的空调中存在了 2 个月的空调所占的比例) × ( 存在了 1 个月的空调所占的比例) ( 4. 2) 20 从上面可知, 在 2 月份剩下来的 40 台空调中到 2 月底还剩 20 台, 因此, ( 3. 2) 中第一个因子为 Ζ 又元月 40 份的空调中有 40 台在市场上生存时间超过 1 个月, 2 月份新投入的 20 台空调有 5 台在市场上生存时间 40+ 5 20 40+ 5 超过 1 个月, 所以, ( 3. 2) 第 2 个因子是 Ζ 由 PL 估计得: Sδ ( 2) = × ≈ 0. 187Ζ 100+ 20 40 100+ 20 由于公司对空调市场复杂性的把握, 请专家给 2 月份的燃气型中央空调市场生存函数赋予调整系数 δ k = 0. 8, 故修正为 S ( 2) = 0. 187×0. 8= 0. 1496Ζ

5 结论

在对产品寿命估计的过程中, 更多遇到的是生存数据的删失状态, 在市场多种随机因素的作用下, 传 统对产品生存时间的分布假设为正态分布有其局限性Λ本文从构造生存函数出发, 建立了一种极大似然修 正估计法, 从理论和应用上都能够解决此类问题Λ

参考文献: [ 1 ]  EL ISA T L EE. 生存数据分析的统计方法 [M ]. 北京: 中国统计出版社, 1998. 9- 300. [ 2 ]  H a lp erin M. M ax i um likelihood esti a tion in trunca ted sam p les [J ]. A nna ls of M a them a tica l Sta tistics, 1952, 23 m m ( 3) : 226- 238. [ 3 ]  李楚霖, 林少宫 微观经济的数理分析导引 [M ]. 武汉: 华中理工大学出版社, 1985. 1- 190. . [ 4 ]  章志敏. 层次分析中的似然函数排序法 [J ]. 经济数学, 2000, 17 ( 1) : 66- 69. [5 ]  Cha rnes A , Coop er W W , R hodes E. M ea su ring the efficiency of DM U [J ]. Eu rop ean Jou rna l of O p era tiona l R e2 sea rch, 1978, 2 ( 8) : 429- 444. [ 6 ]  杨金勋. 具吸收项的多孔隙介质方程解的渐进性 [J ]. 数学研究与评论, 1992, 12 ( 1) : 1- 12. [ 7 ]  L eon tief W. Inp u t 2 tp u t Econom ics[M ]. N Y: O xfo rd U n iversity P ress, 1966. ou [ 8 ]  B a lachand ra R. A com p a rison of R &D p ro ject term ina tion facto rs in fou r indu stria l na tion [J ]. IEEE T ran saction on Eng ineering M anagem en t, 1996, 43 ( 1) : 89- 96. ? 1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.


相关文档

市场生存函数的极大似然估计极其应用
Copula函数中参数极大似然估计的性质
生存分析中的基本函数和参数模型
(5)概率密度函数的监督参数估计法
连续型随机变量函数分布密度的一种简单求法
参数方程所确定的函数的高阶导数的一种逐次求导法
第8章 函数(变量作用域及生存期)
函数二 变量的生存期和作用域
利用least-square参数估计法与Copula函数计算联合概率分布 (matlab code)
第19讲 全局变量及其作用域和生存期 函数的存储分类
电脑版