(BIBD)设计在随机化调查中应用

(整期优先)网络出版时间:2024-10-31
/ 2

(BIBD)设计在随机化调查中应用

董洪芹 

临沂科技职业学院  公共教学部  邮编276025 

摘要:在平衡不完全区组设计(BIBD)方法基础上对保护度进行改进,并构造模型,以(6,3,2)为例,通过相对偏倚、均方误差与Warner模型的估计量相比较。在保护度提高的条件下,得到的相对偏倚、均方误差与Warner相差不大。

关键字:平衡不完全区组设计;Warner模型;Monte Carlo数值模拟

中图分类号[O212.2]

The Application of BalancedIncomplete Block Designs in

Randomized Survey

Dong Hongqin 

Linyi Vocational University of science and technology  Department of Public Education 

P.C 276025  Phone 15192333296

Abstract:Under the balanced incomplete block designs (BIBD) method, improve protect degrees ,and make models. To (6 ,3,2) as an example ,In the protection of the conditionsimprovedifference between Warner model estimator’s relative bias(RB)orMSE and estimator’s relative bias(RB) or MSE of the model improved is small.

KeywordsBalanced incompleteblock designs;Warner model;Monte Carlo numerical simulation

1引言

当今社会中,已存在各种用来估计敏感性问题在人群中所占比例的方法,其中一种:平衡不完全区组设计(BIBD)方法,即事先设计b个盒子,每个盒子既包括敏感属性问题,又包括非敏感属性问题。随机抽取一组个体回答指定盒子里的问题,回答方式为打分的形式,具有此属性即得1分,否则0分,回答完所有问题后的总分。

2构造(6,3,2)模型

(一)(6,3,2)的随机化装置及BIBD抽样设计:首先设计外型上完全相同的6类卡片:第1类卡片上写“你吸毒吗”; 第2类卡片上写“你偷税吗” 第3类卡片上写“你喜欢蓝色吗”;; 第4类卡片上写“你喜欢运动吗”; 第5类卡片上写“你作弊吗”; 第6类卡片上写“你喜欢看书吗”,然后按(BIBD)抽样设计方法,将卡片放入b(b=10)个盒子里,如下表:

1

2

3

4

5

6

7

8

9

10

0

0

0

0

0

1

1

1

2

2

1

1

2

3

4

2

3

4

3

3

2

3

4

5

5

5

4

5

4

5

可知:0,1,2,3,4,5分别表示第1,2,3,4,5,6个属性问题,有下划线的数字为敏感性问题。

(二)(6,3,2)的随机化回答及性质设总体容量为N个个体,用SRSWR抽样方法从中抽取n个个体做调查,并将n平均分为bb=10)组,令,即每组有m个个体,从10组个体中随机抽取一组回答第1个盒子里的所有属性问题,从剩下的9组个体中随机抽取一组回答第2个盒子里的所有属性问题,以此类推,最后剩下1组个体回答第10个盒子里的所有属性问题,若个体具有此属性得1分,否则0分,回答值为各问题回答值得加和或0分。若加和为03时,取0分,否则回答值本身,目的是保护被调查者的个人隐私。

以此类推

其中:表示第j组样本(大小为m)中的第h个样本个体对其中的第i个问题属性值。表示第j组样本中的第h个个体的回答值。(i=0,1,…5;j=1,2,…10;h=1,2…m)

在每组个体中,按SRSWOR抽取到第h个个体回答值为0的概率设为,回答值为1的概率设为,回答值为2的概率设为,这6个属性问题均不相关。

(三)构造(6,3,2)模型:利用最小二乘法求的估计量,使

        (2.1)

达到最小。令(i=0,1,2,3,4,5)经过牛顿法得的估计量。

估计量相对偏倚分别是为:

             (2.2)

其中B(B=5000)表示(2.1)方程计算5000次,没计算一次产生一组估计量。均方误差:       (2.3)

3 Warner模型下估计量的相对偏倚及均方误差

在Warner模型下的无偏估计量分别为:          

相对偏倚:      (3.1)  

均方误差:    (3.2)

4 Monte Carlo数值模拟及效率比较

在BIBD抽样设计下改造模型估计量的数值模拟过程如下:设N=1000个个体,各属性所占的比例分别为。从N中随机抽取n=300个个体做为样本,用n个样本来估计总体中的

Warner模型的估计量数值模拟过程如下:从N中随机抽取n=300个个体做为样本,并将其均分成6组,每组50人,若回答敏感性问题,则将其代入Warner模型的估计量计算,否则可直接回答。

相对均方误差:          (4.1)

通过比较(BIBD)抽样设计方法(2.2)式与Warner方法(3.1)式的相对偏倚如下表:

编号

1

2

3

4

5

6

(BIBD)

0.3736791557

-0.2287632559

-0.0722032137

0.1792607856

-0.0681091393

-0.1544411913

(Warner)

0.0035600000

0.0023866667

0.0006133333

0.0034851852

0.0031333333

0.0008155556

(BIBD)

0.3565011803

0.2173090507

0.0569608368

0.1808143104

0.0703614703

0.1539704293

(Warner)

0.0070800000

0.0073733333

0.0017955556

0.0009037037

0.0004733333

-0.0004311111

(BIBD)

0.3610191884

0.2206171162

0.0595793374

0.1660041028

0.0603397885

0.1559857446

(Warner)

0.0053466667

0.0007933333

-0.0001822222

0.0011925926

0.0019866667

0.0022844444

通过比较(BIBD)抽样设计方法与Warner方法的相对均方误差(4.1)式如下表:

1

2

3

4

5

6

2.358476

2.473150

16.862468

16.042934

1.599224

13.842980

2.268242

2.305051

16.250424

15.954415

1.661260

13.588959

2.213163

2.434722

16.807181

16.356557

1.658696

13.046093

2.372176

2.302982

16.685803

16.608699

1.656662

13.818179

5结论

(BIBD)抽样设计改进模型相对偏倚、相对均方误差虽比Warner单个估计方法的稍高一些,但改进后的方法不但实施起来更加简便,且大大提高了保护度,从而可提高被调查者回答问题的可靠性,得到的数据更加真实,新方法还可使一次参与调查的个体数更多,调查的更广泛。

参考文献:

[1] Warner,S.L.Randomized response:A Survey technique for eliminating evasive answer bias [J]. Am.Statist.Assoc.1965,60:63-69.

[2] Hedayat,A.S.,Rao,C.R.,Stufken,J..Samplng plan excluding contiguous units [J]. Journal of Statist .Plann.Inference ,1988,19,159-170.

[3]冯士雍,施锡铨.抽样调查-理论,方法和实践[M].上海:上海科技技术出版社,1994.

[4]薛毅,陈立萍.R统计建模与R软件[M].清华大学出版社,2007