— (284)

دانشکده علوم
پایان نامه کارشناسی ارشد در رشته آمار ریاضی
فواصل اطمینان همزمان برای مقایسه میانگین های جوامع لاگ نرمال
به کوشش:
طاهره منوچهری
استاد راهنما:
دکتر سلطان محمد صدوقی الوندی
خرداد 1393

به نام خدا
اظهار نامه
اینجانب طاهره منوچهری ( 9130241 ) دانشجوی رشتهی آمار گرایش آمار ریاضی دانشکده علوم اظهار میکنم که این پایان نامه حاصل پژوهش خودم بوده و در جاهایی که از منابع دیگران استفاده کردهام، نشانی دقیق و مشخصات کامل آن را نوشتهام. همچنین اظهار میکنم که تحقیق و موضوع پایان نامهام تکراری نیست و تعهد مینمایم که بدون مجوز دانشگاه دستاوردهای آن را منتشر ننموده و یا در اختیار غیر قرار ندهم. کلیه حقوق این اثر مطابق با آییننامه مالکیت فکری و معنوی متعلق به دانشگاه شیراز است.
نام و نام خانوادگی: طاهره منوچهری
تاریخ و امضا:
تقدیم به
پدر و مادر عزیز و مهربانم،
که در سختی ها و دشواری های زندگی همواره یاوری دلسوز و فداکار و پشتیبانی محکم ومطمئن برایم بوده اند.
سپاسگزاری
سپاس باد، ایزد دانا و توانا را که لطف و عنایت خود را شامل این بنده ناچیز کرد تا در راه رسیدن به اهداف و خواستههایم قدمی کوچک بردارم. اکنون که به مدد خداوند این دست نوشته به اتمام رسیده است، بر خود واجب میدانم تا از تمام دوستان و عزیزانی که مرا در تهیه این رساله همراهی نمودهاند تشکر و قدردانی کنم. از پدر و مادر مهربانم که با صبر و پشتیبانی همیشگی خود، آرامش روحی و آسایش فکری مرا فراهم نمودند و همواره امید به موفقیت را در من زنده نگاه داشتند و همچنین از برادران عزیزم که وجودشان همواره مایه دلگرمی من است، خاضعانه تشکر می کنم.
مراتب سپاس و قدردانی بیکران خود را به محضر استاد ارجمند جناب آقای دکتر محمد صدوقی که با کولهباری از تجربه همواره راهنمای من در به اتمام رساندن این رساله بودهاند، تقدیم می دارم. همچنین از اساتید بزرگوار،جناب آقای دکتر محمود خراتی و سرکار خانم دکتر مینا توحیدی که با راهنمایی های ارزنده خود در تصحیح پایان نامه مرا یاری نموده اند، کمال تشکر را دارم.
چکیده

فواصل اطمینان همزمان برای مقایسه میانگین های جوامع لاگ نرمال
به کوشش
طاهره منوچهری
توزیع لاگ نرمال به طور عمده برای تجزیه و تحلیل داده های مثبت و چوله به راست مورد استفاده قرار می گیرد. این داده ها معمولا در مطالعات و تحقیقات زیست شناسی، پزشکی و اقتصادی بدست می آیند. ما در این رساله ابتدا به بررسی آزمون برابری میانگین های لاگ نرمال با استفاده از مفهوم p-مقدار تعمیم یافته (GP) که توسط لی (Li)(2009) معرفی شده است، می پردازیم. نتایج شبیه سازی ها نشان می دهد که این روش بهتر از روش های مجانبی دیگر چون آزمون ولچ عمل می کند. همچنین به مقایسه همزمان نسبت و اختلاف میانگین های لاگ نرمال با ساختن فواصل اطمینان همزمان که توسط شاراشمیت (Schaarschmidt) (2013) معرفی شده است، خواهیم پرداخت. او با بکارگیری تقریب نرمال، تصحیح بانفرونی و کمیت محوری تعمیم یافته (GPQ)، فواصل اطمینان همزمان را معرفی می کند. طبق نتایج بدست آمده از شبیه سازی ها، روش ارائه شده برپایه کمیت محوری تعمیم یافته بهتر از روش های دیگر عمل می کند. همچنین به معرفی فاصله اطمینان تعمیم یافته فیدوشیال که توسط هنیگ (Hannig et.al) (2006) برای مقایسه نسبت میانگین های لاگ نرمال استفاده شده است، می پردازیم. این فواصل اطمینان دارای پوشش مجانبی صحیح می باشد.
کلید واژه:p -مقدار تعمیم یافته، کمیت محوری تعمیم یافته، کمیت محوری تعمیم یافته فیدوشیالفهرست مطالب
عنوان صفحه
فصل اول: مقدمه
1-1- کاربردهای توزیع لاگ نرمال2
1-2- ویژگی ها و خواص توزیع لاگ نرمال3
1-2-1- تابع چگالی احتمال 3
1-2-2- رابطه توزیع لاگ نرمال با توزیع نرمال3
1-2-3- کمیت های توزیع لاگ نرمال4
1-2-4- برآوردگرهای ماکزیمم درستنمایی و نااریب پارامترها6
1-3- بررسی میانگین توزیع لاگ نرمال6
1-3-1- پیشینه7
1-3-2- آزمون برای میانگین توزیع لاگ نرمال8
1-3-2-1-p -مقدار تعمیم یافته8
1-3-3- فاصله اطمینان برای میانگین توزیع لاگ نرمال11
فصل دوم: آزمون برابری میانگین های جوامع لاگ نرمال
2-1- مقدمه15
2-2- آزمون ها16
2-2-1- آزمون ولچ (Welch’s test)17
1-2-2-1- روش ولچ (Welch Method)18
2-2-2- روش p-مقدار تعمیم یافته20
2-3- شبیه سازی27
2-4- نتیجه گیری29
فصل سوم : فواصل اطمینان همزمان برای مقایسه نسبت و اختلاف میانگین های جوامع لاگ نرمال
3-1- مقدمه31
3-2- نمادها و پارامترها31
3-3- روش های ساختن فواصل اطمینان همزمان33
3-3-1- روش تقریب نرمال با تصحیح بانفرونی33
3-3-2- روش کمیت محوری تعمیم یافته با تصحیح بانفرونی36
3-3-3- روش تقریب نرمال و تصحیح آن بوسیله چندک های نرمال چند متغیره36
3-3-4- روش کمیت محوری تعمیم یافته38
3-3-5- روش کمیت محوری تعمیم یافته فیدوشیال42
3-3-5-1- پیشینه44
3-3-5-2- معرفی روش ساختن فاصله اطمینان تعمیم یافته فیدوشیال45
3-3-5-3- فاصله اطمینان همزمان تعمیم یافته فیدوشیال46
3-3-5-4- خصوصیت مجانبی فواصل اطمینان همزمان تعمیم یافته فیدوشیال48
3-4- شبیه سازی مونت کارلو52
فصل چهارم: مثال عددی و نتیجه گیری
4-1- مثال عددی63
4-2- نتیجه گیری66
پیوست
پیوست 1 : برنامه نویسی69
پیوست 2 : لغت نامه فارسی- انگلیسی97
پیوست3 : لغت نامه انگلیسی-فارسی101
فهرست منابع و مراجع105
فهرست جدول ها
عنوان و شماره صفحه
جدول 2-3-1- برآورد مونت کارلو برای خطای نوع اول آزمون ها 28
جدول 2-3-2- برآورد مونت کارلو برای توان آزمون ها 28
جدول 3-1- مجموعه پارامترهای μi و σi2 انجام شده در شبیه سازی ها 54
جدول 4-1- برآورد پارامترها در مثال 4-1 63
جدول 4-2- فواصل اطمینان همزمان 95 درصدی عددی دو طرفه برای نسبت و اختلاف گروه ها با گروه کنترل در مثال 4-1 64
جدول 4-3- فواصل اطمینان همزمان 95 درصدی دو طرفه برای نسبت گروه ها با گروه کنترل با روش دانت در مثال 4-1 65
فهرست نمودارها
عنوان و شماره صفحه
نمودار 1-2-1- تابع چگالی لاگ نرمال با μ=0 و برای پنچ مقدار از σ2 5
نمودار 3-1- نمودار جعبه ای احتمال پوشش ها برای مجموعه پارامترهای تعریف شده در جدول 3-1 57
نمودار 3-2- نمودار پراکندگی احتمال پوشش های روش GPQ و روش های ANB،ANM و GPQB برای مقایسه گروه ها با گروه کنترل 58
نمودار 3-3- نمودار پراکندگی برآورد اریبی نسبی روش های GPQ و ANM برای 23 مجموعه پارامترهای تعریف شده در جدول 3-1 60
نمودار 4-1(a)- نمودار جعبه ای برای مشاهدات مثال 4-1 63
نمودار 4-2(b)- نمودار Q-Q مقادیر باقیمانده مدل یک طرفه ANOVA برای داده های اصلی مثال 4-1 63
نمودار 4-2(c)- نمودار Q-Q مقادیر باقیمانده مدل یک طرفه ANOVA برای داده های تبدیل یافته با تبدیل لگاریتم داده های اصلی مثال 4-1 63
فهرست نشانه های اختصاری
ANB : Asymptotic normality with the Bonferroni adjustment
ANM : Asymptotic normality and multiplicity adjustment
ANOVA : Analysis of variance
FGPQ : Fiducial generalized pivotal quantity
GP : Generalized p-value
GPQ : Generalized pivotal quantity
GPQB : Generalized pivotal quantity with Bonferroni adjustment
LN : log normal

فصل اول: مقدمه
مقدمه
در این فصل توزیع لاگ نرمال و زمینه های کاربرد این توزیع را معرفی خواهیم کرد. همچنین برای آشنایی با مفاهیمی که در این پایان نامه استفاده می شود، به آزمون کردن و ساختن فاصله اطمینان برای میانگین این توزیع می پردازیم.
کاربردهای توزیع لاگ نرمال
در تحقیقات و مطالعات پزشکی و زیست شناسی، داده های بدست آمده معمولا مثبت بوده و دارای توزیع راست چوله با واریانس هایی هستند که با افزایش میانگین افزایش می یابند. به ویژه زمانی که داده ها از فرآیندهای تکثیری بدست می آیند، می توان انتظار چنین ویژگی- هایی را داشت. به عنوان مثال آزمایشات ژنتیک و فرآیند متابولیسمی در سیستم زیستی دارای چنین شرایطی هستند. یک راه برای توجیه این ویژگی ها در نظر گرفتن توزیع لاگ نرمال برای داده ها می باشد. البته با توجه به رابطه توزیع لاگ نرمال با توزیع نرمال، این فرض را می توان با استفاده از نمودار چندکها یا آزمون شپیرو-ویلک(Shapiro-wilk test) برای داده- های نرمال بررسی کرد. برای انجام آزمون شپیرو-ویلک ابتدا لازم است از یک تبدیل لگاریتمی روی داده ها استفاده شود. زیرا اگر داده های اصلی لاگ نرمال باشند با این تبدیل داده ها دارای توزیع نرمال می شوند.
ویژگی ها و خواص توزیع لاگ نرمال
1-2-1- تابع چگالی احتمال
توزیع لاگ نرمال دو پارامتری (LN) که با نماد LN(μ,σ2) نمایش داده می شود، دارای تابع چگالی احتمال به صورت زیر است:
f(x;μ,σ2)=1×2πσ2exp⁡{-12σ2lnx-μ)2, x>0, μ∈R, σ>0که در آن، μپارامتر مکان و σ پارامتر مقیاس می باشد.
با توجه به فرم تابع چگالی لاگ نرمال، این توزیع متعلق به خانواده توزیع های نمایی طبیعی است.
1-2-2- رابطه توزیع لاگ نرمال با توزیع نرمال
اگر فرض کنیم که X دارای توزیع LN(μ,σ2) باشد، آنگاه Y=ln⁡(X) دارای توزیع نرمال با میانگین μ و واریانس σ2 خواهد بود که با نماد N(μ,σ2) نمایش می دهند و دارای تابع چگالی احتمال به صورت زیر است:
f(y;μ,σ2)=12πσ2exp⁡{-12σ2y-μ)2 y∈R, μ∈R, σ>01-2-3- کمیت های توزیع لاگ نرمال
اگر فرض کنیم که X دارای توزیع LN(μ,σ2) باشد،آنگاه تابع مولد گشتاور Y=ln⁡(X) که Y دارای توزیع N(μ,σ2) است، به صورت زیر خواهد بود:
MYt=EetY=eμt+12t2σ2از آن جایی که X=eY است، میانگین و واریانس متغیر X را می توان به صورت زیر محاسبه کرد.
EX=EeY=MY1=eμ+12σ2VarX=EX2-E2X=Ee2Y-E2eY =MY2-MY21=e2μ+2σ2-e2μ+σ2=e2μeσ2(eσ2-1)که با تعریف w=eσ2 داریم
VarX=ww-1e2μضریب تغییرات (CV)، ضریب چولگی γ1 و ضریب برجستگی (γ2) توزیع لاگ نرمال، به ترتیب به صورت زیر هستند:
CV=w-1, γ1=w+2w-1, γ2=w4+2w3+3w2-6همچنین با توجه به اینکه μ میانه توزیع متغیر تصادفی Y است یعنی
PrY≤μ=12و اینکه تابع نمایی یک تابع صعودی و یک به یک می باشد پس
PrY≤μ=PreY≤eμ=PrX≤eμ=12بنابراین میانه توزیع متغیر تصادفی X برابر با eμ خواهد بود.
همان طور که مشاهده می شود، توزیع لاگ نرمال یک توزیع با مقادیر مثبت است. در این توزیع کمیتی چون میانه فقط به پارامتر μ و کمیت های همچون ضریب تغییرات، ضریب چولگی و ضریب برجستگی به پارامتر σ2 بستگی دارند، اما کمیت های بسیار مهم و کاربردی در تحلیل و استنباط آماری یعنی میانگین و واریانس آن تابعی از پارامترهای توزیع یعنی μ وσ2 می باشند. قابل ذکر است که این توزیع بشدت چوله می باشد و میزان چولگی آن به پارامتر σ2 بستگی دارد. برای روشن تر شدن این موضوع نمودار تابع چگالی احتمال چند توزیع لاگ نرمال با پارامتر μ=0 وσ2 های مختلف در زیر آورده شده است.
نمودار (1-2-1): تابع چگالی لاگ نرمال با μ=0 برای پنچ مقدار از σ20.2 ―
0.5 ―
1 ―
2 ―
3 ―

1-2-4- برآوردگرهای درستنمایی ماکزیمم و نااریب پارامترها
اگر فرض کنیم X1,…,Xn یک نمونه تصادفی از توزیع LN(μ,σ2) باشند، آنگاهY1,…,Yn، Yi=ln⁡(Xi)، دارای توزیع N(μ,σ2)خواهند بود، بنابراین برآوردگرهای درستنمایی ماکزیمم برای μ و σ2 به صورت زیر هستند:
μ=Y=1ni=1nYi , σ2=1ni=1nYi-Y2.و برآوردگر نااریب برای σ2 به صورت زیر می باشد:
S2=1n-1i=1n(Yi-Y)2.بررسی میانگین لاگ نرمال
به طور معمول میانه به عنوان معیار خلاصه سازی داده های چوله مورد توجه است، همچنین با توجه به اینکه میانه این توزیع تنها به پارامتر μ بستگی دارد، به راحتی می توان آماره آزمون و فاصله اطمینان برای میانه را محاسبه کرد ولی معمولا میانه، کمیت مورد علاقه برای محققان نیست. به عنوان مثال، یکی از کمیت های مورد علاقه مدیران بیمارستان میانگین هزینه درمان در زیرگروه های مختلف بیماران است. به طور کلی، اگر پرسش محقق مربوط به استنباط در مورد متوسط، مجموع یا نسبت باشد، واضح است که استنباط برای میانگین جامعه بیشتر از میانه مد نظر می باشد. از آنجا که میانگین این توزیع تابعی از هر دو پارامتر است، بدست آوردن آزمون دقیق یا آزمون و فواصل اطمینان بهینه پیچیده می شود. روش های زیادی برای استنباط در مورد میانگین توزیع لاگ نرمال وجود دارد. ما در این فصل از مفهوم p-مقدار تعمیم یافته (Generalized p-value) و فاصله اطمینان تعمیم یافته (Generalized Confidence Interval) استفاده می کنیم.
1-3-1- پیشینه
استنباط درباره میانگین یک جامعه لاگ نرمال توسط افرادی چون لند (Land) در سالهای (1971،1972،1973،1975،1988)، آنگوس (Angus)(1994)، ژو و گو (Zhou & Gao) (1997) و کریشنامورتی و متیو (Krishnamoorty & Mathew)(2003) مورد بررسی قرار گرفته است. مسئله مقایسه میانگین های دو جامعه لاگ نرمال در مطالعات افرادی چون ژو و گو (1997)، ژو و تو (Tu) (2000)، کریشنامورتی و متیو (2003) و چن (Chen) و ژو (2006) مطرح شده است. همچنین برای آزمون برابری میانگین های جوامع لاگ نرمال، روش های کلاسیک توسط گوو و لوه (Guo & Luh)(2000) و گیل (Gill)(2004) معرفی شد که این روش ها به طور مناسب خطای نوع اول را کنترل نمی کنند. البته این مسئله را لی (Li) در سال 2009 بررسی کرد. او آزمونی را براساس روش p-مقدار تعمیم یافته کریشنامورتی و متیو (2003) ارائه کرد. همچنین مسئله فواصل اطمینان همزمان برای نسبت میانگین های توزیع لاگ نرمال توسط هنیگ (Hannig) (2009) و صدوقی الوندی و ملک زاده (Sadooghi-Alvandi & Malekzadeh) (2014) و برای نسبت و اختلاف میانگین های توزیع لاگ نرمال توسط شاراشمیت (Schaarschmidt)(2013) بررسی شده است.
کریشنامورتی و متیو برای استنباط روی میانگین توزیع لاگ نرمال از مفهوم p-مقدار تعمیم یافته و فاصله اطمینان تعمیم یافته استفاده کردند. p-مقدار تعمیم یافته توسط ویراهاندی و تسو (Weerahandi & Tsue) در سال 1989 و فاصله اطمینان تعمیم یافته توسط ویراهاندی در سال 1993 معرفی شده است. (Krishnamoorty and Mathew,2003,p.103-121)
1-3-2- آزمون برای میانگین توزیع لاگ نرمال
فرض کنید X1,…,Xn یک نمونه تصادفی از توزیع LN(μ,σ2) باشد و Yi=ln⁡(Xi) قرار می دهیم. برای راحتی محاسبات به جای میانگین توزیع، لگاریتم آن یعنی η=μ+12σ2 را آزمون می کنیم. آزمون زیر را در نظر بگیرید:
(1-3-1) H0:η≤η0 v.s H1:η >η0که η0 یک مقدار مشخص از η می باشد.
1-3-2-1-p -مقدار تعمیم یافته
فرض کنید X یک بردار تصادفی از توزیعی با بردار پارامترهای نامعلوم η=(θ,δ) باشد به گونه ای که θ پارامتر مورد علاقه و δ پارامتر مزاحم می باشد. (پارا متر مزاحم پارامتری است که در توزیع متغیر X وجود دارد اما پارامتر مورد علاقه نیست.)
فرض کنید علاقه مند به آزمون H0:θ≤θ0 در مقابل H1:θ>θ0 هستیم به گونه ای که θ0 مقداری مشخص و معلوم می باشد. همچنین فرض کنید x نشان دهنده مقدار مشاهده شده بردار تصادفی X باشد.
کمیت تصادفی T(X;x,θ,δ) که به مقدار مشاهده شده x و پارامترها بستگی دارد را متغیر آزمون تعمیم یافته (Generalized Test Variable) گوییم هرگاه سه ویژگی زیر برقرار باشد:
1) مقدار مشاهده شده T(X;x,θ,δ) یعنی T(x;x,θ,δ) وابسته به پارامترهای نامعلوم نباشد.
2) توزیع آماره T(X;x,θ,δ) به شرط مشخص بودن پارامتر θ به پارامتر مزاحم δ بستگی نداشته باشد.
3) به ازای x و δ ثابت، Pr⁡(T(X;x,θ,δ)≤t) تابعی یکنوا نسبت به θ باشد. (1-3-2)
براساس شرایط فوق اگر Pr⁡(T(X;x,θ,δ)≤t) نسبت به θ غیرصعودی باشد، آنگاه p-مقدار تعمیم یافته به صورت زیر تعریف می شود:
p-value=supθ≤θ0PrTX;x,θ,δ≥t=PrTX;x,θ0,δ≥t
در ضمن اگر Pr⁡(T(X;x,θ,δ)≤t) نسبت به θ غیرنزولی باشد، آنگاه p-مقدار تعمیم یافته به صورت زیر خواهد بود:
p-value=supθ≤θ0PrTX;x,θ,δ≤t=PrTX;x,θ0,δ≤t به گونه ای که t=Tx;x,θ,δ است.
طبق تعریف فوق، در توزیع لاگ نرمال مطرح شده، اگر آماره T1 را به صورت زیر تعریف کنیم:
T1=y-Y-μSnsn+12σ2S2s2-η(1-3-3) =y-ZUn-1sn+12s2Un-1-ηکه در آن Z=Y-μσn دارای توزیع نرمال استاندارد و U=(n-1)S2σ2 دارای توزیع کای اسکور با n-1 درجه آزادی می باشد. همچنین Uو Z از هم مستقل هستند. Y وS2 برآوردگرهای نااریب برای μ و σ2 هستند که در بخش (1-2-4) معرفی شده است. حال شرایط (1-3-2) را برای آماره T1 بررسی می کنیم:
1) مقدار مشاهده شده T1 صفر است، بنابراین t1 به پارامترهای مجهول بستگی ندارد.
2) به ازای η ثابت، با توجه به اینکه آماره T1 ترکیبی از توزیع های نرمال و کای اسکور است که توزیع آنها به پارامترهای مجهول بستگی ندارد. بنابراین توزیع T1 هم به پارامترهای مجهول بستگی ندارد.
3) با توجه به اینکه η پارامتر مکان است، بنابراین Pr⁡(T1≤t1) نسبت به η غیر نزولی می- باشد.
در نتیجه می توان T1 را به عنوان متغیر آزمون تعمیم یافته در نظر گرفت و p-مقدار تعمیم یافته را به صورت زیر تعریف کرد:
p-value=PrT1<0η=η0بنابراین فرض صفر در رابطه (1-3-1) در سطح α رد می شود اگر p-value<α باشد.
1-3-3- فاصله اطمینان برای میانگین توزیع لاگ نرمال
در این جا نیز برای سادگی محاسبات ریاضی ابتدا برای η یک فاصله اطمینان بدست می- آوریم سپس از تبدیل نمایی استفاده می کنیم.
کمیت تصادفی R=rX;x,θ,δ که به مقدار مشاهده شده x و پارامترها بستگی دارد را کمیت محوری تعمیم یافته(Generalized Pivotal Quantity) گوییم هرگاه شرایط زیر برقرار باشد.
1) توزیع کمیت R مستقل از پارامترهای نامعلوم باشد.
2) مقدار مشاهده شده R یعنی r(x;x,θ,δ) وابسته به پارامتر مزاحم δ نباشد. (1-3-5)
حال اگر Cγ را طوری در نظر بگیریم که PrR∈Cγ=γ باشد، آنگاه مجموعه Θc از فضای پارامتری Θ (Θ فضای پارامتری θ می باشد) که به صورت زیر تعریف می شود، یک فاصله اطمینان تعمیم یافته 100γ درصد برای θ خواهد بود.
ΘCr=θ∈Θ:rx;x,θ,δ∈Cγبا توجه به تعریف فوق، برای توزیع لاگ نرمال مطرح شده، اگر T2 را به صورت زیر تعریف کنیم:
T2=y-Y-μSnsn+12σ2S2s2(1-3-6) =y-ZUn-1sn+12s2Un-1
آنگاه T2 یک کمیت محوری تعمیم یافته برای η خواهد بود، زیرا شرایط (1-3-5) که در زیر بررسی شده است، برقرار می باشد.
1) با توجه به اینکه کمیت T2 ترکیبی از توزیع های نرمال و کای اسکور است و توزیع آنها به پارامترهای مجهول بستگی ندارد. بنابراین توزیع T2 هم به پارامترهای مجهول بستگی ندارد.
2) مقدار مشاهده شده T2 برابر η می باشد که به پارامتر مزاحم μ وابسته نیست.
بدین ترتیب یک فاصله اطمینان 100(1-α) درصد تعمیم یافته برای η به صورت زیر تعریف می شود:
T2α2,T21-α2که در آن مقدار T21-α2 و T2α2 صدک های 100(α2) و 100(1-α2) از توزیع T2 می باشد.
با توجه به روابط (1-3-3) و (1-3-6)، T1=T2-η است. پس می توان p-مقدار تعمیم یافته برای آزمون (1-3-1) را از آماره T2 به صورت زیر محاسبه کرد:
p-value=PrT2≤η0پس فرض η≤η0 در سطح α رد می شود اگر p-value<α باشد.
برای محاسبه p-مقدار تعمیم یافته و فاصله اطمینان تعمیم یافته لازم است توزیع T2 را بدانیم ولی با توجه به اینکه T2 تنها به نمونه، متغیرهای تصادفی نرمال استاندارد و کای اسکور ارتباط دارد، پس برای مشخص کردن توزیع آن از محاسبه این آماره با استفاده از تولید تصادفی K مقدار از T2 که K یک مقدار بزرگ است، استفاده می کنیم. در این صورت با استفاده از روش مونت کارلو که در الگوریتم زیر آمده است، می توان p-مقدار تعمیم یافته و فاصله اطمینان تعمیم یافته را برآورد کرد.
الگوریتم :
برای هر نمونه بدست آمده x1,…,xn مقادیر yi=ln⁡(xi)، i=1,..,n، را بدست می آوریم.
y=1ni=1nyi و s2=1n-1i=1n(yi-y)2 را محاسبه می کنیم.
برای k=1,…,Kمتغیرهای Zk~N(0,1) و Uk~χn-12 را تولید می کنیم.
مقادیر T2k=y-ZkUkn-1sn+12s2Uk2n-1 را بدست می آوریم.
( پایان حلقه )
اگر T2k≤η0 باشد dk=1 و در غیر اینصورت dk=0 قرار می دهیم.
بنابراین برآورد p-مقدار تعمیم یافته به صورت 1Kk=1Kdk می باشد، همچنین صدک 100(1-α) ام از T21,…,T2K، برآورد کران بالای فاصله اطمینان تعمیم یافته یک طرفه برای η یعنی T21-α خواهد بود.
فصل دوم: آزمون برابری میانگین های جوامع لاگ نرمال
آزمون برابری میانگین های جوامع لاگ نرمال
2-1- مقدمه
یکی از مسائل مهم در آمار، مسئله مقایسه میانگین های چند جامعه (تیمار) است. روش استاندارد برای آزمون کردن برابری میانگین های چند جامعه با فرض نرمال بودن توزیع داده- ها، آزمون F (ANOVA F-test) می باشد، با توجه به رابطه توزیع لاگ نرمال و نرمال که در بخش (1-2-2) بیان شد، می توان از تبدیل لگاریتم طبیعی روی داده ها و آزمون F برای بررسی این مسئله در توزیع لاگ نرمال استفاده کرد. ولی با این تبدیل، فرض برابری میانگین- ها در داده های اصلی با فرض برابری میانگین ها در داده های تبدیل یافته در صورتی که واریانس های داده های تبدیل یافته برابر نباشند، معادل نخواهند بود که در ادامه این موضوع بررسی می شود.
برای حل این مسئله روش استاندارد و دقیقی وجود ندارد. استفاده از روش های مجانبی، یک راه حل معمول در این گونه مسائل می باشد که در این مسئله نیز چندین روش مجانبی وجود دارد.
گوو و لوه در سال 2000 سه آزمون مجانبی را مورد بررسی قرار دادند که شامل آزمون آلکساندر-گوورن (Alexander-Govern test) (1994)، آزمون ولچ (Welch test) (1951) و آزمون مرتبه دوم جیمز (James second-order test) (1951) می باشند. این روش ها را با آزمون F مقایسه کردند. نتایج شبیه سازی آنها نشان داد که این سه آزمون تقریبا مانند هم عمل می کند و قابل اعتماد تر و پرتوان تر از آزمون F می باشد.
همچنین، لی (Li) در سال 2009، روش p-مقدار تعمیم یافته را برای مقایسه میانگین های چند جامعه لاگ نرمال بکار برد که در مقایسه با آزمون های مجانبی دیگر خواص خوبی داشت.
در این فصل به معرفی روش لی و آزمون ولچ می پردازیم و این دو روش را براساس ملاک هایی چون توان و اندازه آزمون مقایسه می کنیم.
2-2- آزمون ها
فرض کنید طرح، یک طرح تصادفی کامل وYi1,…,Yini مشاهده ها از واحدهای آزمایشی در تیمار i ام i=1,…,I باشد. همچنین فرض کنید Yij=exp⁡(Xij) دارای توزیع N(μi,σi2) است، به عبارت دیگر Xij دارای توزیع لاگ نرمال با پارامترهای μi وσi2 و امید ریاضی θi=exp⁡(μi+12σi2)، می باشد.
μi=Yi=1nij=1niYij و σi2=1nij=1ni(Yij-μi)2 به ترتیب برآوردگرهای درستنمایی ماکزیمم برای μi و σi2 هستند، همچنین برآوردگر نااریب برای σi2، Si2=1ni-1j=1ni(Yij-μi)2 می باشد.
در این فصل مسئله مورد علاقه آزمون کردن فرضیه های زیر می باشد:
(2-2-1) H0:θ1=…=θI v.s H1:.باشد متفاوت θi از یکی حداقلاگر ηi=ln(θi) قرار دهیم آنگاه فرض فوق معادل می شود با
(2-2-2) H0:η1=…=ηI v.s H1:.باشد متفاوت ηi از یکی حداقلو در صورت برابر بودن σi2 (واریانس Yij ) فرض برابری ηiمعادل با فرض برابری μi خواهد بود، یعنی
H0*:μ1=…=μI v.s H1*:باشد متفاوت μi از یکی حداقلکه در این صورت با مسئله مقایسه میانگین های I جامعه نرمال روبرو هستیم و می توانیم از آزمون استاندارد F استفاده کنیم. همچنین برای آزمون کردن برابریσi2 ( واریانس Yij ها ) می توان از آزمون لون(Leven’s test) (1960) استفاده کرد. ولی اگرσi2 ها برابر نباشند، فرض H0 هرگز با فرض H0* معادل نخواهند بود و آزمون F مناسب نیست. در ادامه برای آزمون کردن فرض H0 دو آماره آزمون مجانبی را معرفی می کنیم.
2-2-1- آزمون ولچ (Welch’s test)
ولچ در سال 1951 برای مقایسه میانگین چند جامعه، یک آزمون مجانبی معرفی کرد. در این بخش ابتدا روش ولچ را به صورت مختصر توضیح می دهیم (Welch, 1951,p.330-336)، سپس با استفاده از این روش به آزمون کردن فرضیه (2-2-2) می پردازیم.
2-2-1-1- روش ولچ (Welch Method)
فرض کنید Yi، i=1,…,I، متغیرهای تصادفی مستقل با توزیع نرمال با میانگین μi و واریانس λiσi2 باشند که در آن λi ثابت و معلوم و μi و σi2 مجهول می باشند. همچنین فرض کنید Si2 برآورد σi2 باشد بطوری که fiσi2Si2 دارای توزیع کای اسکور با fi درجه آزادی باشد.
ولچ در سال 1951 آماره i=1Iwi(Yi-Y)2، که در آن wi=1λiSi2 و Y=i=1IwiYii=1Iwi می باشد را معرفی کرد. وی با محاسبه تابع مولد گشتاور این آماره و مقایسه آن با تابع مولد گشتاور توزیع F به این نتیجه رسید که i=1Iwi(Yi-Y)2 تقریبا دارای توزیع cF است بطوریکه F دارای توزیع F با درجات آزادی v1 و ν2 می باشد که v1 ، ν2 و c به صورت زیر محاسبه می شوند.
v1=I-1 , v1=I2-13Ac=I-1+2I-2I+1A , A=i=1I1fi1- wii=1Iwi2.در مسئله مورد نظر ما، با توجه به اینکه μi و Si2 برآوردگرهای نااریب برای μi و σi2 هستند، پس برآوردگر نااریب برای ηi به صورت زیر خواهد بود:
ηi=μi+12Si2که در آن μi وSj2 مستقل از هم هستند و μi دارای توزیع Nμi,σi2ni و (ni-1)Si2σi2 دارای توزیع کای اسکور با ni-1 درجه آزادی می باشد، بدین ترتیب
varηi=σi2ni+σi4{2ni-1}با جایگزین کردن برآوردگر Si2 به جای σi2، یک برآوردگر برای واریانس ηi به صورت زیر خواهد بود:
Si2ni+Si4{2ni-1}برای ساختن آماره ولچ، ابتدا لازم است روابط زیر را تعریف کنیم:
wi=1{Si2ni+Si42ni-1} , U=i=1Iwi , η=(i=1Iwiηi)/Uحال اگر B,A را به صورت زیر تعریف کنیم:
A=I-1-1i=1Iwiηi-η2B=2I-1I2-1-1i=1I(1-wiU)2ni-1آنگاه آماره ولچ به صورت
W=AB+1است که تحت فرض صفر دارای توزیع مجانبی F با v1=I-1 و
v2={3I2-1-1i=1I(1-wiU)2ni-1}-1درجه آزادی می باشد. بنابراین فرض صفر در (2-2-2) رد می شود اگر W بزرگتر از صدک 100(1-α) از توزیع F با v1 و v2 درجه آزادی باشد.
2-2-2- روش p-مقدار تعمیم یافته
لی در سال 2009 براساس روش کریشنامورتی و متیو (2003)، p-مقدار تعمیم یافته برای آزمون (2-2-2) را به صورت زیر محاسبه کرد.(Li ,2009 , p.1404-1408)
اگر قرار دهیمη=(η1,…,ηI)’ و تعریف کنیم
H=10…0-101…0-1……………00…1-1(I-1)×Iآنگاه آزمون (2-2-2) با آزمون زیر معادل می شود:
(2-2-3) H0:Hη=0 v.s H1:Hη≠0براساس مطالب گفته شده در بخش (1-3-3)، Tηi تعریف شده در زیر یک کمیت محوری تعمیم یافته برای پارامتر ηi=μi+12σi2، i=1,…,I می باشد.
Tηi=yi-ZiUini-1sini+12si2Ui(ni-1)در رابطه بالا yi وsi2 مقدار مشاهده شده میانگین و واریانس نمونه ای Yi وSi2 و Zi=ni(Yi-μi)/σi دارای توزیع نرمال استاندارد و Ui=ni-1Si2/σi2 دارای توزیع کای اسکور با ni-1 درجه آزادی می باشد و در ضمن Zi ها از Ui ها مستقل هستند.
بنابراین یک کمیت محوری برای Hη به صورت
(2-2-4) THη=HTη1,…,TηI’ =HTηبدست می آید.
قضیه 2-2-1: اگر بردارهای Y=(Y1,…,YI) و S2=(S12,…,SI2) را داشته باشیم، آنگاه امید شرطی و ماتریس واریانس شرطی THη به شرط Y,S2=(y,s2) که به ترتیب با μT و ΣT نمایش داده می شود به صورت زیر می باشد:
μT=HETη1y,s2,…,ETηIy,s2’ΣT=HdiagVarTη1y,s2,…,VarTηIy,s2H’که در این روابط
ETηiy,s2=yi+ni-12ni-3si2 ,ni>3VarTηiy,s2=ni-1nini-3si2+ni-122ni-32ni-5si4 , ni>5اثبات: با توجه به تعریف امید ریاضی و واریانس داریم:
μT=ETHηy,s2=EHTηy,s2=HETη1,…,TηI’y,s2 =HETη1y,s2,…,ETηIy,s2’ΣT=VarTHηy,s2=VarHTηy,s2=H VarTηy,s2H’ =HdiagVarTη1y,s2,…,VarTηIy,s2H’که در این روابط ETηiy,s2 و VarTηiy,s2 به صورت زیر محاسبه می شود:
ETηiy,s2=Eyi-ZiUini-1sini+12si2Ui(ni-1)y,s2 =yi-ni-1nisiEZiy,s2E1Uiy,s2+ni-12si2E1Uiy,s2=yi+ni-12si2Γni-12-112ni-12Γni-1212ni-12-1 =yi+ni-12ni-3si2 ,ni>3در رابطه بالا EZiy,s2=0 می باشد.
همچنین
VarTηiy,s2=Varyi-ZiUini-1sini+12si2Ui(ni-1)y,s2 =ni-1nisi2VarZiUiy,s2+ni-124si4Var1Uiy,s2-ni-1ni-1nisi3covZiUi,1Uiy,s2که در این رابطه
VarZiUiy,s2=E(ZiUi)2y,s2-E2ZiUiy,s2 =EZi2y,s2E1Uiy,s2-E2Ziy,s2E21Uiy,s2 =1×1ni-3-0×E21Uiy,s2=1ni-3و
Var1Uiy,s2 =E1Ui2y,s2-E21Uiy,s2 =Γni-12-212ni-12Γni-1212ni-12-2-1ni-32=1ni-3ni-5-1ni-32 =2ni-32ni-5و
covZiUi,1Uiy,s2=EZiUi×1Uiy,s2-EZiUiy,s2E1Uiy,s2=EZiy,s2E1Ui32y,s2-EZiy,s2E1Uiy,s2EZiUiy,s2=0در نتیجه
VarTηiy,s2=ni-1nisi21ni-3+ni-124si42ni-32ni-5 =ni-1nini-3si2+ni-122ni-32ni-5si4 , ni>5 .حال با داشتن μT و ΣT می توانیم T را به صورت زیر تعریف کنیم :
(2-2-5) T=ΣT-12(THη-μT)که آماره استاندارد شده THη است، همچنین با داشتن بردار y,s2، مقدار مشاهده شده T یعنی t=ΣT-12(Hη-μT) را داریم. با توجه به اینکه توزیع T به پارامتر نامعلومی بستگی ندارد، بنابراین Pr⁡(T2≥t2) بستگی به پارامتر نامعلوم ندارد. حال اگر q{T2;γ} را صدک 100γ ام از توزیع T2 درنظر بگیریم، داریم
PrT2<qT2;γ=γاز آن جا که مقدار مشاهده شده THη برابر با Hη است، پس ناحیه اطمینان تعمیم یافته 100γ درصد برای Hη با حل نامساوی زیر بدست می آید.
Hη-μT’ΣT-1Hη-μT<qT2;γحال اگر تعریف کنیم μ0=ΣT-120-μT=-ΣT-12μT، آنگاه براساس ناحیه اطمینان تعمیم یافته Hη، p-مقدار تعمیم یافته برای آزمون (2-2-3) به صورت زیر محاسبه می شود:
p-value=PrT2≥t2H0=PrT2≥μ02 =PrTHη-μT’ΣT-1THη-μT≥μT’ΣT-1μT(2-2-6)
و در این صورت فرض صفر در رابطه (2-2-3) رد می شود اگر p-value کمتر از سطح معنی داری α باشد.
به صورت کاربردی برای محاسبه p–مقدار تعمیم یافته می توانیم از الگوریتم زیر استفاده کنیم.
الگوریتم 2-2-1: برای بردارهای داده شده (n1,…,nI)،(y1,…,yI)،(s12,…,sI2):
برای l=1,…,L :
Zi~N(0,1) و Ui~χni-12، i=1,…,I، را تولید می کنیم.
مقدار Tl=HTη که در رابطه (2-2-4) آمده است را محاسبه می کنیم.
( پایان حلقه )
μT=1Ll=1LTl و ΣT=1L-1l=1L(Tl-μT)(Tl-μT)’ را محاسبه می کنیم.
Tl2=Tl-μT’ΣT-1Tl-μT،l=1,…,L و μ02=μT’ΣT-1μT را محاسبه می کنیم.
اگر Tl2≥μ02 باشد، wl=1 قرار می دهیم.
1Ll=1Lwl یک برآورد مونت کارلو برای p-مقدار تعمیم یافته می باشد.
2-3- شبیه سازی
در این بخش، با استفاده از شبیه سازی مونت کارلو به مقایسه توان و اندازه آزمون روش p-مقدار تعمیم یافته لی (2009) و روش ولچ (1951) می پردازیم. بدین منظور شبیه سازی اندازه آزمون برای I=3 و 6 گروه و شبیه سازی توان آزمون برای I=3, 5 و 10 گروه انجام شده است. در روش ولچ برای هر مجموعه از اندازه های نمونه و پارامترهای داده شده، 10000 بار نمونه تصادفی تولید و در هر بار اندازه و توان آزمون را محاسبه می کنیم. روش p-مقدار تعمیم یافته دارای دو حلقه می باشد که حلقه داخلی 100000 بار به منظور محاسبه p-مقدار و حلقه بیرونی 10000 بار به منظور محاسبه اندازه و توان آزمون تکرار می شود. نتایج در جداول (2-3-1) و (2-3-2) آمده است. همچنین در جدول ها نماد GP نشان دهنده روش p-مقدار تعمیم یافته می باشد.
نتایج عددی جدول (2-3-1) نشان می دهد که احتمال خطای نوع اول برای آزمون GP در همه مجموعه ها نزدیک به سطح معنی داری 05/0 است. در صورتی که آزمون ولچ بسیار آزاد است یعنی احتمال خطای نوع اول بزرگتر از سطح معنی داری 05/0 دارد، این نتایج حتی برای حجم نمونه های بزرگ نیز دیده می شود.
در جدول (2-3-2) نتایج مربوط به توان دو آزمون برای فرض های مقابل بدست آمده است. توان دو آزمون با افزایش نمونه ها افزایش می یابد، همچنین بدون در نظر گرفتن اندازه نمونه- ها و مقادیر پارامترها، مقادیر این جدول نشان می دهد که توان روش p-مقدار تعمیم یافته کمتر از آزمون ولچ می باشد.
جدول 2-3-1- برآورد مونت کارلو برای خطای نوع اول آزمون ها
I (n1,…,nI) (μ1,…,μI) (σ12,…,σI2) GP Welch
3 (4,6,20) (1,1,1) (0.1,0.1,0.1) 0.0416 0.064
3 (4,6,20) (1,1,1.25) (1,1,0.5) 0.0343 0.078
3 (4,6,20) (1,1.25,1.45) (1,0.5,0.1) 0.0437 0.082
6 (4,5,6,6,8,10) (1,1,1,1,1,1) (0.1,0.1,0.1,0.1,0.1,0.1) 0.027 0.063
6 (4,5,6,6,8,10) (1,1,1,1,1,0.8) (0.1,0.1,0.1,0.1,0.1,0.5) 0.0262 0.066
6 (4,5,6,6,8,10) (1,1,1,1,1,0.9) (0.1,0.1,0.1,0.1,0.1,0.3) 0.0274 0.058
6 (4,8,12,24,30,40) (1,1,1,1,1,1) (0.1,0.1,0.1,0.1,0.1,0.1) 0.0452 0.074
6 (4,8,12,24,30,40) (1,1,1,1,1,0.8) (0.1,0.1,0.1,0.1,0.1,0.5) 0.0438 0.066
6 (4,8,12,24,30,40) (1,1,1,1,1,0.9) (0.1,0.1,0.1,0.1,0.1,0.3) 0.0417 0.067
جدول 2-3-2- برآورد مونت کارلو برای توان آزمون ها
I (n1,…,nI) (μ1,…,μI) (σ12,…,σI2) GP Welch
3 (15,10,5) (1,1,1) (0.1,0.3,0.9) 0.052 0.055
3 (45,20,15) (1,1,1) (0.1,0.3,0.9) 0.159 0.147
5 (4,5,6,7,8) (1,1,1,1,1) (0.5,0.4,0.3,0.2,0.1) 0.036 0.058
5 (5,10,15,20,25) (1,1,1,1,1) (0.5,0.4,0.3,0.2,0.1) 0.049 0.067
10 (4,5,5,6,6,7,7,8,8,9) (1,1,1,1,1,1,1,1,1,1) (0.2,0.18,0.16,0.14,0.12,0.1,0.08,0.06,0.04,0.02) 0.038 0.087
10 (5,5,10,10,15,15,20,20,25,25) (1,1,1,1,1,1,1,1,1,1) (0.2,0.18,0.16,0.14,0.12,0.1,0.08,0.06,0.04,0.02) 0.062 0.080
10 (5,5,10,10,15,15,20,20,25,25) (1,1,1,1,1,1,1,1,1,1) (2,1.8,1.6,1.4,1.2,1,0.8,0.6,0.4,0.2) 0.093 0.145
10 (30,30,25,25,20,20,15,15,10,10) (1,1,1,1,1,1,1,1,1,1) (0.1,0.15,0.2,0.25,0.3,0.35,0.4,0.45,0.5,0.55) 0.074 0.097
10 (30,30,25,25,20,20,15,15,10,10) (1,1,1,1,1,1,1,1,1,1) (1,1.5,2,2.5,3,3.5,4,4.5,5,5.5) 0.147 0.345
2-4- نتیجه گیری
با توجه به مطالعات و بررسی های انجام شده بر روی خطای نوع اول برای آزمون برابری میانگین های لاگ نرمال، روش p-مقدار تعمیم یافته بهتر از روش های مجانبی دیگر چون ولچ عمل می کند، زیرا بدون در نظر گرفتن اندازه نمونه ها و مقادیر μi ها و σi2 ها، نتایج مناسبی از نرخ خطای نوع اول ارائه می دهد. بنابراین طبق مطالب گفته شده در این فصل برای آزمون کردن برابری میانگین های چند جامعه لاگ نرمال ابتدا آزمون برابری σi2 ها (واریانس های داده های تبدیل یافته با تبدیل لگاریتم) را انجام می دهیم، در صورت برابری σi2 ها سراغ آزمون F برای آزمون کردن برابری میانگین ها می رویم و اگر σi2 ها برابر نبودند سراغ آزمون welch یا GP می رویم. در صورتی که برای پژوهشگر خطای نوع اول مهم باشد آزمون GP را پیشنهاد می کنیم و در غیر این صورت روش welch بدلیل بالا بودن توان آزمون پیشنهاد می شود.
فصل سوم: فواصل اطمینان همزمان برای مقایسه نسبت و اختلاف میانگین های جوامع لاگ نرمال
فواصل اطمینان همزمان برای مقایسه نسبت و اختلاف میانگین های جوامع لاگ نرمال
مقدمه
در صورتی که فرض برابری میانگین های چند جامعه (تیمار) رد شود، مسئله یافتن تیمارهایی که باعث رد فرض برابری شده اند، مسئله دیگری برای پژوهشگر خواهد بود که مقایسه های دو به دو میانگین ها مطرح می شود. برای این مسئله، روش های استاندارد تحت فرض نرمال بودن توزیع داده ها، شامل روش توکی ((Tukey’s method برای مقایسه دو به دو تیمارها (1953) و روش دانت (Dunnett’s method) برای مقایسه تیمارها با تیمار کنترل (1955) می باشد. همچنین برای بررسی های بیشتر محققان، فواصل اطمینان همزمان برای مقابله های تعریف شده توسط محقق تحت فرض نرمال وجود دارد(Bretz et al.,2001).
در این فصل به مقایسه دو به دو میانگین های جوامع لاگ نرمال با ساختن فواصل اطمینان همزمان برای نسبت و اختلاف میانگین ها می پردازیم.
نمادها و پارامترها
فرض کنید طرح، یک طرح تصادفی کامل و Yi1,…,Yini مشاهده ها از واحدهای آزمایشی در تیمار i ام i=1,…,I باشد. همچنین فرض کنید Yij=exp⁡(Xij) دارای توزیع N(μi,σi2) است، به عبارت دیگر Xij دارای توزیع لاگ نرمال با پارامترهای μi وσi2 می باشد.
μi=yi=1nij=1niyij و σi2=1nij=1ni(yij-μi)2 به ترتیب برآوردهای درستنمایی ماکزیمم برای μi و σi2 هستند، همچنین برآوردگر نااریب برای σi2، Si2=1ni-1j=1ni(Yij-Yi)2 می باشد.
قبل از معرفی روش ها ذکر این نکته ضروری است که اگر فرض اضافی، برابریσi2 ها را در تیمارهای i=1,…,I داشته باشیم (به این معنا که ضریب تغییرات مشترک در تیمارها وجود دارد) مطابق با بحثی که در بخش (2-2) داشتیم، بسادگی می توانیم برای محاسبه فواصل اطمینان همزمان برای اختلاف هایμi-μi’ از روش های توکی یا دانت یا آزمون مقابله های کلی استفاده کنیم و در نهایت با یک تبدیل نمایی روی فواصل اطمینان بدست آمده به فواصل اطمینان برای نسبت میانه ها یعنی eμi-μi’=eμieμi’ تبدیل می شود (با فرض اضافی برابری σi2 ها نسبت میانه ها با نسبت میانگین ها برابر می شود). البته همان طور که قبلا بیان شد بررسی اختلاف و نسبت میانگین ها بیشتر از میانه ها مد نظر می باشد.
پس فرض کنید
θi=EXij=expμi+12σi2 ; θ=θ1,…,θI’ηi=lnθi ; η=η1,…,ηI’در این فصل به دنبال مقایسه یک مجموعه M تایی از نسبت ρii’=θiθi’ یا اختلاف δii’=θi-θi’ که مطابق با نیاز پژوهشگر تعریف می شود، هستیم. همچنین می توان این M مجموعه را به صورت زیر تعریف کرد:
(3-2-1) ρ=expCη(3-2-2) δ=Cθکه در آن C یک ماتریس M×I با درایه های cmi با شرایط زیر می باشد:
i=1Icmi=0,∀m=1,…,M و i:cmi>0cmi=1,∀m=1,…,M
عبارت های بالا برخی تعابیر کاربردی پارامترها مانند نسبت امیدها ( نسبت میانگین های وزنی از امیدها) در تساوی (3-2-1) و اختلاف امیدها (اختلاف میانگین های حسابی وزنی از امیدها) در تساوی (3-2-2) را ساده تر می کند.
3-3- روش های ساختن فواصل اطمینان همزمان
در این بخش برای ساختن فواصل اطمینان همزمان برای ρii’ و δii’ چند روش را معرفی می کنیم.
3-3-1- روش تقریب نرمال با تصحیح بانفرونی

یک روش بسیار ساده محاسباتی، بدست آوردن فاصله اطمینان بر پایه تقریب نرمال می باشد.
قضیه 3-3-1: (روش دلتای چند متغیره (Multivariat Delta Method) ) فرض کنید X1,X2,… یک دنباله تصادفی و مستقل از توزیعی با تابع چگالی fx;λ و λ برآوردگر درستنمایی ماکزیمم برای λ باشد. اگر τ=g(λ) یک تابع از λ با مشتقات جزئی پیوسته باشد و τ برآورد درستنمایی ماکزیمم τ باشد و شرایط نظم برای خانواده fx;λ برقرار باشد، آنگاه τ-τ به صورت مجانبی دارای توزیع نرمال با میانگین صفر و واریانس ∂g∂λ’I-1λ∂g∂λ می باشد، که در آن I ماتریس اطلاع برای بردار پارامترهای نامعلوم λ است. (اثبات: (Lehmann and Casella,1995,Section 1.8
طبق خاصیت پایایی برآوردگرهای درستنمایی ماکزیمم، برآورد درستنمایی ماکزیمم برای θi و ηi بترتیب θi=expμi+12σi2 و ηi=μi+12σi2 می باشد.
حال با توجه به اینکه θi و ηi یک تابع پیوسته از پارامترهای نامعلومλi=(μi,σi2) با مشتقات جزئی پیوسته است و شرایط نظم برای توزیع نرمال که جزء خانواده نمایی است، برقرار می باشد. پس طبق قضیه (3-3-1)، θi و ηi به طور مجانبی دارای توزیع نرمال هستند. برای بدست آوردن واریانس آنها لازم است ماتریس اطلاع فیشر λi محاسبه شود. با توجه به نرمال بودن Yij ها ماتریس اطلاع به صورت زیر است:
I=niσi200ni(2σi4)همچنین
∂ηi∂λi=11/2 , ∂θi∂λi=θi12θi بدین ترتیب، برآورد واریانس های θi و ηi به صورت زیر خواهند بود:
Vθi=θi2σi2ni+θi2σi42ni Vηi=σi2ni+σi42ni با در نظر گرفتن روابط (3-2-1) و (3-2-2) و خاصیت پایایی برآوردهای درستنمای ماکزیمم، برآوردهای درستنمایی ماکزیمم lnρm=i=1Icmiηi و δm=i=1Icmiθi به صورت زیر هستند:
logρm=i=1Icmiηi , δm=i=1Icmiθi که دارای توزیع نرمال با میانگین های ln⁡(ρm) و δm و برآورد واریانس های i=1Icmi2Vηi و i=1Icmi2Vθi می باشند.
بنابراین فاصله اطمینان همزمان دوطرفه 100(1-α) درصد با تصحیح بانفرونی روی آن برای ρm برابر با
(3-3-1) expi=1Icmiηi±z1-α2Mi=1Icmi2Vηiو برای δi برابر با
(3-3-2) i=1Icmiθi±z1-α2Mi=1Icmi2Vθiمی باشد که در آن z1-α/(2M) نشان دهنده چندک 1-α/(2M) از توزیع نرمال استاندارد است. این روش استاندارد با محاسبات ساده که برپایه تقریب نرمال و تصحیح بانفرونی بیان می شود را با نماد ANB نمایش می دهند.
3-3-2 – روش کمیت محوری تعمیم یافته با تصحیح بانفرونی
چین و ژو در سال 2006 برای مقایسه میانگین دو جامعه لاگ نرمال دو روش بر پایه آماره لگاریتم نسبت درستنمایی و یک روش بر پایه کمیت محوری تعمیم یافته بیان کردند. استفاده از روش های لگاریتم نسبت درستنمایی برای مقایسه همزمان میانگین های چند جامعه، سخت می باشد. زیرا از نظر محاسباتی ایجاد محور برای یک نمودار M-بعدی کاری بسیار مشکل است و همچنین اینکه کدام مقدار چندک را در مسئله M-بعدی بکار باید گرفت، زمانی که همبستگی بین مقابله



قیمت: 10000 تومان

متن کامل در سایت homatez.com

About: admin


دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *