آشنا با همبستگی و تحلیل رگرسیون

  • 2022-09-11

در این بخش ابتدا تجزیه و تحلیل همبستگی را مورد بحث قرار می دهیم ، که برای تعیین کمیت ارتباط بین دو متغیر مداوم (به عنوان مثال ، بین یک متغیر مستقل و وابسته یا بین دو متغیر مستقل) استفاده می شود. تجزیه و تحلیل رگرسیون یک روش مرتبط برای ارزیابی رابطه بین متغیر نتیجه و یک یا چند عامل خطر یا متغیرهای مخدوش است. متغیر نتیجه نیز به متغیر پاسخ یا وابسته گفته می شود و عوامل خطر و مخدوش کننده ها پیش بینی کننده یا متغیرهای توضیحی یا مستقل نامیده می شوند. در تجزیه و تحلیل رگرسیون ، متغیر وابسته "y" مشخص می شود و متغیرهای مستقل توسط "x" مشخص می شوند.

[توجه: اگر به عنوان توانایی پیش بینی حتی فراتر از حد داده ها ، اصطلاح "پیش بینی کننده" می تواند گمراه کننده باشد. همچنین ، اصطلاح "متغیر توضیحی" ممکن است در شرایطی که استنتاج ها باید در شناسایی انجمن ها محدود شوند ، تأثیر علی ایجاد کنند. اصطلاحات متغیر "مستقل" و "وابسته" کمتر در معرض این تفسیرها قرار دارند زیرا آنها به شدت دلالت و تأثیر ندارند.

تجزیه و تحلیل همبستگی

در تجزیه و تحلیل همبستگی ، ما یک ضریب همبستگی نمونه ، به طور خاص ضریب همبستگی لحظه محصول پیرسون را تخمین می زنیم. ضریب همبستگی نمونه ، مشخص شده R ،

دامنه بی ن-1 و 1+ است و جهت و قدرت ارتباط خطی بین دو متغیر را تعیین می کند. همبستگی بین دو متغیر می تواند مثبت باشد (به عنوان مثال ، سطح بالاتر یک متغیر با سطح بالاتر دیگری همراه است) یا منفی (یعنی سطح بالاتر یک متغیر با سطح پایین تر از دیگری همراه است).

علامت ضریب همبستگی نشانگر جهت ارتباط است. بزرگی ضریب همبستگی نشان دهنده قدرت ارتباط است.

به عنوان مثال ، همبستگی R = 0. 9 نشان دهنده ارتباط قوی و مثبت بین دو متغیر است ، در حالی که همبستگی R = -0. 2 یک ارتباط ضعیف و منفی را نشان می دهد. همبستگی نزدیک به صفر نشان دهنده ارتباط خطی بین دو متغیر مداوم نیست.

لیزا: [به نظر من این توصیف گیج کننده است. شما می گویید ضریب همبستگی معیار «قدرت تداعی» است، اما اگر فکر کنید، آیا شیب معیار بهتری برای سنجش نیست؟ما از نسبت‌های ریسک و نسبت‌های شانس برای تعیین کمیت قدرت ارتباط استفاده می‌کنیم، به‌عنوان مثال، زمانی که یک مواجهه وجود دارد، احتمال نتیجه چند برابر بیشتر است. کمیت مشابه در همبستگی شیب است، یعنی برای یک افزایش معین در متغیر مستقل، متغیر وابسته چند برابر افزایش می یابد؟و "r" (یا شاید بهتر است R-squared) معیاری است که نشان می دهد چه مقدار از تغییرپذیری در متغیر وابسته را می توان با تفاوت در متغیر مستقل به حساب آورد. معیار مشابه برای یک متغیر دوگانه و یک پیامد دوگانه، نسبت قابل انتساب است، یعنی نسبت Y که می‌تواند به حضور مواجهه نسبت داده شود.]

توجه به این نکته مهم است که ممکن است یک ارتباط غیرخطی بین دو متغیر پیوسته وجود داشته باشد، اما محاسبه یک ضریب همبستگی این را تشخیص نمی‌دهد. بنابراین، همیشه مهم است که داده ها را قبل از محاسبه ضریب همبستگی به دقت ارزیابی کنید. نمایشگرهای گرافیکی به ویژه برای بررسی ارتباط بین متغیرها مفید هستند.

شکل زیر چهار سناریوی فرضی را نشان می دهد که در آنها یک متغیر پیوسته در امتداد محور X و دیگری در امتداد محور Y رسم شده است.

  • سناریوی 1 یک ارتباط مثبت قوی (r=0. 9) را نشان می‌دهد، مشابه آنچه که ممکن است برای همبستگی بین وزن تولد نوزاد و طول تولد ببینیم.
  • سناریوی 2 ارتباط ضعیف تری را نشان می دهد (r=0, 2) که ممکن است انتظار داشته باشیم بین سن و شاخص توده بدنی (که با افزایش سن افزایش می یابد) مشاهده شود.
  • سناریوی 3 ممکن است عدم ارتباط (r تقریباً 0) را بین میزان قرار گرفتن در معرض رسانه در نوجوانی و سنی که در آن نوجوانان فعالیت جنسی را آغاز می‌کنند، نشان دهد.
  • سناریوی 4 ممکن است ارتباط منفی قوی (r= -0. 9) را که به طور کلی بین تعداد ساعات ورزش هوازی در هفته و درصد چربی بدن مشاهده می شود، به تصویر بکشد.

مثال - همبستگی سن حاملگی و وزن تولد

یک مطالعه کوچک با حضور 17 نوزاد برای بررسی ارتباط بین سن حاملگی در هنگام تولد، اندازه‌گیری شده بر حسب هفته، و وزن هنگام تولد، بر حسب گرم انجام شد.

BirthWgtTable.png

ما می خواهیم ارتباط بین سن حاملگی و وزن هنگام تولد نوزاد را تخمین بزنیم. در این مثال وزن هنگام تولد متغیر وابسته و سن حاملگی متغیر مستقل است. بنابراین y=وزن تولد و x=سن حاملگی. داده ها در یک نمودار پراکنده در شکل زیر نمایش داده شده اند.

BirthWgtGraph.png

هر نقطه نشان دهنده یک جفت (x, y) است (در این مورد سن حاملگی که بر حسب هفته اندازه گیری می شود و وزن هنگام تولد با گرم اندازه گیری می شود). توجه داشته باشید که متغیر مستقل در محور افقی (یا محور X) و متغیر وابسته در محور عمودی (یا محور Y) قرار دارد. نمودار پراکندگی ارتباط مثبت یا مستقیمی را بین سن حاملگی و وزن هنگام تولد نشان می دهد. نوزادانی که سن حاملگی کمتری دارند بیشتر با وزن کمتر و نوزادانی با سن حاملگی طولانی تر با وزن بالاتر بیشتر متولد می شوند.

فرمول ضریب همبستگی نمونه است

که در آن Cov(x, y) کوواریانس x و y است که به صورت تعریف شده است

Correlation2.png

واریانس های نمونه x و y هستند که به صورت تعریف شده اند

Correlation4.png

واریانس های x و y تغییرپذیری نمرات x و نمرات y را حول میانگین نمونه مربوطه خود می سنجد (

، به طور جداگانه در نظر گرفته شده است). کوواریانس تغییرپذیری جفت های (x, y) را حول میانگین x و میانگین y که به طور همزمان در نظر گرفته می شوند، اندازه گیری می کند.

برای محاسبه ضریب همبستگی نمونه، باید واریانس سن حاملگی، واریانس وزن تولد و همچنین کوواریانس سن حاملگی و وزن تولد را محاسبه کنیم.

ابتدا داده های سن حاملگی را خلاصه می کنیم. میانگین سن بارداری:

برای محاسبه واریانس سن حاملگی، باید مجذور انحرافات (یا تفاوت ها) بین هر سن حاملگی مشاهده شده و میانگین سن حاملگی را جمع کنیم. محاسبات در زیر خلاصه شده است.

GestationCorrelationCompTable.png

واریانس سن بارداری:

Correlation8.png

در مرحله بعد، داده های وزن هنگام تولد را خلاصه می کنیم. میانگین وزن هنگام تولد:

Correlation9.png

واریانس وزن هنگام تولد دقیقاً همانطور که در جدول زیر نشان داده شده است برای سن حاملگی محاسبه می شود.

GestationCorrelationCompTable2.png

واریانس وزن هنگام تولد:

Correlation12.png

سپس کوواریانس را محاسبه می کنیم،

Correlation13.png

برای محاسبه کوواریانس سن بارداری و وزن تولد، باید انحراف از میانگین سن حاملگی را در انحراف از میانگین وزن تولد برای هر شرکت کننده ضرب کنیم (یعنی

محاسبات در زیر خلاصه شده است. توجه داشته باشید که ما به سادگی انحرافات از میانگین سن بارداری و وزن تولد را از دو جدول بالا در جدول زیر کپی کرده و ضرب می کنیم.

Correlation15.png

کوواریانس سن حاملگی و وزن هنگام تولد عبارت است از:

Correlation16.png

اکنون ضریب همبستگی نمونه را محاسبه می کنیم:

Correlation18.png

جای تعجب نیست که ضریب همبستگی نمونه نشانگر همبستگی مثبت قوی است.

همانطور که اشاره کردیم ، ضرایب همبستگی نمونه ا ز-1 تا 1 +است. در عمل ، همبستگی های معنی دار (به عنوان مثال ، همبستگی هایی که از نظر بالینی یا از نظر بالینی مهم هستند) می توانند به اندازه 0. 4 (ی ا-0. 4) برای ارتباط مثبت (یا منفی) باشند. همچنین آزمایشات آماری برای تعیین اینکه آیا همبستگی مشاهده شده از نظر آماری معنی دار است یا خیر (به عنوان مثال ، از نظر آماری تفاوت معنی داری با صفر) وجود دارد. روشها برای آزمایش اینکه آیا یک همبستگی نمونه مشاهده شده حاکی از همبستگی آماری معنی دار در کلینباوم ، کوپر و مولر است. 1

محتوا © 2013. کلیه حقوق محفوظ است. تاریخ آخرین اصلاح شده: 17 ژانویه 2013. دانشکده بهداشت عمومی دانشکده بهداشت عمومی دانشگاه بوستون < Pan> ما اکنون ضریب همبستگی نمونه را محاسبه می کنیم:

برچسب ها

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : ۰
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.