در این بخش ابتدا تجزیه و تحلیل همبستگی را مورد بحث قرار می دهیم ، که برای تعیین کمیت ارتباط بین دو متغیر مداوم (به عنوان مثال ، بین یک متغیر مستقل و وابسته یا بین دو متغیر مستقل) استفاده می شود. تجزیه و تحلیل رگرسیون یک روش مرتبط برای ارزیابی رابطه بین متغیر نتیجه و یک یا چند عامل خطر یا متغیرهای مخدوش است. متغیر نتیجه نیز به متغیر پاسخ یا وابسته گفته می شود و عوامل خطر و مخدوش کننده ها پیش بینی کننده یا متغیرهای توضیحی یا مستقل نامیده می شوند. در تجزیه و تحلیل رگرسیون ، متغیر وابسته "y" مشخص می شود و متغیرهای مستقل توسط "x" مشخص می شوند.
[توجه: اگر به عنوان توانایی پیش بینی حتی فراتر از حد داده ها ، اصطلاح "پیش بینی کننده" می تواند گمراه کننده باشد. همچنین ، اصطلاح "متغیر توضیحی" ممکن است در شرایطی که استنتاج ها باید در شناسایی انجمن ها محدود شوند ، تأثیر علی ایجاد کنند. اصطلاحات متغیر "مستقل" و "وابسته" کمتر در معرض این تفسیرها قرار دارند زیرا آنها به شدت دلالت و تأثیر ندارند.
تجزیه و تحلیل همبستگی
در تجزیه و تحلیل همبستگی ، ما یک ضریب همبستگی نمونه ، به طور خاص ضریب همبستگی لحظه محصول پیرسون را تخمین می زنیم. ضریب همبستگی نمونه ، مشخص شده R ،
دامنه بی ن-1 و 1+ است و جهت و قدرت ارتباط خطی بین دو متغیر را تعیین می کند. همبستگی بین دو متغیر می تواند مثبت باشد (به عنوان مثال ، سطح بالاتر یک متغیر با سطح بالاتر دیگری همراه است) یا منفی (یعنی سطح بالاتر یک متغیر با سطح پایین تر از دیگری همراه است).
علامت ضریب همبستگی نشانگر جهت ارتباط است. بزرگی ضریب همبستگی نشان دهنده قدرت ارتباط است.
به عنوان مثال ، همبستگی R = 0. 9 نشان دهنده ارتباط قوی و مثبت بین دو متغیر است ، در حالی که همبستگی R = -0. 2 یک ارتباط ضعیف و منفی را نشان می دهد. همبستگی نزدیک به صفر نشان دهنده ارتباط خطی بین دو متغیر مداوم نیست.
لیزا: [به نظر من این توصیف گیج کننده است. شما می گویید ضریب همبستگی معیار «قدرت تداعی» است، اما اگر فکر کنید، آیا شیب معیار بهتری برای سنجش نیست؟ما از نسبتهای ریسک و نسبتهای شانس برای تعیین کمیت قدرت ارتباط استفاده میکنیم، بهعنوان مثال، زمانی که یک مواجهه وجود دارد، احتمال نتیجه چند برابر بیشتر است. کمیت مشابه در همبستگی شیب است، یعنی برای یک افزایش معین در متغیر مستقل، متغیر وابسته چند برابر افزایش می یابد؟و "r" (یا شاید بهتر است R-squared) معیاری است که نشان می دهد چه مقدار از تغییرپذیری در متغیر وابسته را می توان با تفاوت در متغیر مستقل به حساب آورد. معیار مشابه برای یک متغیر دوگانه و یک پیامد دوگانه، نسبت قابل انتساب است، یعنی نسبت Y که میتواند به حضور مواجهه نسبت داده شود.]
توجه به این نکته مهم است که ممکن است یک ارتباط غیرخطی بین دو متغیر پیوسته وجود داشته باشد، اما محاسبه یک ضریب همبستگی این را تشخیص نمیدهد. بنابراین، همیشه مهم است که داده ها را قبل از محاسبه ضریب همبستگی به دقت ارزیابی کنید. نمایشگرهای گرافیکی به ویژه برای بررسی ارتباط بین متغیرها مفید هستند.
شکل زیر چهار سناریوی فرضی را نشان می دهد که در آنها یک متغیر پیوسته در امتداد محور X و دیگری در امتداد محور Y رسم شده است.
- سناریوی 1 یک ارتباط مثبت قوی (r=0. 9) را نشان میدهد، مشابه آنچه که ممکن است برای همبستگی بین وزن تولد نوزاد و طول تولد ببینیم.
- سناریوی 2 ارتباط ضعیف تری را نشان می دهد (r=0, 2) که ممکن است انتظار داشته باشیم بین سن و شاخص توده بدنی (که با افزایش سن افزایش می یابد) مشاهده شود.
- سناریوی 3 ممکن است عدم ارتباط (r تقریباً 0) را بین میزان قرار گرفتن در معرض رسانه در نوجوانی و سنی که در آن نوجوانان فعالیت جنسی را آغاز میکنند، نشان دهد.
- سناریوی 4 ممکن است ارتباط منفی قوی (r= -0. 9) را که به طور کلی بین تعداد ساعات ورزش هوازی در هفته و درصد چربی بدن مشاهده می شود، به تصویر بکشد.
مثال - همبستگی سن حاملگی و وزن تولد
یک مطالعه کوچک با حضور 17 نوزاد برای بررسی ارتباط بین سن حاملگی در هنگام تولد، اندازهگیری شده بر حسب هفته، و وزن هنگام تولد، بر حسب گرم انجام شد.
ما می خواهیم ارتباط بین سن حاملگی و وزن هنگام تولد نوزاد را تخمین بزنیم. در این مثال وزن هنگام تولد متغیر وابسته و سن حاملگی متغیر مستقل است. بنابراین y=وزن تولد و x=سن حاملگی. داده ها در یک نمودار پراکنده در شکل زیر نمایش داده شده اند.
هر نقطه نشان دهنده یک جفت (x, y) است (در این مورد سن حاملگی که بر حسب هفته اندازه گیری می شود و وزن هنگام تولد با گرم اندازه گیری می شود). توجه داشته باشید که متغیر مستقل در محور افقی (یا محور X) و متغیر وابسته در محور عمودی (یا محور Y) قرار دارد. نمودار پراکندگی ارتباط مثبت یا مستقیمی را بین سن حاملگی و وزن هنگام تولد نشان می دهد. نوزادانی که سن حاملگی کمتری دارند بیشتر با وزن کمتر و نوزادانی با سن حاملگی طولانی تر با وزن بالاتر بیشتر متولد می شوند.
فرمول ضریب همبستگی نمونه است
که در آن Cov(x, y) کوواریانس x و y است که به صورت تعریف شده است
واریانس های نمونه x و y هستند که به صورت تعریف شده اند
واریانس های x و y تغییرپذیری نمرات x و نمرات y را حول میانگین نمونه مربوطه خود می سنجد (
، به طور جداگانه در نظر گرفته شده است). کوواریانس تغییرپذیری جفت های (x, y) را حول میانگین x و میانگین y که به طور همزمان در نظر گرفته می شوند، اندازه گیری می کند.
برای محاسبه ضریب همبستگی نمونه، باید واریانس سن حاملگی، واریانس وزن تولد و همچنین کوواریانس سن حاملگی و وزن تولد را محاسبه کنیم.
ابتدا داده های سن حاملگی را خلاصه می کنیم. میانگین سن بارداری:
برای محاسبه واریانس سن حاملگی، باید مجذور انحرافات (یا تفاوت ها) بین هر سن حاملگی مشاهده شده و میانگین سن حاملگی را جمع کنیم. محاسبات در زیر خلاصه شده است.
واریانس سن بارداری:
در مرحله بعد، داده های وزن هنگام تولد را خلاصه می کنیم. میانگین وزن هنگام تولد:
واریانس وزن هنگام تولد دقیقاً همانطور که در جدول زیر نشان داده شده است برای سن حاملگی محاسبه می شود.
واریانس وزن هنگام تولد:
سپس کوواریانس را محاسبه می کنیم،
برای محاسبه کوواریانس سن بارداری و وزن تولد، باید انحراف از میانگین سن حاملگی را در انحراف از میانگین وزن تولد برای هر شرکت کننده ضرب کنیم (یعنی
محاسبات در زیر خلاصه شده است. توجه داشته باشید که ما به سادگی انحرافات از میانگین سن بارداری و وزن تولد را از دو جدول بالا در جدول زیر کپی کرده و ضرب می کنیم.
کوواریانس سن حاملگی و وزن هنگام تولد عبارت است از:
اکنون ضریب همبستگی نمونه را محاسبه می کنیم:
جای تعجب نیست که ضریب همبستگی نمونه نشانگر همبستگی مثبت قوی است.
همانطور که اشاره کردیم ، ضرایب همبستگی نمونه ا ز-1 تا 1 +است. در عمل ، همبستگی های معنی دار (به عنوان مثال ، همبستگی هایی که از نظر بالینی یا از نظر بالینی مهم هستند) می توانند به اندازه 0. 4 (ی ا-0. 4) برای ارتباط مثبت (یا منفی) باشند. همچنین آزمایشات آماری برای تعیین اینکه آیا همبستگی مشاهده شده از نظر آماری معنی دار است یا خیر (به عنوان مثال ، از نظر آماری تفاوت معنی داری با صفر) وجود دارد. روشها برای آزمایش اینکه آیا یک همبستگی نمونه مشاهده شده حاکی از همبستگی آماری معنی دار در کلینباوم ، کوپر و مولر است. 1
محتوا © 2013. کلیه حقوق محفوظ است. تاریخ آخرین اصلاح شده: 17 ژانویه 2013. دانشکده بهداشت عمومی دانشکده بهداشت عمومی دانشگاه بوستون < Pan> ما اکنون ضریب همبستگی نمونه را محاسبه می کنیم: