
ضریب همبستگی یک آمار توصیفی است که داده ها را خلاصه می کند و به شما در مقایسه نتایج بین داده های نمونه کمک می کند. این بدون واحد است ، به این معنی که می توانید ضرایب را مستقیماً مقایسه کنید. در این آموزش ، شما می آموزید که چه ارتباطی و انواع مختلف ضریب همبستگی وجود دارد.
همبستگی چیست؟
همبستگی به رابطه آماری بین دو نهاد اشاره دارد. این میزان میزان ارتباط دو متغیر را به صورت خطی اندازه گیری می کند. به عنوان مثال ، قد و وزن یک فرد مرتبط است و افراد قد بلندتر تمایل به سنگین تر از افراد کوتاه تر دارند.
می توانید همبستگی را در انواع مجموعه داده ها اعمال کنید. در بعضی موارد ، شما ممکن است بتوانید پیش بینی کنید که چگونه اوضاع ارتباط برقرار خواهد شد ، در حالی که در برخی دیگر ، این رابطه به عنوان یک تعجب کامل خواهد بود. یادآوری این نکته حائز اهمیت است که فقط به این دلیل که چیزی در ارتباط است به معنای علت آن نیست.
سه نوع همبستگی وجود دارد:
- همبستگی مثبت: یک همبستگی مثبت بدان معنی است که این رابطه خطی مثبت است و دو متغیر در یک جهت افزایش یا کاهش می یابد.
- همبستگی منفی: یک همبستگی منفی برعکس است. خط رابطه دارای شیب منفی است و متغیرها در جهت های مخالف تغییر می کنند ، یعنی یک متغیر در حالی که دیگری افزایش می یابد کاهش می یابد.
- بدون همبستگی: هیچ همبستگی به این معنی است که متغیرها بسیار متفاوت رفتار می کنند و بنابراین ، هیچ رابطه ای خطی ندارند.

کار رویایی خود را با بهترین منابع شروع کنید!
برنامه تحصیلات تکمیلی Caltech در برنامه اکتشاف علوم داده
ضریب همبستگی چیست؟
- ضرایب همبستگی اندازه گیری قدرت رابطه خطی بین دو متغیر را به شما می دهد.
- حرف R نشان دهنده ارزش است و بی ن-1 و 1+ متغیر است
- اگر r<0, it implies negative correlation
- If r>0 ، این به معنای همبستگی مثبت است
- اگر r = 0 باشد ، به معنای هیچ ارتباطی نیست
- محاسبه ضریب همبستگی زمان می برد. بنابراین ، داده ها برای محاسبه ضریب همبستگی به یک ماشین حساب ، رایانه یا آمار وارد می شوند.
نوع ضریب همبستگی
عمدتا دو نوع ضرایب همبستگی وجود دارد.
همبستگی لحظه محصول پیرسون
ضریب همبستگی پیرسون در آمار به عنوان اندازه گیری قدرت رابطه بین دو متغیر و ارتباط آنها تعریف شده است. این توسط r مشخص شده است.
ضریب همبستگی را می توان با استفاده از فرمول زیر محاسبه کرد:

- r = ضریب همبستگی
- xbar = میانگین x-متغیر
- ybar = میانگین Y- متغیر
- xi yi = نمونه های متغیر x ، y
همبستگی رتبه Spearman
همبستگی رتبه Spearman قدرت و جهت ارتباط بین دو متغیر رتبه بندی شده را اندازه گیری می کند. این اساساً اندازه گیری یکنواختی رابطه بین دو متغیر را نشان می دهد ، یعنی چگونه می توان رابطه بین دو متغیر را با استفاده از یک عملکرد یکنواخت نشان داد.

ρ = همبستگی رتبه Spearman
di = تفاوت بین رده های متغیرهای مربوطه
n = تعداد مشاهدات
همبستگی را با استفاده از اکسل محاسبه کنید
اکنون خواهید دید که چگونه می توانید همبستگی بین دو متغیر را با استفاده از اکسل محاسبه کنید. در اینجا ، داده های دمای روز و واحد بستنی فروخته شده در آن روز را دارید.

مرحله 1: در برگه داده ها ، در گروه تجزیه و تحلیل ، روی تجزیه و تحلیل داده ها کلیک کنید.

مرحله 2: همبستگی را انتخاب کرده و روی OK کلیک کنید.

مرحله 3: محدوده ورودی و خروجی را انتخاب کنید.

مرحله 4: روی OK کلیک کنید. داده های همبستگی را دریافت خواهید کرد.

0. 774 نشان می دهد که بین دو متغیر یک رابطه مثبت مثبت وجود دارد.
همبستگی کندال
اکنون ، در این وبلاگ قبلاً در مورد ضریب همبستگی آموخته ایم. بیایید در مورد همبستگی کندال بیاموزیم. همبستگی رتبه Kendall یک آزمون غیر پارامتری برای ارزیابی میزان وابسته به دو متغیر به یکدیگر است. اگر دو نمونه ، A و B را در نظر بگیریم ، تعداد کل جفت ها با نمونه های A و B N (N-1)/2 است که هر یک از آنها اندازه نمونه N دارند. همبستگی رتبه Kendall را می توان به شرح زیر محاسبه کرد:
فرمول ضریب همبستگی
NC تعداد متناسب است.
nd تعداد ناسازگار است
هنگامی که داده ها توسط مقادیر سفارش داده می شوند ، همبستگی رتبه Kendall برای دیدن اینکه آیا سفارش قابل مقایسه است یا خیر ، استفاده می شود. ضریب همبستگی کندال جفت داده ها را می گیرد و میزان اتصال را بر اساس الگوهای تطابق و عدم تطابق بین جفت ها محاسبه می کند. بر خلاف سایر اشکال ضریب همبستگی که از مشاهدات به عنوان پایه و اساس همبستگی استفاده می کنند.
- متناسب: به طور مشابه (سازگاری) مرتب شده است. اگر (x2 - x1) و (y2 - y1) همان علامت را دارند ، پس از آن گفته می شود که دو مشاهده متناسب است.
- متناقض: به ترتیب دیگری (ناسازگاری). اگر (x2 - x1) و (y2 - y1) دارای علائم متضاد باشند ، گفته می شود که یک جفت مشاهدات متناسب است.
مقادیر همبستگی Rho Spearman اغلب از مقادیر TAU کندال بزرگتر است. جفت های متناسب و متناقض به عنوان پایه ای برای محاسبات استفاده می شوند. حال ، بیایید ببینیم چگونه ضریب همبستگی را پیدا کنیم؟
برنامه کارشناسی ارشد دانشمند داده
با همکاری دوره IBM COVENE
ضریب همبستگی را محاسبه کنید
قبل از انجام مراحل ، بیایید ببینیم که همبستگی در آمار چیست؟اندازه و جهت رابطه بین دو یا چند متغیر با اندازه گیری آماری همبستگی ، که به عنوان یک عدد بیان شده است ، توصیف شده است. با این حال ، همبستگی بین دو متغیر لزوماً دلالت بر این ندارد که تغییر در یک متغیر دلیل تغییر در مقادیر دیگری است. بیایید ضریب همبستگی را محاسبه کنیم.
مجموعه داده های خود را تعیین کنید
قبل از شروع ریاضی خود در مورد متغیرهای خود تصمیم بگیرید. شما ممکن است پس از آشنایی با مجموعه داده های خود ، این شماره ها را در معادله خود قرار دهید. متغیرهای X و Y را بین این مقادیر قرار دهید.
x: (1 ، 2 ، 3 ، 4) و y: (2 ، 3 ، 4 ، 5)
میانگین متغیرهای X و Y را محاسبه کنید
مقادیر هر متغیر را به هم اضافه کرده و بر اساس تعداد کل مقادیر موجود در مجموعه داده تقسیم کنید تا میانگین آن را تعیین کنید ، همچنین به عنوان میانگین شناخته می شود. با استفاده از مثال ، شما 1 ، 2 ، 3 و 4 را به هم اضافه می کنید و 4 را تقسیم می کنید تا میانگین X را پیدا کنید زیرا X دارای چهار مقدار ممکن است. به همین ترتیب با متغیرهای Y. از آنجا که در مثال فوق چهار مقدار ممکن برای y وجود دارد ، شما می توانید 2 ، 3 ، 4 و 5 را به هم اضافه کنید و به 4 تقسیم کنید.
میانگین را کم کنید
با کم کردن میانگین از هر مقدار متغیر X ، می توانید مقدار X-متغیر "a" را محاسبه کنید. به همین روش ، می توانید با کم کردن میانگین از هر مقدار ، مقدار y متغیر را محاسبه کرده و نتیجه را "b" بنامید.
ضرب کنید و جمع را پیدا کنید
این مرحله بعدی است. هر مقدار A باید با مقدار B مطابقت داشته باشد. پس از انجام همه ضرب ها با اصطلاحات مربوطه ، کل این فرمول را دریافت کنید.
ریشه مربع را تعیین کنید
در این مرحله ، شما ممکن است هر مقدار A را مربع کرده و کل را محاسبه کنید. پس از آن ، ریشه مربع مبلغی را که تازه تعیین کرده اید محاسبه کنید. این به عنوان مخرج فرمول عمل می کند.
تقسیم کردن
نه ، شما باید شماره ای را که در مرحله 4 به دست آورده اید تقسیم کنید. با شماره ای که در مرحله 5 به آن رسیده اید. بنابراین ، مخرج را توسط شماره ساز تقسیم کنید. ضریب همبستگی دنبال خواهد شد.
محدودیت های همبستگی
1. همبستگی نشانگر علیت نیست و برای انجام این کار قابل استفاده نیست. ما نمی توانیم استنباط کنیم که یک متغیر علت دیگری است حتی اگر رابطه بسیار بالایی بین آنها وجود داشته باشد.
برای مثال تصور کنید که بین تماشای برنامه های تلویزیونی خشونت آمیز و انجام رفتار خشونت آمیز در نوجوانی رابطه وجود دارد. ممکن است متغیر سوم (خارجی)، مانند بزرگ شدن در یک خانواده خشن، عامل هر دوی اینها باشد، و هم رفتار خشونت آمیز و هم تماشای تلویزیون نتیجه این باشد.
2. ما از طریق ارتباط با اطلاعات ارائه شده محدود شده ایم. برای مثال، فرض کنید تحقیقات ارتباطی بین مقدار زمانی که دانش آموزان برای انجام تکالیف خود صرف می کنند (از نیم ساعت تا سه ساعت) و تعداد G. C. S. E را نشان می دهد. پاس می دهد (1 تا 6). نادرست است که از این نتیجه بگیریم که قرار دادن 6 ساعت تکالیف احتمالاً منجر به 12 G. C. S. E می شود. عبور می کند.
نمونه هایی از همبستگی
حال، بیایید چند مثال واقعی را درک کنیم و ببینیم همبستگی منفی به چه معناست؟و همبستگی مثبت به چه معناست؟
مثال 1: چربی بدن و زمان دویدن
هرچه زمان بیشتری را برای دویدن بگذراند، چربی بدن افراد کاهش می یابد. به عبارت دیگر، بین متغیر چربی بدن و متغیر زمان دویدن همبستگی منفی وجود دارد. با افزایش زمان دویدن، چربی بدن کاهش می یابد.
مثال 2: نتایج امتحان و زمان تماشای تلویزیون
نتایج امتحانات معمولاً زمانی که دانش آموز بیشتر تلویزیون تماشا می کند آسیب می بیند. به عبارت دیگر، بین مقدار متغیر زمان صرف شده برای تماشای تلویزیون و نمره متغیر امتحان همبستگی منفی وجود دارد. نتایج امتحان با افزایش زمان تماشای تلویزیون کاهش می یابد.
مثال 3: قد در مقابل وزن
رابطه بین وزن و قد فرد اغلب خوب است. به بیان دیگر، افراد بزرگتر اغلب وزن بیشتری دارند.
مثال 4: دما در مقابل. فروش بستنی
دما و فروش کلی بستنی ارتباط مطلوبی دارد. به عبارت دیگر، از آنجایی که افراد بیشتری دوست دارند زمانی که هوای بیرون گرم است، بستنی بخرند، فروش کلی بستنی شرکت در زمانی که هوا گرم تر است بیشتر می شود.
نتیجه
در این آموزش شما با اینکه همبستگی چیست آشنا شده اید. شما همچنین ضرایب همبستگی و انواع آنها را بررسی کردید. شما همچنین همبستگی محصول-لحظه پیرسون و همبستگی رتبه اسپیرمن را با فرمول یاد گرفتید.
اگر به دنبال این هستید که این کار را بیشتر دنبال کنید و به عنوان یک تحلیلگر داده شغلی ایجاد کنید، برنامه تحصیلات تکمیلی Caltech Simplilea در علوم داده با همکاری دانشگاه Caltech CTME و با همکاری IBM برنامه مناسب شماست.
آیا این آموزش در مورد چه ارتباطی برای شما مفید است؟اگر شک و یا سؤال دارید ، لطفاً آنها را در بخش نظرات این آموزش ذکر کنید ، و ما کارشناسان ما را در سریعترین زمان برای شما پاسخ می دهیم!
Bootcamp آنلاین تحلیلگر داده ما را در شهرهای برتر پیدا کنید:
| نام | تاریخ | محل |
| تحلیلگر داده | کلاس از 3 ژوئن 2023 ، دسته آخر هفته شروع می شود | شهر شما | دیدن جزئیات |
| تحلیلگر داده | کلاس از 24 ژوئن 2023 ، دسته آخر هفته شروع می شود | شهر شما | دیدن جزئیات |
| تحلیلگر داده | کلاس از اول ژوئیه 2023 ، دسته آخر هفته شروع می شود | شهر شما | دیدن جزئیات |
درباره نویسنده
آریایی گوپتا
آریایی علاقه مندان به فناوری است که دوست دارد در مورد فن آوری های روند امروز به روز شود. او نسبت به همه چیز فناوری ، یک محقق مشتاق اشتیاق دارد و می نویسد که الهام بخش است. گذشته از فناوری ، او یک بازیکن فوتبال فعال و علاقه مندان به بازی است.
تجارت با گزینههای باینری...
ما را در سایت تجارت با گزینههای باینری دنبال می کنید
برچسب :
نویسنده : حمیدرضا پگاه
بازدید : 21
تاريخ : سه
شنبه
14 شهريور
1402 ساعت: 19:13