برای یافتن به اصطلاح R-Squared از هر دو مجموعه داده متغیر ، از ضریب ماشین حساب تعیین کننده استفاده کنید. اگر تا به حال فکر کرده اید که ضریب تعیین چیست ، به خواندن ادامه دهید ، زیرا ما هم فرمول مربع R و هم توضیحی در مورد چگونگی تفسیر ضریب تعیین به شما می دهیم. ما همچنین نمونه ای از چگونگی یافتن R-Squared یک مجموعه داده را با دست ارائه می دهیم ، و رابطه بین ضریب تعیین و همبستگی پیرسون چیست.
ضریب تعیین چیست؟
در تجزیه و تحلیل رگرسیون خطی ، ضریب تعیین توصیف می کند که نسبت واریانس متغیر وابسته را می توان با متغیر (های) مستقل توضیح داد. به عبارت دیگر ، ضریب تعیین ارزیابی می کند که چگونه نقاط داده واقعی با پیش بینی رگرسیون تقریب می یابد ، بنابراین قدرت رابطه خطی بین متغیر توضیح داده شده و متغیر (های) توضیحی را تعیین می کند. به همین دلیل ، گاهی اوقات خوب بودن یک مدل نامیده می شود.
بیشتر اوقات ، ضریب تعیین به عنوان R 2 ، که به سادگی "R Squared" نامیده می شود ، مشخص می شود.
چگونه می توان از این ضریب ماشین حساب تعیین کننده استفاده کرد؟
ماشین حساب R-Squared ما ضریب تعیین ، R 2 را برای شما تعیین می کند ، اگر با یک رگرسیون خطی ساده کار می کنید ، y~AX + B:
نقاط داده خود را در ردیف های مناسب وارد کنید. ردیف های اضافی همانطور که می نویسید ظاهر می شوند.
هنگامی که حداقل سه نقطه وجود داشته باشد ، ضریب ماشین حساب تعیین کننده ما مقدار R 2 را در پایین ماشین حساب ، به همراه یک تفسیر باز می گرداند. وت
تصمیم بگیرید که آیا می خواهید فقط یک خلاصه اساسی یا جزئیات کامل محاسبه را ببینید.
چگونه ضریب تعیین را تفسیر کنیم؟
ضریب تعیین یا مقدار R-Squared ، یک مقدار بین 0. 0 تا 1. 0 است که بیان می کند که نسبت واریانس y را می توان با x توضیح داد:
اگر r 2 = 1 ، ما یک تناسب کامل داریم ، به این معنی که مقادیر y کاملاً تعیین می شوند (یعنی بدون هیچ خطایی) توسط مقادیر x ، و تمام نقاط داده دقیقاً در خط تخمینی بهترین تناسب قرار دارند.
اگر r 2 = 0 ، مدل ما در پیش بینی مقادیر y بهتر از مدل نیست که همیشه مقدار متوسط y را به عنوان یک پیش بینی باز می گرداند.
با ضرب R 2 در 100 ٪ ، درصد واریانس y را دریافت می کنید که با کمک x توضیح داده می شود. برای مثال:
اگر r 2 = 0. 8 ، 80 ٪ از واریانس y توسط x پیش بینی می شود
اگر r 2 = 0. 5 سپس نیمی از واریانس y را می توان با x توضیح داد
درصد مکمل ، یعنی ، (1 - R 2) * 100 ٪ ، واریانس غیر قابل توضیح را تعیین می کند:
- اگر r 2 = 0. 6 ، 60 ٪ از واریانس y با کمک x توضیح داده شده است ، در حالی که 40 ٪ باقیمانده برای آن حساب نشده است.
فرمول ضریب تعیین
ȳ میانگین Y باشد1, . yn؛وت
ŷ1, . ŷnمقادیر مناسب (پیش بینی شده) مدل رگرسیون ساده y باشید~تبر + ب.
قبل از اینکه فرمول مربع R را ارائه دهیم ، باید سه نوع مبالغ مربع را تعریف کنیم:
مجموع مربع های خطاها (SSE به طور خلاصه) ، که به عنوان مبلغ باقیمانده مربع ها نیز نامیده می شود:
SSE اختلاف بین مقادیر واقعی Y و مواردی را که توسط مدل ما پیش بینی شده است ، تعیین می کند. بر اساس SSE ، می توانید میانگین خطای مربع (MSE) را محاسبه کنید. اگر هنوز با این مفهوم آشنا نیستید ، به ماشین حساب MSE ما مراجعه کنید.
جمع رگرسیون مربع ها (کوتاه به SSR) ، که گاهی اوقات به عنوان جمع توضیح داده شده مربع نیز خوانده می شود:
SSR = ∑ (ŷi- ȳ) ²
SSR تفاوت بین مقادیر پیش بینی شده توسط مدل رگرسیون و مواردی را که به ابتدایی ترین روش پیش بینی شده است ، اندازه گیری می کند ، یعنی با نادیده گرفتن کامل x و استفاده از فقط مقدار متوسط Y به عنوان یک پیش بینی کننده جهانی.
مجموع مربع ها (SST) ، که کل تنوع را در y تعیین می کند:
SST = ∑ (Yi- ȳ) ²
معلوم است که این سه مبالغ مربع رضایت دارند:
SST = SSR + SSE
بنابراین شما فقط باید هر دو مورد از آنها را محاسبه کنید ، و باقیمانده آن را می توان به راحتی پیدا کرد!
وقت آن است که فرمول ضریب تعیین ، R 2! در اینجا چند فرمول (معادل) وجود دارد:
R 2 = SSR / SST
r 2 = 1 - SSE / SST
R 2 = SSR / (SSR + SSE)
چگونه ضریب تعیین را پیدا کنیم؟
بگذارید ضریب تعیین برای داده های زیر را تعیین کنیم: (0 ، 1) ، (2 ، 4) ، (4 ، 4)
میانگین Y را محاسبه کنید ، بنابراین ، برای 1 ، 4 ، 4 ، ȳ = 3
از ماشین حساب رگرسیون خطی ساده ما استفاده کنید تا متناسب با مدل y~AX + B به داده های ما: Y~0. 75x + 1. 5
با کمک خط رگرسیون ، مقادیر متناسب (پیش بینی شده) را با استفاده ازi= 0. 75xi+ 1. 5:
محاسبه SST: تفاوت های بین y را مربع کنیدiو ȳ ، سپس نتایج را جمع کنید:
(1 - 3) 2 = 4
(4 - 3) 2 = 1
(4 - 3) 2 = 1
SST = 4 + 1 + 1 = 6
محاسبه SSR: تفاوت های بینiو ȳ ، سپس نتایج را جمع کنید:
(1. 5 - 3) 2 = 2. 25
(3 - 3) 2 = 0
(4. 5 - 3) 2 = 2. 25
SSR = 2. 25 + 0 + 2. 25 = 4. 5
فرمول مربع R را اعمال کنید:
r 2 = SSR / SST = 4. 5 / 6 = 0. 75
مربع و همبستگی
در رگرسیون ساده حداقل مربعات خطی ، y~AX + B ، ضریب تعیین R 2 همزمان با مربع ضریب همبستگی پیرسون بین x است1, . xnو y1, . ynواداین مفهوم را با ماشین حساب همبستگی پیرسون Omni کشف کنید.
تجارت با گزینههای باینری...
ما را در سایت تجارت با گزینههای باینری دنبال می کنید
برچسب :
نویسنده : حمیدرضا پگاه
بازدید : 61
تاريخ : پنجشنبه
21 ارديبهشت
1402 ساعت: 19:29