آموزش رگرسیون خطی چندگانه و نحوه انجام آن در نرم افزار SPSS

آموزش رگرسیون خطی چندگانه در spss

رگرسیون خطی چندگانه یکی از تکنیک های پیچیده آماری است که معمولاً برای داده هایی بکار می رود که سطح سنجش آن ها فاصله ای است. رگرسیون خطی به دو صورت رگرسیون خطی ساده و رگرسیون خطی چندمتغیره مطرح می گردد. رگرسیون خطی ساده به پیش بینی مقدار یک متغیر وابسته بر اساس مقدار یک متغیر مستقل می پردازد. اما رگرسیون چند متغیره روشی است برای مشارکت جمعی و فردی دو یا چند متغیر مستقل در تغییرات یک متغیر وابسته. از آنجا که وظیفه اساسی علم، پیش بینی و تبیین پدیده هاست، بنابراین در تحقیقاتی که بر پیش بینی و تبیین ناظرند، تحلیل رگرسیون می تواند نقش بارزی ایفا کند. در تحقیقات پیش بینی عمدتاً کاربرد عملی مورد تأکید است. در این نوع تحقیقات، محقق می کوشد تا بر اساس اطلاع از یک یا چند متغیر مستقل، به یک معادله رگرسیونی دست یابد و از آن برای پیش بینی مقادیر متغیر وابسته استفاده نماید.

برای ورود متغیرهای رگرسیونی به مدل، چهار روش اصلی وجود دارد که در ادامه توضیح داده می شود.

روش همزمان (Enter Method):

در این روش کلیه متغیرهای مستقل بطور همزمان وارد مدل می شوند تا تأثیر کلیه متغیرهای مهم و غیر مهم بر متغیر وابسته مشخص گردد. در این روش تمام متغیرها در یک مرحله به ترتیب حداقل تولرانس وارد تحلیل می شوند. یکی از مشکلات روش همزمان این است که چون تمامی متغیرها بدون توجه به ضریب همبستگی شان با متغیر وابسته وارد معادله می شوند بنابراین احتمالاً متغیرهایی هم که حضورشان در معادله معنی دار نیست، در آن باقی می مانند که در اثر حضور نابجا، مقادیر F و R2 کاهش می یابد.

همچنین ببینید : فیلم آموزشی تحلیل واریانس طرح بلوکی کامل تصادفی شده در نرم افزار SPSS

روش حذف پس رو (Backward Method):

در این روش همانند روش Enter ابتدا کلیه متغیرهای مستقل وارد معادله شده و اثر کلیه متغیرها روی متغیر وابسته سنجیده می شود. اما بر خلاف روش Enter، در این روش به مرور متغیرهای ضعیف تر و کم اثرتر یکی پس از دیگری از معادله خارج شده و در نهایت این مراحل تا زمانی ادامه می یابد که خطای آزمون معنی داری به ده درصد برسد. در این روش متغیرهای مهم شناخته شده و در معادله باقی می مانند.

روش پیش رونده (Froward Method):

این روش، ابتدا همبستگی ساده بین هر یک از متغیرهای مستقل را با متغیر وابسته محاسبه می کند. سپس متغیر مستقلی که بیشترین همبستگی را با متغیر وابسته دارد و به عبارتی بیشترین مقدار واریانس را تبیین می کند، وارد تحلیل می کند. دومین متغیری که وارد تحلیل می شود، متغیری است که پس از تفکیک متغیر اول، بیشترین ضریب همبستگی را با متغیر وابسته دارد. این روش تا زمانی ادامه دارد که خطای آزمون به پنج درصد برسد.

روش گام به گام (Stepwise Method):

در این روش، مانند روش Foreward متغیرها یک به یک وارد مدل می شوند. یعنی ابتدا متغیری که بیشترین همبستگی را با متغیر وابسته دارد انتخاب می شود. دومین متغیری که وارد تحلیل می شود متغیری است متغیری است که پس از تفکیک متغیر مقدم بر آن موجب بیشترین افزایش در مقدار ضریب R2 می شود. در این روش ورود متغیرها به مدل را یک به یک و تا زمانی ادامه می دهیم که معنی داری متغیر به ۰٫۹۵ برسد. یعنی سطح خطا ۰٫۰۵ گردد.

همچنین ببینید : تحلیل کواریانس و اندازه‌ گیریهای تکراری در نرم افزار آماری SPSS

فرق اصل این روش با روش Forward در آن است که در روش Forward متغیرهای وارد شده در تحلیل در معادله باقی می مانند ولی در روش Stepwise با ورود متغیر جدید، متغیرهایی که قبلاً وارد معادله شده اند از نو آزموده می شوند تا مشخص گردد آیا هنوز هم حضور آن ها در مدل به موفقیت آن کمک می کند یا خیر؟ بنابراین احتمال دارد برخی از متغیرهایی که در مرحله اول قدرت تبیین بالایی داشته اند در مرحله بعدی حذف شوند.

برای درک بهتر مطلب، نحوه انجام رگرسیون خطی چندگانه در نرم افزار SPSS بصورت مرحله به مرحله توضیح داده می شود:
در پژوهشی رابطه بین فسفر قابل دسترس گیاه ذرت (Y) در خاک و مقادیر فسفر غیرآلی (X1)، فسفر آلی محلول در K2CO3 (متغیر X2)، و فسفر آلی موجود در KCO3 (متغیر X3) بدست آمده است. هدف از این مطالعه برازش مدل رگرسیون Y بر سه متغیر دیگر است.

برای برازش رگرسیون خطی چندگانه، ابتدا داده ها را مطابق شکل زیر وارد نرم افزار SPSS می نماییم:

رگرسیون خطی چندگانه

رگرسیون خطی چندگانه در اکسل

 در کادر باز شده متغیر Y را به قسمت Dependent و سه متغیر X را به قسمت Independent منتقل می کنیم و در نهایت با کلیک روی Ok نتایج برازش رگرسیون برای ما ظاهر می شود.

رگرسیون خطی چندگانه گام به گام

در جدول اول، همانند شکل زیر مقدار R، R2 و R2 تصحیح شده نشان داده شده است. میزان R2 تصحیح شده نشان می دهد که چه مقدار از کل تنوع (واریانس) متغیر Y توسط سه متغیر X توجیه شده است. در این مطالعه این مقدار ۰٫۴۵۱ می باشد که رقم بالایی نیست.

فرمول رگرسیون خطی چندگانه

جدول دوم، همانند شکل زیر، جدول تجزیه واریانس رگرسیون را نشان می دهد. در این جدول میزان F مدل رگرسیون برابر ۵٫۶۴۷  و احتمال معنی داری آن برابر ۰٫۰۰۹ است. بنابراین، مدل رگرسیون با سه متغیر معنی دار است. حال برای بررسی اهمیت هر یک از متغیرها در مدل سه گانه به ادامه خروجی ها توجه می کنیم.

مثال رگرسیون خطی چندگانه

جدول سوم، همانند شکل زیر، جدول ضرایب مختلف رگرسیون است. قسمت اول ضرایب استاندارد نشده (Unstandardized Regression)، قسمت دوم ضرایب استاندارد شده (Standardized regression)، قسمت سوم آزمون t و قسمت چهارم سطح معنی داری را نشان می دهد.

همانطور که مشاهده می شود پارامترهای مدل شامل عرضار مبدأ و ضرایب رگرسیون برای X1 و X2 و X3 به ترتیب برابر با ۴۳٫۸، ۱٫۷۷، ۰٫۰۸- و ۰٫۱۶ می باشد. بنابراین مدل رگرسیون عبارت است از:

Y=43.8+1.77X1-0.08X2+0.16X3

این مدل حاکی از رابطه مثبت X1 و X3 با Y (فسفر قابل دسترس خاک) و تأثیر منفی X2 (فسفر آلی محلول در K2CO3) بر فسفر قابل دسترس ذرت است، اما اگر دقت شود مشاهده می شود که آزمون t نشان می دهد که متغیرهای X2 و X3 در مدل اثر معنی داری بر Y ندارند زیرا مقدار .sig برای این دو متغیر به ترتیب برابر ۰٫۸۴۵ و ۰٫۱۷۴ بوده که بزرگتر از ۰٫۰۵ است.

ضریب تبیین (R2) مدل ۵۴ درصد می باشد که چندان زیاد نمی باشد.

مدل رگرسیون خطی چندگانه