بررسی نرمال و غیرنرمال بودن داده ها در نرم افزار spss
چه داده هایی نرمال و چه داده هایی غیرنرمال هستند
نحوه تشخیص نرمال یا غیرنرمال بودن داده ها در آمار
یکی از مهم ترین و اصلی ترین آزمون های لازم برای شروع تحلیل های آماری، تشخیص نرمال بودن یا غیرنرمال بودن داده ها می باشد. یکی از معتبرترین آزمون های آماری برای تعیین نرمال بودن یا نبودن داده ها، آزمون کولموگروف اسمیرنف است. در این مقاله، به نکات مهم در بررسی توزیع داده ها در نرم افزار spss پرداخته شده است.
نتایج آزمون کولموگروف-اسمیرنف
یکی از مهم ترین نتایج آزمون کولموگروف-اسمیرنف، دستیابی به بررسی توزیع داده ها می باشد. اگر توزیع داده ها نرمال باشد، باید از آزمون های پارامتریک استفاده گردد و اگر توزیع داده ها، نرمال نباشد یا غیرنرمال باشد ، باید از آزمون های ناپارامتریک استفاده گردد.
در آزمون کولموگروف-اسمیرنف، میزان معناداری sig برای ما بسیار مهم و تعیین کننده است. در نرم افزار SPSS و خروجی های نرم افزار براساس فرض صفر تعیین شده در هر آزمون، می توان میزان معناداری و عدد مربوط به آن را بررسی نمود. در این آزمون، در جدول خروجی آن، باید میزان معناداری بررسی شود.
فرض صفر در آزمون کولموگروف اسمیرنف چیست؟؟
فرض صفر در آزمون های آماری، در حقیقت فرضی خنثی است که نشان می دهد در آن آزمون هیچ اتفاق خاصی ایجاد نشده است. به طور مثال فرض صفر در آزمون کولموگروف اسمیرنف، فرض می کند که توزیع داده ها نرمال است. در ادامه با بررسی عدد میزان معناداری مشخص می شود که آیا این عدد از مقدار استاندارد 5درصد خطا کمتر است یا بیشتر؟
اگر میزان معناداری کمتر از عدد 05. باشد، فرض صفر ما رد می شود. یعنی؛ توزیع داده ها نرمال نیست .
فرض صفر در آزمون کولموگروف اسمیرنف= توزیع داده ها نرمال است.
اگر میزان معناداری، کمتر از 05. باشد، فرض صفر رد می شود. یعنی توزیع داده ها غیرنرمال است.
اگر میزان معناداری، بزرگتر از 05. باشد، فرض صفر تأیید می شود. یعنی توزیع داده هانرمال است.
انتخاب درست از آزمون های آماری در انجام پایان نامه و مقالات
یکی از مهم ترین موارد روش تحقیق های آماری، استفاده درست از آزمون های آماری است. آزمون ها باید براساس هدف اصلی شما طراحی شوند. خروجی آمار، باید بتواند شما را به هدف اصلی پژوهش، برساند. به طور مثال اگر به دنبال انجام روش تحقیق با کیفیت در فصل سوم و چهارم پایان نامه هستید باید از آزمون ها به صورت آگاهانه استفاده نمایید. هر آزمونی برای هر پایان نامه ای مناسب نیست.
تعریف کلی نرمال بودن یا نبودن داده ها
نرمال بودن، یعنی داده های پاسخ دهندگان روی تابع نشان داده شده در شکل زیر قرار بگیرد و اگر داده ها بر روی این توزیع قرار بگیرد، یعنی داده های پژوهش ما نرمال هستند و اگر داده ها بر روی این نمودار قرار نگیرند یعنی داده های پژوهش ما، غیرنرمال هستند. اشتباهی که در بسیاری از پایان نامه ها ومقالات ایرانی مشاهده می شود که باعث ایجاد جواب های آماری اشتباه می گردد این است که داده های پژوهش خود را دستکاری می کنند تا نرمال شود یا به صورت غیر اصولی داده های پژوهش را نرمال فرض می کنند و از آزمون های پارامتریک معمول استفاده می کنند که جواب هایی نادرست را می گیرند و این جواب ها در بسیاری از موارد بر نتایج پژوهش آماری تأثیر بسیار بالایی دارد.
دیدگاه های درست در انجام روش های آماری چیست؟
نکته بسیار مهمی که بسیاری از پژوهش های آماری با آن روبرو هستند این است که داده هایی که از طریق پرسشنامه و تابع لیکرت به دست می آیند به دلیل اینکه داده هایی پیوسته نیستند به طور کلی دارای توزیع غیرنرمال هستند چون شما در تابع لیکرت از بین اعداد 1 تا 5 یک عدد را انتخاب می کنی و اعداد بین آن ها را نمی توان در نظر گرفت. یعنی ما نمی توانیم عدد 1.5 داشته باشیم یا نمی توانیم عدد 2.5 که بین 2 و 3 است را در نظر بگیریم و این داده ها به دلیل گسسته بودن داده هایی غیرنرمال هستند و می بایست از آزمون های غیر پارامتریک استفاده گردد. این موضوع در مقالات خارجی بیس از آمار اثبات شده است که تابع لیکرت به طور کلی داده هایش غیرنرمال است. البته این یکی از دیدگاه های آماری است. دیدگاه دیگر این است که طبق نتایج آزمون کولموگروف اسمیرنف و طبق فرض صفر، نحوه نرمال بودن یا نبودن چک شود و اگر همه داده ها نرمال بود، از آزمون های پارامتریک استفاده شود و در غیر این صورت، توزیع داده ها غیرنرمال است.
بررسی آزمون های آماری جهت بررسی نرمال بودن یا نبودن داده ها
قبل از هر گونه آزمونی که با فرض نرمال بودن دادهها صورت میگیرد باید آزمون نرمال بودن صورت گیرد. برای آزمون نرمال بودن داده ها روش های متعددی وجود دارد. برخی از آزمون های بررسی نرمال بودن داده ها عبارتند از:
- بررسی چولگی و کشیدگی داده ها
- ترسیم نمودار هیستوگرام
- آزمون کولموگروف-اسمیرنوف
- آزمون شاپیرو-ویلک
آزمون کولموگروف-اسمیرنوف
سرشناس ترین آزمون برای بررسی نرمال بودن و غیرنرمال بودن داده های پژوهش آزمون کولموگروف-اسمیرنوف است.پس از بررسی عادی یا نرمال بودن کشیدگی و یا چولگی توزیع دادهها، از آزمون شاپیرو-ویلک یا آزمون کولموگروف-اسمیرنوف استفاده می شود تا از نرمال بودن دادهها اطمینان حاصل گردد.هنگام بررسی نرمال بودن دادهها ما فرض صفر مبتنی بر اینکه توزیع دادهها نرمال است را در سطح خطای ۵% تست میکنیم. بنابراین اگر آماره آزمون بزرگتر مساوی ۰.۰۵ بدست آید، در این صورت دلیلی برای رد فرض صفر مبتنی بر اینکه داده نرمال است، وجود نخواهد داشت. به عبارت دیگر توزیع دادهها نرمال خواهد بود. برای آزمون نرمالیته فرضهای آماری به صورت زیر تنظیم میشود:
H0-توزیع دادههای مربوط به هر یک از متغیرها نرمال است
H1 : -توزیع دادههای مربوط به هر یک از متغیرها نرمال نیست
جهت انجام این دو آزمون فرمان زیر را اجرا کنید:
در کادر باز شده متغیرهای موردنظر را وارد لیست Dependent list کنید و سایر جاها را خالی بگذارید. سپس روی دکمه plots کلیک کرده و در کادر جدید گزینه Normality plots with tests را تیک دار کنید.
با این عمل خروجی شامل جدولی تحت عنوان Tests of Normality است که به شما دو مقدار سطح معناداری را برای هر کدام از متغیرها به طور مجزا می دهد. این مقادیر در تشخیص نرمال بودن دادهها تعیین کننده است. چنانچه سطح معناداری در آزمون Shapiro-Wilk یا آزمون کولموگروف-اسمیرنوف که در این جدول با sig. نمایش داده می شود بیشتر از ۰.۰۵ باشد می توان دادهها را با اطمینان بالایی نرمال فرض کرد. در غیر این صورت نمیتوان گفت که داده ها توزیعشان نرمال است.
محاسبه چولگی و کشیدگی
ابتدا چولگی و کشیدگی داده ها آزمون می شود. چولگی معیاری از تقارن یا عدم تقارن تابع توزیع میباشد. برای یک توزیع کاملاً متقارن چولگی صفر و برای یک توزیع نامتقارن با کشیدگی به سمت مقادیر بالاتر چولگی مثبت و برای توزیع نامتقارن با کشیدگی به سمت مقادیر کوچکتر مقدار چولگی منفی است. کشیدگی یا kurtosis نشان دهنده ارتفاع یک توزیع است. به عبارت دیگر کشیدگی معیاری از بلندی منحنی در نقطه ماکزیمم است و مقدار کشیدگی برای توزیع نرمال برابر ۳ می باشد. کشیدگی مثبت یعنی قله توزیع مورد نظر از توزیع نرمال بالاتر و کشیدگی منفی نشانه پایین تر بودن قله از توزیع نرمال است. برای مثال در توزیع t که پراکندگی داده ها بیشتر از توزیع نرمال است، ارتفاع منحنی کوتاه تر از منحنی نرمال است.
آنچه در جلسه دفاع باید بدانیم!!!
خروجی های نرم افرار و نحوه تحلیل آن ها و بررسی نحوه رد یا تأیید فرضیه ها و بررسی دلایل آن برای همه دانشجویان که از روش تحقیق های آماری در پایان نامه خود استفاده کرده اند، الزامی می باشد. همچنین دلایل استفاده از آزمون های آماری و نحوه تحلیل آن ها نیز از جمله موارد ضروری برای ارائه جلسه دفاع پایان نامه می باشد. اما، آموزش نرم افزار و مراحل انجام آن ، اغلب از دانشجویان درخواست نمی شود.
انجام با کیفیت آمار پایان نامه و مقالات معتبر همراه با آموزش
جهت انجام تحلیل آماری با spss ، می توانید با شماره تماس مهندس حمصیان 09133862776 در تماس باشید. تحلیل های آماری تخصصی پایان نامه باید براساس اصول علمی آمار انجام شود و همچنین توضیحات لازم روش تحقیق و خروجی های آمار باید در جلسه دفاع پایان نامه توضیح داده شود.جهت مشاوره و انجام صفر تا صد پايان نامه و جلسه دفاع با شماره تماس ٠٩١٣٣٨٦٢٧٧٦ مهندس حمصيان در تلگرام و واتس اپ در تماس باشيد (اولويت با پيامك هاي تلگرامي است) به اميد موفقيت شما در تمام مراحل زندگي.
مقالات مشابه در سایت
نوشته شده توسط مهندس مهرداد حمصیان
سلام و وقت بخیر. برای نمونه های آزمایشگاهی که سه تکرار می باشد(یعنی 3 عدد داریم) باید داده ها را غیرنرمال در نظر گرفت یا می توان برای نرمال بودن یا نبودن از آزمون شاپیرو ویلک یا کولموگروف اسمیرنوف استفاده کرد؟
عالی بود واقعا
سلام. مقدور هست همین مطالب رو به شکل pdf از خدمتتون بگیرم ؟ همین توضیح نرمالیتی دادهها و احیانا مطالب مشابه مربوط به انتخاب تست مناسب برای هر نوع مطالعه در علوم پزشکی رو؟
سلام وقتتون بخیر، برای مشاوره آماری می تونید با مهندس حمصیان در تلگرام یا واتس آپ در ارتباط باشید به ایشون پیام بدین که به چه چه چیزهایی نیاز دارید تا ایشون کمکتون کنند. شماره تماس ایشون جهت وقت مشاوره 09133862776 در تلگرام و واتس آپ می باشد.