وبلاگ آمار و بیومتری
مقایسه میانگین ها در SPSS
پس انجام تجزیه واریانس و بررسی این که آیا بین گروهها یا تیمارهای مورد بررسی اختلاف معنی دار وجود دارد یا خیر، نوبت به این می رسد که مشخص کنیم کدام گروه از نظر یک صفت از بقیه بالاتر و کدام پایین تر است. این کار با استفاده از آزمون های مقایسه میانگین انجام می شود. این آزمون ها در SPSS در قسمت Post Hoc قرار دارند که از مسیر Analyze, Compare means, One way ANOVA (هنگام وجود یک فاکتور تاثیرگذار) یا مسیر Analyze, General linear model (هنگام وجود بیش از یک فاکتور تاثیرگذار) قابل دسترس است. مهمترین آنها آزمون دانکن (Duncan) و آزمون دانت (Dunnet) هستند.
آزمون دانکن حتی در صورت معنی دار نشدن اختلافات گروهها در آزمون تجزیه واریانس نیز قابل استفاده است و یک دسته بندی بین گروهها (تیمارها) انجام می دهد. اما آزمون دانت تنها زمانی استفاده می شود که یک شاهد (تیماری که کار خاصی روی آن انجام نشده) در آزمایش وجود دارد و حتما باید اختلاف گروهها معنی دار شده باشد. آزمون دانکن گروهها یا تیمارها را در یک یا چند ستون مرتب می کند. بزرگترین میانگین ها همواره در سمت راست قرار دارند. گروهایی که میانگین آنها در یک ستون قرار دارد اختلافی با هم ندارند. اما اگر میانگین های آنها در ستون های مختلف قرار گرفتند نشان دهنده معنی دار بودن اختلاف آنها است. از همین نحوه قرارگیری برای گذاشتن برچسب معنی داری روی میانگین ها استفاده می شود. اما آزمون دانت تمامی گروهها را یک به یک با شاهد مقایسه می کند و دسته بندی انجام نمی دهد. در اغلب موارد استفاده از هر دو آزمون لازم یا مفید خواهد بود.
برای اطلاعات بیشتر مراجعه کنید به:
کیانی، بهمن. 1393. کاربرد روشهای پیشرفته آماری در منابع طبیعی، انتشارات دانشگاه یزد، 522 صفحه.
تبدیل داده ها
بسیاری اوقات توزیع داده ها نرمال نبوده و برای استفاده از آزمون های ناپارامتری ناچار هستیم داده ها را تبدیل کنیم تا توزیع انها نرمال شود. مهم ترین تبدیل ها شامل گرفتن لگاریتم، جذر گرفتن و آرک سینوس هستند.
تبدیل لگاریتمی بیشتر برای داده هایی که به صورت کمّی پیوسته و یا حاصل از شمارش پدیده ها باشند مناسب است مانند قطر، ارتفاع، وزن، تعداد در واحد سطح و غیره. این متغیّرها معمولاً توزیع نمایی داشته و با لگاریتم گرفتن توزیع نرمال یا تقریباً نرمال پیدا خواهند کرد. لازم به ذکر است که در چنین مواردی متغیّر جدید که لگاریتم اعداد متغیّر اصلی را در بر دارد در تجزیه و تحلیل ها شرکت میکند. لگاریتم را هم می توان در پایه 10 و هم در پایه e (عدد نپر) گرفت و تفاوتی ندارند. امّا بهتر است لگاریتم در پایه 10 گرفته شود. برای تبدیل معکوس هم باید 10 را به توان عدد حاصل رسانید. در صورتی که تعداد صفر یا اعداد کوچک در مجموعه داده ها زیاد باشند، بهتر است به جای (log(x از (log(x+1) , log(2x+1 و (log(x+3.8 استفاده شود.
برای اطلاعات بیشتر مراجعه کنید به:
کیانی، بهمن. 1393. کاربرد روشهای پیشرفته آماری در منابع طبیعی، انتشارات دانشگاه یزد، 522 صفحه.
محاسبه آماره های توصیفی در Excel
برای محاسبه شاخص های تمایل مرکزی و پراکندگی در نرم افزار excel نخست داده ها را در یک ستون تایپ کنید. در اینجا فرض بر این است که داده ها در ستون A تایپ شده و تعداد انها 50=n است. دستورات مورد استفاده برای شاخص های مختلف به صورت زیر خواهند بود. لازم به ذکر است که پس از تایپ علامت مساوی و دستور ذکر شده، باید محدوده داده ها توسط ماوس انتخاب و بعد کلید enter زده شود. همچنین می توان از فلش موجود در کنار علامت ∑ استفاده کرد. برخی از دستورات عمومی قابل مشاهده هستند وسایر انها در قسمت more functions قابل دسترس خواهند بود.
میانگین حسابی =average(A1:A50) مجموع =sum(A1:A50)
حداقل =min(A1:A50) حداکثر =max(A1:A50)
میانه =median(A1:A50) نما =mode.mult(A1:A50)
واریانس =var.s(A1:A50) انحراف معیار =stdev.s(A1:A50)
اشتباه معیار =stdev.s/sqrt(50) چولگی =skew(A1:A50)
کشیدگی =kurt(A1:A50) تعداد =count(A1:A50)
تعیین تعداد نمونه بر اساس دقت
زمانی که متغیر مورد بررسی مقیاس کمی داشته باشد از رابطه زیر برای تعیین تعداد نمونه مورد نیاز استفاده می شود:
در این رابطه n تعداد نمونه لازم، %Sx درصد انحراف معیار است که از تقسیم انحراف معیار مطلق به میانگین به دست می آید. میانگین و انحراف معیار هر دو بر اساس نمونه برداری اولیه (پیش آزمون) و یا از تحقیقات قبلی به دست می آیند. همچنین %E درصد خطا (اشتباه) مجاز است که در تحقیقات مختلف بین 3 تا 10 درصد درنظر گرفته می شود. بر این اساس اگر انحراف معیار یک صفت 8، میانگین آن 40 (درصد انحراف معیار برابر 20 درصد) و خطای مجاز 10 درصد باشد، تعداد نمونه لازم 16 عدد خواهد بود:
15.36= (102) / (202 * 1.962)
در برخی منابع، مقدار خطا در بازه 1-0 مورد استفاده قرار می گیرد. بنابراین خطای 10 درصد با 0.1 نشان داده خواهد شد. در چنین مواردی لازم است مقدار میانگین در مخرج کسر قرار گیرد و در صورت کسر نیز مقدار مطلق انحراف معیار قرار گیرد. لذا رابطه به صورت زیر اصلاح می شود:
تعداد نمونه مورد نیاز به صورت زیر خواهد بود:
15.36= 2(0.1 * 40) / (82 * 1.962)
تجزیه واریانس با اندازه های تکراری (Repeated Measures)
این آزمون برای مقایسه بیش از دو گروه وابسته استفاده می شود. متاسفانه در بسیاری از تحقیقات، تشخیص مستقل یا وابسته بودن گروهها به درستی صورت نگرفته و به جای این آزمون، از تجزیه واریانس معمولی استفاده می شود. بیشترین کاربرد روش مذکور مقایسه پیشبینی های انجام شده در مورد یک متغیر توسط مدل های مختلف است. همچنین زمانی که یک اندازه گیری در زمان های مختلف، با دستگاههای مختلف یا با روش های مختلف انجام شده باشد و بیش از دو زمان، دستگاه یا روش مد نظر باشند باید از این تکنیک استفاده شود. مثال هایی از کاربرد تجزیه واریانس با اندازه های تکراری به شرح زیر هستند:
1- مقایسه سه مدل شبکه عصبی، رگرسیون و درخت تصمیم برای پیشبینی شاخص خشکی در پنج سال آینده
2- مقایسه موجودی در هکتار جنگل یا تراکم یک مرتع در شش ماه فروردین تا شهریور در چند پلات
3- مقایسه قرائت های انجام شده از PH چند نمونه آب توسط سه دستگاه مختلف
برای آشنایی با روش انجام این آزمون و پیش فرض های آن مراجعه کنید به:
کیانی بهمن. 1393. کاربرد روش های پیشرفته آماری در منابع طبیعی، انتشارات دانشگاه یزد، 522 صفحه.
بررسی همبستگی یک متغیر دومقوله ای (Binary) و یک متغیر کمی پیوسته (Continous)
متغیرهای دومقوله ای را می توان مانند متغیرهای کمی در نظر گرفت. این مساله به ویژه زمانی که کدهای صفر و یک برای دو سطح متغیر درنظر گرفته شوند مصداق بیشتری دارد. در چنین مواردی آزمون پیرسون برای بررسی همبستگی مناسب است. از طرفی نمودار ابر نقاط در این حالت شکل معقول و قابل فهمی نداشته و تفسیر نتایج ممکن است با مشکل مواجه شود. تحقیقات جدید نشان می دهند که بررسی همبستگی متغیرها فایده کمتری نسبت به مدلسازی دارد و از نظر علمی کمتر قابل توجه است. بر این اساس در بررسی رابطه یک متغیر دومقوله ای با یک متغیر کمی شاید استفاده از رگرسیون لجستیک بهتر باشد. با این حال گاهی محققین علاقه مند به انجام تحلیل همبستگی برای نوع متغیرها هستند. در چنین مواردی آزمون پوینت بای سریال که نوع خاصی از آزمون پیرسون است توصیه می شود.
در برخی منابع برای محاسبه ضریب همبستگی پوینت بای-سریال فرمول های خاصی پیشنهاد شده و جهت بررسی معنی داری آن نیز آزمون t مستقل مناسب شمرده شده است. به این صورت که متغیر دومقوله ای به عنوان متغیر گروهبندی درنظر گرفته می شود که داده های متغیر کمی را به دو گروه تقسیم می نماید. اما بررسی اینجانب نشان داد که مقدار ضریب همبستگی به دست آمده از فرمول ذکر شده دقیقا برابر مقدار r آزمون پیرسون است. همچنین p-value حاصل از آزمون t استیودنت دقیقا برابر با مقدار به دست آمده از آزمون پیرسون است. لذا همواره می توان از آزمون پیرسون که در SPSS از مسیر Analyze Correlate Bivariate قابل دسترس است برای بررسی همبستگی یک متغیر دو مقوله ای با یک متغیر کمی پیوسته استفاده نمود.
ماخذ: کیانی، بهمن. 1393. کاربرد روشهای پیشرفته آماری در منابع طبیعی، انتشارات دانشگاه یزد، 522 صفحه.
تحلیل رگرسیون با ماشین حساب
ماشین حساب مهندسی امکان انجام تحلیل رگرسیون خطی تک متغیره را دارا است. برای انجام این تحلیل نخستین مرحله ورود به قسمت رگرسیون ماشین حساب است. در ماشین حساب CASIO fx 3600 این کار با فشار دادن دکمه های MODE و 2 انجام می شود. پس از آن عبارت LR در صفحه نمایش ماشین حساب قابل رویت خواهد بود.
مرحله بعد وارد کردن داده ها است. برای این کار داده های x و y به صورت جفت جفت وارد می شوند. دکمه مورد استفاده برای وارد کردن داده ها روی خودش، در بالا یا در پایین با عبارت XD,YD مشخص شده است. روش کار به این صورت است که X1 را فشار داده دکمه Xd,Yd و بعد Y1 را زده و در نهایت دکمه ENT یا RUN فشار داده می شود. برای جفت های بعدی داده ها نیز به همین ترتیب عمل می شود.
مرحله سوم محاسبات است که با کمک کلیدهای ترکیبی SHIFT و KOUT به همراه شماره های مختلف انجام میشود. لیست ترکیب ها و نتیجه به دست آمده به شرح زیر است:
SHIFT 7 مقدار ثابت (b0) را محاسبه می کند.
SHIFT 8 مقدار شیب خط (b1) را محاسبه می کند.
SHIFT 9 مقدار ضریب همبستگی (R) را محاسبه می کند (با رساندن آن به توان دو، ضریب تعیین به دست می آید).
لازم به ذکر است که ترکیب کلید SHIFT با شماه های 1 تا 6 و همچنین ترکیب کلید Kout با کلیدهای 1 تا 6 مقادیر مجموع، میانگین، مجموع توان دو، جمع حاصلضرب و سایر مقادیر لازم برای هر دو متغیر X و Y را مشخص می کنند که این مقادیر در زیر دکمه های 1 تا 6 با دو رنگ نارنجی و سیاه نوشته شده اند. ماشین حساب امکان انجام آزمون F برای بررسی معنی دار بودن مدل رگرسیون را ندارد و این بررسی را باید با کمک بسته های نرم افزاری مانند SPSS ، SAS یا MINITAB انجام داد.