تبدیل داده ها
تبدیل داده ها
بسیاری اوقات توزیع داده ها نرمال نبوده و برای استفاده از آزمون های ناپارامتری ناچار هستیم داده ها را تبدیل کنیم تا توزیع انها نرمال شود. مهم ترین تبدیل ها شامل گرفتن لگاریتم، جذر گرفتن و آرک سینوس هستند.
تبدیل لگاریتمی بیشتر برای داده هایی که به صورت کمّی پیوسته و یا حاصل از شمارش پدیده ها باشند مناسب است مانند قطر، ارتفاع، وزن، تعداد در واحد سطح و غیره. این متغیّرها معمولاً توزیع نمایی داشته و با لگاریتم گرفتن توزیع نرمال یا تقریباً نرمال پیدا خواهند کرد. لازم به ذکر است که در چنین مواردی متغیّر جدید که لگاریتم اعداد متغیّر اصلی را در بر دارد در تجزیه و تحلیل ها شرکت میکند. لگاریتم را هم می توان در پایه 10 و هم در پایه e (عدد نپر) گرفت و تفاوتی ندارند. امّا بهتر است لگاریتم در پایه 10 گرفته شود. برای تبدیل معکوس هم باید 10 را به توان عدد حاصل رسانید. در صورتی که تعداد صفر یا اعداد کوچک در مجموعه داده ها زیاد باشند، بهتر است به جای (log(x از (log(x+1) , log(2x+1 و (log(x+3.8 استفاده شود.
برای اطلاعات بیشتر مراجعه کنید به:
کیانی، بهمن. 1393. کاربرد روشهای پیشرفته آماری در منابع طبیعی، انتشارات دانشگاه یزد، 522 صفحه.