محاسبه ضریب همبستگی پیرسون در پایتون : Pearson correlation
در بسیاری از برنامه های تحلیلی نیاز به محاسبه ضریب همبستگی پیرسون در پایتون داریم. در ادامه نحوه محاسبه ضریب پیرسون را آموزش داده ایم
برای محاسبه ضریب همبستگی پیرسون در پایتون میتوانیم از تابع pearsonr از کتابخانه Numpy استفاده کنیم در ادامه کد آن را آورده ایم:
اگر کتابخانه numpy را نصب ندارید برای نصب آن میتوانید به آموزش نصب کتابخانه در پایتون مراجعه کنید
1 2 3 4 5 6 7 8 9 10 11 12 13 |
# calculate correlation coefficient from numpy.random import seed from numpy.random import randn from scipy.stats import pearsonr # seed random number generator seed(1) # prepare data data1 = 20 * randn(1000) + 100 data2 = data1 + (10 * randn(1000) + 50) # calculate Pearson's correlation corr, p = pearsonr(data1, data2) # display the correlation print('Pearsons correlation: %.3f' % corr) |
ابتدا دو ماتریس داده بنام data1 و data2 با توزیع گوسی به ترتیب با میانگین 100 و واریانس 20 و همچنین میانگین 50 و واریانس data1 تولید کرده ایم. سپس ضریب همبستگی پیرسون بین این دو ماتریس داده را محاسبه کرده ایم.
برای تولید اعداد تصادفی در پایتون میتوان از توزیع های مختلف استفاده کرد برای توضیحات بیشتر به “روشهای تولید اعداد تصادفی در پایتون” مراجعه کنید
عالییی بود عااالی