Какво е коефициент на корелация?
Коефициентът на корелация се използва, за да се определи колко силна е връзката между две променливи и неговите стойности могат да варират от -1,0 до 1,0, където -1,0 представлява отрицателна корелация и +1,0 представлява положителна връзка. Той разглежда относителните движения на променливите и след това определя дали има някаква връзка между тях.
Формула на коефициента на корелация
Където
- r = коефициент на корелация
- n = брой наблюдения
- x = 1-ва променлива в контекста
- y = 2-ра променлива
Обяснение
Ако има някаква корелация или кажете връзката между две променливи, тогава тя трябва да посочи дали една от променливите се променя в стойността, тогава другата променлива също ще има тенденция да се променя в стойността, например в конкретна, която може да бъде или в същата, или в обратна посока . Частта на числителя в уравнението провежда тест и относителна сила на променливите, които се движат заедно, а знаменателната част на уравнението мащабира числителя чрез умножаване на разликите на променливите от квадратни променливи.
Примери
Можете да изтеглите този шаблон за корелация на коефициента на формула Excel тук - Шаблон за формула на Excel на коефициента на корелацияПример # 1
Помислете за следните две променливи x andy, от вас се изисква да изчислите коефициента на корелация.
По-долу са дадени данни за изчислението
Решение:
Използвайки горното уравнение, можем да изчислим следното
Имаме всички стойности в горната таблица с n = 4.
Нека сега въведем стойностите за изчисляване на коефициента на корелация.
Следователно изчислението е както следва,
r = (4 * 25 032,24) - (262,55 * 317,31) / √ [(4 * 20 855,74) - (262,55) 2] * [(4 * 30 058,55) - (317,31) 2]
r = 16 820,21 / 16 831,57
Коефициентът ще бъде -
Коефициент = 0.99932640
Пример # 2
Държава X е развиваща се икономическа държава и тя иска да извърши независим анализ на решенията, взети от нейната централна банка по отношение на промените в лихвените проценти дали това е повлияло на инфлацията и дали централната банка може да контролира същото.
След обобщението на лихвения процент и инфлацията, които преобладаваха средно в страната за тези години, са дадени по-долу.
По-долу са дадени данни за изчислението.
Президентът на страната се обърна към вас, за да проведете анализ и да представите презентация по същия въпрос на следващата среща. Използвайте корелация и определете дали централната банка е постигнала целта си или не.
Решение:
Използвайки обсъдената по-горе формула, можем да изчислим коефициента на корелация. Третиране на лихвения процент като една променлива казва x и третиране на инфлацията като друга променлива като y.
Имаме всички стойности в горната таблица с n = 6.
Нека сега въведем стойностите за изчисляване на коефициента на корелация.
r = (6 * 170,91) - (46,35 * 22,24) / √ [(6 * 361,19) - (46,35) 2] * [(6 * 82,74) - (22,24) 2]
r = -5,36 / 5,88
Корелацията ще бъде -
Корелация = -0,92
Анализ: Изглежда, че корелацията между лихвения процент и инфлацията е отрицателна, което изглежда правилна връзка, тъй като лихвеният процент нараства, инфлацията намалява, което означава, че те са склонни да се движат в обратна посока един от друг и изглежда отгоре резултатът централната банка беше успешна в изпълнението на решението, свързано с лихвената политика.
Пример # 3
Лабораторията на ABC провежда изследвания на височината и възрастта и иска да разбере дали има някаква връзка между тях. Те са събрали извадка от 1000 души за всяка от категориите и са намерили средна височина в тази група.
По-долу са дадени данни за изчисляване на коефициента на корелация.
От вас се изисква да изчислите коефициента на корелация и да стигнете до заключението, че ако съществува някаква връзка.
Решение:
Третирането на възрастта като една променлива казва x и третирането на височината (в cms) като друга променлива като y.
Имаме всички стойности в горната таблица с n = 6.
Нека сега въведем стойностите за изчисляване на коефициента на корелация.
r = (6 * 10,137) - (70 * 850) / √ [(6 * 940 - (70) 2] * [(6 * 1,20,834) - (850) 2]
r = 1 322,00 / 1 361,23
Корелацията ще бъде -
Корелация = 0.971177099
Уместност и употреба
Той се използва в статистиката главно за анализ на силата на връзката между разглежданите променливи и освен това измерва дали има някаква линейна връзка между дадените набори от данни и колко добре те могат да бъдат свързани. Една от често срещаните мерки, които се използват за корелация, е коефициентът на корелация на Пиърсън.
Ако променлива променя стойността и заедно с тази променлива променя стойността, тогава разбирането на тази връзка е критично, тъй като може да се използва стойността на първата променлива, за да се предвиди промяната в стойността на втората променлива. Днес една корелация има многобройни употреби в тази модерна епоха, както се използва във финансовата индустрия, научните изследвания и къде ли още не. Но е важно да се знае, че корелацията има основни три типа взаимоотношения. Първият е положителна връзка, която гласи, ако има промяна в стойността на променлива, тогава ще има промяна в свързаната променлива в същата посока, по същия начин, ако има отрицателна връзка, тогава свързаната променлива ще се държи в противоположна посока. Също така, ако няма корелация, тогава r ще означава нулева стойност.Вижте изображенията по-долу, за да разберете по-добре концепцията.