Мултиколинеарност (определение, видове) | Топ 3 примера с обяснение

Какво е мултиколинеарност?

Мултиколинеарността е статистическо явление, при което две или повече променливи в регресионния модел са зависими от другите променливи по такъв начин, че едната може да бъде линейно предсказана от другата с висока степен на точност. Обикновено се използва в наблюдателни изследвания и по-малко популярен в експериментални изследвания.

Видове мултиколинеарност

Има четири вида мултиколинеарност

  • # 1 - Перфектна мултиколинеарност - Съществува, когато независимите променливи в уравнението предсказват перфектната линейна връзка.
  • # 2 - Висока мултиколинеарност - отнася се до линейната връзка между двете или повече независими променливи, които не са перфектно корелирани помежду си.
  • # 3 - Структурна мултиколинеарност - Това се причинява от самия изследовател чрез вмъкване на различни независими променливи в уравнението.
  • # 4 - Мултиколинеарност, базирана на данни - Причинява се от експерименти, които са лошо проектирани от изследователя.

Причини за мултиколинеарност

Независими променливи, промяната в параметрите на променливите прави, че малка промяна в променливите има значително влияние върху резултата и събирането на данни се отнася до извадката от избраната популация, която се взема.

Примери за мултиколинеарност

Пример # 1

Да приемем, че ABC Ltd KPO е нает от фармацевтична компания за предоставяне на изследователски услуги и статистически анализ на болестите в Индия. За това ABC ltd е избрал възраст, тегло, професия, ръст и здраве като първични параметри.

  • В горния пример има ситуация с мултиколинеарност, тъй като независимите променливи, избрани за изследването, са пряко свързани с резултатите. следователно би било препоръчително изследователят да коригира променливите първо, преди да започне какъвто и да е проект, тъй като резултатите ще бъдат пряко засегнати поради избраните променливи тук.

Пример # 2

Да приемем, че ABC Ltd е назначена от Tata Motors, за да разбере обема на продажбите на tata motors ще бъде висок в коя категория на пазара.

  • В горния пример първо ще бъдат финализирани независими променливи, въз основа на които трябва да бъде завършено изследването. това може да бъде месечен доход, възраст. марка, по-ниския клас. Това означава само, че ще бъдат избрани данни, които ще се поберат във всички тези раздели, за да се разбере колко хора могат да си купят тази кола (tata nano), без дори да погледнат друга кола.

Пример # 3

Нека приемем, че ABC Ltd е наета да представи доклад, за да знае колко хора под 50 години са склонни към инфаркти. за това параметрите са възраст, пол, медицинска история

  • В горния пример има мултиколинеарност, която се е появила, защото независимата променлива „възраст“ трябва да бъде променена на възраст под 50 години за покана на заявления от обществеността, така че лицата, които са на възраст над 50 години, автоматично да бъдат филтрирани.

Предимства

По-долу са някои от предимствата

  • Линейна връзка между независимите променливи в уравнението.
  • Много полезно в статистически модели и изследователски доклади, изготвени от изследователски фирми.
  • Директно въздействие върху желания резултат.

Недостатъци

По-долу са някои от недостатъците

  • В някои от ситуациите този проблем ще бъде разрешен чрез събиране на повече данни за променливите.
  • Неправилно използване на фиктивни променливи, т.е. изследователят може да забрави да използва фиктивни променливи, когато е необходимо.
  • Вмъкване на две същите или еднакви променливи в уравнението като kg и lbs в тегла.
  • Вмъкване на променлива в уравнението, която е комбинация от 2.
  • Усложнен за извършване на изчисления, тъй като е статистическа техника и изисква статистическите калкулатори да извършват изпълнението.

Заключение

Мултиколинеарността е един от най-предпочитаните статистически инструменти, често използвани при регресионен анализ и статистически анализ за големи бази данни и желания резултат. Всички големи компании имат отделен статистически отдел в своята компания, за да извършват статистически регресионен анализ на продукти или хора, за да предоставят на ръководството стратегическа представа за пазара и също така да им помогнат да изготвят своите дългосрочни стратегии, съобразявайки се с това. Графичното представяне на анализа дава на читателя ясна картина на пряката връзка, точност и ефективност.

  • Ако целта на изследователя е да разбере независимите променливи в уравнението, тогава мултиколинеарността ще бъде голям проблем за него.
  • Изследователят трябва да направи необходимите промени в променливите на самия етап 0, в противен случай това може да има огромно въздействие върху резултатите.
  • Мултиколинеарността може да бъде направена чрез изследване на матрицата на корелация.
  • Възстановителните мерки играят съществена роля в решаването на проблемите за мултиколинеарността.