Проста линейна регресия, корелация

Ако предварително се знае, че връзката между знака на х факторен и ефективно знак у трябва да бъде линейна, която се изразява като вид уравнение. проблем се свежда до намиране на група от точки на най-правата линия, наречена линейна регресия линия двойка. Трябва да се намерят такива стойности на коефициентите А и В. че сумата от квадратите на отклоненията е минимум:

Ако след означават средни стойности и признаци на X и Y, тогава получава при използване на метода на най-малките квадрати регресия функция отговаря на следните условия:

  • Проста линейна регресия линия минава през точката;
  • средната стойност на отклоненията е равна на нула :;
  • ценности и не са обвързани :.

Стягане линейна връзка характеризира линеен коефициент на корелация двойка. Корелационният коефициент се изчислява както следва:

За по-обективен изявление следва да се отбележи, че не е реч за коефициента на корелация на Пиърсън. Има и други видове корелационни коефициенти например коефициента на корелация Спиърман, коефициента на корелация Кендал и др. Но коефициент на корелация на Пиърсън се използва в по-голямата част от случаите, тъй като често се приема, че нормалното разпределение на променливите или не значително се различава от нормалното. Това е условие за такова разпределение заявление коефициент Pearson корелация.

Стойностите на коефициента на корелация варира от -1 до 1.

Таблицата по-долу от стойностите на коефициента на корелация и съответните стягане характеристики на комуникацията между променливите.

коефициент на корелация