коефициент на корелация на Spearman

коефициент на корелация Спиърмън (Спиърман коефициент на корелация ранг) - мярка за линейна връзка между случайни величини. корелация Спиърман ранг. това е, да се оцени връзката на сила използва не е числени стойности и съответните класове. Коефициент инвариантен по отношение на всеки монотонна мащаб измерване трансформация.

дефиниция

Като се има предвид две проби.

Изчисление на корелация на Spearman:

Spearman корелационен коефициент, изчислен по формулата:

\ Sum_ ^ п (R_i-S_i) ^ 2 "> [1], където - чин наблюдение в серия - чин наблюдение в серията.

Коефициент заема стойности в интервала. точки по въпросите на равенството на строга линейна зависимост, на гърба.

В случай на припокриване наблюдения:

В присъствието на ставните връзки коефициент на корелация Спиърман трябва да се изчислява, както следва:

Обосновка Спиърман тест:

Спиърман тест статистика е коефициент на корелация и залязва на Pearson ранг. Тя се определя по следната формула:

Използването на факта, че ^ Ni ^ 2 ">, получаваме:

Пренареждане на двойки във възходящ ред на първия компонент, получаваме набор. Тогава пренапише коефициентът на корелация под формата на Спиърман:

По този начин, - линейна функция на редиците. Дясната страна на уравнение може да се запише, както следва: [1]

който е най-удобен за изчисления.

Статистически корелации Свободни

Срещу алтернатива \ 0 "ALT =" H_1: \; \ Rho \> \ 0 ">:

ако повече от Спиърман критерия за маса стойност [1], с ниво на значимост, нулевата хипотеза се отхвърля.

Критичната региона Спиърман тест.

Обмислете центрирани и нормализират копиеносец статистика:

Нулевата хипотеза се отхвърля (срещу алтернативата - \ 0 "ALT =" \ лява | \ р \ дясна | \> \ 0 ">), ако:

, [1] [1], където "> има квантил на стандартното нормално разпределение.

Сближаване работи задоволително, тъй като. [1]

През 1978 г. Робърт Коновър и Иман предложи следното изменение значително увеличава точността на сближаване. Той използва линейна комбинация на нормални и styudentovskoy квантил. слагам:

Хипотезата е отхвърлен в полза на алтернативен \ 0) "ALT =" H_1 \ (\ р \> \ 0) "> ако" >, където \; "> означават съответно квантил нива на стандартното нормално разпределение и т-разпределението с градуса свобода.

Следват примери на изчислителни корелации Kendall и Spearman. Стойностите на коефициентите, посочени по-горе всеки образ във формата, където - Kendall Съотношение - Spearman. Прави впечатление, че в повечето случаи \ \ напусна | \ Tau \ дясна | "ALT =" \ напусна | \ Rho \ дясна | \> \ \ напусна | \ Tau \ дясна |. "> Обяснението на този ефект е по-долу.

Посоката на линейна зависимост

Kendall и Спиърман корелация. Нормално конденз.

Корелацията коефициенти отзивчиви към промяна на посоката и шумност линейна връзка между променливите.

Наклонът на линейната тенденция

Kendall и Спиърман корелация. Въртящият групата.

Корелацията коефициенти отзивчиви към промяна на посоката, но не реагира на промените в наклона на тенденцията. В първия, четвъртия и седмия фигури дисперсията на една от променливите е близо до нула, и по тази причина не може да се запише, че линейна зависимост.

В нелинейна зависимост

Kendall и Спиърман корелация. В нелинейна зависимост.

Кендъл и копиеносец мерки корелация не отразяват нелинейна връзката между променливите.

Линейни и нелинейни зависимост

Във всяка от илюстрации, изброени по-долу прехода от линеен до нелинейна зависимост. Коефициентите на корелация и Спиърман Кендъл реагират на него по същия начин.

Kendall и Спиърман корелация. Кръстосан лента.

Kendall и Спиърман корелация. Разширяване на групата.

Kendall и Спиърман корелация. Синусоида с променлива амплитуда.

Тъй като промяната на линейна зависимост на коефициента на нелинейни корелационни падне.

Съобщение Спиърман коефициент на корелация и Pearson

В случай на нормално разпределение на проби от коефициента на корелация на Spearman може да се използва за оценка на коефициента на корелация на Пиърсън съгласно формулата:

Съобщение Спиърман коефициент на корелация и Kendall

Мостри и съответния ранг ред:

,\ Ldots, R_) ">, където" > - ти ранг на обекта в поредица от варианти за вземане на проби; , \ Ldots, R_) ">, където" > - ти ранг на обекта в редица варианти на извадката.

Начертайте поръчване на работа редици.

Има редица ценности във възходящ порядък :. След поредицата от редиците на поръчаните пробата ще бъде последователност от естествени числа. Стойности, съответстващи на стойности в този случай образуват поредица от редиците:

Kendall коефициент на корелация и коефициент на корелация Спиърман ранг изразява в следното:

Прави впечатление, че в случай на инверсии дава допълнително тегло, като по този начин по-отзивчиви към несъгласие класиране, отколкото. Този ефект е показан в горния пример: в повечето от тях \ \ напусна | \ Tau \ дясна | "ALT =" \ напусна | \ Rho \ дясна | \> \ \ напусна | \ Tau \ дясна | ">.

Одобрение. [1] Ако пробата не корелира и (изпълнен хипотеза), големината и значително zakorrelirovany. Корелационният коефициент между тях може да се изчисли по формулата:

Критерият е предложен от британски психолог Карл Едуард копиеносец през 1904.

бележки

литература

Вижте. Също насоки относно използването на MachineLearning.ru ресурси в процеса на обучение.