коефициент на корелация на Spearman
коефициент на корелация Спиърмън (Спиърман коефициент на корелация ранг) - мярка за линейна връзка между случайни величини. корелация Спиърман ранг. това е, да се оцени връзката на сила използва не е числени стойности и съответните класове. Коефициент инвариантен по отношение на всеки монотонна мащаб измерване трансформация.
дефиниция
Като се има предвид две проби.
Изчисление на корелация на Spearman:
Spearman корелационен коефициент, изчислен по формулата:
\ Sum_ ^ п (R_i-S_i) ^ 2 "> [1], където - чин наблюдение в серия - чин наблюдение в серията.
Коефициент заема стойности в интервала. точки по въпросите на равенството на строга линейна зависимост, на гърба.
В случай на припокриване наблюдения:
В присъствието на ставните връзки коефициент на корелация Спиърман трябва да се изчислява, както следва:
Обосновка Спиърман тест:
Спиърман тест статистика е коефициент на корелация и залязва на Pearson ранг. Тя се определя по следната формула:
Използването на факта, че ^ Ni ^ 2 ">, получаваме:
Пренареждане на двойки във възходящ ред на първия компонент, получаваме набор. Тогава пренапише коефициентът на корелация под формата на Спиърман:
По този начин, - линейна функция на редиците. Дясната страна на уравнение може да се запише, както следва: [1]
който е най-удобен за изчисления.
Статистически корелации Свободни
Срещу алтернатива \ 0 "ALT =" H_1: \; \ Rho \> \ 0 ">:
ако повече от Спиърман критерия за маса стойност [1], с ниво на значимост, нулевата хипотеза се отхвърля.
Критичната региона Спиърман тест.
Обмислете центрирани и нормализират копиеносец статистика:
Нулевата хипотеза се отхвърля (срещу алтернативата - \ 0 "ALT =" \ лява | \ р \ дясна | \> \ 0 ">), ако:
, [1] [1], където "> има квантил на стандартното нормално разпределение.
Сближаване работи задоволително, тъй като. [1]
През 1978 г. Робърт Коновър и Иман предложи следното изменение значително увеличава точността на сближаване. Той използва линейна комбинация на нормални и styudentovskoy квантил. слагам:
Хипотезата е отхвърлен в полза на алтернативен \ 0) "ALT =" H_1 \ (\ р \> \ 0) "> ако" >, където \; "> означават съответно квантил нива на стандартното нормално разпределение и т-разпределението с градуса свобода.
Следват примери на изчислителни корелации Kendall и Spearman. Стойностите на коефициентите, посочени по-горе всеки образ във формата, където - Kendall Съотношение - Spearman. Прави впечатление, че в повечето случаи \ \ напусна | \ Tau \ дясна | "ALT =" \ напусна | \ Rho \ дясна | \> \ \ напусна | \ Tau \ дясна |. "> Обяснението на този ефект е по-долу.
Посоката на линейна зависимост
Kendall и Спиърман корелация. Нормално конденз.
Корелацията коефициенти отзивчиви към промяна на посоката и шумност линейна връзка между променливите.
Наклонът на линейната тенденция
Kendall и Спиърман корелация. Въртящият групата.
Корелацията коефициенти отзивчиви към промяна на посоката, но не реагира на промените в наклона на тенденцията. В първия, четвъртия и седмия фигури дисперсията на една от променливите е близо до нула, и по тази причина не може да се запише, че линейна зависимост.
В нелинейна зависимост
Kendall и Спиърман корелация. В нелинейна зависимост.
Кендъл и копиеносец мерки корелация не отразяват нелинейна връзката между променливите.
Линейни и нелинейни зависимост
Във всяка от илюстрации, изброени по-долу прехода от линеен до нелинейна зависимост. Коефициентите на корелация и Спиърман Кендъл реагират на него по същия начин.
Kendall и Спиърман корелация. Кръстосан лента.
Kendall и Спиърман корелация. Разширяване на групата.
Kendall и Спиърман корелация. Синусоида с променлива амплитуда.
Тъй като промяната на линейна зависимост на коефициента на нелинейни корелационни падне.
Съобщение Спиърман коефициент на корелация и Pearson
В случай на нормално разпределение на проби от коефициента на корелация на Spearman може да се използва за оценка на коефициента на корелация на Пиърсън съгласно формулата:
Съобщение Спиърман коефициент на корелация и Kendall
Мостри и съответния ранг ред:
,\ Ldots, R_) ">, където" > - ти ранг на обекта в поредица от варианти за вземане на проби; , \ Ldots, R_) ">, където" > - ти ранг на обекта в редица варианти на извадката.
Начертайте поръчване на работа редици.
Има редица ценности във възходящ порядък :. След поредицата от редиците на поръчаните пробата ще бъде последователност от естествени числа. Стойности, съответстващи на стойности в този случай образуват поредица от редиците:
Kendall коефициент на корелация и коефициент на корелация Спиърман ранг изразява в следното:
Прави впечатление, че в случай на инверсии дава допълнително тегло, като по този начин по-отзивчиви към несъгласие класиране, отколкото. Този ефект е показан в горния пример: в повечето от тях \ \ напусна | \ Tau \ дясна | "ALT =" \ напусна | \ Rho \ дясна | \> \ \ напусна | \ Tau \ дясна | ">.
Одобрение. [1] Ако пробата не корелира и (изпълнен хипотеза), големината и значително zakorrelirovany. Корелационният коефициент между тях може да се изчисли по формулата:
Критерият е предложен от британски психолог Карл Едуард копиеносец през 1904.
бележки
литература
Вижте. Също насоки относно използването на MachineLearning.ru ресурси в процеса на обучение.