Проверка на значението на коефициента на корелация
Тъй като честотата на дискретизация се изчислява чрез вземане на проби, е случайна променлива. Ако. тогава възниква въпросът: Дали наистина обяснява съществува линейна връзка между и или поради случайни фактори?
Ние тестваме нулевата хипотеза, че населението няма никаква връзка. , и ненулев коефициент на корелация селективно се обясни само с случайността за вземане на проби.
Алтернативна хипотеза може да е един от видовете: двустранно. (Ако не е известна корелация марка); или едностранно. или. (Ако знакът на съответствието може да се определи предварително). За тестване на хипотезата, използван - Студентски критерий. Емпирична стойност, изчислена от т -тест формула Студентски
където - коефициент селективен корелация, - обем на пробата. Най-изчислена емпирична стойност се сравнява с тази в таблицата критичната стойност с избраното ниво на значимост и степени на свобода.
Ако. нулевата хипотеза е приет. Следователно в общата популация не е значима корелация. и ненулев коефициент на корелация селективно се обясни само с случайността за вземане на проби.
Ако. нулевата хипотеза се отхвърля. Направят изводи:
за двустранен алтернативна хипотеза - коефициент на корелация е значително различен от нула;
за едностранно хипотеза - има статистически значим положителен (или отрицателен) корелация.
Takzhetablitsey да използвате критичните стойности на коефициента на корелация, от които можем да намерят критичната стойност на коефициента на корелация на броя на степените на свобода и ниво на значимост. Ако. след това населението не е значима корелация между изследваните характеристики. и ненулев коефициент на корелация проба обясни само проба случайността или недостатъчно размер проба за идентифициране на линейна връзка. Ако. се стига до заключението, че коефициента на корелация значително се различава от 0 и е налице статистически значима корелация.
Имайте предвид, че по-малкия размер на извадката, толкова по-голям трябва да бъде изчислена стойността на коефициента на корелация за извършване на хипотезата на линейна зависимост между стойностите на X и Y. Въпреки произволно близо до единство стойност не гарантира, причинно-следствена климатик, колкото е възможно, предвид естеството на връзките помежду им.
Например, някои събития могат едновременно, но независимо (съвместни събития) възникнат или промяна (фалшиво регресия). Други - да са в причинно-следствена връзка не с друг, а в по-сложен причинно-следствена връзка (непряк регресия). По този начин, със значителен коефициент на корелация окончателно заключение за причинно-следствена връзка с може да се направи само като се вземат предвид спецификата на проблема, предмет на разследването.
Пример 2. За да се определи значението на коефициент на корелация проба се изчислява в Пример 1.
Решение. Ние излага хипотеза. че в общата популация няма никаква връзка. Тъй като се определя знака на корелацията в резултат на решението от Пример 1 - съотношението е положителен, то алтернатива хипотеза е едностранно изглед. , Нека да се намери стойността на емпиричния-теста:
Броят на степените на свобода е. степен на значимост, изберете равни. Според таблицата "Критична -тест Student на различни нива значение" ние откриваме критичната стойност.
Тъй като. между нивото и средното равнище на постижения в областта на математиката има статистически значима корелация.