Нека разгледаме измерване на случайни променливи (з
Доверителен интервал - интервал, който ще обхване неизвестен стойност на очакваните разпределението на параметър с предварително определена вероятност (общо казано, се отнася до всяко измеримо стойност).
Оценка на параметър за дистрибуция с доверителен интервал се нарича оценка интервал.
Основното предимство на оценяването интервала - способността да се характеризират доверието в изчислените параметри на разпределението. Например, може да се каже "С вероятност от 95% от средната стойност на нормалното разпределение на данните ми ще бъде в диапазона 100-102, или, тъй като могат да бъдат написани ,.
Защо ми е необходим оценка интервал? Да предположим, че искате да разберете искането за обработка на всяка уеб услуга. За да направите това, ние правим някои измервания: ние постоянно се изпращат заявки, получава отговори на исканията, записва времето между изпращането на молба и получаване на отговор (otlika време). Както може би сте забелязали от предишните записи, в хода на измерването, ние получаваме много различни времена за реакция. Някои стойности се срещат по-често, някои - по-малко. Всичко това показва, че имаме работа с една случайна променлива. В случайна променлива има право на разпространение, който се определя от редица параметри. параметри за дистрибуция, ние не знаем, но можем да ги оценява въз основа на наличната пробата (резултати от измервания). Например, оценка на нормалната дисперсията на разпределение е дисперсията на проба.
Въпреки това, нашата оценка - също е случайна променлива. Това се вижда лесно, ако изпълнявате програмата за събиране на данни от първия запис отново. Вие ще получите около едни и същи данни, но все пак те ще са различни и затова дисперсията на извадката ще бъде различен. С други думи, тази оценка (или, както се казва, статистика) зависи от конкретната проба.
Според централната лимит теорема, когато голям брой измервания дистрибуторската ни параметър оценка има разпределение близо до нормалното. Ето защо, толкова повече ще има проба, дисперсията на извадката е по-близо до дисперсия (параметър) в нормална закона за разпределение! Но кога да спреш? Ясно е, че ако направим 10,000 измервания, а след това ние сме напълно (с увереност в 99,9999%) ще може да се направи точна оценка на истинските стойности на параметрите на разпределението, но често това не е възможно. Помощ идва интервал оценка.
Можем да кажем: "Ние не искаме да се направи 10,000 измервания, но това е достатъчно, за да бъдат сигурни в нашите оценки на параметрите на разпространение от 95%." изчисление интервал като увереност може да се окаже, че за 95% сигурност, достатъчно само на 50 измервания. Значително спестяване на енергия и ресурси!)
Да означим вероятността за доверието. (Инж. Ниво на доверие) или надеждността, или доверие - вероятността, че измерената стойност на реално да бъде в интервала на доверие. Самата стойност се нарича ниво на значимост. Математически, можем да пишем това:
,
където - е истинската стойност на очакваните граници, - по-ниска стойност на диапазона, - горната част.
Чудя се какво вече се е срещнал по-рано, той също се нарича ниво на значимост, но показва, че вероятността за отхвърляне на нулевата хипотеза.
Така че, колкото повече, толкова по-ниско ниво на доверие и по-малка е доверителния интервал. достатъчно Обикновено, след това нивото на доверие ще бъде равен на 95%.
Различните дистрибуции на различните варианти и съответно изграждането на интервалните оценки за тези параметри са различни.
доверителните интервали на нормалното разпределение
Нека да видим как изглежда доверителен интервал за очакването за нормално разпределение с известна стандартно отклонение (не забравяйте, стандартното отклонение - е корен квадратен от дисперсията). Възниква въпросът, как можем да сме наясно, стандартното отклонение? Тази характеристика на случайната променлива може да бъде определена, например, при производството на всякакви технически процес продукт трябва да осигури предварително определено стандартно отклонение. В тази ситуация, на доверителния интервал, построена въз основа на случайна извадка, ще помогне да се определи - дали продуктите са произведени като стандарт. процес.
, където п - размер на пробата, - пробата означава и най-интересното е, че - квантил на стандартното нормално разпределение (нормално разпределение с очакването мат = 0 и стандартно отклонение = 1.) за даден вероятност.
Ние няма да се даде на всички изчисления, защо така определят от доверителния интервал. Повече може да чете в [1] (стр. 50-55).
Нека обясня отново за квантил. Квантил - това е стойност, която е случайна стойност няма да надвиши предварително определена вероятност. Квантил - е обратна на функцията на разпределение, т.е. ,
Статистика на малки проби
В случаите, когато стандартното отклонение е неизвестен, и обема на пробата не надвишава 10-30 стойности, използвани тениски статистики за параметъра разпределение стойност оценка. т-статистика се изчислява като квантил на трет-разпределение (разпределението на Student, вижте първата част на тази серия от записи.) и се определя от един параметър - степента на свобода. За нормално разпределение, където - обем на пробата.
Тогава интервал оценка тепиха. очаквания ще бъдат, както следва:
, където - коефициент на Student (стойността т статистика квантил реда за броя на степените на свобода DF = п - 1), - проби вариацията.
Доверителни интервали експоненциалното разпространение
След предишния рекорд, аз се опитах друго разпределение на наличните данни - експоненциално. Оказа се, че той е по-подходящ от разпределението Erlang. Резултатите от измерването могат да бъдат намерени на илюстрацията по-долу и в прикачения файл ipython бележника. Очевидно е, че това се случва поради факта, че разпространението на тези конкретни данни, не е оставена опашка.
Ето защо, продължава нашия пример, ние откриваме доверителния интервал за параметъра на експоненциалното разпределение. Между другото, ако се използва експоненциалното разпределение в изчисленията в рамките на теорията за изчакване на параметъра "интензитет дошъл, пръв обслужен", и той щеше да означава, средното време на получаване на нови искания за единица време.
Оценка е обратна на средната аритметична стойност на проба, т.е.
.