Групирани и интервал серия данни - studopediya
Така че, нека да изучават свойствата на обема на случайна променлива (RV) X Nx1 получена проба. x2, ..., хп>.
Последователността на примерни стойности на x1. x2, ..., хп. записано в реда на появата им, тя е източник на статистически материал и призова прост статистически редове.
За компактен, удобен и визуално представяне на наличните статистически данни, необходими за да се направи първоначалното им обработка.
Напишете всички елементи на проба в низходящ ред и нека членовете на такава последователност. , , където
Всеки елемент се нарича статистика ред (вариант), и последователността
Той призова вариационен серия. съществуващото проба.
Ако изучаваме дискретна случайна променлива. при което броят на възможните стойности е голям (п <10), то для каждого из отличающихся друг от друга наблюденных значений (обозначим их ) подсчитываются частоты mi и относительные частоты (частости) mi /n появления этих значений в выборке.
резултати от изчисленията се записват в таблица 1, който се нарича статистическа групирани заедно.
Таблица 1 - Статистическа сноповия брой
Ако проучи непрекъсната случайна стойност или дискретна случайна променлива, броят на възможните стойности, което е достатъчно голям (п> 10), в диапазон [xmin (N); Xmax (п)] на всички наблюдавани стойности разделени в к з дължина бита. и броят на броя на примерни данни, уловени във всяка от бита. Резултатите от изчисление са записани в таблица 2, която се нарича интервал статистическа серия.
Таблица 2 - Интервал на случайни числа
Средната стойност на интервал
може да се използва следната процедура за определяне на границите на интервалите:
1 се изчислява степента на изменение на извадката стойности: R = Xmax - xmin. където xmin и Xmax съответно минималния и максималния брой варианти.
2 определи продължителността на етапа на разделяне. където к - броя на битовете на дяла. За избрана ориентация, к Стърджис може да се използва формулата (), където п - размер на пробата. Избор на броя на значителни бита зависи от размера на извадката п. За голям п стойност, получена от формула R. Стърджис, трябва да се приема като долна граница за R (за опростяване последващо изчисления часа получената стойност може да бъде закръглено до бóпо-голяма или по-малка).
3 Определяне на границите на интервалите преградните: С1 = xmin - з / 2, С2 = С1 + часа. С3 = C2 + часа. и т. г. Процесът на разграждане продължава, докато максималния елемент проба не попада в обхвата. Средната стойност на всеки частичен интервал може да се дефинира като средно аритметично на неговите граници.
елементи за вземане на проби, които попадат в границата на дялът на бита могат да бъдат определени за всяка от тези интервали (например, на дясно, както е направено в таблица 2), или честоти на тези стойности може да бъде разделена поравно между две съседни интервали.
За графични изображения клъстерирани случаен номер обикновено се използва бар графика (Фигура 1), която представлява поредица от вертикални сегменти мл / п на дължина. в очакване на по абсцисата на координати.
За графични изображения интервал статистическа серия често се използва относителната честота хистограма (фигура 2). При изграждането на хистограмата на абсцисата е необходимо да се забави гранични стойности интервали извадката [Ci ,; CI + 1) () и всяка от тези интервали, като основа, за конструиране на правоъгълници, чиито части са равни мл / п. След това височината на правоъгълника е мили / (NHI). Общата площ на хистограмата очевидно е равен на 1.
Фигура 1 - барграф
Фигура 2 - Хистограмата на съответните честоти