Определяне на размера на проба 1

Определяне на размера на извадката

По-рано разгледахме методи за конструиране на доверителен интервал за очакванията на населението като цяло. Във всеки от тези случаи, ние предварително определен размер на извадката, не се взема предвид ширината на доверителния интервал. определяне на размера на извадката е трудно в реални приложения. Това зависи от наличието на финансови средства, време и лекота на създаване на проба. 1 Например, ако имаме нужда да се изчисли средната стойност на фактурите или фалшиви фактури дял в компанията компютърната система, трябва първо да разберете как точно трябва да бъде оценката. С други думи, необходимо е да се определят вземане на проби грешка се допуска оценка на всеки един от параметрите. Освен това е необходимо предварително да се определи цената на доверието на истинския параметър в населението.

Определяне на размера на извадката за оценка на очакването

За да се определи размерът на извадката е необходимо да се изчисли общото население на очакване, помислете за вземане на проби стойност грешка и ниво на доверие. Също така, за допълнителна информация за стойността на стандартното отклонение. За да се извлече формула за изчисляване на размера на извадката, ние започваме с формула (1) (произхода на формулата видите изграждане на доверителния интервал за очакването на цялото население.):

където Н - средната стойност на проба, Z - стандартизирана стойност нормално разпределена случайна променлива, съответстваща на кумулативен вероятността от 1 - α / 2. σ - стандартно отклонение на населението, п - размер на пробата

В тази формула, стойността, която се добавя и изважда от х. равна на половината от дължината на интервала. Той определя мярката на грешката възникващи поради грешка за вземане на проби, който е обозначен с д, и се изчислява по формулата

Решаването на уравнение (2) по отношение на п. получаваме:

По този начин, за да се определи размера на извадката, което трябва да знаете три параметъра:



  1. Необходимата степен на доверие, което засяга размера на което е Z. критична стойност стандартизирано нормално разпределение; 2

  2. Приемливо вземане на проби грешка д;

  3. Стандартното отклонение сигма.

На практика, за да се изчисли тези стойности не е лесно. Как да се определи нивото на доверие и допустимата грешка? Обичайната Отговорът на този въпрос може да бъде само експерти в съответната област (т.е. хора, които разбират смисъла на оценените стойности). Като правило, нивото на доверие 95% (в този случай, Z = 1,96). 3 Ако е необходимо да се повиши нивото на доверие обикновено избран размер, равен на 99%. Ако е възможно да се ограничи по-ниско ниво на доверие, 90% е избран. Определяне на грешката при извадка, не е необходимо да се мисли за това количество (по принцип, всяка грешка е нежелателно). Трябва да се създаде такава грешка на получените резултати позволяват разумно тълкуване.

В допълнение към нивото на доверие и допустимата грешка, е необходимо да се знае, стандартното отклонение на населението. За съжаление, тази опция е едва ли някога е познавал. В някои случаи е стандартното отклонение на населението може да се определи на базата на предварителни проучвания. В други ситуации, експертът може да се вземе предвид обхвата на вземане на проби и разпределението на случайната променлива. Например, ако цялото население има нормално разпределение, неговата големина е приблизително равна 6σ (т.е. ± 3σ в близост очаквания). Ето защо, стандартното отклонение е приблизително равна на една шеста от обхвата. Ако степента на σ е невъзможно да се изчисли по този начин, трябва да изпълнява пилотен и за изчисляване на стандартното отклонение на резултатите.

Пример 1. Да се ​​върнем към проблема на одита. Да предположим, че от информационната система екстрахира проба, състояща се от 100 сметки, попълнен през последния месец. Компанията иска да изгради интервала, съдържащ математически очаквания от общото население, нивото на доверие е равно на 95%. Както се определя размерът на пробата? Дали да го актуализира?

Да предположим, че след консултации с експерти, които работят в компанията, създадена грешка статистическа извадка позволи на ± 5 долара и увереност. - 95%. Резултати от предишни проучвания показват, че стандартното отклонение на населението е приблизително равна на $ 25. По този начин, е = 5, σ = 25 и Z = 1,96 (който съответства на ниво на доверие 95%). Съгласно формула (3) получаваме:

Следователно, п = 96. По този начин, размер на пробата от 100 е избрана удобно и отговаря на изискванията, наложени от компанията.

Пример 2: Един вид индустриална компания в Средния Запад произвежда електрически изолатори. Ако по време на изолатора се провали, късо съединение се случи. За да изпробвате силата на изолатора, компанията е тестване, по време на който се определя максималната сила, необходима да пробие изолатора. Якостта се измерва в кг товар, което води до разрушаване на изолатора (фиг. 1, колона А). Да приемем, че ние трябва да се изчисли средната якост на счупване на изолатора с точност до 25 паунда при 95% доверителен интервал за тази стойност. Получените данни от предишно проучване показват, че стандартното отклонение е 100 паунда. Определя необходимия обем на пробата.

Решение. По този начин, е = 25, σ = 100, 95% доверителен интервал (т.е., Z = 1,96) (фиг. 1).

Определяне на размера на проба 1

Фиг. 1. Определяне на размера на извадката

Така, п = 62 (частични резултати обикновено са закръглени до най-близкото цяло число излишък).

Определяне на размера на извадката за функция оценка пропорционално на населението

Направихме преглед на метода за определяне на размера на извадката за оценка на математическото очакване от общото население. Да предположим сега, че ние трябва да се определи съотношението на разходи, които не отговарят на правилата, приети от Дружеството (виж на първоначалните условия. Пример 1 по-горе). Колко отгоре да се извлекат от информационната система, за да се построи период е дадено ниво на доверие? За да отговорим на този въпрос, ние прилагаме същия подход, както за определяне на размера на извадката за оценка на математическото очакване.

грешка за вземане на проби се определя от формула (2). Когато се оценява делът на функция σ стойност трябва да бъде заменен от сумата. По този начин, формулата за грешка за вземане на проби се следната форма:

Изразяване п чрез други количества, ние получаваме следната формула:

По този начин, за да се определи размера на извадката, което трябва да знаете три параметъра:



  1. Желано ниво на доверие, който определя стойността на Z.

  2. Допустим вземане на проби за грешка е.

  3. вярно успеваемост Р.

На практика, за да се изчисли тези стойности не е лесно. Ако е известно, нивото на доверие, че е възможно да се изчисли критичната стойност на стандартизиран нормално разпределение Z. вземането на проби за грешка е, определя точността, с която оценява дела на успехи в населението. Третият вариант - делът на успехи в р население - това е опцията, че трябва да се оцени. Е, как да се направи оценка на диапазона на изменение на р на нейните ценности примерни?

Има два начина. На първо място, в много ситуации, за да се оцени стойността на р може да използва резултатите от предишни изследвания. На второ място, ако данните от предишните проучвания не са на разположение, можете да се опитате да се изчисли параметър р, така че да се избегне подценяване на размера на извадката. Имайте предвид, че във формула (5), стойността на р (1 - п) е в числителя. Вследствие на това е необходимо да се намери максималната стойност на тази величина. Очевидно е, че се постига с р = 0.5.

По този начин, ако знака на част стр в общата популация неизвестното предварително, за да се определи размера на извадката, трябва да се създаде р = 0,5. В този случай, размерът на извадката ще се надценява, което води до допълнителни разходи за неговото производство. Ако това е вярно съотношение успех в населението се различава от 0.5, на доверителния интервал ще бъде много по-дълго, отколкото е необходимо. Оценка на параметъра р в този случай ще бъде много точен, но това ще трябва да плати допълнителното време и финансови ресурси, мили.

Нека се върнем към проблема на одита. Да предположим, че одиторът желае да изгради интервал, съдържащ над грешка фракция, степен на точност е равна на 95%. Допустимо е точност ± 0,07. Резултатите от предишни изследвания показват, че делът на фалшиви фактури не надвишава 0.15. По този начин, е = 0,07, р = 0.15 и Z = 1,96 (който съответства на ниво на доверие 95%). Съгласно формула (5), ние получаваме:

По този начин една извадка в размер на 100 бе избран правилно и напълно отговаря на изискванията, изложени от компанията.

Определяне на размера на пробата, получена от общата популация на ограничен

За да се определи обема на пробата, получена от краен общото население без заместване, е необходимо да се използва фактор на корекция. Например, грешката за вземане на проби при оценката на очакването, се изчислява, както следва:

При оценката на дела на грешка функция за вземане на проби е:

За да се изчисли размерът на извадката за оценка на функцията на очакване или дял, се прилага формулата:

където n0 - размер на извадката с изключение на краен коефициент за корекция за цялото население. Прилагане на резултатите от корекционен коефициент в следната формула:

Предишна статия Изграждане на доверителния интервал за очакването на населението

Обратно към Съдържание Статистика за Мениджъри Използване на Microsoft Excel


2? За да се определи стойността на размера на пробата се използва вместо Z. т. да се изчисли Т стойностите на критичния размер на пробата трябва да се знае предварително. В повечето случаи, размери позволяват примерни и сближени от т-разпределение в стандартизиран нормално разпределение.


3? Интервал ниво в доверието на 95% се разделя на две равни части. Първата част е от лявата страна на математическото очакване от общото население, а вторият - в дясно. Стойността на Z, съответният вероятността от 2.5% (0025 квадрат) е равен -1.96, и стойността на Z, съответната обща площ от 0975, равно на 1.96. За изчисляване на функцията е удобно да се използва Excel Z = NORM.ST.OBR (р), където р - вероятността, замествайки стойностите на p1 = 2.5%, и Р2 = 97.5%

Определяне на размера на извадката