Основни функции в R

Така че, в първата статия, ние ще представим на методите на изчисление на някои показатели, групирани под общото понятие или основни описателни статистически данни. Прието е за средната стойност (средноаритметично, медиана и режим), минималната и максималната стойност, дисперсията и стандартното отклонение на отклонение, по четвъртини и персентил ...

Като набор от наблюдателни резултати създаде набор от ценности, които се подчиняват на нормален закон за разпределение, която се състои от 100 наблюдения от средната аритметична стойност от 50 и стандартно отклонение от 5. работния файл е прикрепен към статията и е достъпна за всички регистрирани потребители. Винаги можете да генерирате тези стойности себе си, използвайте командата:

> X write.csv (х, файл = "data.csv")

Сега, генерирани набор от ценности, съхранени в папката Моите документи в data.csv файл. Той може по всяко време да изиска, като напишете:

> Read.csv (файл = "data.csv", глава = вярно, септември = "," разл = "").

или определяне на стойността на променлива:

> X средната (х)
[1] 50.33122

В R, винаги можете да зададете алгоритъм изчисление, ако не сте сигурни или не знаете как да се проведе негово командване. Така например, средната аритметична стойност е сумата от всички стойности, разделена на броя им. Така, средната аритметична стойност може да се изчисли с помощта на:

За изчисляване на средната стойност на следната команда:

Но за стандарта на модата в командата R не е предоставена, така че използвайте следния израз:

Минималната и максималната стойност могат да бъдат изчислени с помощта на следните команди, съответно:

Standard отбор гама, отразява "от-до" стойности във формат диапазон (от минималната до максималната):

> Range (х)
[1] 39.44106 65.11346

За да се изчисли наистина разпространението, трябва да въведете следната команда:

С помощта на следното уравнение може да се изчисли с варианти стойности:

Корен квадратен от тази стойност показва стандарт (RMS) отклонение:

Последната цифра може да се изчисли с помощта на специална функция за изчисляване на стандартното отклонение:

За да се изчисли четвъртина и въведете следната команда:

> Квантил (х)
0% 25% 50% 75% 100%
47.04634 50.56743 52.57987 39.44106 65.11346

Получените резултати показват, минимална стойност, първата, втората, третата и четвъртата четвъртина.

За да се изчисли персентил (квантил), използвайте командата:

вектор аргумент "в" посочва съответната част на устройството. Например, за да се изчисли на 30, 60 и 90% квантил, въведете командата:

> Квантил (х, в (0.30. 60. 90))
30% 60% 90%
48.52572 51.30114 56.32634

Има и команда да се позове на стандартен набор от дескриптивна статистика. Например:

> Резюме (х)
Мин. Първа Чу. Медиана среден трети Чу. Макс.
39,44 47,05 50,57 50,33 52,58 65,11

> Fivenum (х)
[1] 39,44106 47,02794 50,56743 52,61602 65,11346

С последната команда получава минимална стойност на първата четвъртина, медиана и третата четвъртина и максимални стойности.

Всички тези команди са основни - построена през R. В допълнение към стандартните команди, има много различни пакети, които ви позволяват как да се автоматизира процеса на изчисления и прилагат някои други алгоритми за изчисляване на статистическите стойности.