клъстер анализ

Евклидово разстояние (разстояние)

Разстоянието между две точки Euclidean х и у - е най-късото разстояние между тях. Дву- или триизмерни случай - една права линия, свързваща тези точки. Общата формула за случая на п двумерен (х променливи) е: 1

Акроним дистрибуция, както и в по следната формула, разстоянието съответства на думата. За. Ние се получи дадения пример

На площада Евклидово разстояние

Тази опция е зададена по подразбиране. Благодарение на спомагателни системи за погасяване при изчисляването се взема предвид най-добрия Голямата разлика. Това винаги трябва да се използва при изграждането на клъстери, използвайки центъра на тежестта и средни методи и метода на Ward (Ward-метод) (виж. Sec. 20.5).

За дадения пример ние cfot = (5-4) 2 + (4-10) 2 = 37

Както с коефициента на корелация на Пиърсън, обхвата на тази мярка е между -1 и 1.

За пример, ние имаме

Ако групиране наблюдения извършват само въз основа на две променливи, коефициента на корелация на Пиърсън (виж раздел 15.1 ..) със стойности в диапазона от -1 до 1 не е подходящ за използване като мярка на сходство; тя ще даде само стойности -1 или 1.

Разликата между две наблюдения е максималната абсолютната стойност на разликата на последователни двойки променливи, съответстващи на тези наблюдения.

В примера, абсолютната разлика между първата променлива стойност е 1, а втората променлива - 6. Следователно, разликата е 6 Chebyshev.

Това разстояние мярка, известна още като разстоянието Манхатън или шега - таксиметров шофьор разстояние, определено от сумата на абсолютните разлики двойки стойност. За двумерен пространство не е линейна евклидовата разстояние между две точки, както и пътя, който трябва да преодолеят таксиметровия шофьор Манхатън, за да премине от една къща в друга по улиците се пресичат под прав ъгъл.

За нашия пример, ние сме dfst = | 5-4 | + | 4-10 | 7 =

Минковски разстояние, равно на корен г-ти мощност от сумата на абсолютните двойки разлики стойност при R-та степен:

В SPSS при изчисляване на това разстояние може да използва само корен квадратен, докато степента на разликата стойности може да бъде избрано в границите от 1 до 4. Ако тази степен взети равно на 2, след получаване на Евклидово разстояние.

Тази обобщена изпълнение на Минковски разстояния. Това разстояние, наричан също право разстояние мощност, равна корен г-ти мощност от сумата на абсолютните разлики двойки стойности, измерени в р-та степен:

Тук и в основата и за сума степен да изберете стойности от 1 до 4.