клъстер анализ
Евклидово разстояние (разстояние)
Разстоянието между две точки Euclidean х и у - е най-късото разстояние между тях. Дву- или триизмерни случай - една права линия, свързваща тези точки. Общата формула за случая на п двумерен (х променливи) е: 1
Акроним дистрибуция, както и в по следната формула, разстоянието съответства на думата. За. Ние се получи дадения пример
На площада Евклидово разстояние
Тази опция е зададена по подразбиране. Благодарение на спомагателни системи за погасяване при изчисляването се взема предвид най-добрия Голямата разлика. Това винаги трябва да се използва при изграждането на клъстери, използвайки центъра на тежестта и средни методи и метода на Ward (Ward-метод) (виж. Sec. 20.5).
За дадения пример ние cfot = (5-4) 2 + (4-10) 2 = 37
Както с коефициента на корелация на Пиърсън, обхвата на тази мярка е между -1 и 1.
За пример, ние имаме
Ако групиране наблюдения извършват само въз основа на две променливи, коефициента на корелация на Пиърсън (виж раздел 15.1 ..) със стойности в диапазона от -1 до 1 не е подходящ за използване като мярка на сходство; тя ще даде само стойности -1 или 1.
Разликата между две наблюдения е максималната абсолютната стойност на разликата на последователни двойки променливи, съответстващи на тези наблюдения.
В примера, абсолютната разлика между първата променлива стойност е 1, а втората променлива - 6. Следователно, разликата е 6 Chebyshev.
Това разстояние мярка, известна още като разстоянието Манхатън или шега - таксиметров шофьор разстояние, определено от сумата на абсолютните разлики двойки стойност. За двумерен пространство не е линейна евклидовата разстояние между две точки, както и пътя, който трябва да преодолеят таксиметровия шофьор Манхатън, за да премине от една къща в друга по улиците се пресичат под прав ъгъл.
За нашия пример, ние сме dfst = | 5-4 | + | 4-10 | 7 =
Минковски разстояние, равно на корен г-ти мощност от сумата на абсолютните двойки разлики стойност при R-та степен:
В SPSS при изчисляване на това разстояние може да използва само корен квадратен, докато степента на разликата стойности може да бъде избрано в границите от 1 до 4. Ако тази степен взети равно на 2, след получаване на Евклидово разстояние.
Тази обобщена изпълнение на Минковски разстояния. Това разстояние, наричан също право разстояние мощност, равна корен г-ти мощност от сумата на абсолютните разлики двойки стойности, измерени в р-та степен:
Тук и в основата и за сума степен да изберете стойности от 1 до 4.