Мярка за отдалеченост
Сходство или разлика между етикетиране на предмети, се определя в зависимост от избрания показател разстояние между тях. Ако всеки обект е описано от свойства (характеристики), тогава тя може да бъде представена като точка в п-тримерно пространство, и сходство с други предмети ще се определя, както е подходящо разстояние. Когато класификации се използват различни мерки разстояния между обектите.
1. евклидовата разстояние
Това е може би най-често използваната мярка за разстояние. Това е геометрична разстояние в многомерен пространство и се изчислява както следва:
- - разстояние между обекта и;
- - стойност собственост обект;
- - стойността на обектно-имота.
Natural, от геометрична гледна точка, евклидовата мярката за разстояние може да бъде безсмислена, ако знаците са измерени в различни мерни единици. За да се справи със ситуацията, прибягва до дажби на всеки елемент. Използването на Евклидово разстояние е оправдано в следните случаи:
- свойства (характеристики) на обекта са хомогенни във физическия смисъл и са еднакво важни за класификация;
- функция пространство съвпада с геометричния пространство.
2. квадратно Евклидово разстояние
Това разстояние мярка се използва в случаите, когато е необходимо да се даде по-голяма стойност, по-отдалечени един от други субекти. Това разстояние се изчислява по следния начин:
3. претеглена Евклидово разстояние
Той се използва в случаите, когато всеки -Properties успели да приписват някои "тегло", пропорционално на степента на важност на тази функция в класификация на проблем:
За определяне на теглото като цяло са свързани с допълнителни изследвания, като организацията на експертно проучване и обработка на техните становища.
4. Хеминг разстояние
Също така го нарича Манхатън, град-блок разстояние или такси геометрия. Това разстояние е разликата в координатите. В повечето случаи това разстояние мярка води до същите резултати, както за конвенционално Евклидово разстояние. Имайте предвид обаче, че това измерване на въздействието на отделните големи разлики (емисии) намалява (тъй като те не са на квадрат). Hamming разстояние се изчислява съгласно формулата:
5. Chebyshev разстояние
Счита стойността на максималната модул на разликата между стойностите на съответните свойства (характеристики) включват
6. Процент на несъгласие
Например, първият признак на обекта - на пода, а вторият - на възраст, третият - на мястото на работа. Представлява стойностите на свойства (характеристики) на обекта като вектор на стойности. Първият елемент - (от мъжки пол, на 20 години, учител), вторият вектор - (от мъжки пол, на 28 години, мениджър). Процент на несъгласие е 2/3. Тези вектори се различават с 66.6%.
Изборът на мерки разстояния и везни за класифициране на имоти - един много важен етап, тъй като тези процедури се различават по състава и количеството на генерираните класове, както и от степента на сходство на обекти в рамките класове.