валидност на теста

изпитвания за съответствие на измерване на психичното свойство VALNDNOSTYO тест. Това е, без преувеличение, най-важната характеристика на психометрични тестове. Ако високата надеждност на теста ни казва, че тестът наистина измерва нещо, високата валидността ukazyvaet.na, че мерките за изпитване точно това, което искаме. Разбира се, за валидността на теста също негативно повлияно от случайни фактори. Ето защо, в психометрични приета психометрична следната основна неравенството:

Изследването е доминиран от специални лабораторни критерии. Например, конструирана компактен тест въпросник на тревожност. В специален трудоемко цел лабораторен експеримент, в който възпроизвежда реална ситуация тревожност (тест доброволци YZ раждат за погрешни действия сегашните удари и т. П.) се използва като критерий за валидността на това.

Много често, тъй като критериите за валидност използват експертна оценка. Например, ние искаме да се уверите, че кратък тест за измерване на нивото на дисциплина е валиден. За тази анкета учителите за нивото на дисциплина е добре известно за тях студенти. И тогава ние сравняваме (връзка) резултатите от изпитванията и експертна оценка за дисциплината на учениците.

Нека тук малко подробности в този последен пример. Тук имаме един от самите прости и популярни методи за емпирични (статистически) валидност измерване. Този метод е добре познати групи. За да участвате в експеримент психометрична валидността на изпитването, са поканени да се провери по темите, за които се знае към коя група принадлежат критерий к.с.. В случай на избраните студенти дисциплина тестови ясно дисциплинирани според Дефект учители (критерии висока група), и със сигурност недисциплиниран (критерий Ниска Group). Учениците със средното за критерии при тестовете не участват. След теста, ние очакваме, например, просто tetrachoric корелация между теста и критерия. За да направите това, попълнете с tetrachoric таблица:

Елемент и с това, че плочата - е броят на лицата, принадлежащи към високо лента от теста и в зависимост от критерия, б елемент - броя на индивиди, принадлежащи към група тест за висока, но ниско от групата критерий и др ...

Очевидно е, че когато пълната валидността на фута тестовите елементи и таблетите трябва да бъде нула. Това означава, че тестът не трябва да дава грешки - да кажем, че студент nizkodistsiplinirovanny когато учителите казват, че ученикът много дисциплиниран (случая).

Мярка за съвпадение (корелация) между края на тестваните групи и критерия се оценява като се използва простата коефициента Phi Guilford:

Когато броят на тестваната група от 30 души (това е минималният брой проби, за да се провери валидността на) статистически значима връзка с критерия за изпитване, можем да кажем, че Фи> -0,36. Въпреки че е, разбира се, много ниска валидност, но все пак теста в този случай дава значително по-добри резултати от случаен си задавате въпроса. Това е, ако вашето училище е конкуренцията и искате да изберете не само талантлив, но и дисциплинирани ученици, които можете да използвате теста, валидността на който сте проверили и се оказа, че е значителен.

метод, известен групи има сериозен недостатък. Той не винаги е възможно да се използва теста за предвиждане. Фактът, че образуването на известни групи, за да направи оценка на работата, която е случило в миналото и искаме да направим тест дневна прогноза за поведение, което ще се случи в бъдеще. Много от тестовете, използвани в образователните психодиагностика имате тези недостатъци. Те са били в най-добрия, по начина, известен групи и нямат т.нар ПРОГНОСТИЧНА VALYDNOSTYU (или поне на валидността на тази строго доказано експериментално). Разбира се, на местно ниво, задачата за осигуряване на предсказуем валидност не може да бъде решен. Тя е само с голяма научна и методическа център. След Необходимо е да се привлече около десет пъти повече субекти на психометричните проучване, за да се провери валидността на предсказуем - не 30, а най-малко 300. В действителност, ние просто не знам кой от тях 300 ще падне в бъдеще в екстремни групи.

Например, ние искаме да се използва теста за прогнозиране на готовността на студентите до обучение в гимназията. Това е типичен предсказуем психо задача. Някой трябва да поеме по трудния многогодишна програма прогностичен тест на потенциала на този тест. Необходимо е да се тества на 300 500 ученици, а след това изчакайте един от тях да отиде в колеж и да бъде успешна там, за да се научат. След две-три интервали могат да се образуват criterial група и изчисляват тест корелация със същите параметри на тези на бившето училище. Едва след изпълнението на такава схема психометрична експеримент, може да се твърди, че тестът е бил утвърден предсказуем валидност. Без това, ние се процедира, просто защото на доверието в научно тест интуицията разработчик и ние нямаме независими доказателства, че тестът може да се използва за прогнозиране.

Отличителни нормални евтини схеми за валидиране на тестове (от известните групи) и скъпи схеми предсказващи за валидиране на тестове - основен елемент на психодиагностика грамотност не само за психолози, но също така и за учителите, за този въпрос, за всякаква информация, психодиагностика клиенти.

Когато клиентът не знае със сигурност, няма доказателства за ефективността на предложеното изпитване може да се изисква от тестери, то е надеждно защитена от ругатни.