Определение надежности теста. Определение надежности
целого тестаСтраница 1
Термином «
надежность»характеризуется воспроизводимость, или стабильность, результатов тестирования. Если распределение тестовых оценок какой-либо группы, прошедшей тестирование когнитивных способностей, имеет простую среднюю арифметическую, равную 100, а через неделю у той же группы эта мера средней тенденции окажется равной 72, мы вынуждены будем заподозрить что-то неладное. Мы сочтем этот тест ненадежным, потому что его результаты не воспроизводятся. Общеизвестно, что результаты повторного тестирования одной и той же группы людей всегда несколько отличаются от результатов их первого тестирования, но если эта разница существенна, значит либо в самом тесте, либо в методике обсчета его результатов есть какой-то изъян.
Известны три метода определения надежности теста: метод определения ретестовой надежности, метод определения надежности взаимозаменяемых форм теста и метод определения надежности расщеплением. Метод определения ретестовой надежности основан на двукратном тестировании одной и той же группы людей и корреляции двух распределений тестовых оценок. Чем меньше коэффициент корреляции, называемый в данном случае коэффициентом надежности, отличается от +1 — идеального значения для положительной корреляции, — тем более надежным считается тест. В идеале, коэффициент надежности теста, который предполагается использовать в отборочном процессе, должен быть более +0,8, однако на практике приемлемым считается и тест с коэффициентом надежности, равным примерно +0,7. Однако этот метод имеет несколько ограничений. Экономически невыгодно дважды отвлекать людей от работы только для того, чтобы протестировать их. Кроме того, может сказаться и эффект научения: во-первых, люди запоминают вопросы после первого тестирования, а во-вторых, в промежутке между двумя тестированиями они могут приобрести определенный дополнительный опыт, в результате чего тестовые оценки во второй раз будут выше.
Метод определения надежности взаимозаменяемых форм теста тоже базируется на двукратном тестировании, однако в данном случае для повторного тестирования используется не тот же самый тест, а его эквивалентная, или параллельная, форма. Недостатком этого метода является то, что разработка двух самостоятельных и эквивалентных тестов непростая и дорогостоящая процедура.
Метод определения надежности расщеплением заключается в том, что после однократного применения теста входящие в него вопросы делят пополам с последующей корреляцией тестовых оценок за каждую из них. Преимущество этого метода в том, что он не требует больших затрат времени и позволяет ограничиться одним тестированием. При этом исключаются факторы, способные повлиять на вторую оценку.
В нашем исследовании повторное тестирование производилось спустя 36 дней с максимально приближенными условия первого тестирования.
Таблица 4.
Распределение индивидуальных баллов испытуемых по ретесту
|
30 |
27 |
29 |
33 |
21 |
35 |
30 |
26 |
28 |
34 |
30 |
24 |
|
29 |
29 |
31 |
27 |
21 |
33 |
29 |
27 |
28 |
32 |
34 |
22 |
Роль России в мировой психологической мысли
По своему вкладу в развитие мировой психологической мысли русская психология занимает одно из ведущих мест. Однако русская психология оказалась обойденной в зарубежной историографии. Зарубежные историографы (Э. Боринг, Д. Флюгель, Г. Мэрфи и другие), а в равной мере представители официальной философии и психологии дореволюционной России ...
Многомерность возраста
Понятием возраста объединяются два ряда развития, которые Л. С. Выготский назвал натуральным (развитие организма) и социальным (приобщение индивида к культуре путем обучения, воспитания, социализации в широком смысле слова).
Любой анализ жизненного пути должен учитывать принципиальную многомерность возрастных свойств и критериев их оце ...
Психокибернетика
Термин предложил Мальц (Maltz M.) для обозначения психотерапевтического подхода (который сам автор называет телеологическим) к изменению восприятия самого себя. Методика, с точки зрения автора, является аналогом «целенаправленного поведения механических систем» и представляет собой, по существу, вариант программы аутотренинга. Основная ...