Определение надежности теста. Определение надежности
целого тестаСтраница 1
Термином «
надежность»характеризуется воспроизводимость, или стабильность, результатов тестирования. Если распределение тестовых оценок какой-либо группы, прошедшей тестирование когнитивных способностей, имеет простую среднюю арифметическую, равную 100, а через неделю у той же группы эта мера средней тенденции окажется равной 72, мы вынуждены будем заподозрить что-то неладное. Мы сочтем этот тест ненадежным, потому что его результаты не воспроизводятся. Общеизвестно, что результаты повторного тестирования одной и той же группы людей всегда несколько отличаются от результатов их первого тестирования, но если эта разница существенна, значит либо в самом тесте, либо в методике обсчета его результатов есть какой-то изъян.
Известны три метода определения надежности теста: метод определения ретестовой надежности, метод определения надежности взаимозаменяемых форм теста и метод определения надежности расщеплением. Метод определения ретестовой надежности основан на двукратном тестировании одной и той же группы людей и корреляции двух распределений тестовых оценок. Чем меньше коэффициент корреляции, называемый в данном случае коэффициентом надежности, отличается от +1 — идеального значения для положительной корреляции, — тем более надежным считается тест. В идеале, коэффициент надежности теста, который предполагается использовать в отборочном процессе, должен быть более +0,8, однако на практике приемлемым считается и тест с коэффициентом надежности, равным примерно +0,7. Однако этот метод имеет несколько ограничений. Экономически невыгодно дважды отвлекать людей от работы только для того, чтобы протестировать их. Кроме того, может сказаться и эффект научения: во-первых, люди запоминают вопросы после первого тестирования, а во-вторых, в промежутке между двумя тестированиями они могут приобрести определенный дополнительный опыт, в результате чего тестовые оценки во второй раз будут выше.
Метод определения надежности взаимозаменяемых форм теста тоже базируется на двукратном тестировании, однако в данном случае для повторного тестирования используется не тот же самый тест, а его эквивалентная, или параллельная, форма. Недостатком этого метода является то, что разработка двух самостоятельных и эквивалентных тестов непростая и дорогостоящая процедура.
Метод определения надежности расщеплением заключается в том, что после однократного применения теста входящие в него вопросы делят пополам с последующей корреляцией тестовых оценок за каждую из них. Преимущество этого метода в том, что он не требует больших затрат времени и позволяет ограничиться одним тестированием. При этом исключаются факторы, способные повлиять на вторую оценку.
В нашем исследовании повторное тестирование производилось спустя 36 дней с максимально приближенными условия первого тестирования.
Таблица 4.
Распределение индивидуальных баллов испытуемых по ретесту
|
30 |
27 |
29 |
33 |
21 |
35 |
30 |
26 |
28 |
34 |
30 |
24 |
|
29 |
29 |
31 |
27 |
21 |
33 |
29 |
27 |
28 |
32 |
34 |
22 |
Младший подростковый период (10 – 12-13 лет)
Общая характеристика:
§ Период повышенной активности ЦНС, желез внутренней секреции. Это ведет к увеличению гормонов в крови и усилению признаков полового созревания.
§ Половое созревание происходит неодинаково у девочек и мальчиков ( у девочек раньше и острее протекает кризис)
§ Возбуждение преобладает над торможением и подросток мо ...
Основные характеристики возрастных кризисов
Л.С. Выготский придавал кризисам большое значение и рассматривал чередование стабильных и кризисных периодов как закон детского развития. Согласно теории критических периодов детского развития, каждый критический период – результат перестройки социальной ситуации развития, в основе которой, с одной стороны, лежит изменение объективного ...
Оптическое воздействие цвета.
К этому воздействию относятся иллюзии или оптические явления, вызываемые цветом и изменяющие внешний вид предметов. Рассматривая оптические явления цвета, все цвета можно условно разделить на две группы: красные и синий, т.к. в основном цвета по своим оптическим свойствам будут тяготеть к какой-нибудь из этих групп. Исключение составляе ...