Определение надежности теста. Определение надежности целого теста
Страница 1

Инфо по психологии » Исследование уровня креативности менеджеров по рекламе » Определение надежности теста. Определение надежности целого теста

Термином «

надежность»характеризуется воспроизводимость, или стабильность, результатов тестирования. Если распределение тестовых оценок какой-либо группы, прошедшей тестирование когнитивных способностей, имеет простую среднюю арифметическую, равную 100, а через неделю у той же группы эта мера средней тенденции окажется равной 72, мы вынуждены будем заподозрить что-то неладное. Мы сочтем этот тест ненадежным, потому что его результаты не воспроизводятся. Общеизвестно, что результаты повторного тестирования одной и той же группы людей всегда несколько отличаются от результатов их первого тестирования, но если эта разница существенна, значит либо в самом тесте, либо в методике обсчета его результатов есть какой-то изъян.

Известны три метода определения надежности теста: метод определения ретестовой надежности, метод определения надежности взаимозаменяемых форм теста и метод определения надежности расщеплением. Метод определения ретестовой надежности основан на двукратном тестировании одной и той же группы людей и корреляции двух распределений тестовых оценок. Чем меньше коэффициент корреляции, называемый в данном случае коэффициентом надежности, отличается от +1 — идеального значения для положительной корреляции, — тем более надежным считается тест. В идеале, коэффициент надежности теста, который предполагается использовать в отборочном процессе, должен быть более +0,8, однако на практике приемлемым считается и тест с коэффициентом надежности, равным примерно +0,7. Однако этот метод имеет несколько ограничений. Экономически невыгодно дважды отвлекать людей от работы только для того, чтобы протестировать их. Кроме того, может сказаться и эффект научения: во-первых, люди запоминают вопросы после первого тестирования, а во-вторых, в промежутке между двумя тестированиями они могут приобрести определенный дополнительный опыт, в результате чего тестовые оценки во второй раз будут выше.

Метод определения надежности взаимозаменяемых форм теста тоже базируется на двукратном тестировании, однако в данном случае для повторного тестирования используется не тот же самый тест, а его эквивалентная, или параллельная, форма. Недостатком этого метода является то, что разработка двух самостоятельных и эквивалентных тестов непростая и дорогостоящая процедура.

Метод определения надежности расщеплением заключается в том, что после однократного применения теста входящие в него вопросы делят пополам с последующей корреляцией тестовых оценок за каждую из них. Преимущество этого метода в том, что он не требует больших затрат времени и позволяет ограничиться одним тестированием. При этом исключаются факторы, способные повлиять на вторую оценку.

В нашем исследовании повторное тестирование производилось спустя 36 дней с максимально приближенными условия первого тестирования.

Таблица 4.

Распределение индивидуальных баллов испытуемых по ретесту

30

27

29

33

21

35

30

26

28

34

30

24

29

29

31

27

21

33

29

27

28

32

34

22

Страницы: 1 2


Физиологические основы внимания
Идеалистические взгляды на природу внимания можно проследить в работах Г. Лейбница, И. Канта, В. Вундта и У. Джемса. С критикой идеалистических взглядов на природу внимания уже в 20-х годах выступает академик В.М. Бехтерев. Развивая материалистическую линию Сеченова в трактовке вопросов внимания, он доказывает, что внимание, как и други ...

Социальная ситуация развития в дошкольном возрасте
Отделение ребенка от взрослого к концу раннего возраста приводит к новым отношениям дошкольника с ним и к новой ситуации развития. Впервые ребенок выходит за пределы своего семейного круга и устанавливает новые отношения с более широким миром взрослых людей. Общение ребенка с взрослыми усложняется и приобретает новые формы и новое соде ...

Примеры личностных деструкций. Агрессивность
Агрессивность, как свойство личности, является социально приобретенным продуктом социализации. Отдельные врожденные характеристики (тип высшей нервной деятельности, гормональный статус и т.д.) в процессе развития могут оказывать влияние на формирование этой черты личности и порой существенное, но не являются определяющими. Согласно сов ...