Психодиагностические методики, виды методик.
В настоящее время существует несколько достаточно обоснованных классификаций психодиагностических методик.
Во-первых, можно различать диагностические методы, основанные на заданиях, которые предполагают правильный ответ, либо на заданиях, относительно которых правильных ответов не существует К первой группе относятся многие тесты интеллекта, тесты специальных способностей, некоторых личностных черт (например, тест Равена, диагностическая процедура определения полезависимости-поленезависимости Уиткина, тест ригидности Лучинса и др.).
Диагностические методики второй группы состоят из заданий, которые характеризуются лишь частотой (и направленностью) того или иного ответа, но не его правильностью. Таковы большинство личностных опросников (например, тест 16PF Р Кеттелла):Во-вторых, можно различать вербальные и невербальные психодиагностические методики.
Первые так или иначе опосредованы речевой активностью обследуемых; составляющие эти методики задания апеллируют к памяти, воображению, системе убеждений в их опосредованной языком форме. Вторые включают речевую способность испытуемых только в плане понимания инструкций, само же выполнение задания опирается на невербальные способности - перцептивные, моторные.
Третье основание, используемое для классификации психодиагностических методик, - это характеристика того основного методического принципа, который положен в основу данной методики. По этому основанию обычно различают: 1) объективные тесты; 2) стандартизованные самоотчеты, которые в свою очередь включают: а) тесты-опросники; б) открытые опросники, предполагающие последующий контент-анализ; в) шкальные техники, построенные по типу семантического дифференциала Ч. Осгуда; и методики классификации; г) индивидуально ориентированные техники типа ролевых репертуарных решеток; 3) проективные техники; 4) диалогические
Объективные тесты - это те методики, в которых возможен правильный ответ, т.
е. правильное выполнение задания.Общим для всей группы методик стандартизованного самоотчета является использование вербальных способностей испытуемого, а также обращение к его мышлению, воображению, памяти.
Тесты-опросники предполагают набор пунктов (вопросов, утверждений), относительно которых испытуемый выносит суждения (как правило, используется двух- или трехальтернативный выбор ответов).
Одна и та же психологическая переменная представляется группой пунктов (не менее 6). Пункты теста-опросника могут быть прямыми, апеллирующими непосредственно либо к опыту субъекта (например: Боитесь ли Вы темноты?), либо к мнениям, суждениям испытуемого, в которых косвенно проявляются его личный опыт или переживания (например: Большинство людей честны?) Опросники строятся как одномерные или многомерные, включающие в себя целый ряд психологических переменных.
Открытые опросники не предусматривают стандартизованного ответа испытуемого; стандартизация обработки достигается путем отнесения произвольных»ответов к стандартным категориям.
Шкальные техники предполагают оценку тех или иных объектов (словесных утверждений, изобразительного материала, конкретных лиц и т. п.) по выраженности в них качества, заданного шкалой (например: «теплый - холодный», «сильный - слабый»). Обычно используются трех-, пяти- и семиточечные шкалы. Особый вариант шкалирования – это субъективная классификация, предполагающая выявление субъективного структурирования объектов на уровне шкалы наименований.
Индивидуально-ориентированные (идеографические) техники типа репертуарных решеток могут по форме совпадать со шкальными, опросными методами, напоминать беседу или интервью. Их основное отличие от тестов-опросников состоит в том, что параметры, которые оцениваются (оси, измерения, конструкты), не задаются извне, а выделяются на основе индивидуальных ответов данного конкретного испытуемого. Отличие этих методов от метода интервью состоит в том, что репертуарные решетки позволяют осуществлять применение современного статистического аппарата и делают надежными диагностические выводы относительно индивидуальных особенностей субъекта.
Проективные техники основаны на том, что недостаточно структурированный материал, выступающий в качестве «стимула», при соответствующей организации всего эксперимента в целом порождает процессы фантазии, воображения, в которых раскрываются те или -иные характеристики субъекта. В клиническом употреблении проективные техники часто строятся на интуиции и теоретической подготовке психодиагноста, которые оказываются необходимыми на этапе интерпретации данных. Исследовательское употребление проективных техник предполагает, как правило, применение контент-аналитических процедур, стандартизирующих обработку данных.
Диалогические техники учитывают, что психодиагност вступает в контакт с обследуемым и достигает наилучших диагностических результатов за счет специфических особенностей этого контакта, релевантных диагностической задаче. Так, доверительный контакт необходим при диагностике семейных затруднений, характера личностного развития ребенка и во многих других случаях, в которых диагност одновременно выступает в роли и консультанта, и психотерапевта. Ситуация диагностического патопсихологического обследования диктует построение общения по принципу экспертизы.
Диалогические техники могут быть вербальными (интервью, беседы) и невербальными (например, игра с ребенком может выступать как невербальная диагностическая процедура).
Различные методические приемы, на основе которых строятся те или иные методики, можно расположить на одной шкале, если за единое основание классификации принять меру вовлеченности в диагностическую процедуру самого психодиагноста и степень его влияния на результат обследования.
Аппаратурные методики и объективные психологические тесты обладают наименьшей вовлеченностью психодиагноста в процедуру психодиагностики, минимальным влиянием личности психодиагноста и его опытности как психолога на результаты обследования. Почти столь же малой степенью вовлеченности психодиагноста обладают и некоторые формы стандартизованных самоотчетов - многие опросники и шкальные техники.
Можно сказать, что в этих методиках личные качества психолога воплотились на этапе разработки методики; сама же процедура обследования, как и фиксация ее результата, оказывается рутинной операцией, которая в принципе может выполняться с помощью лаборанта-непсихолога или по компьютерной программе. Диагностические техники, напротив, характеризуются максимальной степенью вовлеченности психодиагноста в процесс психодиагностики, максимальным влиянием его опытности, профессиональных навыков, способностей в сфере общения на результаты обследования. Этими качествами обладают различные виды бесед, интервью, диагностических игр. Например, патопсихологический эксперимент как особый психодиагностический метод характеризуется высокой степенью вовлеченности психодиагноста: должен быть создан «мотив» экспертизы (обследуемый должен понимать, что на основе его ответов будет сделано важное для него диагностическое заключение), результаты отдельных проб интерпретируются в зависимости от того, насколько выражен этот мотив (по мнению психодиагноста). Не менее явным оказывается влияние психодиагноста на результаты диагностического заключения, выносимого на основе беседы с клиентом психологической консультации. Своими реакциями, ответными репликами, манерой держаться психодиагност может как создать оптимальные условия для получения диагностически важной информации, так и полностью исказить эту информацию, ее смысл.Все остальные психодиагностические методики занимают промежуточное положение между двумя полюсами, образованными объективными тестами и диалогическими техниками.
Уже многомерные тесты-опросники, предполагающие анализ профиля и интерпретацию отдельных шкал в зависимости от значений других и характера профиля в целом, требуют клинической опытности психодиагноста и, следовательно, на этапе психодиагностичен, кого заключения не свободны от влияния личности диагноста. Не менее значимым является это влияние и при необходимости кодирования результатов обследования, полученные с помощью открытых опросников либо проективных техник В последнем случае существенное значение имеет создание психодиагностом атмосферы, раскрывающей способности испытуемого к воображению, творчеству.
Если ввести одновременно два основания - меру вовлеченности психодиагноста, его влияние на результаты обследования, с одной стороны, и предметную направленность инструмента - с другой, то известные на сегодня психодиагностические методики можно расположить в двухмерной классификационной таблице.
Соответствующие методики окажутся расположенными в клетках таблицы, при этом столбцы будут заполнены неравномерно по строкам таблицы. Так, способности и психические функции диагностируются в основном методами, влияние психодиагноста в которых выражено минимально, - в основном объективными тестами и тестами-опросниками. Личностные черты преимущественно диагностируются тестами-опросниками; когнитивная организация, другие индивидуальные свойства выявляются преимущественно методиками среднего уровня (по степени влияния психодиагноста на процесс диагностики) - репертуарными решетками, проективными техниками.
Мотивация, отношение диагностируются преимущественно проективными техниками. Роль диалогических методик, обладающих максимальной степенью включенности психодиагноста, особенно важна в области диагностики взаимоотношений, общения (таких свойств, актуализация которых требует воссоздания реальных ситуаций общения).
Приведенная в данном разделе классификация отражает достаточно грубо лишь общие черты психологических диагностических методик - более конкретно вопрос о классификациях обсуждается в соответствующих главах книги. Однако и в таком виде предлагаемая классификация обладает эвристической ценностью. Если заполнить все клетки табл. 1, станет видно, где существует нехватка методов определенного типа. Так, например, явно не хватает методик диалогического типа для определения способностей (см. главу 5), поскольку' эффективная демонстрация способностей у некоторых субъектов существенно зависит от условий психодиагностики и характера контакта с психодиагностом. Пользователь психодиагностических методик, так же как их разработчик, может расчертить и заполнить подобную таблицу для себя и вписать в клетки известные ему методики.
Это позволит ему лучше представить себе, какими методами необходимо овладеть и где возникаетнеобходимость в поиске и научной разработке методов.На основе теории измерения строятся психологические тесты. Тест — сокращенная по времени и упрощенная процедура психологического измерения, применяемая для решения практических (иногда исследовательских) задач.
В чем заключается суть психологического измерения?
В психологии различают три основные процедуры психологического измерения. Основанием для различения является объект измерения.
Во-первых, психолог может измерять особенности поведения людей для того, чтобы определить, чем один человек отличается от другого с точки зрения выраженности тех или иных свойств, наличия того или иного психического состояния или для отнесения его к определенному типу личности. Психолог, измеряя особенности поведения, определяет сходства или различия людей. Психологическое измерение становится измерением испытуемых.
Во-вторых, исследователь может использовать измерение как задачу испытуемого, в ходе выполнения которой последний измеряет (классифицирует, ранжирует, оценивает и т.п.) внешние объекты: других людей, стимулы или предметы внешнего мира, собственные состояния. Часто эта процедура оказывается измерением стимулов. Понятие «стимул» используется в широком смысле, а не в узкопсихофизическом или поведенческом. Под стимулом понимается любой шкалируемый объект.
В-третьих, существует процедура так называемого совместного измерения (или совместного шкалирования) стимулов и людей. При этом предполагается, что «стимулы» и «испытуемые» могут быть расположены на одной оси. Поведение испытуемого рассматривается как проявление взаимодействия личности и ситуации.
Внешне процедура психологического измерения ничем не отличается от процедуры психологического эксперимента. Более того, в психологической исследовательской практике понятия «измерение» и «эксперимент» часто используются как синонимы. Однако при проведении психологического эксперимента нас интересуют причинные связи между переменными, а результатом психологического измерения является всего лишь отнесение испытуемого либо оцениваемого им объекта к тому или иному классу, точке шкалы или пространству признаков.
В строгом смысле слова психологическим измерением можно назвать лишь измерение поведения испытуемых, т. е. измерение в первом значении этого понятия.
Психологическое измерение стимулов является задачей, которую выполняет не экспериментатор, а испытуемый в ходе обычного психологического (точнее — психофизического) эксперимента. В этом случае измерение используется только как методический прием наряду с другими методами психологического исследования; испытуемый же «играет роль» измерительного прибора. Поскольку результаты такого рода «измерений» интерпретируются на основе той же модели измерений, а обрабатываются с применением тех же математических процедур, что и результаты измерения поведения испытуемых, в психологии принято употреблять понятие «психологическое измерение» в двух различных смыслах.
Процедура психологического измерения состоит из ряда этапов, аналогичных этапам экспериментального исследования.
Основой психологических измерений является математическая теория измерений — раздел психологии, интенсивно развивающийся параллельно и в тесном взаимодействии с развитием процедур психологического измерения. Сегодня это — крупнейший раздел математической психологии.
С математической точки зрения, измерением называется операция установления взаимно однозначного соответствия множества объектов и символов (как частный случай — чисел). Символы (числа) приписываются вещам по определенным правилам.
Правила, на основании которых числа приписываются объектам, определяют шкалу измерения.
Измерительная шкала— основное понятие, введенное в психологию в 1950г. С. С. Стивенсом (Экспериментальная психология/Под ред. С.С. Стивенса. М., 1963); его трактовка шкалы и сегодня используется в научной литературе.
Итак, приписывание чисел объектам создает шкалу. Создание шкалы возможно, поскольку существует изоморфизм формальных систем и систем действий, производимых над реальными объектами.
Числовая система является множеством элементов с реализованными на нем отношениями и служит моделью для множества измеряемых объектов.
Различают несколько типов таких систем и соответственно несколько типов шкал. Операции, а именно — способы измерения объектов, задают тип шкалы. Шкала в свою очередь характеризуется видом преобразований, которые могут быть отнесены к результатам измерения. Если не соблюдать это правило, то структура шкалы нарушится, а данные измерения нельзя будет осмысленно интерпретировать.
Тип шкалы однозначно определяет совокупность статистических методов, которые могут быть применены для обработки данных измерения.
Шкала (лат. scala — лестница) в буквальном значении есть измерительный инструмент.
П. Суппес и Дж. Зинес [Суппес П., Зинес Дж., 967] дали классическое определение шкалы: «Пусть A — эмпирическая система с отношениями (ЭСО), R — полная числовая система с отношениями (ЧСО), f — функция, которая гомоморфно отображает А в подсистему R (если в области нет двух разных объектов с одинаковой мерой, что является отображением изоморфизма). Назовем шкалой упорядоченную тройку ».
Обычно в качестве числовой системы R выбирается система действительных чисел или ее подсистема. Множество А — это совокупность измеряемых объектов с системой отношений, определенной на этом множестве. Отображение f — правило приписывания каждому объекту определенного числа.
В настоящее время определение Суппеса и Зинеса уточнено. Во-первых, в определение шкалы вводится G — группа допустимых преобразований. Во-вторых, множество А понимается не только как числовая система, но и как любая формальная знаковая система, которая может быть поставлена в отношение гомоморфизма с эмпирической системой. Таким образом, шкала — это четверка . Согласно современным представлениям, внутренней характеристикой шкалы выступает именно группа G, а f является лишь привязкой шкалы к конкретной ситуации измерения.
В настоящее время под измерением понимается конструирование любой функции, которая изоморфно отображает эмпирическую структуру в символическую структуру. Как уже отмечено выше, совсем не обязательно такой структурой должна быть числовая. Это может быть любая структура, с помощью которой можно измерить характеристики объектов, заменив их другими, более удобными в обращении (в том числе числами).
Тестирование (в частности, психологическое) является разновидностью процедуры измерения свойств объекта. Свойство — философская категория, выражающая такую сторону предмета, которая обусловливает его различия и общность с другими предметами и обнаруживается в его отношении к ним.
В логике под свойством понимается одноместный предикат вида Р(х): например, x-город — в отличие от отношения, которое также является одноместным предикатом Свойство может быть многоместным предикатом, а отношение — одноместным, например: «Петр любит самого себя». Свойство ограничивает область объектов, которым оно приписывается. В результате операции приписывания свойства объектов становится меньше, чем было до этого Отношение же всегда образует новые объекты, например, Р(х, у, z), где х — мужчины, у — женщины, z — дети;
если Р— генетическое отношение, то связанные этим отношением х, у и z дают новый объект — человечество.
Отсюда ясно, что, вводя понятие «свойство», мы выделяем класс психических сущностей, которые этим свойством обладают.
Свойства классифицируются по наличию интенсивности и ее изменениям. При этом различают три основных типа свойств:
а) точечные;
б) линейные;
в) многомерные.
Рассмотрим первый тип: точечные свойства. Человек может быть: либо мертвым, либо живым; или мужчиной, или женщиной; или холериком, или сангвиником.
Ни одна женщина не может быть чуть-чуть беременной. Существуют свойства, которые не имеют интенсивности и могут рассматриваться как точечные, или «свойства нулевого измерения». Такие свойства обладают определенностью, качественной, но не количественной.
Второй тип свойств образуют линейные свойства (одномерные свойства). Последний термин, с нашей точки зрения, более удачен. Другие линейные свойства, присущие предмету, всегда имеют определенную интенсивность, причем могут изменяться лишь в направлении уменьшения или увеличения этой интенсивности. Таковы масса, упругость, вязкость, мощность, температура, физическая сила человека, его рост и т.д. Отметим, что большинство психических свойств относится традиционно к этому типу. В частности, факторная теория интеллекта вводит понятия: «общий интеллект», «креативность», «дивергентное мышление», основываясь на том, что эти свойства являются одномерными (линейными).
Одномерные (линейные) свойства помимо качественной определенности обладают также количественной. Обычно вводится понятие интервала интенсивности, под которым понимается вся совокупность интенсивностей данного свойства (диапазон интенсивности). Физические свойства такого рода называются скалярами.
Примером двухмерных свойств являются векторные величины. Двухмерные свойства можно представить как комбинацию одномерных (разложение вектора на плоскости — комбинация скалярных величин: величины угла и длины отрезка). Их обобщением являются многомерные свойства, которые можно определить как свойства, способные изменяться в n-отношениях: пространственные векторы в математике, тензоры в физике и т.д.
Между точечными, линейными и многомерными свойствами существует простое отношение сводимости: многомерное свойство может быть представлено как совокупность линейных свойств, а линейное — как множество точечных свойств. Соответственно набор точечных свойств можно представить в качестве псевдолинейного свойства, а набор линейных — как псевдомногомерное свойство.
Можно теоретически предусмотреть 4-й случай, когда свойство качественно не определено. Это парадоксально только на первый взгляд. Возможен вариант: есть некое число, но неясно, представляет ли оно какое-либо свойство.
Таким образом, можно ввести следующую типологию свойств:
1) свойство не определено;
2) точечное свойство;
3) линейное свойство;
4) многомерное свойство.
Рассмотрим на качественном уровне общую структуру психологического тестирования — применение теста, призванного измерить определенное свойство.
Психологический тест включает в себя некоторую совокупность заданий, инструкции: испытуемому — правило работы с тестом, экспериментатору — правило организации работы испытуемого с тестом и правило работы с данными, а также теоретическое описание с указанием свойств, измеряемых тестом, шкал (топологии свойства) и метода введения шкальной оценки. Указываются также психометрические параметры теста.
С теоретической точки зрения, для измерения свойства и интерпретации тестового балла следует описать типичную структуру и процедуры тестирования с позиций взаимодействия испытуемого и экспериментатора.
Испытуемый, обладающий свойством (Рi), должен выполнить (F1) задания теста (), дать ряд ответов (). Экспериментатор должен этот ряд ответов () отобразить (F2) на «модели совокупности испытуемых», т.е. совокупности измеряемых свойств (), чтобы получить некоторый результат тестирования.
Тем самым существуют два типа процедур: собственно тестирование — взаимодействие испытуемого с тестом, и интерпретация — «взаимодействие» данных испытуемого с «моделью совокупности испытуемых». Получаем два отображения — F: Р —> J и F: J —> Р. Идеальная обобщенная модель теста, возникающая из процедуры тестирования, тем самым должна включать в себя:
1) описание вида отображения F1 и F2 (они должны быть тождественными);
2) описание топологии свойства;
3) характеристику индикаторов (ответов испытуемого) и задач .
Индикаторы являются поведенческими признаками и так же, как свойства, могут быть: 1) не определены; 2) дискретны; 3) линейны; 4) многомерны. В обычном случае мы имеем дискретные индикаторы: отдельные поведенческие акты. Искусственным методом (суммируя индикаторы) мы образуем при интерпретации псевдолинейное свойство, получая «сырой» балл. Возникает проблема: в каких случаях можно это делать? Кроме того, существуют некоторые отношения на множествах испытуемых и индикаторов.
Если свойство не определено, то единственное отношение, которое можно установить на множестве испытуемых, — это отношение сходства.
Если свойство является точечным, то на множестве испытуемых можно ввести отношения эквивалентности (обладает свойством), неэквивалентности (не обладает свойством) и применить дихотомическую классификацию.
Наконец, если свойство линейное или многомерное, то испытуемых можно шкалировать по их положению на линейном континууме или в пространстве.
Поступаем так и в отношении индикаторов. Они могут быть эквивалентны или не эквивалентны, определены или не определены, шкалированы или не шкалированы.
Следовательно, в зависимости от вида отношений, которые мы вводим на множестве испытуемых (определяется природой свойства) или индикаторов (определяется описанием поведения и заданий), получаем разные модели теста. Кроме того, необходимо учесть вид отображений — F1 и F2 , которые представляют собой решающие правила соотнесения индикаторов со свойством. Они зависят от интерпретации процедуры тестирования. Ниже мы рассмотрим некоторые возможные модели.
Итак, возможны следующие модели теста, основанные на различной топологии измеряемого свойства.
1. Если свойство не определено, то необходимо рассматривать отношение различия на множестве людей. Это отношение порождает новый класс объектов. Отсюда — тест выявляет меру сходства каждого человека с «человеком-эталоном».
2. Если свойство качественно определено, то оно рассматривается как точечное, что позволяет ограничить класс объектов — выделить людей, обладающих свойством, и людей, им не обладающих.
Тест позволяет в этом случае произвести дихотомическую классификацию.
3. Если свойство линейное или многомерное, то можно выявить величину свойства, характеризующую каждого человека.
Тест позволяет измерить свойство количественно.
Существует множество конкретных тестовых методик, которые можно классифицировать по самым разным основаниям. В настоящее время психологический тест рассматривается как набор заданий, т.е. измерительный инструмент, обнаруживающий свойство. Общее название для заданий — пункты теста. Испытуемому предлагаются варианты ответа по отношению к каждой задаче. Ответ регистрируется и считается индикатором (признаком), обнаруживающим свойство. Варианты ответа могут быть разными, но чаще используются такие: «да» — «нет», «решил» — «не решил» и др. Каждый индикатор, сочетание пунктов — ответ, соотносится с ключом, который приписывает индикатор определенному свойству.
В основе подобной процедуры лежит модель, предложенная еще К. Левиным [Lewin К., 1936], — поведение есть функция личности и ситуации: В= f (Р, S). Решается иная задача: восстановить свойство личности по поведению в ситуации: ситуацией является пункт теста, а поведением — ответ испытуемого: Р = f (В, S). Таким образом, каждый индикатор свойства есть соединение поведения и ситуации: = В & S. Тем самым личность есть производное от совокупности индикаторов: P = f().
Многомерный тест измеряет не одно, а несколько свойств личности, поэтому в общем случае имеется матрица вида J х Р, где каждый индикатор соотносится со свойством.
Процедура обнаружения свойств, к которой сводится тестовое измерение, завершается выводом суммарного балла. Такое отношение между индикаторами и тестом называется кумулятивно-аддитивной моделью. «Сырой» балл считается оценкой, характеризующей испытуемого.
Наиболее часто эту оценку считают оценкой «интенсивности» свойства. Тем самым явно или неявно принимается гипотеза о том, что относительная частота обнаружения свойства прямо пропорциональна «интенсивности» свойства: у = k (т/ п) + С, где т/п — отношение числа обнаруженных признаков к общему числу испытаний, у — «интенсивность» свойства, а k и С — некоторые константы. Очевидно, что неявным образом для измерения психологических особенностей индивидов применяется интервальная шкала.
Гипотезу о наличии подобной связи называют также гипотезой эквивалентности интенсивности и экстенсивности проявления свойства.
Кумулятивную гипотезу проверяют путем корреляции результатов применения различных методик. В частности, при измерении мотивации в качестве базовой методики используется предложенный Г. Мюрреем Тест тематической апперцепции (ТАТ). Он состоит из нескольких картинок с изображением людей в определенных ситуациях. Испытуемому предлагается составить рассказ по поводу каждой ситуации. Его высказывания анализируются. По известным ключевым признакам выявляется связь высказываний с определенной мотивацией. Число высказываний, относящихся к тому или иному мотиву, характеризует величину его интенсивности. Кумулятивная гипотеза является в этом случае переводом на математический язык известной поговорки: «У кого что болит, тот о том и говорит». Считается, что количество «речевых продуктов» пропорционально силе мотива. Число признаков психологического свойства при этом не фиксировано, а может быть только соотнесено со средним значением по выборке. Опросники, разработанные для диагностики мотивации, сопоставляются с методикой ТАТ. При наличии высокого положительного коэффициента линейной корреляции результатов кумулятивно-аддитивная модель принимается и для обработки данных личного опросника.
Критическую оценку применения кумулятивно-аддитивной модели дал Р. Мейли [Мейли Р., 1975]. Он полагал, что и методика типа ТАТ, и опросники (особенно — на самооценку) измеряют только вероятность наличия у испытуемого того или иного психологического свойства, а не его интенсивность.
Критика, с которой выступает Мейли, носит только качественный характер и не имеет математического или эмпирического обоснования.
Процедура суммирования баллов сама по себе не плоха и не хороша: важно выявить природу итоговой оценки. Суммарный балл может характеризовать близость испытуемого к некоторому типу, а с помощью оценки определяется его место на шкале порядка или интервалов. Вид интерпретации тестового балла зависит от принятой разработчиком модели.
Традиционные обобщенные измерительные модели теста являются математическими, описывающими взаимодействие измерительного инструмента (теста) и объекта измерения (человека). Основная особенность этих моделей: они применялись для обоснования метода обработки данных тестирования в целях выявления латентного свойства.
В отношении психологического свойства можно сделать следующие теоретические предположения. Первое, наиболее простое, заключается в том, что нам неизвестно, есть свойство или нет. Утверждение кажется парадоксальным, однако дело в том, что психическое свойство — некоторое теоретическое допущение, и если у нас нет достаточных оснований пользоваться этим понятием для объяснения поведения, лучше к нему не прибегать. Второй вариант допущения состоит в том, что свойство есть, но нам неизвестна его топология: неясно, является ли это свойство точечным, линейным, многомерным и т.д. Третье возможное утверждение: нам известна топология свойства. Свойство — одномерный континуум (непрерывный) и может быть измерено некоторой порядковой или метрической шкалой (шкала наименований не является шкалой в строгом смысле этого слова).
По отношению к взаимодействию испытуемого и теста возможны два допущения:
1) появление признака строго детерминировано и соответственно детерминирован тип ответа;
2) взаимодействие испытуемого и задания определяет вероятность получения того или иного ответа.
Чаще применяется вероятностная модель (рис. 6.4).
Множество свойств имеет определенную структуру. Традиционно полагается, что тестируемые свойства должны быть линейно независимы, хотя в общем случае это условие необязательно.
Каждое свойство имеет определенную топологию: она может быть не определена, а свойство — точечно, линейно, многомерно.
1. Тест измеряет свойства некоторых объектов, принадлежащих определенному множеству -совокупности потенциальных испытуемых. В руководстве к тесту оговариваются характеристики множества испытуемых, для которых он предназначен. Тем самым определено некоторое множество с отношениями между его элементами. Эти отношения связаны с топологией свойства. Если топология свойства не определена, то на множестве испытуемых можно вводить только отношения сходства, не соответствующего правилу транзитивности отношений. Если свойство является точечным, то, согласно его определению, оно позволяет отделить испытуемых, обладающих свойством, от испытуемых, им не обладающих. То есть на множестве испытуемых можно ввести отношения эквивалентности—неэквивалентности, свидетельствующие о степени обладания свойством. Наконец, если свойство линейное, то испытуемых можно расположить на линейном континууме и ввести метрику.
2. Тест включает в себя множество заданий () и вариантов ответов испытуемого (), которые оговорены в предлагаемой ему инструкции (решил — не решил, да — нет, хорошо — средне — плохо и т. д.). Декартово произведение x = дает нам множество индикаторов (признаков) измеряемого свойства. Индикаторы могут быть относительно свойства разнородны, однородны (т. е. на них могут быть введены отношения эквивалентности), шкалированы (область разной «силы»).
Отношения на множестве индикаторов независимы от отношений на множестве испытуемых, т. е. от топологии свойства. Это правило соответствует принципу объективности метода измерения: свойства прибора (в нашем случае — тестовых заданий) не зависят от свойств объекта.
3. Между множествами испытуемых (), индикаторов () и свойств () существуют определенные отношения, которые можно разбить на отношения измерения и интерпретации. Измерение — это творческий подход испытуемого (испытуемых) к работе с тестом, «порождение» ответов на задания (признаков).
Интерпретация заключается в том, что на основе этих признаков экспериментатор при работе с «ключом» теста выявляет свойства испытуемого и относит его к определенной категории (подмножеству множества испытуемых).
Отношения измерения:
1. Отображение множества свойств на множество испытуемых вида F1: дает представление об отношении измеряемых свойств к испытуемым. Например: испытуемые могут обладать или не обладать той или иной интенсивностью свойства и т.д.
Каждое свойство характеризуется вектором вида , где Oij — величина, показывающая на принадлежность свойства Рi испытуемому Oi.
Обычно Pij характеризует распределение испытуемых, на которых апробировали тест, по отношению к пространству свойств.
2. Отображение F2: определяет процесс измерения. Каждое свойство характеризуется вектором , где — величина, определяющая, в какой мере свойство Рj детерминирует индикатор Jk. Если описание теста сопровождается данными факторного или латентно-структурного анализа, то эта величина отражает «нагрузку» фактора на пункт теста.
3. Отображение F3: позволяет оценить результат измерения и определить, какие признаки проявил испытуемый при выполнении теста. Каждый испытуемый характеризуется вектором , где — величина, показывающая, в какой мере испытуемый О1, проявил признак Jk. Обычно признаки проявляются дихотомически: решил — не решил, да — нет; иногда привлекаются непрерывные величины:
время решения задания, шкальная оценка и т.д.
Этот вектор характеризует ответы испытуемого на тест и подвергается процедуре интерпретации.
Отношения интерпретации:
1. Отображение множества на множество вида F3: дает представление о первичной структуре данных. Каждый индикатор характеризуется вектором . При тестировании способностей этот вектор позволяет определить, какие испытуемые решили те или иные задачи.
2. Отображение множества на множество вида F2: указывает на процесс интерпретации тестового балла, точнее — вектора обнаруженных признаков. Каждый индикатор характеризуется вектором , где Рij — величина, определяющая «вес» индикатора по отношению к свойству. В инструкции к тесту «вес» индикатора используется для подсчета накопленного балла. Он соответствует «нагрузке» фактора на пункт теста. По отображению F2 можно говорить о процедуре подсчета «сырого» балла.
3. Отображение множества на множества вида P1: характеризует интерпретацию — приписывание свойства или определенного уровня его интенсивности конкретному испытуемому (группе испытуемых). Каждый испытуемый характеризуется вектором , где Pij — величина, определяющая, в какой мере свойство Рi, выражено у испытуемого Оi. Эта величина является итогом процесса интерпретации — «психологическим портретом» испытуемого. С позиции обобщенной модели основное требование к тесту заключается в том, чтобы процедуры интерпретации и измерения были тождественными. Иными словами, тождественными должны быть обратные отображения F1 и F1' , F2 и F2', F3 и F3'. В противном случае результаты интерпретации будут расходиться с результатами измерения (тестирования).
Описания множеств и видов отображения F1' ,F2' и F3' определяются в ходе разработки теста и включаются в теоретическое описание теста и в инструкцию экспериментатора.
Поскольку тест направлен на измерение психического свойства (в частности, способности), то вид конкретной модели, описывающей тест, определяется топологией свойства.
Рассмотрим варианты нормативной обобщенной модели теста для одномерного случая, когда измеряется только одно свойство.
1. Свойство не определено.
Если топология свойства не определена, то это означает, что множество испытуемых нельзя (в соответствии с определением понятия «свойство») разбить на подмножества, обладающие или не обладающие свойством. Иначе: на множестве испытуемых нельзя ввести отношения эквивалентности—неэквивалентности. Однако на множестве испытуемых можно ввести отношения толерантности (сходства). Это отношение рефлексивно, симметрично, но не транзитивно. Множество индикаторов нельзя характеризовать по отнесенности к свойству, так как — множество свойств, качественно не определенных. Следовательно, каждый испытуемый характеризуется лишь структурой своих ответов.
Единственно возможный способ интерпретации таких результатов — выделение из множества испытуемых «эталонного испытуемого» (например, решившего все задачи теста). После этого производится подсчет коэффициентов сходства всех испытуемых с «эталоном».
Назовем этот вариант модели «моделью сходств». В психологических исследованиях она применяется редко. Очевидно, свою роль играет стремление исследователей максимально повысить мощность интерпретации данных.
2. Свойство качественно определено.
Топология свойства определена: оно является точечным. На множества испытуемых можно ввести отношение эквивалентности—неэквивалентности (рефлексивное, симметричное, транзитивное), указывающее на наличие или отсутствие у них свойства. Следовательно, отображение F1: является отображением множества на точку. Вектор значений Рij характеризует индивидуальную меру выраженности свойства (в вероятностной интерпретации — вероятность его наличия) у испытуемого. Соответственно определены все отображения F1' ,F2' и F3' (и обратные им). Если испытуемые обладают / не обладают свойством, то их можно разбить на основании результата тестирования на классы, имеющие и не имеющие свойства. При интерпретации данных используется следующий алгоритм: фиксируются индикаторы, проявленные испытуемым, подсчитывается индивидуальный показатель наличия или отсутствия у него свойства и принимается решение о его принадлежности к одному из дихотомических классов — А и `А (обладающих и не обладающих свойством).
Назовем эту модель моделью дихотомической классификации. Она использована в опросниках Личко, опросниках УНП и ряде других.
3. Свойство качественно и количественно определено. Свойство является линейным континуумом, следователь, на нем определена метрика. Отображение F1': указывает на меру принадлежности испытуемых к той или иной градации свойства (точке линейного континуума).
В этом случае для подсчета величины, характеризующей принадлежность испытуемого к определенной интенсивности свойства, применяют кумулятивно-аддитивную модель: число признаков, проявленных при выполнении заданий теста (с учетом «весов»), прямо пропорционально интенсивности свойства, которым обладает испытуемый. Эта модель есть отображение F2': . Тем самым применяется следующая интерпретация: фиксируются ответы испытуемого; вычисляется «сырой» балл; испытуемый обладает определенной интенсивностью свойства на основе отображения «сырого» балла на шкалу, характеризующую свойство. Эта модель — модель латентного континуума — является наиболее распространенной при тестировании психических свойств.
Индикаторы свойства также могут быть однородными и разнородными. В последнем случае они шкалируются или не шкалируются. Если индикаторы однородны, то они выявляют свойство или уровень его интенсивности с равной вероятностью. Если индикаторы разнородны, то они выявляют свойство или уровень его интенсивности с разной вероятностью. На множестве индикаторов может быть введена некоторая мера — «сила» признака: чем сильнее признак, тем с большей вероятностью он выявляет свойство или определенный уровень его интенсивности. В этом случае для описания теста мы получаем так называемую модель Раша.
Классическая теория теста лежит в основе современной дифференциальной психометрики. Описание оснований этой теории содержится во многих учебниках, пособиях, практических руководствах, научных монографиях.
Конструирование тестов для изменения психологических свойств и состояний основано на шкале интервалов. Измеряемое психическое свойство считается линейным и одномерным. Предполагается также, что распределение совокупности людей, обладающих данным свойством, описывается кривой нормального распределения.
В основе тестирования лежит классическая теория погрешности измерений; она полностью заимствована из физики. Считается, что тест — такой же измерительный прибор, как вольтметр, термометр или барометр, и результаты, которые он показывает, зависят от величины свойства у испытуемого, а также от самой процедуры измерения («качества» прибора, действий экспериментатора, внешних помех и т.д.). Любое свойство личности имеет «истинный» показатель, а показания по тесту отклоняются от истинного на величину случайной погрешности. На показания теста влияет и «систематическая» погрешность, но она сводится к прибавлению (вычитанию) константы к «истинной» величине параметра, что для интервальной шкалы значения не имеет.
Если тест проводить много раз, то среднее будет характеристикой «истинной» величины параметра. Отсюда выводится понятие ретестовой надежности: чем теснее коррелируют результаты начального и повторного проведения теста, тем он надежнее. Стандартная погрешность измерения:
Предполагается, что существует множество заданий, которые могут репрезентировать измеряемое свойство. Тест есть лишь выборка заданий из их генеральной совокупности. В идеале можно создать сколько угодно эквивалентных форм теста. Отсюда — определение надежности теста методами параллельных форм и расщепление его на эквивалентные равные части.
Задания теста должны измерять «истинное» значение свойства. Все задания одинаково скоррелированы друг с другом. Корреляция задания с истинным показателем:
Поскольку в реальном монометрическом тесте число заданий ограничено (не более 100), то оценка надежности теста всегда приблизительна.
Так, определяемая надежность теста связана с однородностью, которая выражается в корреляциях между заданиями. Надежность возрастает с увеличением одномерности теста и числа его заданий, причем довольно быстро. Стандартная надежность 0,02 соответствует тесту длиной в 10 заданий, а при 30 заданиях она равна 0,007.
Оценка стандартной надежности:
Для оценок надежности используется ряд показателей. Наиболее известна формула Кронбаха:
Для определения надежности методом расщепления используется формула Спирмена—Брауна.
В принципе классическая теория теста касается лишь проблемы надежности. Вся она базируется на том, что результаты выполнения разных заданий можно суммировать с учетом весовых коэффициентов.
Так получается «сырой» балл
Y=aaxi+c,
где xi — результат выполнения i-го задания, а — весовой коэффициент ответа, с — произвольная константа.
По поводу того, откуда возникают «ответы», в классической теории не говорится ни слова.
Несмотря на то, что проблеме валидности в классической теории теста уделяется много внимания, теоретически она никак не решается. Приоритет отдан надежности, что и выражено в правиле: валидность теста не может быть больше его надежности.
Валидность означает пригодность теста измерять то свойство, для измерения которого он предназначен. Следовательно, чем больше на результат выполнения теста или отдельного задания влияет измеряемое свойство и чем меньше — другие переменные (в том числе внешние), тем тест валидней и, добавим, надежнее, поскольку влияние помех на деятельность испытуемого, измеряемую валидным тестом, минимально.
Но это противоречит классической теории теста, которая основана не на дея-тельностном подходе к измерению психических свойств, а на бихевиористской парадигме: стимул—ответ. Если же рассматривать тестирование как активное порождение испытуемым ответов на задания, то надежность теста будет функцией, производной от валидности.
Тест валиден (и надежен), если на его результаты влияет лишь измеряемое свойство.
Тест невалиден (и ненадежен), если результаты тестирования определяются влиянием нерелевантных переменных.