Вопросы конструирования экспериментальных групп (дизайн выборки).
Выбор объекта исследования — следующая задача, которую предстоит решать психологу после определения зависимой и независимой переменных.
В прикладных исследованиях свобода психолога ограничена уже тем, что объект известен с самого начала.
В других случаях психолог волен выбирать тот объект, который больше соответствует задачам исследования. Лаборатория нейрофизиологии Института психологии РАН под руководством Ю. И. Александрова выявляет нейронные механизмы регуляции поведения. Центральная проблема — как новая мотивация организует систему регуляции поведенческого акта? Удобная модель формирования новой мотивации прослеживается при возникновении зависимости от алкоголя. На людях такие опыты, естественно, ставить неэтично, небезопасно, а у желающих принять участие в эксперименте такая зависимость, как правило, уже имеется. В качестве объекта выбираются кролики, у которых легко выработать эту зависимость; их можно оперировать, вживляя электроды в головной мозг, и, наконец, обучить той или иной форме поведения. Для того чтобы выяснить, как субъективная уверенность влияет на успешность принятия решения при обнаружении сигнала, нет необходимости прибегать к особым ухищрениям, но для работы в психологическом эксперименте (длительном, требующем произвольного внимания и ответственного отношения к делу) лучше привлекать людей интеллигентных и социально зрелых, поэтому часто в роли испытуемых выступают друзья исследователя, аспиранты и дипломники.Идеальным объектом психологического исследования может выступать либо отдельный индивид, либо группа. В первом случае мы говорим об общепсихологическом эксперименте, во втором — о социально-психологическом. Но в конкретном эксперименте не только реальный объект должен соответствовать по своим характеристикам идеальному объекту, но и результаты, полученные при его участии, должны применяться к другим объектам.
Если бы все люди (или животные) были похожи друг на друга, а еще лучше — оказались совершенно одинаковыми, то не возникло бы никаких проблем. Эксперимент можно провести с участием одного испытуемого, а полученные результаты применить для объяснения поведения всех других людей. Но люди различаются по полу, возрасту, расе, национальности, принадлежности к той или иной культуре или религии, социальному и экономическому положению и т.д. Следовательно, простая генерализация (обобщение) данных, полученных при исследовании одного испытуемого, невозможна. Однако на практике, например в лабораторных экспериментах по исследованию сенсорных процессов, памяти, внимания и т.д., этими различиями пренебрегают, считая, что наш испытуемый может представлять любого индивида из Homo sapiens. В более занятных случаях голубь или крыса может выступить в качестве модели любого человека, например в экспериментах по оперантному научению. Но это иная проблема. Здесь же заметим, что эксперимент может быть проведен с одним испытуемым (single-experiment) или с группой. В социальной психологии это будет одна группа и множество групп — «группа групп».Эксперимент с одним испытуемым проводится тогда, когда:
1) индивидуальными различиями можно пренебречь, исследование чрезвычайно велико по объему и включает множество экспериментальных проб;
2) испытуемый — уникальный объект, например гениальный музыкант или творчески одаренный шахматист;
3) от испытуемого требуется особая компетентность при проведении исследования (эксперимент с обученными испытуемыми);
4) повторение данного эксперимента с участием других испытуемых невозможно.
Для экспериментов с одним испытуемым разработаны особые экспериментальные планы. Чаще исследование проводится с экспериментальной группой, в которой все испытуемые объективно различны, но отобраны и распределены по подгруппам с помощью той или иной стратегии.
Различают четыре основных вида «дизайна» — конструирования экспериментальных групп.
При первом варианте исследование проводится с двумя различными группами: экспериментальной и контрольной, которые ставятся в разные условия.
Это наиболее распространенный способ.Второй вариант предполагает исследование одной группы: ее поведение изучается и в экспериментальных и в контрольных условиях. Он применяется, когда имеется только экспериментальная группа и нет возможности сформировать контрольную. Но этот план никак не контролирует «эффект последовательности» и используется лишь в тех редких случаях, когда эффектом последовательности можно пренебречь.
Третий вариант — конструирование групп методом «парного дизайна» — состоит в следующем. Для каждого субъекта группы подбирается эквивалентный ему (или похожий на него), и они распределяются по разным группам. Соответственно контрольная и экспериментальная группы становятся похожими по составу испытуемых. Конечно, в этом случае невозможно соблюсти полную эквивалентность групп в обоих условиях эксперимента, но данный способ значительно лучше, чем эксперимент с участием одной группы в разных условиях.
Наконец, четвертый план является смешанным: все группы ставятся в разные условия. При этом образуется несколько групп. Способ применяется при факторном планировании эксперимента.
Итак, формирование выборки испытуемых — экспериментальной группы — должно подчиняться ряду правил.
1. Содержательный критерий (критерий операциональной валидности). Напомним, что операциональная валидность определяется соответствием экспериментального метода проверяемой гипотезе. Подбор экспериментальной группы должен определяться предметом и гипотезой исследования. Бессмысленно проверять степень развития произвольного запоминания у годовалых и двухлетних детей или выяснять, в какой мере уровень интеллекта группы московских бомжей влияет на выбор того или иного кандидата в Государственную думу (ибо они голосовать не имеют права).
Таким образом, экспериментатор должен создать модель идеального объекта экспериментального исследования для своего частного случая и по возможности его описать, следуя этому описанию при формировании экспериментальной группы.
Характеристики реальной экспериментальной группы должны минимально отклоняться от характеристик идеальной экспериментальной группы.2. Критерий эквивалентности испытуемых (критерий внутренней валидности). Результаты, полученные при исследовании экспериментальной выборки, должны распространяться на каждого ее члена. То есть мы должны учесть все значимые характеристики объекта исследования, различия в выраженности которых могут существенно повлиять на зависимую переменную. Допустим, необходимо проверить влияние ситуативной тревожности детей на скорость овладения школьными навыками. В этом случае состав экспериментальной группы должен быть подобран так, чтобы в нее входили дети с одинаковым уровнем развития интеллекта. Если же это не удается сделать, то при обработке данных используется нормировка результатов на величину значимого параметра.
Процедура подбора эквивалентных групп и эквивалентных испытуемых называется рандомизацией.
3. Критерий репрезентативности (критерий внешней валидности). Существуют теоретические статистические критерии репрезентативности (представленности) выборки испытуемых. Группа лиц, участвующих в эксперименте, должна представлять всю часть популяции, по отношению к которой мы можем применять данные, полученные в эксперименте. Величина экспериментальной выборки определяется видом статистических мер и выбранной точностью (достоверностью) принятия или отвержения экспериментальной гипотезы. Она может быть равна множеству индивидов, чье поведение нас интересует. Экспериментальная выборка может представлять лишь часть интересующего нас множества. Главная проблема состоит в том, чтобы определить, на какие другие интересующие нас группы можно распространить результаты проводимого нами исследования.
Подбор экспериментальной группы осуществляется с помощью различных стратегий. Напоминаем, для чего нужна стратегия отбора групп. Задача сводится, во-первых, к устранению уже рассмотренного в предыдущих разделах «эффекта смешения». Под этим термином понимается влияние индивидуальных различий между испытуемыми на связь независимой и зависимой переменных.
Например, на публичное поощрение за хорошую работу люди разного темперамента реагируют неодинаково. Тем самым контролируется влияние побочной переменной на внутреннюю валидность. Во-вторых, экспериментальная группа должна представлять изучаемую популяцию, т.е. обеспечивать внешнюю валидность эксперимента.Использование реально существующих групп порождает систематическое смешение независимой переменной с индивидуальными свойствами испытуемых.
Для нас уже очевидно, что экспериментальная выборка представляет собой модель популяции в целом или той ее части, поведение которой нас интересует.
Наиболее простой вариант был уже рассмотрен — составление репрезентативной группы испытуемых, характеристики которой соответствуют характеристикам интересующей нас популяции. Иногда невозможно найти способ создания репрезентативной группы. Тогда используется метод приближенного моделирования. В частности, исследование может проводиться при участии студентов 2-го курса университета, а данные приписываются всем людям, или «людям в возрасте от 17 до 21 года», или «людям со средним образованием в возрасте от 17 до 21 года» и т. д. Чем меньше генерализация, т. е. чем точнее набор критериев, описывающих популяцию, на которую распространяются выводы о характеристиках экспериментальной выборки, тем выше внешняя валидность эксперимента.
При моделировании популяции методом случайного выбора, или рандомизации, экспериментальную выборку составляют так, что каждой личности предоставляется равный шанс для участия в эксперименте. Каждому индивиду присваивается номер; с помощью таблицы случайных чисел производится формирование экспериментальной выборки. Процедура очень трудноосуществима, поскольку каждый представитель интересующей нас популяции должен быть учтен. На практике прибегают к более простым способам случайного отбора. Отбирают любую группу испытуемых, затем измеряют у них значимое для эксперимента индивидуальное свойство. После этого испытуемых распределяют по группам методом Монте-Карло так, что вероятность попасть в группу для каждого испытуемого равна.
Наконец, существует еще один способ моделирования выборки — стратометрический. Генеральная совокупность рассматривается как совокупность групп, обладающих определенными характеристиками. В экспериментальную выборку отбираются испытуемые с соответствующими характеристиками — так, чтобы в ней были равно представлены лица из каждой страты. Чаще всего используются следующие характеристики: пол, возраст, политические предпочтения, образование и уровень доходов. Эту стратегию применяют психодиагносты при разработке тестов, педагогические психологи, в основном же ею пользуются социологи и социальные психологи при опросах общественного мнения, исследовании социальных установок и т.д.
Ряд авторов выделяет стратегию попарного отбора. При этом экспериментальная и контрольная группы составляются из индивидов, эквивалентных по значимым для эксперимента побочным параметрам. Идеальный вариант — использование близнецовых пар (моно- и дизиготных). Разновидностью этой стратегии является подбор однородных подгрупп, в которых испытуемые уравнены по всем характеристикам, кроме интересующих исследователя дополнительных переменных. Другой вариант — выделение значимой дополнительной переменной. Все испытуемые тестируются, ранжируются по уровню выраженности переменной. Группы формируются так, чтобы испытуемые, обладающие одинаковыми или близкими значениями переменной, попали в разные группы.
Итак, существует шесть стратегий построения групп:
1) рандомизация;
2) попарный отбор;
3) рандомизация с выделением страт (стратометрический отбор);
4) приближенное моделирование;
5) репрезентативное моделирование;
6) привлечение реальных групп.
Различают два основных типа привлечения испытуемых в группу:
а) отбор,
б) распределение.
Отбор проводят при рандомизации, рандомизации с выделением страт, при репрезентативном и приближенном моделировании. Распределение осуществляется при способе составления групп из эквивалентных пар и исследованиях с участием реальных групп.
Считается, что наилучшая внешняя и внутренняя валидность достигается при стратегии подбора эквивалентных пар и стратометрической рандомизации: индивидуальные особенности испытуемых с помощью этих стратегий контролируются максимально. В остальных же случаях нет никаких гарантий эквивалентности испытуемых, контролируемости индивидуальных различий и представительности группы.
Привлечение добровольцев или принудительное участие в эксперименте нарушает репрезентативность выборки. Отметим лишь, что стратегии попарного моделирования, приближенного моделирования и стратометрической рандомизации, в отличие от стратегии рандомизации («случайно отобранных групп»), предполагают, что нам известен дополнительный параметр — индивидуальная особенность, которая может оказать значимое влияние на результат эксперимента. Ошибка в выделении этого параметра и/или недоучет других параметров приводят экспериментатора к неудаче. Очевидно, что применение таких стратегий формирования групп должно опираться на серьезные знания в области дифференциальной психологии (психологии индивидуальных различий).
Мы уже знаем, что многие авторы, в частности Кэмпбелл, считали подбор эквивалентных пар менее надежным методом, чем рандомизация. Рандомизацию можно считать наиболее надежной стратегией и с точки зрения репрезентации в эксперименте изучаемой популяции, и с точки зрения контроля дополнительных переменных. Наиболее существенная проблема при рандомизации: в какой мере первичная выборка, из которой мы формируем экспериментальную и контрольные группы, действительно представляет генеральную совокупность? Решение этой проблемы — дело искусства и интуиции экспериментатора.
Отдельная проблема — численность экспериментальной выборки. В зависимости от целей и возможностей она может варьировать от одного испытуемого до нескольких тысяч человек. Количество испытуемых в отдельной группе (экспериментальной или контрольной) в большинстве экспериментальных исследований варьирует от 1 до 100. Рекомендуется, чтобы численность сравниваемых групп была не менее 30-35 человек из соображении статистических: коэффициенты корреляции выше 0,35 при таком количестве испытуемых значимы при а = 0,05.
Если же для обработки данных используется факторный анализ, то существует простое правило: надежные факторные решения можно получить лишь в том случае, когда количество испытуемых не менее чем в 3 раза превышает число регистрируемых параметров. Кроме того, как рекомендует Л. В. Куликов, целесообразно увеличивать количество испытуемых, по крайней мере, на 5-10 % больше требуемого, поскольку часть из них будет «отбракована» в ходе эксперимента или при анализе экспериментальных протоколов (не поняли инструкцию, не приняли задачу, дали «девиантные» результаты и т.д.).
Что касается состава по полу и возрасту, то рекомендуется (кроме специальных случаев) разбивать общую группу на подгруппы мужчин и женщин и обрабатывать данные отдельно для каждой подгруппы. Возрастной состав определяется исходя из целей исследования. Для ориентировки приведем наиболее распространенную периодизацию возрастов:
1. Новорожденный — 0-10 дней.
2. Грудной — 10 дней-1 год.
3. Раннее детство — 1-2 года.
4. Первый период детства — 3-7 лет.
5. Второй период детства — 8-12 лет (мальчики), 8-11 лет (девочки).
6. Подростковый — 13-16 лет (мальчики), 12-15 лет (девочки).
7. Юношеский— 17-21 год (мужчины), 16-20 лет (женщины).
8. Средний: первый период — 22-35 лет (мужчины), 21-35 лет (женщины); второй период — 36-60 лет (мужчины), 36-55 лет (женщины).
9. Пожилой возраст — 61-75 лет (мужчины), 55-75 лет (женщины).
10. Старческий возраст — 75-90 лет.
11. Долгожители — 90 лет и старше.