Читать книгу Методология психотехники. Предвосхищение. Эволюция. Труд. Избранные психологические труды. Том 1 - Соломон Геллерштейн - Страница 46

II. Проблемы тестирования[12]
Метод тестов и его теоретические предпосылки[13]

Оглавление

Метод тестов нельзя рассматривать как последнюю новинку психологической науки. Впервые примененный Кеттеллом в 1890 г., этот метод получил в дальнейшем самое широкое распространение в различных областях прикладной психофизиологии: педагогической, промышленной, медицинской и др. Литература по вопросам, связанным с применением тестов в педагогике и психологии, неисчерпаема. Однако и сейчас еще этот метод способен возбуждать ряд сомнений, и в части теоретической наука о тестах является еще далеко не разработанной областью. Этим объясняется, по-видимому, тот факт, что и у нас за последнее время вокруг проблемы тестовых испытаний ведутся все более и более оживленные споры. В спорах этих, как всегда, выявляются самые крайние точки зрения. Одни оспаривают какое бы то было научное значение тестов, другие, чрезмерно увлеченные тестовыми испытаниями, склонны преувеличивать их действительную роль. По-видимому, аналогичное явление имеет место и за рубежом. С полным правом мы можем привести здесь слова В. Штерна, сказанные по поводу состояния психологической методики испытания одаренности: «В преувеличенных надеждах и преждевременных требованиях нет недостатка так же, как и в бессмысленных нападках и бесплодной критике»[14].

Такое положение вещей обусловлено, очевидно, помимо прочего, отсутствием строго разработанной теории тестов. Тестологическая наука еще не вышла из фазы накопления материалов и самых робких попыток его теоретического освещения. Вдумчивое изучение немногих работ, посвященных принципиальному обоснованию тестовой методики, показывает, что на пути создания теории тестологии встречается еще немало непреодоленных препятствий. Источник их коренится, с одной стороны, в недостаточности наших знаний касательно генезиса, структуры и законов изменчивости тех признаков, которые испытываются с помощью тестов, с другой стороны, в трудности нахождения таких измерительных единиц для оценки явлений психологического порядка, которые обладали бы всеми свойствами математически сравниваемых величин. Пытаясь придать тестам характер не только симптоматических заданий, но и определенного мерила, мы не должны забывать, что мы сталкиваемся с крайне важным в принципиальном отношении вопросом об измерении в психологии вообще. Проблема тестов и составляет часть этой более общей проблемы. В этом, пожалуй, и заключается все значение и весь смысл тестовой методики, ибо нетрудно представить себе какой мощный толчок получила бы в своем развитии психологическая наука, если бы ей удалось объективно и точно взвешивать и оценивать явления, относящиеся к области человеческого поведения.

В сущности, применение тестов возникло из вполне понятной потребности внесения количественных и объективных критериев в область психологии вообще и в психофизиологическую диагностику в первую очередь. Тестовая методика явилась естественной реакцией на несовершенство обычных полуинтуитивных диагностических приемов, еще и сейчас достаточно широко применяемых в педагогике, психиатрии и др. Было бы, однако, заблуждением думать, что тестам суждено вытеснить все остальные методы. Одной из задач тестологии как раз и является установление границ метода тестов и его связи с другими методами.

Уже и сказанного достаточно, чтобы уяснить всю важность всякой сколько-нибудь серьезной попытки освещения проблемы тестов с теоретической и методологической стороны. В настоящей статье, ни в коей мере не рассчитывая охватить всю проблему тестов во всей ее глубине, мы пытаемся в самых общих чертах представить проблему тестов в свете теории и если не дать, то, по крайней мере, наметить посильные ответы на основные вопросы.

С самого начала следует внести ясность в понятие «тест». Нам представляется наиболее полным следующее определение теста. Тест – это испытательный эксперимент, носящий характер определенного задания, которое стимулирует определенную форму активности и выполнение которого, поддаваясь количественной и качественной оценке, служит симптомом совершенства определенных функций.

Это, вместе с тем, и наиболее широкое определение теста. В зависимости от целей применения теста определяется характер тестового задания и его направленность на оценку развития тех или иных признаков. Признаки, испытываемые тестами, выявляются в форме определенных действий, служащих симптоматическим выражением некоторых скрывающихся за ними процессов.

Как уже было упомянуто, тест является прежде всего методом диагностическим. Его применение теснейшим образом связано со стремлением дать количественное выражение индивидуальным различиям между людьми по целому ряду признаков. Этим стремлением в известной мере обусловлена преимущественная направленность теста на такие признаки, изучение интер- и интравариативности которых имеет вполне ясный практический смысл.

Было бы ошибкой, однако, думать, что назначение теста – исключительно в постановке диагноза. Правда, большая часть тестов, применяемых в прикладной психологии, преследует чисто диагностические цели (и, конечно, прогностические). Но нет ничего принципиально невозможного в использовании тестов и для иных целей. Как на свидетельство несколько своеобразного применения тестов можно указать на факт их использования рядом исследователей для целей упражнения функций и их усовершенствования путем тренировки. Много примеров тому можно найти в трудовой педагогике (отчасти уже и в обычной школьной практике), в психотерапии и в промышленной психологии. Возможность подобного применения тестов вытекает непосредственно из данного выше определения теста, в котором подчеркивается стимулирующая роль теста. Систематическое и определенным образом дозированное повторение определенного рабочего стимула, активирующего определенные формы деятельности, не может не повлечь за собой совершенствования испытываемых в данном тесте функций.

Отметим некоторые существенные черты, присущие тесту вообще. Тот факт, что с помощью теста пытаются испытать степень совершенства определенного признака или системы признаков, влечет за собой необходимость придания тесту характера некоторого экспериментального задания. Отсюда становится понятным, что все плюсы и минусы (а плюсов, нам представляется, гораздо больше, чем минусов) экспериментального метода вообще переносятся и на метод тестов. Тест, с этой стороны, есть один из видов психологического эксперимента. Тест как экспериментальное задание, носящее обычно характер инструкции или вопроса, выполняется разными людьми с далеко не одинаковой успешностью. В этом и заключается дифференциально-психологический смысл этого метода. Испытываемые тестом признаки обнаруживают определенный характер вариативности у разных групп людей, в пределах одной и той же группы и у каждого индивидуума на различных ступенях его развития и в связи с различными внешними и внутренними условиями. Если эта вскрываемая тестами вариативность может быть уложена в рамки некоторых закономерностей, если она обнаруживает определенные тенденции, то этого достаточно, чтобы признать в тесте мощное оружие в деле разрешения самых различных практических задач, связанных с психологией индивидуальных различий.

Не случайно вся почти прикладная психология строится на учении о вариативности, составляющем, как известно, одну из важнейших глав дифференциальной психологии. Вот почему понять смысл и психологическую значимость метода тестов можно лишь при условии рассмотрения его как метода дифференциальной психологии. Если бы тест ограничивался лишь констатированием и количественной регистрацией интер- и интравариативности в результатах выполнения определенных заданий, то значение этого метода было бы невелико. Всякий результат представляет для нас интерес постольку, поскольку он в каком-нибудь отношении симптоматичен. Поэтому ясность в понимании всего значения метода тестов будет нами достигнута лишь тогда, когда мы попытаемся поставить вопрос о тестах в близкую связь с учением о симптомах. Учение это еще недостаточно разработано, но обойти его не может ни одно сколько-нибудь серьезное исследование, посвященное проблеме измерения в психологии.

С попыткой применить в области психических явлений количественный масштаб мы сталкиваемся уже в психофизике, в работах Вебера и др. Однако методы психофизики не сразу были использованы в качестве тестов. Первоначально они носили характер исследовательских экспериментов, направленных на установление определенных закономерностей в области психофизических явлений.

Такой же чисто исследовательский, а не испытательный характер носили первые опыты с измерением скорости реакций. Лишь начиная с того момента, когда изучаемые теоретической психологией процессы стали рассматриваться со стороны их реальной жизненной значимости, когда в них стали усматривать источники или, во всяком случае, одно из важнейших условий полноценности трудовых возможностей человека, – с этого момента и наметился в психологии поворот от чисто исследовательского эксперимента к испытательному. Этот поворот оказался чрезвычайно плодотворным и для теоретической психологии. Психологический эксперимент, найдя себе приложение в разрешении жизненно важных задач, очистился от окутывавшей его оболочки сугубо абстрактной теоретичности, и перед нами открылась совершенно еще не разработанная область изучения конкретной действительности во всей ее сложности и запутанности. Сильнейшим толчком в деле ускорения этого оздоровительного для психологии процесса явились все более и более настойчивые требования и запросы повседневной жизни, выдвинувшей на очередь проблемы профессионального подбора, изучения утомления, рационализации труда, усовершенствования методов обучения и т. д.

Означенный поворот ознаменовался не только переключением в достаточной мере разработанных в экспериментальной психологии психофизических и психохронометрических методов на новые цели, но и широким развитием методов психодинамики.

Наиболее характерной чертой метода тестов и является их направленность на результат деятельности, определенным образом стимулируемой и обнаруживающей качественно и количественно различный эффект в зависимости от силы диспозиций (интеллектуальных, моторных и т. д.). По этому пути в последнее время развиваются такие своеобразные модификации тестов, каковыми являются модель-тесты, имитирующие жизненные ситуации, комплексные тесты, испытывающие сложные сочетания отдельных функций, тесты на так называемый практический интеллект и т. п.

В этой особенности тестовой методики заключены большие ее достоинства, но в ней же таится источник ее несовершенства. Нередко со стороны критиков метода тестов можно слышать указания на поверхностность тех суждений и диагнозов, которые опираются на изучение результата, а не процесса. И действительно, сама по себе производительность при выполнении некоторого задания может лишь весьма условно служить критерием для постановки диагноза, а тем более прогноза. Нужно, чтобы производительность что-то отражала, чтобы результат был в каком-нибудь отношении характерен, чтобы на основании результата можно было делать более общие заключения о функциональных возможностях испытуемого. Короче говоря, нужно, чтобы деятельность, активируемая тестом, была симптоматична. Теперь становится понятным, почему мы с самого же начала выдвинули то положение, что все здание тестологической науки покоится на фундаменте учения о симптомах.

Вряд ли кто-нибудь станет сомневаться в том, что метод тестов – это один из методов косвенного познавания психофизических свойств человека. Это обстоятельство хотя и ограничивает, но ни в коей мере не умаляет ни теоретического, ни практического значения тестовой методики. Оно подчеркивает лишний раз необходимость углубленной работы по линии отыскания точных критериев для оценки истинной симптоматичности предлагаемых разными авторами тестов. Чтобы пути, по которым надлежит вести эту работу, стали более ясными, необходимо несколько остановиться на содержании учения о симптомах.

Тот или другой поддающийся объективной регистрации признак, относящийся к структуре человеческого организма или к формам человеческого поведения, будет ли это особенность человеческой походки, нажим или наклон почерка, выражение лица или результат выполнения определенного задания, может быть назван симптомом, если он отражает закономерным образом состояние определенной функции или системы функций организма. Внешний признак может быть симптомом для внутреннего, скрытого (но вполне реального и объективного) процесса, если всякие изменения, происходящие в глубине этого скрытого процесса, тотчас же находят свое определенное отражение вовне. Знанием симптомов какого-нибудь явления или процесса пользуются в тех случаях, когда трудно бывает непосредственным путем вскрыть природу этого процесса. Путь симптоматический – всегда косвенный путь, и к нему вынуждены прибегать исследователи даже в самых точных областях знания.

То, что является результатом тестового испытания, представляет собой – вернее, должно представлять собой – также некоторый симптом. Можно говорить о симптомах тех или других форм одаренности, о симптомах утомляемости и т. д. Тут же следует сделать оговорку: каждый симптом, испытываемый тестом, может обладать большей или меньшей константностью, он может быть более или менее устойчивым, и его значимость может простираться на определенные группы людей определенного возраста, социального положения и т. д. Изучение вариабельности симптомов, вскрываемых тестами, их изменчивости и всех условий, от которых эта изменчивость зависит, – одна из важнейших задач тестологической науки.

В специальном разделе дифференциальной психологии В. Штерн[15] делает попытку развить основные положения симптоматологии как учения, лежащего в основе всех видов «экстроспективного» метода в психологии, в том числе и метода тестов. Штерн неоднократно подчеркивает, что далеко не всякий признак можно рассматривать как определенный симптом. Больше того: один и тот же внешний признак часто может служить отражением самых различных внутренних процессов, точно так же, как одна и та же функция могут у разных людей и у одного человека в разное время выявляться в различных внешних симптомах. Это обстоятельство создает большие, но отнюдь не непреодолимые трудности в деле научного обоснования тестовой методики.

Все признаки, поддающиеся объективному изучению и рассматриваемые как симптомы определенных скрытых от исследователя процессов, могут быть восприняты либо в виде кратковременных и мгновенных проявлений, либо в виде длительных проявлений, носящих хронический характер.

Симптоматичность тех и других признаков по своему характеру неодинакова; кратковременные признаки служат показателем некоторых психических состояний, переживаемых индивидуумом преимущественно в те моменты, когда данные симптомы налицо; длительные признаки отражают заложенные в индивидууме предрасположения, характеризующие наиболее глубокие тенденции личности как в отношении направленности, так и в отношении потенциальной вооруженности. Соответственно указанному разделению можно различать симптоматику переживаний и симптоматику предрасположений. Первая служит обычным орудием в общепсихологических исследованиях, вторая – в исследованиях дифференциальной психологии.

Связь между учением о симптомах и тестологией становится теперь совершенно ясной. Постараемся проиллюстрировать ее на нескольких примерах. Спросим себя: какого рода симптомы вскрываются тестами, испытывающими одаренность? Характерной особенностью этих тестов является, как известно, их направленность на выявление динамических свойств личности. Результат тестового испытания расценивается здесь не как таковой, а с точки зрения лежащих за ним предпосылок и скрывающихся за ним возможностей. Решение, которое дает испытуемый, служит отправным пунктом для построения вектора, идущего от результата вниз – к задатку, и направленного от него вверх – к пределу. Иначе говоря, ответ испытуемого рассматривается как точка на некоторой кривой. Отсюда и вытекает основное принципиальное и методологическое требование – измерять признаки, симптоматичность которых имеет определенную временную протяженность, т. е. они должны выявлять не только данности, но и тенденции. Это предпосылка их прогностической ценности.

Спросим себя дальше: существуют ли тесты, симптоматичность которых носит иной характер? На этот вопрос не трудно будет ответить, если вспомнить область применения тестов для целей испытания утомляемости. Как известно, эти тесты должны отразить колебания таких переменчивых состояний человека, как работоспособность, продуктивность и т. д. Испытываемые этими тестами признаки должны обладать по возможности незначительной интервариативностью, но быть вместе с тем чрезвычайно лабильными в отношении ряда факторов, обусловливающих интравариативную изменчивость. Ясно, что такого рода тесты обладают не той симптоматичностью, о которой шла речь, когда мы касались тестов одаренности.

Приведенные два примера, разумеется, не исчерпывают ни всего многообразия тестовых испытаний, ни всех специфических различий в вскрываемых тестами симптомах. Однако они достаточны для того, чтобы сделать из них и некоторые методологические и практические выводы, долженствующие иметь особенно большое значение при конструировании тестов и при оценке результатов их применения. Именно в этих областях работы с тестами и наблюдаются чаще всего ошибки.

Трудности, с которыми мы сталкиваемся в работе по конструированию тестов, предназначаемых для определенных практических целей, связаны главным образом с вопросом об устойчивости измеряемого тестом признака. Чем изменчивее эти признаки, чем большее количество факторов влияет на эту изменчивость, тем труднее уловить закономерную тенденцию в испытываемых тестом признаках. Прогноз оказывается тем более надежным, чем устойчивее эти признаки. И тем не менее большая интравариативность признака еще не служит основанием к тому, чтобы признать его несимптоматичным. Важно лишь учесть характер его симптоматичности. Признак, который является чутким реагентом на изменения в состоянии человеческого организма, может быть использован как симптом в тех случаях, когда практически необходимо почему-либо оценить степень лабильности определенных функций. Если эта лабильность связана закономерным образом с таким фактором, как утомление, то с помощью соответствующих тестов оказывается возможным улавливать вызываемые утомлением колебания и понижения работоспособности. Таковы тесты, испытывающие функции внимания, отчасти память, ряд моторных функций, функции сенсорного аппарата и пр. Эти тесты, наоборот, оказываются обычно малопригодными для испытания одаренности, ибо одной из предпосылок последних является, возможно, большая стабильность соответствующих функций.

Весьма часто, впрочем, один и тот же тест может быть применен для разных целей: например, для испытания степени совершенства профессионально важного признака в испытаниях профессиональной пригодности и для испытания профессионального утомления. В таких случаях меняется, в зависимости от целей испытания, сама постановка опытов, их продолжительность и, что особенно важно, характер выбираемых для оценки теста индикаторов. В качестве примера можно привести тест с испытанием скорости двигательных реакций на зрительные и слуховые раздражители. Как симптом профессиональной пригодности тест с испытанием реакций расценивается обычно либо со стороны средней продолжительности реакции, либо со стороны изменения среднего времени в связи с меняющимся характером раздражителей (например, в связи с приданием определенному раздражителю эмоциональной окраски, изменением темпа подачи раздражителей, включением редкого раздражителя и т. д.). Когда этот же тест применяется для испытания устойчивости или колеблемости реактивных функций под влиянием утомления, оказывается более удобным в качестве индикатора брать не среднее время, а коэффициент вариативности двигательной реакции на протяжении более длительного опыта. Так или иначе, стабильность или лабильность признака может служить одним из критериев для применения испытывающего этот признак теста то для одних, то для других практических целей.

Вряд ли следует входить более глубоко в область симптоматологии, чтобы понять, что основная и важнейшая задача теории тестового метода заключается в отыскании точных критериев для оценки симптоматичности различных тестов. В этом направлении возможно идти несколькими путями. В исследованиях, посвященных методологии тестов, достаточно четко обозначились два пути: 1) функционального анализа и 2) статистической проверки.

Исследователи, идущие по первому пути, пытаются проникнуть в психологическую природу и механизмы активируемой тестом формы деятельности. Путь этот чрезвычайно труден.

Статистический подход в обосновании симптоматичности тестов выражается в направленности исследователя на добывание и изучение результатов широкого, массового применения тестов на самом разнородном материале с последующей дифференцированной разработкой этого материала по признакам возрастным, социальным, половым и т. д. Такое широкое статистическое применение тестов в целях их обоснования, уточнения и стандартизации нашло свое наиболее яркое отражение в работах американских авторов. Взаимоотношения между функционально-аналитическим и вариационно-статистическим направлениями еще не вырисовались с достаточной отчетливостью, но уже и сейчас есть много оснований к тому, чтоб усматривать в этих двух направлениях не антагонистические, а друг друга взаимно дополняющие и оплодотворяющие подходы к одному и тому же вопросу. Каждый из двух подходов чреват своими особыми трудностями: путь функционального анализа упирается в проблемы классификации психологических понятий, взаимоотношения психологии и физиологии, структуры психических процессов и внутренней корреляции между отдельными психофизиологическими функциями. Путь статистический требует четкости в выборе количественных критериев, математического и психологического обоснования их соизмеримости, умения находить специфические для каждого признака количественные индексы, постоянного учета вероятных ошибок и исчисления и главное – знания тех границ, в пределах которых статистические величины еще сохраняют свою психологическую значимость. Повторяем, оба названных пути друг друга нисколько не исключают, и работа в обоих направлениях должна быть теснейшим образом связана, чтобы результаты оказались по-настоящему плодотворным.

В настоящей статье трудно охватить, а тем более оценить современное состояние тестологической теории в том виде, в каком она оформилась в настоящее время. Как исследовательская, так и практическая работа с применением тестов ведется весьма интенсивно. Развертывающаяся под напором практических запросов педагогических, промышленных и военных учреждений, тестологическая работа приняла самые разнообразные формы. Метод тестов в связи с этим не только количественно разросся, но и качественно модифицировался. Заключительную часть этой статьи мы посвятили попытке представить все многообразие тестовых методов в несколько упорядоченном виде, не претендуя при этом на их окончательную и исчерпывающую классификацию. Подобная задача должна быть предметом специальной работы. Основное разделение тестовой методики намечается по линии ее целевой направленности. Большая часть тестов применяется для целей диагностических. При этом в психофизиологических тестах, направленных на выявление стойких тенденций личности, исследователи пытаются использовать диагноз как основу для прогноза. В этом существенное отличие этих тестов от так называемых школьных тестов, которые дальше измерения приобретенных знаний и навыков не идут. То обстоятельство, что и тесты одаренности неизбежно захватывают знания и навыки, не может служить достаточным основанием к тому, чтобы не усматривать принципиального отличия их от школьных тестов.

Наряду с психофизиологическими тестами, выявляющими одаренность в ее разнообразных формах, существуют тесты, используемые для испытания утомляемости. Отличие между обеими этими группами тестов было отмечено выше. Наконец, к числу психофизиологических тестов следует приобщить еще тесты, применяющиеся для целей тренировки. Эта группа тестов часто ничем по существу не отличается от тестов одаренности и вводится в процессы производственного или обычного школьного обучения в качестве систематических и определенным образом дозированных заданий для тренировки. В области восстановительного упражнения и в области психотерапии тренировочные тесты находят себе все большее и большее применение. Что касается тестов на утомление, то исторические их корни следует искать в работах Крепелина и его школы, Бинэ и Анри, Моссо и других исследователей, посвятивших много работ вопросам психофизиологии труда вообще и труда школьников в частности.

В отношении испытываемых тестами функций удобнее всего подразделять тесты соответственно общепринятому в психофизиологии расчленению психофизической организации человека на 3 группы:

1) тесты, испытывающие функции воспринимающего аппарата (зрительного, слухового, тактильного, кинэстетического);

2) тесты, испытывающие функции перерабатывающего аппарата (интеллект – теоретический и практический);

3) тесты, испытывающие функции реактивно-моторного аппарата.

В особую группу следовало бы выделить тесты моторной одаренности, тесты на социальную установку и тесты, испытывающие черты характера и темперамента, эмоциональные свойства и т. д.

По характеру деятельности, активируемой тестом, можно разделять тесты на словесные (вербальные) и немые. Немые тесты находят себе в последнее время все большее и большее применение в тех исследованиях, где желательно выявить степень и характер развития интеллекта вне зависимости его от запаса слов, вербального мышления и т. д.

По сложности испытываемых тестами функций возможно подразделение их на комплексные (синтетические) и аналитические. Синтетические тесты находят себе большое применение в испытаниях профессиональной пригодности, причем они, в свою очередь, имеют ряд специфических модификаций. Таковы модель-тесты, сложные установки с одновременными испытаниями функций сенсорно-моторного аппарата и интеллекта.

По способу оценки результатов тестового испытания тесты разделяются на характеризующие (иначе – качественные) и измеряющие (количественные). Примером характеризующих тестов является тест с описанием картины, отчасти тест с тремя словами и ряд других, направленных на оценку индивидуальных различий не по степени развития определенного признака, а по характеру его развития. Это и отличает их от измеряющих тестов. В то время как эти последние стремятся дать степень развития признака, характеризующие тесты пытаются отыскать типическое его выражение. Не исключается этим необходимость и возможность определять тип развития также с помощью количественных данных. Характеризующие, или качественные, тесты имеют значение преимущественно там, где с помощью теста надлежит оценить спонтанную деятельность испытуемого. Измеряющие тесты чаще всего стимулируют и выявляют реактивные функции. Они могут быть градуальными и альтернативными. Впрочем, многие тесты носят характер смешанный: каждая входящая в тест отдельная задача, оценивается альтернативно, вся совокупность решений дает возможность градуировать испытуемых по числу решенных заданий. Чисто альтернативных тестов очень мало. К их числу относится, например, тест на цветовую слепоту. Вся область вопросов, связанных со статистической обработкой тестового материала и с выборами соответствующих математических критериев (коэффициентов, формул, кривых), составляет настолько важную главу тестологии, что ей следует посвятить особую статью.

14

Штерн В. Одаренность детей и подростков. М.: Книгоспилка, 1926. С. 65.

15

Stern W. Die differentielle Psychologie in ihren methodischen Grundlagen. Leipzig, 1911. – Рус. пер.: Штерн В. Дифференциальная психология и ее методические основы. Пер. с нем. М.: Наука, 1998.

Методология психотехники. Предвосхищение. Эволюция. Труд. Избранные психологические труды. Том 1

Подняться наверх