В чем заключается нормативно ориентированный подход к измерению результатов обучения
Нормативно-ориентированный подход.
В рамках первого, нормативно-ориентированного, подхода разрабатываются тесты для сравнения учеников по уровню учебных достижений. Сравнимость достигается путем сопоставления результата каждого учащегося с результатами других, выполнявших тот же самый тест. Сообразно двум подходам к интерпретации результатов тестирования выстраиваются два подхода к созданию педагогических тестов. Оба они перспективны и важны, имеют свою сферу применения, свои преимущества и недостатки.
В нормативно-ориентированном подходе при интерпретации результатов возникают определенные трудности, так как относительная позиция испытуемого может быть неточно или даже неправильно определена. Очевидно, что испытуемый будет выглядеть лучше на фоне более слабой, чем более сильной группы. Например, можно высоко оценить знания ученика, выполнившего правильно в тесте всего 30 заданий из 60 в том случае, если группа слабая и 70%, а то и 80% испытуемых группы сделали меньшее число заданий теста. Тот же самый результат ученика, но в другой, сильной группе будет отнесен к категории довольно низких, если только 10—20% испытуемых группы сделали правильно 30 заданий, а все остальные значительно превысили этот результат. В этой связи возникает вопрос об истинной оценке результата каждого учащегося, выполнившего тест.
Многолетние попытки получить ответ на этот вопрос привели к идее установления норм, т. е. системы показателей, отражающих результаты выполнения теста большой группой (выборкой) испытуемых [5]. Нормы нельзя придумать или задать априорно, они устанавливаются эмпирически. Например, для школьных итоговых тестов нормы выбирают сообразно тому, как выполняет тест представительная выборка учеников. К числу наиболее важных показателей обычно относят средний уровень выполнения и вариативность результатов выборки.
Процесс определения норм называется стандартизацией теста. Стандартизация осуществляется на представительной или, как говорят специалисты, репрезентативной выборке испытуемых, процесс формирования которой является обязательным моментом при определении норм теста. По окончании стандартизации у педагога появляется возможность сравнить тестовый балл каждого испытуемого с установленными нормами и таким образом оценить место результата каждого ученика в распределении баллов нормативной выборки по тесту. Подсчет показателей достаточно прост. При наличии определенных навыков и репрезентативной группы учеников определение норм либо их уточнение может быть осуществлено любым разработчиком или пользователем теста. (Примеры подсчета показателей будут рассмотрены дальше в гл. 5.)
В процессе сравнения индивидуальных баллов учеников с нормами выполнения теста первичный результат каждого испытуемого обычно переводится в некий относительный, производный показатель, позволяющий несколько расширить возможности интерпретации результатов выполнения теста.
Таким путем можно повысить сопоставимость баллов и сделать выводы о достижениях испытуемых по набору тестов, имеющих разные нормы их выполнения. Однако здесь легко допустить ошибку. Относительная позиция испытуемого в тестах по различным дисциплинам может быть неверно интерпретирована из-за несопоставимости тестовых норм, возникающей при стандартизации тестов на различных по подготовке выборках. Например, ошибочным будет результат сравнения оценок ученика по курсу химии и по математике, если один из этих тестов проходил стандартизацию на выборке московских школьников, а другой — на выборке школьников Краснодара либо на любой другой по подготовке выборке школьников той же Москвы.
Понятно, что разные выборки дают разные нормы, и потому при сравнении результатов ученика по разным тестам легко получить неправильный ответ. Таким образом, сопоставимость результатов испытуемого по различным тестам или групп испытуемых достигается далеко не всегда, а только в том случае, если для стандартизации тестов использовались сходные нормативные выборки, обеспечивающие сопоставимость норм различных тестов.
Стандартизация предполагает единообразие не только оценок, но и всей процедуры выполнения теста. Помимо норм разработчик должен дать точные указания относительно формы предъявления теста, оптимального времени его выполнения, устных инструкций и ряда других деталей, влияющих на результаты выполнения теста. Необходимо указать состав выборки стандартизации и ее особенности, смещающие представления о нормативных результатах в сторону завышения или занижения.
При этом следует иметь в виду, что тестовых норм, пригодных для интерпретации результатов всех учеников, не существует вообще. Область применимости любой нормы ограничивается конкретной совокупностью испытуемых, для которых она вырабатывалась. Поэтому нормы никоим образом не абсолютны и не постоянны. Они просто отражают результаты выполнения теста испытуемыми из выборки стандартизации на момент создания теста и подлежат систематическому обновлению и перепроверке.
При разработке и применении тестовых норм особое внимание обращается на выборку стандартизации. Для обеспечения стабильности значений норм выборка должна быть достаточно большой и представительной. Например, если хотят установить нормы выполнения теста по химии для школьников Москвы и Московской области, то нужно протестировать не менее 200-300 учащихся в каждой из нескольких школ, расположенных как в Москве, так и в области, а затем объединить в равных пропорциях все результаты. При этом другая выборка из учащихся этих же школ не должна приводить к нормам, заметно отличным от предыдущих. Некоторые различия норм, без сомнения, будут существовать, однако они не должны быть слишком велики. В противном случае объем выборки необходимо увеличивать и определять новые нормы до тех пор, пока не наступит их стабилизация.
С точки зрения интерпретации результатов каждого испытуемого нормы мало чего стоят, если они неустойчивы и определены с большой выборочной ошибкой. Поэтому процесс увеличения объема выборки и переопределения норм необходим, и только по его завершении есть основания считать, что разработчиком создан стандартизованный тест в рамках нормативно-ориентированного подхода. Процесс установления норм занимает довольно длительное время, иногда до нескольких лет. Особенно в тех случаях, когда содержание теста ориентировано на какие-либо специальные знания, степень владения которыми можно проверить одновременно у очень небольшой группы учеников.
Дата добавления: 2018-11-25 ; просмотров: 981 ; ЗАКАЗАТЬ НАПИСАНИЕ РАБОТЫ
В чем заключается нормативно ориентированный подход к измерению результатов обучения
Лекция 8. Педагогические тесты, их виды и предназначение.
1. Нормативно-ориентированный и критериально-ориентированный подходы в педагогических измерениях.
2. Задачи тестирования и виды тестов.
3. Классификация видов педагогических тестов.
4. Понятийный аппарат: предтестовое задание, тестовое задание, педагогический тест.
1. Нормативно-ориентированный и критериально-ориентированный подходы в педагогических измерениях
Общие подходы к интерпретации результатов педагогических измерений. При педагогических измерениях интерпретация баллов учащихся может иметь различный характер в зависимости от того, каким способом сравниваются оценки учеников. Согласно одному подходу проводится сопоставление баллов каждого учащегося с результатами определенной группы – выборки учащихся, выполнявших тот же самый тест, для определения места каждого балла по отношению к среднему результату в группе (нормативно-ориентированный подход). Согласно другому подходу результаты испытуемых интерпретируются по отношению к содержательной области, включенной в тест и снабженной определенными критериями выполнения (критериально-ориентированный подход).
Оба подхода дают информацию о подготовленности учащихся, однако она имеет различный характер. В соответствии с этими подходами к интерпретации результатов тестирования выделяют нормативно-ориентированные и критериально-ориентированные тесты.
Нормы – это совокупность показателей, отражающая результаты выполнения теста четко определенной выборкой испытуемых – релевантной нормативной группой, репрезентативно представляющей генеральную совокупность тестируемых учащихся [1; 22; 60]. К нормам обычно относят среднее значение тестовых баллов и показатель разброса (вариативности) вокруг среднего значения всех остальных баллов, полученных представительной выборкой тестируемых учащихся, (методы подсчета среднего значения и показателей вариативности, приведены в главе 9). Имея нормы можно установить положение каждого результата по отношению к среднему баллу по тесту, посмотреть, насколько результат учащегося выше или ниже среднего.
Процесс определения норм называется, стандартизацией теста. Стандартизация всегда осуществляется на репрезентативной выборке испытуемых, формирование которой – обязательный момент при определении норм теста.
К нормам предъявляют следующие требования:
— нормы должны быть дифференцированными. Например, тесты для общеобразовательных и профильных школ необходимо стандартизовать на различных выборках, в результате чего получатся, скорее всего, существенно различающиеся нормы;
— нормы должны отражать реальный контингент и актуальные требования к качеству учебных достижений, вытекающие из современной ситуации в образовании;
— нормы должны быть репрезентативными, поэтому они всегда устанавливаются эмпирически в соответствии с результатами тестирования выборки стандартизации (федеральной – для ЕГЭ, муниципальной – для аттестации школ, внутришкольной – для аттестации учащихся в школе).
«Норма» – относительное понятие, тесно связанное с качеством выборки, использованной для стандартизации. Выборка должна точно отражать категорию (или несколько категорий) лиц, для которых предназначен тест, а также быть достаточно большой и сбалансированной для обеспечения столь малой стандартной погрешности, чтобы ею можно было пренебречь в процессе стандартизации теста. Таким образом, при формировании выборки стандартизации необходимо учитывать две переменные – объем и представительность, обеспечивающие в совокупности высокую точность при оценивании норм выполнения теста.
Стратификация выборки. Для равномерного представления различных групп учащихся в популяции испытуемых используют специальный процесс – стратификацию. Стратификация – расслоение выборки на страты, размеры которых должны быть пропорциональны размерам соответствующих популяций в генеральной совокупности учащихся [38]. Обычно в качестве оснований для стратификации выделяют факторы, наиболее связанные с переменной измерения. В ЕГЭ к числу таких факторов можно отнести социальное положение родителей выпускника, регион, где расположена школа, ее принадлежность к числу сельских или городских школ и т.д.
— нормы выполнения теста, которые определяются на выборке стандартизации;
— объем выборки стандартизации, основания для ее стратификации и временной период ее использования;
— необработанные результаты выполнения теста для выборки стандартизации.
Сопоставление норм по различным тестам возможно лишь в том случае, если есть основания для утверждения об адекватности выборок стандартизации.
При критериально-ориентированном подходе по результатам тестирования можно:
— выявить освоенные и не освоенные знания, умения и навыки и построить индивидуальную образовательную траекторию каждого учащегося;
— ранжировать тестируемых по проценту выполнения и построить рейтинговые шкалы;
— разбить испытуемых на две группы с помощью одного критериального балла или на несколько групп с помощью нескольких критериальных баллов, поставив, например, школьные отметки – «два», «три», «четыре», «пять».
Недостатки критернально-ориентированного подхода. Критериально-ориентированный подход имеет недостатки, связанные с необходимостью полного охвата содержания, принимаемого за 100 %, в одном тесте. Аттестационные критериально-ориентированные тесты нередко получаются очень длинными – из 150 — 300 заданий, выполнить которые даже в старших классах при одноразовом предъявлении просто невозможно. Поэтому при аттестации нередко применяют адаптивное тестирование, позволяющее за счет оптимизации трудности заданий значительно сократить длину теста. Используют также сокращение содержания теста за счет минимизации целей оценивания. Для этого критериально-ориентированные тесты нередко применяют для проверки одного-двух умений или навыков, а при охвате более разнородного содержания выбирают нормативно-ориентированные тесты.
Критериально-ориентированные тесты имеют к тому же довольно ограниченную область применения. Они пригодны в тех случаях, когда можно четко определить знания, умения и навыки по конкретной области содержания и задать их верхний и нижний пределы для корректного определения критериев выполнения тестов. В более сложных и менее структурированных областях знаний, связанных с решением задач творческого уровня, определить верхний предел зачастую невозможно.
Иногда при выполнении таких заданий школьник руководствуется знаниями, но чаще все решают смекалка и догадка. Поэтому при создании тестов, предназначенных для контроля за выполнением задач творческого уровня, следует отдавать предпочтение нормативно-ориентированному подходу или стараться совмещать оба подхода в одном тесте [1].
Различия в нормативно-ориентированном и критериально-ориентированном подходах. Нормативно-ориентированные и критериально-ориентированные тесты различаются по целям создания, методике отбора содержания, характеру распределения эмпирических результатов, тестирования, методам их обработки, критериям качества тестов и тестовых заданий, а главное, по интерпретации результатов испытуемых, выполнивших тест.
Содержание критериально-ориентированного теста должно быть достаточно полно. В него включают все то, что условно можно принять за 100%-ный объем; планируемый к усвоению. Содержание нормативно-ориентированного теста фрагментарно, в него включают только те разделы, которых достаточно для дифференциации учащихся по уровню учебных достижений.
В критериально-ориентированных тестах, используемых для аттестации, задания достаточно простые, поскольку педагоги всегда стараются спланировать процент «двоек» и ограничить число неаттестованных учеников. Например, если «двойки» не должны превышать 10% и критерий отсева неуспевающих планируется установить на уровне 70% (все, кто выполнил меньше 70% заданий теста, получают «два»), то в тест необходимо включить не менее 70% легких заданий, которые смогут выполнить 90% тестируемых учеников (рис. 9). Нормативно-ориентированные тесты обычно намного труднее. В них включают от 50 до 70 % заданий средней трудности, т.е. тех, которые смогла выполнить верно только половина тестируемых учеников (рис. 10).
Рис. 9. Распределение заданий по трудности, в нормативно-ориентированном тесте
Рис. 10. Распределение заданий по трудности в критериально-ориенпированном тесте
В силу того, что распределения сырых баллов репрезентативной выборки испытуемых по нормативно-ориентированным и критериально-ориентированным тестам имеют, как правило, различную форму (рис. 11), приходится использовать различающиеся методы оценивания надежности и валидности результатов педагогических измерений, методики шкалирования и выравнивания.
Рис. 11. Типичное распределение баллов по тестам для репрезентативной
Наиболее существенные различия между нормативно-ориентированными и критериально-ориентированньми тестами представлены в табл. 1.
Различия между нормативно-ориентированными и критериально-ориентированными тестами
Нормативно-ориентированные тесты
Критериально-ориентированные тесты
Типичное среднее число учеников, выполнивших правильно почти все задания теста
Область для сравнения результатов учащихся
Результаты других учеников
Содержательная область или совокупность видов учебной деятельности
Диапазон охвата целей проверки
Широкий, охватывает многие цели и виды учебной деятельности
Узкий, обычно охватывает несколько целей контроля
Репрезентативность охвата содержания предмета
Умеренная, фрагментарная, – обычно включают не все разделы
Большая, обычно включают все то, что можно операционализировать и принять за 100%
Разброс результатов учащихся (вариативность баллов)
Высокий, поскольку основная цель тестирования – дифференциация испытуемых по уровню подготовки
Низкий, внутри результатов группы учащихся, превысивших по своим результатам критериальный балл, почти нет вариативности
Подбор заданий по трудности
Распределение оценок трудности близко к нормальному. Основная часть заданий имеет трудность 40—60%
Распределение скошенное. Основная часть заданий имеет трудность 80—90%
Для учителя наиболее информативной является ситуация, когда оба подхода взаимно дополняют, друг друга. Поэтому некоторые тесты разрабатываются с расчетом на то, что результаты учащихся можно соотносить как с нормами, так и с содержанием теста. Пример – контрольно-измерительные материалы (КИМ) ЕГЭ.
2. Задачи тестирования и виды тестов
— задачи, стоящие на входе в обучение (входной контроль);
— текущие задачи (текущий контроль);
— задачи, соответствующие концу определенного периода учебного процесса (итоговый контроль) [60; 74].
Тесты для входного контроля, обычно называемые претестами (предварительными тестами), делятся на два типа.. Претесты первого типа позволяют выявить готовность к усвоению новых знаний в классе. Они разрабатываются в рамках критериально-ориентированного подхода и содержит задания для проверки базовых знаний, умений и навыков, необходимых для усвоения нового материала. В основном эти претесты предназначены для наиболее слабых учеников, находящихся на границе между явно подготовленными и явно не подготовленными к началу усвоения нового материала. По результатам выполнения претеста проводится деление тестируемых на две группы, в одну из которых попадают те, кто может двигаться дальше, а в другую – те, кто нуждается в дополнительной работе и консультациях педагога.
Претесты второго типа разрабатываются в рамках нормативно-ориентированного подхода. Они охватывают планируемые результаты предстоящего обучения и построены полностью на новом материале. По результатам выполнения претеста преподаватель принимает решение, позволяющее внести элементы индивидуализации в массовый учебный процесс. Если ученик показал некоторые предварительные знания по новому материалу, то план его обучения необходимо перестроить и начать с более высокого уровня, чтобы учебный материал имел для него действительный характер новизны. Иногда роль входного претеста выполняет итоговый тест, который предназначен для будущей оценки результатов усвоения нового материала после завершения его изучения.
На рис. 12 показаны возможные функции входного тестирования в учебном процессе.
Рис. 12. Упрощенная модель функций входного тестирования в учебном
процессе, соотнесенная с задачами педагога.
Корректирующие тесты не следует путать со средствами текущего контроля знаний учеников, однако они в какой-то мере близки, хотя бы по целям применения. Однако между первыми и вторыми средствами есть существенные различия технологического и содержательного характера. Традиционные средства текущего контроля менее эффективны и в основном ориентированы на проверку и систематическую оценку знаний учеников по небольшим единицам учебного материала. Корректирующие тесты предназначены для выявления пробелов в знаниях по группе учебных единиц, включающих содержание нескольких тем или даже разделов. Обычно они содержат задания, расположенные по нарастанию трудности, с тем чтобы выявить первые же проблемы в усвоении учебного материала.
Если затруднения ученика при выполнении заданий носят систематический характер, то педагог может прибегнуть к помощи диагностических тестов. Основная цель диагностики – установление причин пробелов в знаниях учеников – достигается специальным подбором содержания заданий в тестах. Как правило, в них бывают представлены слабо варьирующие по содержанию задания, рассчитанные по форме представления на отслеживание отдельных этапов выполнения каждого задания корректирующего теста. Подробная детализация позволяет выявить причины устойчивых ошибок учеников, конкретизировать характер возникающих затруднений и получить выводы о несформированности тех или иных учебных умений.
Например, задание с выбором одного правильного ответа из корректирующего теста по математике для начальной школы может иметь следующий вид:
Максимальное число заданий диагностического теста определяется количеством действий при выполнении задания корректирующего теста. Например, для рассматриваемого числового выражения, можно предложить четыре задания, если у педагога нет желания проверять знание учащимся порядка действий:
4) 2+6:3-8:4 = А. 3 Б. 2 В. 0
Подбор заданий в диагностический тест осуществляется в индивидуализированном режиме, в зависимости от тех заданий, которые выполнил неверно каждый учащийся в корректирующем тесте. Особенно эффективны процессы коррекции и диагностики при компьютерной генерации и предъявлении тестов в сочетании с обучающими модулями по каждой единице неусвоенного учебного материала. В этом случае коррекция проводится незамедлительно, поскольку после выявления очередного пробела и установления его причины компьютер сам подбирает обучающий модуль и сразу же выдает его ученику.
Упрощенная модель функций текущего тестирования представлена на рис. 13.
Рис. 1З. Модель функций тестирования в текущем контроле
Итоговое тестирование. Основная цель итогового тестирования – обеспечение объективной оценки результатов обучения, которая ориентирована на характеристику освоения содержания курса (критериально-ориентированные тесты) или на дифференциацию учащихся (нормативно-ориентированные тесты). На рис. 14 приведена модель функций итогового тестирования.
Рис. 14. Модель функций итогового тестирования
Итоговые тесты обычно подвергаются стандартизации, поскольку чаше всего они применяются для принятия административных управленческих решений в образовании, Если проведение входного и текущего тестирования – функция учителя, то итоговое тестирование часто проводится внешними структурами и носит характер независимых проверок. Примером независимого итогового тестирования в России является ЕГЭ, тестирование при аттестации школ и т.д. внутри школы итоговые тесты можно, использовать при переводе учащихся из класса в класс, при отборе отстающих учеников для определения их в коррекционные классы и т.д.
3. Классификация видов педагогических тестов
Основные подходы к классификации тестов. В отечественной и иностранной литературе существуют различные подходы к классификации педагогических тестов, различающиеся по признакам, которые положены в основу демаркации видов. В соответствии с подходом к интерпретации данных выделяют нормативно-ориентированные и критериально-ориентированные тесты.
По размерности конструкта педагогические тесты делятся на гомогенные (измеряющие только одну переменную и потому однородные по содержанию) и гетерогенные (измеряющие более одной переменной – случай многомерного конструкта) тесты. Гетерогенные тесты бывают полидисциплинарными и междисциплинарными [52; 60]. Полидисциплинарные тесты состоят из гомогенных субтестов по отдельным дисциплинам. Результаты учеников по субтестам объединяются для подсчета итоговых баллов по всему полидисциплинарному тесту. Для выполнения заданий междисциплинарных тестов требуется применение обобщенных, межпредметных, интегративных знаний и умений. Междисциплинарные тесты всегда многомерны, их разработка требует обращения к факторным методам анализа данных, математико-статистическим методам многомерного шкалирования и т.д.
По характеру измеряемых переменных выделяют тесты для проверки знаний, учебных, практических умений, навыков, а также компетентностные тесты. Иногда в отдельную группу выделяют скоростные тесты, требующие жесткого временного ограничения на выполнение каждого задания и содержащие всегда избыточное число заданий, не позволяющее выполнить весь тест. В зависимости от формы предъявления различают бланковые и компьютерные, устные и письменные тесты.
Наиболее общая классификация тестов в учебном процессе позволяет разделить их на две неравные группы: стандартизованные тесты, обладающие нормами выполнения, и нестандартизованные тесты, которых значительно больше, поскольку для использования в повседневном учебном процессе их готовит каждый педагог. Нестандартизованные тесты нередко называют учительскими, или авторскими, тестами.
Классификация по видам контроля, их функциям и характеру решаемых задач. Если в качестве признака демаркации выбрать виды контроля и характер задач, решаемых преподавателем с помощью тестов, то получится классификация видов педагогических тестов, представленная на рис. 15.
Рис. 15. Классификация педагогических тестов
Анализ классификационной таблицы позволяет выделить в качестве основополагающих четыре вида педагогических тестов, среди которых, наибольшую важность по сфере использования имеют итоговые нормативно-ориентированные тесты.
4. Основные определения понятийного аппарата
Понятийный аппарат при разработке и использовании тестов. Необходимость создания четкого понятийного аппарата для разработки тестов не всегда понятна преподавателям-практикам. Отчасти это объясняется кажущейся простотой самих понятий, так как нередко любой набор заданий в тестовой форме в представлении учителя ассоциируется с тестом. Такие псевдотесты сплошь и рядом публикуются в специальных сборниках. Их можно использовать в текущем контроле, но не в работе аттестационных центров.
Несоответствие псевдотестов научно обоснованным критериям качества может привести к значительному ошибочному компоненту в оценках подготовленности учащихся, следствием которого будут неправильные выводы относительно эффективности работы отдельных преподавателей или педагогических коллективов. Таким образом, понятийный аппарат необходим, поскольку он служит целям отделения тестов от того, что нередко за них принимается.
В предтестовых заданиях проверяются наиболее существенные опорные элементы содержания дисциплины. В каждом предтестовом задании определяется то, что однозначно считается правильным ответом с запланированной степенью его полноты.
Преимущества предтестовых заданий по сравнению с традиционными контрольными заданиями обеспечиваются предельной стандартизацией при предъявлении и оценивании результатов их выполнения, что в целом повышает объективность оценок учащихся по тесту.
Обычно требуется не менее двух-трех апробаций, по результатам которых ведется коррекция содержания, формы, трудности задания, его валидности и статистических свойств, характеризующих качество его работы вместе с остальными заданиями теста. Исследование системообразующих характеристик тестового задания проводится на основе анализа дескриптивной (описательной) статистики, а также методов корреляционного, факторного и латентно-структурного анализа. Интерпретация результатов анализа – это всегда сложная аналитическая работа, результаты которой зависят от множества условий, в том числе и от вида создаваемого теста. Статистические характеристики тестовых заданий и требования к их качеству рассмотрены в Лекции 12.
В длительной апробации и коррекции нуждаются в основном итоговые тесты, используемые для принятия управленческих решений в образовании. Например, при разработке учительских тестов для текущего контроля корреляционный и факторный анализ не нужны, но дескриптивная статистика, позволяющая без особых усилий отобрать валидные задания приемлемой трудности, будет также очень полезна.
Педагогический тест. В отличие от первых двух определений, инвариантных относительно целей тестирования и решаемых задач, определение педагогического теста должно быть ориентировано на конкретный вид теста. В частности итоговый нормативно-ориентированный тест – это система тестовых заданий, упорядоченных в рамках определенной стратегии предъявления и обладающих такими характеристиками, которые обеспечивают высокую дифференциацию, точность и обоснованность оценок качества учебных достижений.
Из этого определения следуют два важных вывода. Первый: нет и не может быть тестов, качественных вообще, так как оценка дифференцирующего эффекта теста, точности измерений (надежности) и их адекватности поставленным целям (валидности) зависит не только от характеристик тестовых заданий, но и от особенностей тестируемого контингента учащихся. Второй: для оценки качества теста необходимы эмпирические данные тестирования, полученные на репрезентативной выборке учащихся. Работа по коррекции теста консолидирует систему тестовых задании – постепенно нарастают внутренняя связь и целостность, интегративностъ системы, совершается переход от совокупности предтестовых.заданий к профессионально разработанному тесту.
Итоговый критериально-ориентированный тест – это система тестовых заданий, упорядоченных в рамках определенной стратегии предъявления и обладающих такими характеристиками, которые обеспечивают валидную содержательную интерпретацию учебных достижений по отношению к установленным, статистически обоснованным критериям выполнения [1; 48]. В определении не конкретизируется базовая содержательная область, используемая при интерпретации, что позволяет применять его для различных разновидностей критериально-ориентированных тестов.