+7 (8112) 66-71-14

ege@pskovedu.ru

Псков, ул. Кузнецкая, д.13
Режим работы: ПН-ЧТ 9:00 — 17:00, ПТ 9:00 — 16:00

Основное терминологическое поле теории педагогических измерений

Основное терминологическое поле теории педагогических измерений.

Бочерашвили В.Т., заместитель директора ГБОУ ДПО ПО «ЦОКО» по инновационной работе

 

 

А 

 

Автор - разработчик теста (test developer) –  специалист (учитель-предметник или иной педагогический работник), имеющий адекватный уровень подготовки в области теории и практики педагогических измерений.

 

Адаптивный тест (аdaptive test) — тест, в котором  тестовые задания предлагаются тестируемому  в зависимости от правильности его ответа на  предыдущее тестовое задание.

 

Ассоциация – словесная подсказка в тестовом задании, помогающая тестируемому угадать правильный ответ.

 

Апробация теста – предварительное тестирование репрезентативной выборки для определения соответствия теста его целям и заданным характеристикам.

 

Аккомодация (аccommodation) — изменения в тесте и (или) его администрировании, осуществленные с целью оценивания качества знаний  учащихся с  ограниченными возможностями здоровья.

 

 Альтернативные  формы теста (аlternate forms) — различные версии (варианты)  одного и того же теста, одного  уровня трудности, подготовленные для оценивания одного и того же учебного сегмента, но с разными тестовыми заданиями.

 

Аналитическая выборка (analysis sample) — группа тестируемых,   дающая по результатам тестирования основание для определения  дескриптивных и вероятностных статистик, характеризующих качественный аспект тестирования.

 

Аналитический подсчет баллов  (аnalytic scoring, trait scoring) —  процедура подсчета  рейтером результатов тестирования для теста, состоящего из заданий со свободно конструированным ответом, в соответствии с заранее заданными критериями. 

Анализ тестовых  заданий (items analysis)  – процесс определения трудности и дифференцирующей способности заданий теста посредством статистического анализа, на основе  которого и принимается решение о включении задания в  содержание теста.

Аудит педагогический (educational аudit) — систематическая документированная деятельность по измерению и оценке  академических достижений обучающихся с целью оценки степени  соответствия результатов обучения требованиям образовательных стандартов и (или) содержанию учебных программ.

Б 

 

Балл (score) – условная единица, используемая в тестировании, для оценки результата выполнения тестового задания.

 

Балл критериальный (cut off score) – граничное (пороговое) значение тестового балла, с помощью которого выборка испытуемых делится на тех, кто справился с тестом, и тех кто не справился.

 

Балл первичный (raw score) – индивидуальный балл тестируемого по результатам выполнения теста, равный сумме баллов за верные ответы на задания теста.

 

Балл тестовый (test score) – окончательное численное выражение оценки уровня подготовленности тестируемого, полученное на основании стандартизованной обработки результата, выраженного в первичных баллах.

 

 Балл истинный (true score) – гипотетический балл на определенной для теста шкале, соответствующий уровню подготовленности тестируемого в момент тестирования.

 

Балл категории ответа на тестовое задание – балл, соответствующий определенной категории ответа на политомическое тестовое задание, зависящий от полноты этого ответа.

 

Банк тестовых заданий – совокупность систематизированных тестовых заданий, разработанных для разных целей, прошедших апробацию и имеющих известные качественные характеристики.

 

Бланк ответов – стандартный бланк для записи ответов на тестовые задания или записи номера выбранного ответа из нескольких предложенных заданий.

В

Валидность теста (test validity)  – комплексная характеристика теста, отражающая его свойство служить той цели, для которой он создавался (понятие универсальное, но аспекты доказательств валидности – различны).

 Валидность очевидная (face validity) – представление о сфере применения теста, его результативности и практической ценности у лиц, не располагающих специальными сведениями о тесте.

 

Валидность критериально-ориентированная (сriterion-related validity) — характеристика теста, отражающая его возможность несмещенно сопоставлять результаты педагогического тестирования с внешним критерием, характеризующим объект измерения.

 

Валидность сопоставительная – вид критериально-ориентированной валидности, отражающий корреляцию результатов тестирования, полученного с помощью теста, с результатами измерения того же объекта другим методом.

 

Валидность прогностическая (predicative validity) – критериальная валидность, отражающая эффективность прогноза теста о возможностях тестируемых в будущем.

 

 Валидность конструкта (сonstruct validity) — теоретические и эмпирические данные о том, что  тест измеряет на самом деле  и о том, каков качественный уровень выводов, сделанных на основе результатов тестирования.

 

 Валидность факторная (factor validity) – характеристика педагогического теста, выражающая корреляцию между тестом и каждым из выделенных факторов академических достижений тестируемых.

 

Валидность статистическая  (statistical validity) — характеристика теста, определяемая анализом результатов тестовых испытаний и проверкой знаний традиционными методами.

 

 Валидность содержательная (content validity) – один из аспектов валидности конструкта, фокусирующий доказательства на  пригодности   знаний, умений и навыков,  составляющих  содержание тестовых заданий.

 

Валидизаация теста – совокупность процедур по улучшению валидности теста.

 

Валидизаация перекрестная (cross-validation)   – процедура, в которой для определения прогностической валидности тестирования модель оценивания, экспериментально полученная на одной выборке, применяется к другой выборке.

 

Верификация – 1) процесс установления истинности научных утверждений путем их эмпирической проверки, 2) подтверждение соответствия конечного продукта предопределенным эталонным требованиям (стандартам). 

 

Взвешивание (weighting)  — определение относительного вклада каждого  первичного балла в том случае, когда два или более баллов объединены  в  сложный балл  политомического тестового задания.

 

Внутренняя согласованность (internal consistency) – характеристика теста, отражающая степень однородности тестовых заданий с точки зрения измеряемого тестом качества знаний учащихся.

          Внутренней согласованности коэффициент (coefficient of internal consistency) – одна из разновидностей коэффициента надежности теста, вычисляемая  как ко-эффициент корреляции между результатами ответов испытуемых на четные и нечетные вопросы одного и того же теста.

     Воспроизводимость (reproducibility) – свойство теста к повторению основных  характеристик при последующих применениях.

 

        Выравнивание вариантов теста определенный метод решения комплекса вопросов, связанных с отображением на определенной шкале латентных характеристик всех тестовых заданий (в том числе, составляющих его различные варианты).

 

          Выборочная совокупность (sample)  тестовых заданий  –   совокупность заданий теста, являющаяся частью гипотетической генеральной совокупности тестовых заданий.

 

 Выборка нормативная    стратифицированная – группа тестируемых,  содержащая представителей всех наиболее значимых страт, реально    существующих в генеральной совокупности потенциальных испытуемых, причем в той же пропорции.

 

Г 

 

Генеральная совокупность (universe) - совокупность всех мысленно возможных объектов (статистических единиц) данного вида, над которыми проводятся наблюдения с целью получения конкретных значений случайной величины.

 

Генеральная совокупность тестовых заданий – гипотетическое множество тестовых заданий, полностью представляющее конкретную область знаний (учебный предмет).

 

Д

 

Дисперсия  (variance) - статистика, выраженная в единицах и показывающая              степень  разброса результатов тестирования в баллах.

 

Дисперсионный анализ (analysis of variance) - совокупность моделей и методов, применяемых для исследования влияния одной или нескольких переменных ( факторов) на одну зависимую количественную переменную (отклик).

 

Дифференцирующая способность тестового задания (item discrimination power) – количественная характеристика способности тестового задания дифференцировать учащихся по уровню их подготовленности.

 

И 

 

Измерение – количественное сопоставление свойств объекта с эталоном, принятым в качестве единицы измерения.

 

Индекс – количественная характеристика признака, цифровой показатель чего-либо.

 

Индикатор – качественная характеристика признака, доступная наблюдению и измерению, и позволяющая судить о других характеристиках объекта, недоступ-ных непосредственному исследованию.

 

Искажения  (bias) —  в теории педагогических измерений тенденция оценочных процедур, когда  полученные  результаты имеют систематические отклонения от реальных.

 

                                       К 

 

Качество  как философская категория – существенная определенность предмета, то, в силу чего он является данным, а не другим.  

 

 Качество конструкционное – совокупность устойчивых свойств (признаков) объекта.

 

 Качество эксплуатационное – конкурентоспособность объекта (предмета, услуг), демонстрирующая степень соответствия эталону с точки зрения потребителя.

 

Качество результата педагогического измерения -  конструкционное качество,  представдляющее собой совокупность следующих характеристик: надежность, валидность, точность, достоверность, правильность, сходимость,  воспроизво-димость.

 

Качество образования (в широком смысле) – интегральная характеристика системы образования, отражающая степень соответствия реальных достигаемых образовательных результатов и условий образовательного процесса нормативным требованиям, социальным и личностным ожиданиям.

 

Качество образования – совокупность его свойств, обусловливающая приспособленность к реализации социальных целей по формированию и развитию личности в аспектах ее обученности, воспитанности, выраженности социальных, психических и физических свойств.

 

Качество знаний – целостная совокупность устойчивых свойств, характеризующих результат обучения (полнота, глубина, системность, систематичность, оперативность, гибкость, конкретность, осознанность, свернутость-развернутость  и т. д.).

 

Квалитология –   наука о качестве создаваемых человеком объектов и процессов.

 

Квалиметрия – область науки, объединяющая количественные методы оценки качества объектов, используемые для обоснования оценочных суждений и решений, принимаемых при стандартизации и управлении качеством.

 

Критерий – измеряемый признак, на  основании которого производится сравнение, классификация, оценка объектов и явлений.

 

Количество как философская категория – то, что характеризует объект с точки зрения его измеримости.

 

Компетенция- отчужденное, заранее заданное социальное требование (норма) к образовательной подготовке обучающегося, необходимое для его эффективной деятельности в определенной сфере.

 

Компетентность (по Дж. Равену) -  специфическая способность (состоявшееся качество личности), ориентированная на  эффективное выполнение  конкретного действия в конкретной  предметной области, включающая узкоспециальные знания, предметные навыки, способы мышления, понимание ответственности за свои действия.

 

Компетентностный подход – освоение учащимися различного рода умений, позволяющих им в будущем действовать эффективно в ситуациях  профессиональной, личной и общественной жизни.

К ключевым компетенциям относят:

  • умение учиться (learning);

  • исследование (searching);

  • думание (thinking);

  • общение (communicating);

  • кооперацию, взаимодействие (cooperating);

  • умение «делать дело», доводить дело до конца (getting things done);

  • умение адаптироваться к себе, принимать себя (adopting oneself).

                                  

    Корреляционный анализ – комплекс методов статистического исследования взаимозависимости между переменными, связанными такими отношениями, при которых эта взаимозависимость является нелинейной (стандартной мерой связи переменных является коэффициент корреляции).

     

     Корреляция бисериальная – метод корреляционного анализа отношения переменных, одна из которых измеряется в дихотомической шкале, а другая в порядковой или интервальной.

     

    Корреляция ранговая – метод корреляционного анализа, отражающий отношения переменных, упорядоченных по возрастанию их значения.

     

     Конструкт  — совокупность структурных единиц  знаний учебного сегмента,  для измерения и оценки которых создается педагогический тест (например, знание истории, фактологический материал, понимание прочитанного, навыки обучения,  способность к  анализу текста, логическое мышление, интеллект и т. д.)

          Коэффициент стабильности (coefficient of stability) – коэффициент надежности теста, выраженный показателем корреляции между результатами двух последовательных тестирований одного и того же контингента испытуемых одним и тем же тестом.

        Коэффициент  эквивалентности (coefficient of equivalence) –  коэффициент надежности, который определяется корреляцией между результатами двух параллельных форм одного и того же теста  одного и того же контингента тестируемых.

Конструктно-нерелевантная вариация   (construct-irrelevant variance) — различия между показателями тестируемых  в баллах, вызванные другими факторами, нежели различия в знаниях,  умениях, навыках,  или других характеристиках, включенных в конструкт теста, предназначенный для измерения. 

 

Контрастные группы – эмпирические выборки тестируемых, подбираемые с максимальным и минимальным проявлением критериальных признаков.

 

                                        Л

 

Логит – интервал на логарифмической шкале, принятый за единицу и являющийся мерой сопоставимости уровней подготовленности тестируемого  и трудности тестового задания   (при разности между  и  в один логит вероятность выполнения тестируемым задания равна 0,73).

 

 

                                                               М

 

 Матричное тестирование  (matrix sampling) —  метод администрирования теста, когда разным выборкам тестируемых предлагаются разные тестовые задания.

 

Матрица ответов тестируемого (person-item score matrix) – прямоугольная таблица (размер nх k), в каждой позиции которой указываются ответы тестируемых (номер столбца соответствует номеру задания, а строки являются профилями тестируемых).

 

Меры центральной тенденции – характеристики совокупности переменных, отражающие наиболее типичный, репрезентативный для изучаемой выборки тестируемых, результат (наиболее распространенными мерами центральной тенденции являются: средняя арифметическая, средняя геометрическая, средняя гармоническая, средняя квадратическая, мода и медиана).

 

Меры изменчивости – статистические показатели вариации переменной относительно средних значений, определяющие степень отклонений от центральной тенденции распределения (размах, среднее абсолютное отклонение, дисперсия, стандартное отклонение, коэффициент вариации и др).

 

Модель частичного оценивания (partial credit model) – обобщенная логическая модель для политомических тестовых заданий, позволяющая дополнить альтернативную оценку выполнения задания оценкой «частично правильный ответ».

 

Метод доведения ответа до правильного (answer-until-correct method) – метод, используемый в компьютерном тестировании, когда тестируемый должен отвечать на каждое задание до тех пор,  пока не выберет правильный ответ.

 

          Модератор – комплексная характеристика контингента тестируемых, указывающая на практическую эффективность теста и учитывающая демографические показатели – возраст, пол, регион и т.п.

 

Н

 

Надежность (reliability) – показатель стабильности и устойчивости результатов тестирования в одинаково подготовленных группах тестируемых при неоднократном предъявлении теста.

 

Надежность ретестовая   (test-retest method) – подсчитывается коэффициент  корреляции  по результатам  двух тестирований, разнесенных во времени.

 

 Надежность, определяемая методом  эквивалентных форм (alternate-form reliability) ­ предполагает тестирование не по одному, а двум тестам, одинаковым по охвату материала, степени трудности, но не идентичных,  

 

Надежность, определяемая методом  расщепления (split-half method) – ­   надежность теста, основанная на сопоставлении результатов тестирования по двум или нескольким эквивалентным частям теста.

 

Надежность по методу Кьюдера-Ричардсона  - метод, в  ­ основе которого  однократное предъявление единственной формы теста (задания теста предполагаются дихотомическими) и согласовании ответов по всем заданиям теста  (чем однороднее тест, тем согласованнее его результаты).

Надежность по методу Кронбаха – обобщение метода Кьюдера-Ричардсона на случай, когда задания теста не являются дихотомическими.

Надежность классификации (reliability of classification) — степень соответствия результатов тестирования  испытуемого  определенной  категории (например, базовый, средний и продвинутый уровни) при условии проведения повторного тестирования  с использованием  альтернативной формы теста (при этом предполагается, что изменений в способностях  испытуемого не происходит)

 

 Надежности коэффициент –  количественная характеристика надежности теста, изменяющаяся от 0 до 1, показывающая меру реального результата тестирования и меру влияния на этот результат случайных ошибок.

 

Нормальное распределение (normal distribution) – модель распределения переменных относительно среднего случайным образом под влиянием множества независимых факторов (кривая нормального распределения описывается формулой де Муавра и имеет вид симметричной унимодальной колоколообразной кривой.)

 

Нормативная группа (norm group) – группа тестируемых, используемая в качест-ве основания для сравнения, при котором оценки отдельных тестируемых интер-претируются  в сравнении с распределением баллов в  группе.

 

Нормы тестовые – количественные или качественные критерии оценки результатов педагогического теста, позволяющие определить уровень академических достижений учащегося в той или иной области знаний (в качестве одного из критериев могут выступать статистические показатели выборки стандартизации).

 

                                       О 

 

Ограничение значений (restriction of range) – ситуация, в которой анализ результатов тестирования не включает в себя данные  испытуемых, которые имели бы самые высокие или  самые низкие оценки по одному (или более) переменным.

 Однопараметрическая модель тестирования – логистическая модель, в которой  функция успеха зависит только от разности  ( – уровень подготовленности тестируемого, - трудность тестового задания).

 

Отвлекающий ответ (distractor) – вариант ответа на задание множественного выбора, похожий на правильный ответ, но таковым не являющийся.

 

Основа тестового задания (stem) – языковые и речевые единицы, а также цифро-буквенные обозначения, с которыми тестируемый должен проделать мыслительную или речевую операцию, заданную тестовой ситуацией и сформулированную в инструкции.

             Оценивание суммативное  (summative evaluation) – оценивание,  используемое  для принятия решений о выставлении той или иной оценки  учащемуся в конце учебной деятельности или определения готовности к продвижению (на основе такого оценивания разрабатываются  суждения об общем уровне успешности учащихся).

 Оценивание формативное (formative evaluation) – вид оценивания, созданный для помощи учебному процессу, путем обеспечения обучаемого информацией, которая может быть использована для определения сильных и слабых мест.

 

П 

 

 

Параллельные  варианты теста – варианты теста с примерно одинаковыми статистическими характеристиками.

 

План педагогического теста (технологическая матрица) – таблица, в которой каждое тестовое задание соотносится с определенным элементом содержания учебной дисциплины, видом знаний или умений.

 

Пользователь теста - юридическое или физическое лицо, использующее тест или результаты тестирования для оценки уровня подготовленности испытуемых в определенной области знаний.

 

Показатель – обобщенная количественная характеристика объекта исследования, выраженная в числовой форме.

 

Подсчет баллов целостный  (holistic scoring)  - процедура оценивания результатов тестирования для тестов со свободно-конструируемым ответом, обеспечивающая одно общее суждение об успешности выполнения теста.

 

Последовательное тестирование – педагогическое тестирование, при котором тестовые задания с известными характеристиками последовательно предъявляются тестируемому, уровень подготовленности которого оценивается после каждого ответа с возрастающей точностью.

 

Претест (рretest, pilot testing) — педагогический тест, подготовленный в соответствии со спецификацией,  для сбора статистических характеристик тестовых  заданий и теста в целом, но не прошедший апробацию.

 

Процентиль (percentile)  – сотая часть условной шкалы, дробящей распределение на сто равных частей, и используемая для ранжирования тестируемых по результатам теста.

Р

 

Разрешающая способность теста – длина промежутка на шкале уровня подготовленности тестируемых, соответствующая изменению первичного балла тестируемого на единицу.

 

Рандомизация -  процесс перемешивания объектов, в результате которого они располагается в случайном порядке.

 

Ранг (rank)  - номер наблюдения в вариационном ряде.

 

Размах (range)  -  разность между наибольшим и наименьшим наблюдаемым значением количественного показателя.

 

Ранжир  -  упорядоченный по некоторому основанию ряд.

 

Рейтинг (rating)   -  индивидуальный числовой показатель оценки качества или свойства объекта, используемый при упорядочивании или классификации.

 

Рейтер  — лицо (компьютеризированная процедура), определяющее результат тестирования в баллах исходя из правильности ответов тестируемого за каждое задание теста.

 

 Регрессии уравнение (regression equation) — формула,  вида Y = aх + b, используемая для оценки ожидаемого значения критерия, учитывающая значение одного или более наблюдаемых переменных  как  прогностических показателей.

 

Репликация - повторение исследования  с целью  определения  степени согласованности результатов.

                                                             

                                                                С 

 

Ситуативные переменные педагогического тестирования – совокупность случайных факторов, влияющих на результат тестирования.

 

Сложносоставной балл (composite score) —  балл, являющийся комбинацией двух или более баллов, полученной в соответствии с определенным правилом.

 

Смещение   или систематическая ошибка оценивания  (bias of estimator)  – разница между ожидаемым значением статистики и истинным значением параметра генеральной совокупности, который эта статистика оценивает.

 

Сопоставимость — необходимое условие для сравнения статистических показателей и их анализа,  требующее  единства методологии расчёта показателей, единиц измерения, полноты охвата наблюдением исследуемого  явления  и других условий сравнимости.

 

Стандартное отклонение (standard deviation) —  статистика показывающая, что количество вариаций в наборе  тестовых баллов, выражается в тех же единицах, что и сами оценки, и рассматриваемая при этом как типичное расстояние  между индивидуальным баллом  тестируемого и средним.

 

Стандартная ошибка оценивания  (standard error of estimate) — статистика, демонстрирующая степень, с которой оценка количественных  тенденций меняется в выборках из одной и той же популяции.

 

Стандартная ошибка измерения ( standard error of measurement) — статистика, показывающая  несостоятельность  тестовых баллов, вызванных такими факторами, как  угадывание ответов, особенности некоторых тестовых заданий, включенных в тест,  лояльность или строгость в оценивании результата ( в терминах статистики стандартная ошибка измерения  суть величина, которая показывает стандартное отклонение различий между наблюдаемыми и истинными  баллами) .

 

 Стандарт  —  нормативно-технический документ, устанавливающий комплекс норм, правил, требований к объектам стандартизации, обязательный для исполнения в определенных областях деятельности, разработанный в установленном порядке и утвержденный компетентным органом.

 

Стандарт организации  – документ по стандартизации, утверждаемый юридическим лицом для совершенствования производства, обеспечения качества продукции, работ, оказания услуг.

 

Стандарт образования – диагностическое описание минимальных обязательных требований к отдельным сторонам образования, удовлетворяющее следующим условиям:

  • применимость к определенному образовательному феномену,

  • выполнение в диагностических показателях качества данного феномена,

  • ориентированность на объективные методы контроля его качества.

                Стандартизация - деятельность по разработке (ведению), утверждению, изменению (актуализации), отмене, опубликованию и применению документов по стандартизации и иная деятельность, направленная на достижение упорядоченности в отношении объектов стандартизации;

     Стандартизация теста  (test standardization) – процедура получения распределения индивидуальных баллов по тесту для нормативной группы испытуемых, позволяющая сопоставлять результаты у разных групп тестируемых.

     

     Стандартизированная нормативная выборка – группа тестируемых, включающая представителей наиболее значимых страт генеральной совокупности.

     

    Спецификация теста – документ, содержащий информацию о целях, плане, структуре теста, особенностях включенных тестовых заданий, правилах его администрирования и обработки результатов,  общем сценарии тестирования

     

    Субтест (subtest) – часть теста, состоящая из ограниченного числа тестовых заданий, допускающая независимую обработку результатов с целью решения частных задач тестирования.

     

    Т

     

    Тест педагогический (educational test) – система, специально подобранных ,расположенных в порядке возрастания трудности тестовых заданий специфической формы, предназначенная для количественной оценки академических достижений школьников в одной или нескольких областях.

     

    Тест педагогический стандартизированный  (standardized educational test) – педагогический тест, имеющий спецификацию, тестовые характеристики, стабильно подтвержденные на нескольких репрезентативных выборках тестируемых, и являющий собой единство стандартных методов конструирования, администрирования, обработки, интерпретации и оценки результата.

     

    Тест педагогический локально-стандартизированный  (teacher-made test) – педагогический тест, апробируемый на ограниченном контингенте испытуемых (класс, параллель) и менее строгий по статистическим показателям качества, чем тест стандартизированный.

     

    Тест гетерогенный (heterogeneuse test) – тест, позволяющий оценить уровень подготовленности тестируемого по нескольким смежным учебным дисциплинам.

     

     Тест гомогенный (homogeneuse test) – тест,  позволяющий оценить уровень подготовленности тестируемого по одной учебной дисциплине.

     

    Тест критериально-ориентированный тест (CRT) – тест, цель которого выявить знания тестируемого в соответствии с учебной программой и оценить результаты тестирования относительно некоторого критерия.

     

    Тест нормативно-ориентированный (NRT) – тест, цель которого сравнить академические достижения тестируемых друг с другом или дать оценку этим достижениям относительно тестовой нормы.

     

    Тест мощности (power test) – педагогический тест, включающий тестовые задания, расположенные в порядке возрастания трудности, и не предполагающий жестких ограничений по времени.

     

    Тест скорости (speed test) -  тест, включающий задания примерно равной трудности, результат выполнения которого определяется количеством выполненных заданий за определенное время.

Тест идентификации (indification test) – тест, включающий вместо словесных ответов  схемы, графики, диаграммы, чертежи, в котором испытуемому необходимо в соответствии с условием задания распознать (идентифицировать) изображение.

Тест полиморфный  – педагогический тест, содержащий тестовые задания различных типов.

 

Тест мономорфный  – педагогический тест, содержащий задания одного типа.

Тест вступительный (placement test)   – проводимый с целью определения уровня обученности для распределения тестируемых по результатам теста в соответствующие группы.

Тест по аудированию (listening test) – коммуникативно-речевой тест, предназначенный для проверки орфоэпических, просодических, лексических и грамматических навыков тестируемого, уровня его понимания речевого сообщения при слуховом восприятии.

 

Тест тренировочный, репетиционный (mocktest) – педагогический тест, проверяющий степень подготовленности обучающихся к решающему (экзаменационному, итоговому) тестированию.

 

Тест прогностический  – тест, определяющий успех или неуспех тестируемого в будущем.

 

Тестирующий (tester) – специалист, непосредственно проводящий тестирование, имеющий соответствующее квалификационное удостоверение.

 

 Тестирование абсолютное – тестирование, предназначенное для оценивания уровня подготовки каждого  обучающегося  в конкретной области знаний.

 

 Тестирование относительное – педагогическое тестирование, предназначенное для сопоставления уровня подготовки школьников относительно друг друга или относительно тестовых норм.

 

Тестовая батарея (test battery) – несколько субтестов, объединенных единой целью использования и предназначенных для оценки различных сторон академических достижений тестируемого.

 

Тестовая искушенность – индивидуальный опыт тестируемого, приобретенный   в ходе неоднократного выполнения педагогических тестов.

Тестовое задание (item) – минимальная составляющая единица педагогического теста в виде задания специфической формы, отвечающая требованиям технологичности, чистоты формы и предметного содержания и, кроме того, статистическим требованиям:

1) известной трудности; 2) дифференцирующей способностью (достаточной вариации тестовых баллов); 3) положительной корреляции баллов задания с баллами по всему тесту.

Тестовое задание множественного выбора (multiple-choise item) –  тестовое задание с несколькими вариантами ответа, один (или более) из которых верный.

Тестовое задание дихотомическое – задание, выполнение которого оценивается альтернативно («1» - верно решенное задание, «0» - за нерешенное задание).

 

Тестовое задание политомическое – тестовое задание, выполнение которого допускает несколько категорий ответа, каждая из которых оценивается по-разному.

 

Тестовое задание на установление правильной последовательности (sequences item) – задание, при выполнении которого необходимо установить правильную последовательность действий, операций, событий.

 

Тестовое задание на установление соответствия (matching item) - задание, при выполнении которого необходимо установить соотношение между элементами двух или более множеств.

 

Тестовое задание со свободно конструируемым (кратким или полным) ответом (free-response item, essay item) –  тестовое задание без указания возможных вариантов ответа, требующее самостоятельного формулирования ответа.

 

Тестовое задание в виде логического соотношения – задание, при выполнении которого предполагается установить логическую связь между понятиями.

 

Теория моделирования и параметризации педагогических тестов (Item Response Theory) — теория тестирования, ориентированная на математические модели, параметрами которых (подлежащими определению), служат различные характеристики  как тестируемых, так и самого теста (аналог  данной теории – математическая теория измерения латентных качеств личности – Latent Trait Theory)

 

Точность измерения (рrecision) — ширина интервала, попадание  в который  данной величины  может быть оценено  с любой заданной вероятностью.

 

Трудность тестового задания (item difficulty) – основная количественная характеристика тестового задания, определяемая долей тестируемых, ответивших правильно на тестовое задание.

                                                       

                                                    У 

 

Учебный сегмент  (domain) — определенная совокупность знаний, умений, навыков, являющихся частью содержания учебного предмета.

 

                                                     Х   

 

 Характеристическая     функция     заданного     уровня подготовленности испытуемых  ­  функция характеристик заданий теста, полученная из функции успеха для тестового задания при фиксированном значении заданного уровня подготовленности испытуемых.

 Характеристическая функция заданных параметров тестовых заданий ­ функция одного переменного уровня подготовленности участников тестирования, полученная из функции успеха для тестового задания при фиксированных значениях характеристик заданий.

                                                           Ш 

 

Шкала (scale) – форма фиксации совокупности признаков изучаемого объекта с упорядочиванием их в определенную систему действительных чисел.

 

Шкалирование (scaling) – метод, связанный с выставлением каждому тестируемому тестового балла по единой шкале, вне зависимости от группы и варианта теста (преобразование первичных баллов в шкалированные).

 

Шкала процентная ( percentage mastery scale)– порядковая шкала, на которой тестовый балл тестируемого  прямопропорционален его первичному баллу.

Шкала  номинативная  – это шкала, в которой не выражены количественные характеристики объектов, а учитывается только то свойство объектов, что они разные.

Шкала порядковая (ранговая) -­ шкала, позволяющая ранжировать объекты (присваивать им ранги) по какому-либо признаку.

 

Шкала интервальная  – это шкала, классифицирующая по принципу «больше - меньше» на определенное количество единиц.

 

Шкала отношений - шкала, классифицирующая по принципу «больше - меньше» в определенное количество раз

 

Шкала нормативная (normative scale) — шкала, которая определяется в терминах  результативности нормативной группы (во многих случаях, шкала определяется  значениями специфических величин  - средних и стандартного отклонения шкалированных баллов нормативной группы)

 Шкала нормализованных процентилей - порядковая шкала, тестовый балл по которой соответствует квантилям нормального распределения, в частности, квантилям стандартной нормальной переменной с нулевым математическим ожиданием и единичной дисперсией.

Шкала первичных процентилей – порядковая шкала, тестовый балл испытуемого по которой определяется соответствующим квантилю эмпирического распределения частот первичных баллов участников тестирования.

                                                          Э  

Эталонный (якорный) тест – тест небольшой длины, служащий для                                                 выравнивания шкалы (вариантов теста)                                                 

                                           Я 

Якорные тестовые задания (anchor items) – тестовые задания, общие для всех или нескольких вариантов теста.

 

Файлы: