ݺߣ

ݺߣShare a Scribd company logo
Лабораторная работа №2 Показатели качества теста
Нормативно-ориентированный тест  – позволяет сравнивать учебные достижения отдельных испытуемых друг с другом. Баллы, набранные испытуемыми, широко разбросаны по шкале. (Тесты, по которым можно ставить оценки: ЕГЭ, ЦТ).
Критериально-ориентированный тест  используются, чтобы аттестовать испытуемых по какой-либо области знаний. Баллы, набранные испытуемыми, сконцентрированы вокруг одной точки – критерия (например, в тесте из 50 вопросов, критерием является 25 верных ответов, т.е. если испытуемый набрал 25 баллов, то он аттестован, если нет, то не аттестован. Здесь оценка не выставляется). (Тесты проф.  пригодности,  тесты, составленные для зачетов).
График нормативно-ориентированного теста График критериально-ориентированного теста
Надежность  – отражает точность педагогического измерения, насколько полученные результаты по каждому студенту соответствуют его истинному баллу. Надежностью называется характеристика теста, отражающая точность тестовых измерений и устойчивость результатов к действию случайных факторов.
Методы повышения надежности. 1. Повышение содержательной однородности. Однако чрезмерное повышение однородности может привести к нежелательным последствиям, так как в тест могут попасть задания, дублирующие друг друга, что снизит дифференцирующую способность теста.
2. Увеличение длины теста. В достаточно длинных тестах не очень высокая однородность может сочетаться с высокой надежностью. Однако не всегда возможно использование тестов длиной более 100 заданий, но, тем не менее, необходимо помнить, что чем длиннее тест, тем выше надежность. Существует формула, по которой можно определить, во сколько раз надо увеличить длину теста, чтобы достич желаемой надежности:
3. К методам повышения надежности теста можно отнести совершенствование качества отдельных заданий теста.
Причины снижения надежности теста. 1.Субъективизм при оценке заданий открытой формы 2.Угадывание в заданиях закрытой формы 3.Некорректные формулировки заданий 4.Неоправданный выбор весовых коэффициентов 5.Длина теста 6.Отсутствие стандартных инструкций к тесту 7.Случайные источники снижения надежности теста, связанные не со знаниями, а с испытуемыми.
Содержательная валидность  показывает, насколько тест соответствует программе обучения. Определяется экспертным путем (3 эксперта) и не имеет числового выражения. Критериальная валидность  – степень соответствия между результатами тестирования и внешней переменной критерия. Мы будем считать критериальную валидность как корреляцию между результатами тестирования и экспертной оценкой преподавателя каждого из студентов.   Валидность большая 0,3 считается удовлетворительной.
Конструктная (концептуальная) валидность.  Об этом виде валидности говорится в том случае, если представление об измеряемом феномене существует только в проекте и  требует доказательства. Разработчик теста только предполагает о том, как будет проявляться объект измерения. Чаще всего это относится к психологическим тестам.

More Related Content

лабораторная02 97

  • 1. Лабораторная работа №2 Показатели качества теста
  • 2. Нормативно-ориентированный тест – позволяет сравнивать учебные достижения отдельных испытуемых друг с другом. Баллы, набранные испытуемыми, широко разбросаны по шкале. (Тесты, по которым можно ставить оценки: ЕГЭ, ЦТ).
  • 3. Критериально-ориентированный тест используются, чтобы аттестовать испытуемых по какой-либо области знаний. Баллы, набранные испытуемыми, сконцентрированы вокруг одной точки – критерия (например, в тесте из 50 вопросов, критерием является 25 верных ответов, т.е. если испытуемый набрал 25 баллов, то он аттестован, если нет, то не аттестован. Здесь оценка не выставляется). (Тесты проф. пригодности, тесты, составленные для зачетов).
  • 4. График нормативно-ориентированного теста График критериально-ориентированного теста
  • 5. Надежность – отражает точность педагогического измерения, насколько полученные результаты по каждому студенту соответствуют его истинному баллу. Надежностью называется характеристика теста, отражающая точность тестовых измерений и устойчивость результатов к действию случайных факторов.
  • 6. Методы повышения надежности. 1. Повышение содержательной однородности. Однако чрезмерное повышение однородности может привести к нежелательным последствиям, так как в тест могут попасть задания, дублирующие друг друга, что снизит дифференцирующую способность теста.
  • 7. 2. Увеличение длины теста. В достаточно длинных тестах не очень высокая однородность может сочетаться с высокой надежностью. Однако не всегда возможно использование тестов длиной более 100 заданий, но, тем не менее, необходимо помнить, что чем длиннее тест, тем выше надежность. Существует формула, по которой можно определить, во сколько раз надо увеличить длину теста, чтобы достич желаемой надежности:
  • 8. 3. К методам повышения надежности теста можно отнести совершенствование качества отдельных заданий теста.
  • 9. Причины снижения надежности теста. 1.Субъективизм при оценке заданий открытой формы 2.Угадывание в заданиях закрытой формы 3.Некорректные формулировки заданий 4.Неоправданный выбор весовых коэффициентов 5.Длина теста 6.Отсутствие стандартных инструкций к тесту 7.Случайные источники снижения надежности теста, связанные не со знаниями, а с испытуемыми.
  • 10. Содержательная валидность показывает, насколько тест соответствует программе обучения. Определяется экспертным путем (3 эксперта) и не имеет числового выражения. Критериальная валидность – степень соответствия между результатами тестирования и внешней переменной критерия. Мы будем считать критериальную валидность как корреляцию между результатами тестирования и экспертной оценкой преподавателя каждого из студентов. Валидность большая 0,3 считается удовлетворительной.
  • 11. Конструктная (концептуальная) валидность. Об этом виде валидности говорится в том случае, если представление об измеряемом феномене существует только в проекте и требует доказательства. Разработчик теста только предполагает о том, как будет проявляться объект измерения. Чаще всего это относится к психологическим тестам.