СОДЕРЖАНИЕ ТЕСТА И ТЕСТОВЫХ ЗАДАНИЙ
Вадим Аванесов
Аннотация
В статье рассматриваются вопросы содержания теста и тестовых заданий. Изложены принципы отбора содержания теста и обновлённая классификация видов знаний, которые необходимо знать для каждого разработчика качественного педагогического теста.
Ключевые слова: содержание тестовых заданий и содержание теста.
Проблемная ситуация
В теории педагогических измерений трудно найти вопрос, который мог бы сравниться по важности с вопросами содержания теста и тестовых заданий. Потому что от того, что включается в тест, зависит качество контроля, его результативность и эффективность, общественная значимость или бесполезность проводимого тестирования.
Надо сразу признать, что содержание теста – понятие субъективное и интерсубъктивное. Субъективное означает возможность индивидуальной точки зрения, несовпадающей с другими. То, что один специалист считает важным и нужным, другой педагог может отнести к несущественным элементам, а потому недостойным для включения в тест. Интерсубъективное означает возможность приближения к объективному знанию за счёт сближения индивидуальных мнений, коллективной экспертизы, процессов обсуждения и согласования. Не случайно в процессе разработки образовательных стандартов и тестов самая трудная и главная проблема – достижение общественного консенсуса о содержании образования и о содержании методов контроля качества образовательной деятельности. Главный при этом предмет обсуждения – какие знания нужно включать в образовательные программы и в тесты?
Связь содержания теста с содержанием образовательных программ упомянута здесь не случайно: проверять можно только то, что целенаправленно изучалось. То, что в школе не изучалось, не проверяется ни при каких обстоятельствах. Это запрещено различными положениями и этическими нормами тестирования.
Нерешённость вопросов содержания программ и тестов является одной из главных причин кризиса, поразившего весь мир. Этот кризис часто называют образовательным. На самом деле это кризис не образования, а образовательных систем и учреждений, плохо понимающих разницу между желаемым и возможным. Горькая правда такова, что до сего дня в образовательные программы, как в мешок, каждый ведущий предметник заталкивает до предела, всё, что считается нужным для «современного» образования. В результате объёмы и глубина требуемых знаний растут, курсы становятся сложнее, учиться и учить становится всё труднее. Наглядным примером такого кризисного состояния является школьная математика, которую вообще не усваивают, как минимум, 20 процентов учащихся. А по ряду регионов называется и 50%. И это правда.
Вообще содержание теста легко критиковать из-за того, что оно никогда не бывает совершенным. Нет таких тестов, содержание которых вбирало бы в себя все содержание учебной дисциплины. Всегда есть элементы учебного курса, не включённые в состав теста. Авторам теста приходится много и долго доказывать, что невозможно всё содержание курса втиснуть в небольшое количество, примерно тридцать, заданий теста, а потому многим из содержания программ необходимо жертвовать. При создании теста обычно ставится задача отобразить в нем то основное, что учащиеся и студенты должны знать и уметь в результате изучения курса. Можно сказать так: содержание учебной дисциплины всегда шире содержания тестовых заданий.
Не обязательно требовать, чтобы все основные знания, навыки и представления входили в тест; некоторые из них заметно связаны между собой, иногда перекрывают друг друга по содержанию и потому могут замещаться. Но сторонники «чистой науки» требуют, чтобы вся программа изучавшегося курса вошла в содержание теста. Они тоже исходят как бы из благих побуждений, но таких, которые на корню подрывают всякую возможность создать хороший тест
Иллюстрацией к вопросу о важности содержания контроля может стать неудачный опыт многолетнего экспериментирования с российским единым государственным экзаменом (ЕГЭ). Известно, что содержание теста зависит от цели проводимого контроля. В ЕГЭ же была не одна, а несколько целей, что и предопределило неудачу.
Первая цель – это аттестация всех выпускников школ, где требуется невысокий уровень трудности заданий, иначе основная масса не сдаст успешно, и не пройдёт аттестацию. Именно так и поступают при отборе содержания в т.н. «аттестационных тестах». Хотелось бы обратить внимание на некоторую неточность такого названия. Когда все задания сравнительно лёгкие, то они порождают очень смещённые статистические распределения результатов, а это и есть один из признаков отсутствия теста, как системы заданий возрастающей трудности.
Вторая цель – профессиональный отбор абитуриентов в различные вузы, в т.ч. в ведущие вузы страны, где требуются более трудные задания. Хорошие вузы особенно заинтересованы в более трудном содержании тестовых заданий.
Третья цель - введение т.н. ГИФО, т.е. дифференцированной платности за образование, в зависимости от полученных баллов ЕГЭ.
Четвёртая цель - выявление и учёт всех отлично подготовленных выпускников школ, по всей стране. Для чего это делается, не было сказано. Но специально для этого была создана запредельная, по трудности, часть «С», недопустимая в настоящих тестах. Правильное выполнение таких заданий оценивается в пять раз выше, чем выполнение обычных по трудности заданий в тестовой форме. Т.е задан такой коэффициент, чтобы эти выпускники обязательно выявились и не затерялись в общей массе.
Стремление достигнуть все четыре отмеченные цели сразу и создать для этого один качественный метод (экзамен) – занятие теоретически бессмысленное и бесперспективное. Качественного теста для нескольких сильно различающихся целей не бывает. А потому используемому под эти цели методу дали новое, краткое, доступное для масс названия, КИМ. Что значит контрольно-измерительный материал. КИМ – это очень некачественная форма проверки знаний с фактически засекреченными результатами, ведущая к неконтролируемой трате огромных государственных средств[1].
Если два человека возьмутся делать тест по одной и той же учебной дисциплине, то они включат в него различное содержание. При этом сразу возникает вопрос – а какое содержание лучше? Ответить на этот вопрос нелегко, хотя бы потому, что совершенного содержания не бывает, а пути достижения такого содержания неимоверно трудны. Тем не менее, можно найти такие принципы и правила отбор содержания тестовых заданий, которые помогают ответить на такой вопрос и обосновать качество теста в целом. Именно этому и посвящена основная часть данной статьи.
Главные определения
Содержание образования – это специально отобранная и признанная обществом (государством) система элементов объективного опыта человечества, усвоение которой необходимо для успешной деятельности индивида в избранной им сфере.
В некоторых странах содержанием образовательных программ – равно как образовательными стандартами и тестированием - занимаются независимые общественно-профессиональные органы, ассоциации и объединения. Это имеет место, например, в США, Японии, Южной Корее, Сингапуре и во многих других странах с развитым образовательными системами. В США центральному правительству вообще запрещено проверять качество образования в отдельных штатах. И в этом можно усмотреть большой смысл, особенно если сравнить это с практикой проведения российского ЕГЭ федеральным органом управления образованием. Но разве сможет орган, отвечающий за постановку образования в стране, объективно проверить результаты своей собственной работы? Практика засекречивания истинных результатов ЕГЭ убедительно подтверждает, что не может.
В других странах тестированием занимаются государственные органы управления образованием, что противоречит общей логике организации тестового дела, основанного на принципе добровольности и независимости. Правда, в большинстве таких стран делается оговорка, что в этом деле государство участвует временно. На Украине уже давно, много и правильно говорят о внешнем тестировании, независимом от главного государственного органа управлением образованием.
Содержание школьного образования - система знаний и опыта человечества, усвоение которых необходимо для успешной социализации личности в социальной структуре общества. Содержание образования задается учебным планом и соответствующими ему программами учебных дисциплин, оно отражается в учебниках учебных пособиях и в других средствах обучения[2]. Анализ содержания курсов обычно относится к компетенции преподавателей, в то время как анализ содержания заданий - один из ключевых вопросов теории педагогических измерений. Общие принципы разработки содержания тестовых заданий рассматриваются в теории педагогических измерений, в то время как содержание учебных дисциплин относится больше к той науке, знание которой проверяется.
Содержание высшего профессионального образования – это специально отобранная и признанная обществом система элементов объективного опыта человечества, усвоение которой необходимо для успешной профессиональной деятельности индивида в избранной им сфере и в общем процессе жизнедеятельности, повышения качества жизни. Содержание образования задается учебным планом и соответствующими ему программами[3] учебных дисциплин; оно отражается в учебниках, учебных пособиях и в других средствах обучения.
Содержание теста можно определить как оптимально редуцированное отображение содержания образования в системе тестовых заданий[4].
Содержание тестовых заданий, одного теста, включает в себя примерно тридцать укрупнённых ключевых единиц знаний. Это должны быть такие задания, правильные ответы на которые свидетельствовали бы о действительной подготовленности испытуемых по всем фрагментам изученного курса. Хотя в предельном варианте задача такого рода принципиально недостижима, тем не менее, тестовые задания представляют содержание курса в виде тщательно редуцированной вероятностной системы фрагментов проверяемых знаний.
Каким должно быть содержание
В тестовом задании внимание преподавателя привлекает, в первую очередь, содержание и форма. Содержание определяется как отображение фрагмента учебной дисциплины в тестовой форме, форма - как способ связи, упорядочения элементов задания.
Отображение содержания образования в содержании тестов проводится посредством выделения основных единиц учебного материала, формирования на этой основе т. н. укрупненных дидактических единиц[5]. Эти единицы используются далее в двух различных формах: материала для обучения и материала для контроля. Выделение собственно контрольного материала из общей совокупности дидактических средств является необходимой и нормальной для науки формой исследования интересующего предмета. В работе, целиком посвященной вопросу тестирования, абстракция такого рода необходима.
Содержание тестовых заданий формулируется как можно точнее, короче и яснее.
Точность содержания обеспечивается использованием терминов, элементов искусственного языка, формул, исключением метафор и неадекватной лексики.
Краткость достигается тщательным подбором слов, символов, графиков, позволяющих минимумом средств добиваться максимума ясности смысла задания. Для достижения краткости в каждом задании лучше спросить о чем-нибудь одном. Хорошо, когда задание содержит не более одного придаточного предложения, а лучше, чтобы его не было вовсе.
Ясность содержания достигается тогда, когда все испытуемые правильно понимают подлинный смысл задания. С этой целью из заданий полностью исключаются повторы слов, малопонятные, редко употребляемые, а также не изучавшиеся в курсе символы и иностранные слова, затрудняющие восприятие сути задания. В заданиях, например, по физике, полезно использовать рисунки интересующего процесса. Рисунки повышают понимаемость задания, позволяют избежать многословия, способствую образному представлению, что помогает также и быстроте восприятия, а это существенно при применении тестовых форм.
Формы выражения содержания заданий
Содержание теста может быть представлено испытуемым в четырёх основных формах тестовых заданий.
Если даются готовые ответы на выбор - обычно один правильный и остальные неправильные - то такие задания лучше называть заданиями с выбором одного правильного ответа[6]. Этим заданиям предшествует инструкция для испытуемых: «Нажимайте на клавишу с номером правильного ответа!».
Логической основой первого варианта является закон исключенного третьего, впервые сформулированный Аристотелем. Выбор правильного ответа порождает истинное суждение, а выбор неправильного - ложное суждение. Третьего не дано. Из этого закона следует методическое правило: в каждом задании с выбором одного правильного ответа последний должен быть, что придает однозначность замыслу самого задания и не допускает противоречивых мыслей у испытуемых. Следование закону исключенного третьего налагает запрет на применение таких ответов, как “правильного ответа нет”, “все ответы правильные” или “все ответы неправильные”, которые в практике все еще встречаются. В настоящей работе этот запрет соблюдается.
Второй вариант заданий этой же, первой формы, используется для проверки сопоставительных знаний - с выбором одного, наиболее правильного ответа, из числа ответов, правильных в разной степени. Третий, по счёту, но первый по значимости вариант – это задания с выбором нескольких правильных ответов.
Эти три варианта образуют первую форму. Задания первой формы делятся на такие виды, как задания с двумя, тремя, четырьмя, пятью и с большим числом ответов. Чем больше ответов, тем меньшей является вероятность угадывания правильного ответа.
Во второй форме задание сформулировано так, что готового ответа нет; каждому испытуемому во время тестирования ответ приходится вписывать самому, в отведенном для этого месте. Такие задания называют заданиями открытой формы. После дополнения задания определенным ответом получается истинное или ложное высказывание.
Задания, где элементам одного множества требуется поставить в соответствие элементы другого множества, называются заданиями на установление соответствия. Это третья форма. И, наконец, в тех случаях, когда требуется установить правильную последовательность вычислений, действий, шагов, операций, терминов в определениях понятий, используются задания на установление правильной последовательности. Это четвертая форма.
Каждая из форм позволяет проверить специфические виды знаний, а также соответствующие им контрольные материалы. Выбор форм зависит от цели тестирования и содержания теста, от технических возможностей и уровня подготовленности преподавателей в области теории и методики тестового контроля знаний.
Не следует стремиться обязательно включать в тест задания всех четырёх форм. Причина - нетехнологичность второй, третьей и четвёртой форм при бланковых формах проведения массового контроля. Массовое тестирование рекомендуется проводить посредством заданий с выбором одного или нескольких правильных ответов. Высокоскоростные оптосканы позволяют в течении часа проверить результаты многих тысяч испытуемых и выдать результаты сразу же вслед за процессом тестирования. Опыт очень эффективного использования оптосканов имеется у тестовой службы Республики Казахстан.
В российском и украинском образовании используются задания преимущественно в нетестовой форме. Большинство из них - это вопросы, задачи и упражнения, которые в тестовой культуре не используются. Нередко вопросы и задачи называются тестами. Но ответы на них иногда бывают столь многословными, что для выявления истинности требуются большие затраты интеллектуальной энергии. В то время как технологичная методика тестирования предполагает четкую и быструю дифференцируемость правильного ответа от неправильного. В этом смысле традиционные вопросы и ответы не технологичны; их не рекомендуется включать в тест. То же относится и к задачам, имеющим громоздкие формулировки.
Уровень и структура знаний
С точки зрения педагогических измерений полезно ввести два основных показателя качества знаний - уровень и структура знаний. В качестве показателя уровня знаний может рассматриваться тестовый балл учащихся, который является результатом использования тестового метода.
Преимущество тестового метода проверки знаний перед другими состоит в том, что он позволяет выявить и количественно оценить знание и незнание, а иногда и невежество. Формой представления индивидуальной структуры знания и незнания является профиль, представляемый последовательностью единиц и нулей, получаемых каждым студентом.
В качестве одного из лучших показателей структуры знаний может использоваться профиль знаний испытуемого. Профиль знаний представляет собой упорядоченный набор оценок (вектор-строку) в матрице тестовых результатов. Профиль и соответственно структура знаний называются правильными, если все нули следуют за всеми единицами; в других случаях получаются инвертированные профили знаний, инвертированные в той или иной степени. Мера инвертированности определяется различными индексами, здесь не рассматриваемыми. Роль структуры знаний многократно подчеркивалась выдающимся педагогом А. Дистервегом. Психолог Д. Брунер считает, что “изложение структуры знаний, овладение этой структурой, а не просто усвоение фактов и технических приемов является центральным моментом[7]...”
Формой представления групповой структуры является матрица. Основной метод выявления структуры знания и незнания - многомерный статистический анализ данных.
Если тестовый балл ниже требуемого уровня (измеряемого критерия), то проявленные при этом знания, умения, навыки и представления указывают на докритериальный уровень подготовленности испытуемого. Этот уровень является самым распространенным и массовым. Для многих он оказывается вполне преодолимым по мере изучения ими наук и овладения мастерством. Однако некоторые, преимущественно в силу недостатка способностей и прилежания, так и остаются на этом уровне.
В истории науки и искусств известно немало случаев, когда имевшийся в соответствующие времена критериальный уровень требований к знаниям (или мастерству) мешал общественному признанию отдельных талантов. Поэтому признание нередко приходило только по мере изменения критериев оценки, чаще всего, после смерти авторов многих бессмертных произведений в сфере науки, музыки, живописи. Яркий пример такого рода - изменение критериев оценки творчества Ван Гога, творчества многих художников-импрессионистов, формалистов и др.
Два подхода к оценке содержания теста
Содержание заданий любых тестов оценивается с двух основных позиций – педагогической и тестологической. Педагоги в первую очередь оценивают содержание заданий по преподаваемой ими учебной дисциплине. Тестологи же имеют свой предмет анализа. Вначале они оценивают форму и тестологические характеристики заданий - такие как мера трудности, коррелируемость ответов испытуемых в заданиях с ответами по критерию, эффективность заданий, проверяют надежность и определяет меру валидности результатов теста в целом.
Соответственно, анализ содержания обычно относится к компетенции преподавателей учебных дисциплин, в то время как анализ форм заданий - один из ключевых вопросов общей теории педагогических измерений. Будучи не менее важным компонентом хорошего теста, содержание относится не столько к теории педагогических измерений, сколько к той науке, знание которой проверяется. Тем не менее, в определении содержания теста есть вопросы, относящиеся к теории: это определение содержания теста, вопросы полноты и глубины отображения содержания учебной дисциплины в содержании теста, классификации видов знаний и, наконец, формулирование основных принципов такого отображения
Чем полнее отображение, тем увереннее можно говорить о так называемой содержательной валидности тестовых результатов. Это означает фактическую пригодность содержания теста для явно сформулированной цели. Тест не может быть пригодным для измерения любых знаний, в любое время, и в любом месте. Каждый тест создается для достижения конкретной цели и потому его результаты валидны (пригодны) для измерения знаний по той дисциплине и тех учащихся, для которых он создавался.
Стремление к повышению валидности теста путем расширения числа тем, разделов учебной дисциплины и, соответственно, увеличения числа заданий в тесте нельзя, в принципе, признать рациональным.
Нет таких тестов, содержание которых вбирало бы в себя все содержание учебной дисциплины. При создании теста обычно ставится задача отобразить в нем основные дидактические единицы, которые учащиеся и студенты должны знать и уметь в результате изучения курса. Можно сказать так: содержание учебной дисциплины всегда шире содержания тестовых заданий. Не обязательно требовать, чтобы все основные знания, навыки и представления входили в тест; некоторые из них заметно связаны между собой, иногда перекрывают друг друга по содержанию и потому могут замещаться.
При соответствующих условиях тестолог может из этой сотни отобрать примерно тридцать заданий, которые будут измерять подготовленность выпускников не хуже, а лучше, чем сто заданий. Что достигается за счёт удаления неэффективных заданий, экономии времени, установления нужной очередности вхождения заданий в тест, повышения вариации тестовых баллов, уровня средней корреляции ответов студентов на все задания теста, уточнения факторной структуры теста и применения многих других профессиональных методов разработки педагогических тестов.
Требование оптимальности подводит к необходимости уточнения содержания учебной дисциплины и тестовых заданий, в состав которых обычно входит известная из старой педагогики триада так называемых ЗУНов - знаний, умений и навыков. Установка на усвоение знаний, умений и навыков является следствием, с одной стороны, технократизации педагогического сознания, а с другой - традиционного информационно - объяснительного подхода к построению содержания образования[8]. Преодолению ограниченности такого сознания может способствовать включение в содержание учебных дисциплин овладение опытом учебной и практической деятельности, эмоционально - ценностное отношение к людям и окружающему предметному миру.
К отмеченному добавим представления и компетенции, которые сейчас мало или почти не отражаются в учебных планах и программах. Между тем в условиях быстро изменяющегося и обновляющегося образования прочное знание всего материала учебной дисциплины становится малореальным и трудным делом.
К этому надо добавить, что забывание – необходимый процесс нормально функционирующей психики. Так называемые “остаточные знания” у студентов спустя год после сдачи экзамена редко превышают 15 %. Не случайно метафорические «остаточные знания» – любимый предмет проверки со стороны госорганов. Между тем, знать и проверять нужно не всё, а только нужное и важное для профессиональной деятельности.
Вспоминается мысль А. Дистервега: «Не следует прочно изучать то, что может быть легко забыто»! Представления решают важную задачу ориентации в мире знаний, а это иной раз не менее важно, чем обладать теми или иными частными знаниями. Тем не менее, представления не заменяют знания, а дополняют их, в той мере, в какой требует хорошо организованный учебный процесс. Возникает вопрос - не лучше ли некоторые учебные материалы давать в виде представлений, которые могут быть забыты, но затем, в нужный момент, учащийся можно превратить их в знания самостоятельно?
Содержание теста связывает два начала: научное и учебное. Научное начало отражает процесс развития науки и ее применимость; учебное - обусловливает все то, что формирует систему знания[9]. Научное начало составляет содержание теста в виде основных компонентов: фактический материал, отражающий признаки и свойства предметов, явлений; обобщенные результаты общественно-исторического познания мира - понятия, законы, принципы, основные мировоззренческие понятия, идеи, ведущие научные теории и др.[10] В содержание учебных дисциплин включены и познавательные задания, направленные как на усвоение знаний, таки на интеллектуальное развитие учащихся[11].
Принципы отбора содержания тестовых заданий
Значимость. Этот принцип указывает на необходимость включения в тест только тех элементов знания, которые можно отнести к наиболее важным, ключевым, без которых знания становятся неполными, с многочисленными пробелами. Такие элементы знания ввиду их важности можно назвать структурными элементами. В тест, следовательно, нужно включать только те материалы, которые выполняют роль таких элементов в индивидуальном знании.
Научная достоверность. В тест включается только то содержание учебной дисциплины, которое является объективно истинным и поддается некоторой рациональной аргументации. Соответственно, все спорные точки зрения, вполне нормальные в науке, не рекомендуется включать в тестовые задания. Суть тестовых заданий заключается как раз в том, что они требуют четкого, заранее известного преподавателям ответа, признанного ими в процессе разработки заданий объективно истинным.
Соответствие содержания теста уровню современного состояния науки. Этот принцип вытекает из естественной необходимости готовить специалистов и проверять их знания на современном материале. Трудность в реализации этого принципа заключается в опосредованности связи содержания теста с уровнем развития науки и с содержанием учебной дисциплины.
Репрезентативность. В тест не только включаются значимые элементы содержания, но обращается внимание также на полноту и их достаточность для контроля. В самом деле, можно взять пять-шесть элементов и проверить по ним знания студентов. Но где уверенность, что студент знает и другие важные элементы содержания учебной дисциплины? Путь к появлению такой уверенности лежит в наиболее полном отображении необходимого знания в заданиях теста. Репрезентативность не означает обязательного включения в тест всех значимых элементов содержания. Ведь многие из них явно связаны между собой в общей структуре знаний, включены один в другой полностью или частично. Кроме того, много элементов в структуре знаний иерархически соподчинены. Этому принципу соответствуют основные задания, которые лучше называть структурными.
Возрастающая трудность учебного материала. Этот принцип означает, что каждый учебный элемент в процессе контроля обладает некоторой усредненной, для студентов, мерой трудности, на которую и ориентируются преподаватели. Практически все учебники и пособия построены по принципу возрастающей трудности, особенно в тех науках. которые построены по так называемому автором кумулятивному принципу. В таких учебных дисциплинах, как логика, математика, иностранные языки, статистика, философия и др., знание последующих элементов курса жестко зависит от знания предыдущих учебных элементов. Поэтому изучать такие дисциплины можно только с самого начала, и без пробелов. Трудному содержанию обычно соответствуют и трудные задания. Испытуемый, правильно отвечающий на трудные задания, с большой вероятностью отвечает правильно и на легкие задания.
Вариативность содержания. Содержание теста не может оставаться неизменным и независимым от развития науки, научно - технического прогресса, от нового содержания учебной дисциплины и от новых учебников. По мере изменения содержания учебной дисциплины должно варьироваться и содержание теста. При этом принимается во внимание контингент испытуемых. Если тестируется слабая по подготовленности группа студентов, то оказывается, что трудные задания теста просто не работают; ни один студент правильно ответить на них не может. И потому из дальнейшей обработки и интерпретации тестовых данных эти задания исключаются.
Содержание теста для слабо подготовленных студентов заметно отличается от содержания теста для хорошо обученных студентов. У последних не работают, наоборот, легкие задания, так как на легкие все отвечают правильно. Таким образом, в содержании теста для разных групп имеются вариантная и инвариантная части. Аналогичные части появляются в тесте для студентов, изучающих одну и ту же учебную дисциплину при различающемся числе часов. Соответствующие изменения в содержание теста вносятся для того, чтобы лучше, репрезентативнее, отобразить в нем вариативное содержание учебной дисциплины.
Системность содержания. Это означает подбор такого содержания тестовых заданий, который отвечал бы требованиям системности знаний. Помимо подбора заданий с системным содержанием важно иметь задания, связанные между собой общей структурой знаний. Это возможно только в тех случаях, когда задания теста связаны с общей факторной структурой знаний. Такая связь определяется методами факторного анализа.
Комплексность и сбалансированность содержания теста. Тест, разработанный для итогового контроля знаний, не может состоять из материалов только одной темы, даже если эта тема является самой ключевой в учебной дисциплине. Необходимо искать задания, комплексно отображающие основные, если не все, темы учебного курса. В то же время существует стремление сбалансировано отобразить в тесте основной теоретический материал - понятия, законы и закономерности, гипотезы, факты, структурные компоненты теории - вместе с методами научной и практической деятельности, с умениями эффективно решать типовые профессиональные задания. Такие задания сравнительно легко могут трансформироваться в форму тестовых заданий на установление соответствия или правильной последовательности, превращаясь, таким образом, в дидактическую модель, используемую одинаково успешно и для контроля, и для обучения.
Взаимосвязь содержания и формы. При рассмотрении этого общего диалектического принципа применительно к тестам невольно возникает ассоциация с искусством. Настоящее искусство представляет собой, по словам Гегеля, законченное внутри себя соединение содержания с вполне соответствующей ему формой[12]. Точно так же и настоящий педагогический тест можно охарактеризовать как результат взаимовлияния содержания заданий с наиболее подходящей формой. При этом в отличие от широко распространенного философского истолкования активности содержания и пассивности формы тестовую форму надо рассматривать вместе с содержанием как активную сторону их взаимодействия.
Уже на стадии замысла содержание задания начинает обретать свою форму. Несоответствие задания одной из четырех форм допускает возможность только двух правильных суждений: или это не тестовое задание, или используется какая-то новая неисследованная форма при условии, что группа известных форм определена. Не всякое содержание поддается представлению в форме тестового задания. Доказательства, обширные вычисления, многословные описания трудно выражаются, а то и совсем не выражаются в тестовой форме.
Тестирование является одной из наиболее технологичных форм проведения автоматизированного контроля с управляемыми параметрами качества. В этом смысле ни одна из известных форм контроля знаний студентов с тестированием сравниться не может. Но и абсолютизировать возможности тестовой формы нет никаких оснований. Да и вряд ли есть хотя бы одна какая-то форма, которая могла бы выразить все богатство содержания.
В отличие от философской традиции рассмотрения формы через призму содержания, в теории тестов дело обстоит, можно сказать, наоборот: содержание контроля по каждой учебной дисциплине рассматривается сквозь призму подходящей формы. При этом содержание теста надо относить к теории той или иной учебной дисциплины, в то время как поиск наилучшей формы для выражения содержания является предметом теории тестов.
Содержание задания находится в диалектической связи с формой. Первое, как справедливо отмечается в литературе[13], не может существовать без формы. В свою очередь, содержание приобретает определенность благодаря форме. Одновременно форма является способом существования и сохранения содержания задания. Вне тестовой формы могут храниться только идеи тех или иных заданий. Реализация идеи посредством содержания всегда протекает в активном взаимодействии с той или иной формой. Часто бывает так, что какое-то содержание можно выразить в одной форме и нельзя в другой. В некоторых случаях одно и то же содержание задания можно выразить разными формами.
И, наконец, при правильном отборе контрольного материала содержание теста может быть использовано не только для контроля, но и для обучения. Использование тестовых заданий в автоматизированных контрольно-обучающих программах позволяет учащимся самостоятельно обнаруживать пробелы в структуре своих знаний и принимать меры для их ликвидации. В таких случаях можно говорить о значительном обучающем потенциале тестовых заданий. Использование такого потенциала со временем станет одним из эффективных направлений практической реализации известного на Западе принципа единства и взаимосвязи обучения и контроля.
(Продолжение следует)
[1] После постановления Правительства РФ №119 от 16.02.01 г. о предоставлении отчётов по проведению ЕГЭ только ему был обнаружен аналог этому явлению в истории первых лет советской власти. Это опутанный тайной и огромными расходами проект нефтепровода (из деревянных труб!) между городами Александров Гай и Эмба (Алгемба http://www.ko.ru/document.asp?d_no=6163 ). Как только выделенный миллиард был безотчётно израсходован, и деньги исчезли в неизвестном направлении, этот проект был тихо похоронен в песках пустыни.
[2] Гендина Н.И.. Колкова Н.И. Нормативно-методическое обеспечение учебного процесса в вузе. Стандарты высшего образования. Кемерово, 1998..-170с.
[3]Гендина Н.И.. Колкова Н.И. Нормативно-методическое обеспечение учебного процесса в вузе. Стандарты высшего образования. Кемерово, 1998.-170с.
[4]Аванесов В.С. Композиция тестовых заданий. С. 138. М.: 2 изд. 1998. – 219с.
[5] Эрдниев П.М., Эрдниев Б.П. Укрупнение дидактических единиц в обучении математике. М., Просвещение, 1986; Эрдниев П.М. Укрупнение дидактических единиц как технология обучения Ч.1-2., М. Просвещение, 1992.
[6] Первое применение заданий с выбором одного ответа автор этой книги нашел в работе Whipple G.M. Manual of Mental and Physical Tests. Baltimore, Warwick & York, 1910.
[7] Брунер Дж. Процесс обучения. М.: 1962, с. 15.
[8] Днепров Э.Д. Четвертая школьная реформа в России. Пособие для преподавателей. М.. Интерпракс,1994. С.158.
[9]Архангельский С.И. Лекции по теории обучения в высшей школе. М., Высшая школа, 1974.
[10] Дидактика современной школы. Киев, Радяньска школа, 1987.
[11] Дидактика средней школы /Под. ред. М.Н. Скаткина. М., Просвещение, 1982.
[12] Гегель Г. Энциклопедия философских наук // Соч. Т. 1, 1929.
[13] Философский энциклопедический словарь.- М.: Сов. энциклопедия, 1983.; Философская энциклопедия. Т. 4.-М., Сов. энциклопедия, 1967.
СОДЕРЖАНИЕ ТЕСТА И ТЕСТОВЫХ ЗАДАНИЙ
Статья вторая. Начало в ПИ №3, 2007г.).
Аннотация
В предыдущей статье рассматривались вопросы отбора содержания учебных дисциплин для создания теста и тестовых заданий. Были даны основные определения и рассмотрена проблемная ситуация. В настоящей работе приводится система педагогических принципов формулирования содержания заданий в тестовой форме.
Ключевые слова: содержание тестовых заданий, принципы.
Содержательные принципы теории педагогических измерений
Среди педагогических принципов отбора содержания учебных дисциплин при разработке тестовых заданий, сформулированных в перовой статье, были значимость и научная достоверность, соответствие содержания теста уровню современного состояния науки и др. Репрезентативность содержания теста рассматривалась как выборочная совокупность из содержания теста в банке заданий (генеральной совокупности). Упоминались также принципы возрастающей трудности, системности, вариативности, комплексности и сбалансированности заданий в тесте. Последним был рассмотрен диалектический принцип связи содержания и формы тестовых заданий.
Важно отметить, что часть этих принципов используется не только для отбора заданий в тест, но и для разработки заданий в тестовой форме [1] . Эти задания позволяют радикально улучшить учебный процесс за счёт активного их применения в самостоятельной работе. Напомним, что в иерархии понятий теории педагогических измерений на первом месте стоит педагогическое задание, затем идут задания в тестовой форме, тестовые задания и тест [2] .
Цель настоящей статьи – изложение системы принципов теории педагогических измерений, относящиеся к определению содержания тестовых заданий и заданий в тестовой форме.
Соответствие содержания теста цели тестирования.
Содержание любого педагогического теста более всего зависит от цели тестирования. Если нужно отобрать небольшое число самых подготовленных студентов, скажем, на олимпиаду, то ясно, что задания должны быть трудные, ибо только с помощью таких заданий можно отобрать лучших. Если же, наоборот, требуется отсеять самых слабых, то сделать это лучше с помощью сравнительно легких заданий; те, кто не выполнят эти задания, и есть самые слабые. При необходимости оценить испытуемых во всем диапазоне знания - от низшего до высшего - в тест придется включать задания легкие, средние и трудные. В профессиональном отборе содержание теста зависит от квоты приёма.
При необходимости оценить соответствие знаний выпускников образовательных учреждений требованиям минимума содержания учебных дисциплин, в тест включаются только легкие задания, посильные подавляющему большинству тестируемых. Ни о каком тесте, в классическом понимании этого понятия, в таком случае говорить не приходится, а само понятие «аттестационный тест» превращается в метафору. Для аттестации могут применяться только задания в тестовой форме. При минималистском подходе к организации образования и контроля возникает ряд таких вопросов, как определение минимально “проходного“ процента правильного выполнения числа заданий, определение оценки в зависимости от процента правильных ответов.
Минимальное содержание образовательных стандартов логично соотнести с оценкой «три» (при пользовании пятибалльной шкалой), в то время как хорошие и отличные оценки должны выставляться за знания более широкие и глубокие, нежели минимально требуемые образовательным стандартом.
Мера трудности заданий
Мера трудности задания является содержательным и формальным показателем одновременно. Уже упоминалось, что разработчики качественного теста опираются на принцип возрастающей трудности заданий теста. Мера трудности задания учитывается не только при отборе заданий в тест, но и при разработке самих заданий. Трудность теста зависит от подбора легких или, наоборот, трудных заданий, и тогда содержание теста становится преимущественно легким или трудным. Трудность задания зависит от проверяемого содержания, цели тестирования и планируемого места задания в тесте.
На трудность задания влияет также и время тестирования. Обычный расчёт времени – примерно одна минута на выполнение каждого задания. Если давать больше времени, то задания можно, или нужно, делать труднее. Но это будет уже не тест, а экзамен с использованием заданий в тестовой форме. Что-то похожее на российский ЕГЭ, в котором принципиально используются не тесты, а т.н. контрольно-измерительные материалы (КИМы), научные свойства которых уже много лет остаётся неизвестными для научной общественности. По сомнительному основанию эти КИМы ошибочно называют средствами педагогических измерений.
В теории педагогических измерений традиционной мерой трудности долгие годы была доля правильных ответов испытуемых на задание (p j ). Эта доля рассчитывается по формуле
p j = R j / N ,
где p j с индексом j означает долю правильных ответов на задание под номером j ;
R j представляет число правильных ответов испытуемых на задание под номером j ;
N – число испытуемых, отвечавших на задание j .
Статистика p j , получаемая на выборках испытуемых, сравнительно проста и понятна. А потому много лет она использовалась за рубежом при оценке содержательных и формальных особенностей тестовых заданий.
Однако в наше время обнаружились два непривлекательных свойства этой статистики.
Первое заключается в том, что значение p j всегда оказывается зависимым от уровня подготовленности испытуемых той группы, в которой применяется данное задание. Если группа хорошо подготовлена, то p j становится выше, если же группа плохо подготовлена, то значение p j ниже. На английском языке такого рода необъективную статистику называют group - dependent .
Второе отрицательное свойство этого показателя заключается в том, что увеличение значения p j свидетельствует фактически не о возрастании трудности задания, а, наоборот, об уменьшении меры трудности. Такого рода противоречие между содержанием понятия и содержанием статистического показателя долгое время не беспокоило научную общественность, пока не появилась модель измерения в теории Г.Раша. Где статистика p j вместе с q j = 1-p j , стала частью новой единицы измерения трудности задания. Исходное значение этой единицы измерения вычислялось в матрице тестовых результатов как значение натурального логарифма отношения, ln q j /p j. Эта единица измерения была названа Г.Рашем «логитом трудности задания»
Содержание теста не может быть только легким, средним или только трудным. Здесь в полной мере проявляется известная мысль о зависимости результатов исследования от применяемого метода. Легкие задания создают только видимость наличия знаний. Ориентация органов управления на проверку минимального уровня знаний не дает, и не может дать, представление о реальном или требуемом уровне знаний. Искажает результаты и намеренный подбор заведомо трудных заданий, в результате чего у большинства оказываются заниженные баллы.
Некоторые авторы и педагоги не делают различий между понятиями "трудность" и "сложность" заданий. Однако есть ряд литературных источников, в которых эти понятия определяются по-разному. Трудность - понятие чисто эмпирическое: чем меньше правильных ответов, тем труднее задание. В теории педагогических измерений используется именно это понятие. Трудность заданий теста зависит ещё и от уровня подготовленности испытуемых. Ориентация на трудные задания иногда рассматривается как средство усиления мотивации к учебе. Однако это средство действует неоднозначно. Одних студентов трудные задания могут подтолкнуть к учебе, других - оттолкнуть от нее.
Сложность связывается с идеей о числе умственных операций, которые необходимо совершить для достижения успеха. Сложность учебной задачи объясняется тем, что учащиеся часто не знают тех операций, которые надо производить, чтобы найти решение. Уже отмечалось в наших работах, что все задания в тесте, независимо от их содержания по темам и разделам, располагаются в порядке равномерно возрастающей трудности. Это и есть главный принцип построения теста.
В литературе на русском языке можно найти рекомендации включать в тест больше заданий средней трудности, что может показаться формально правильным с точки зрения определения точности измерения в рамках классической (статистической) теории измерений. Но включение в тест заданий одной только средней трудности приводит к серьезной деформации содержания теста: последний теряет способность сбалансировано отображать содержание изучаемой дисциплины на всём диапазоне глубины знаний и трудности учебной дисциплины. В любом учебном предмете всегда есть легкий, средний и трудный материал.
В погоне за теоретически высокой надежностью данных посредством включения в тест большого числа заданий среднего уровня трудности, теряется содержательная валидность результатов теста. Стремление же улучшить валидность нередко сопровождается снижением надежности результатов. В научной литературе это называется парадоксом Ф. Лорда [3] . С предметно-содержательной точки зрения рекомендации включать в тест, главным образом, задания среднего уровня трудности для увеличения надёжности надо относиться как к чисто формальным решениям, т.е. бессодержательным, и чаще всего, вредным.
Вариативность содержания заданий теста
Вариативность содержания означает возможность замены элементов задания другими похожими элементами, так, чтобы ответы у большинства, если не всех испытуемых, были разные. Например, в тесте по математике все испытуемые могут решать квадратное уравнение, но у каждого испытуемого параметры уравнения могут отличаться. Следовательно, различными будут и ответы. Получается так: задания и ответы разные, а проверяемая тема – одна и та же. Не случайно в центрах тестирования требуют, чтобы каждый разработчик готовил не менее пятнадцати вариантов каждого задания своего теста.
Таким образом, вариативность содержания каждого задания теста исключает возможности списывания. Списывание - традиционный порок средней и высшей школы. Оно является результатом издержек не только этических, но и профессионально-педагогических. Профессорско-преподавательский состав в России, в большинстве своём, не обучен создавать тестовые формы с вариативным содержанием. Вариативность содержания задания достигается применением фасетов. Фасетом называется набор сменных элементов задания, представляемых в фигурных скобках для случайного выбора в автоматизированном тестировании.
Посмотрим на примеры. Как всегда, заданиям предшествует инструкция для испытуемых. Нажимайте на клавишу с номером правильного ответа:
1. {ВЕРГИЛИЙ} ПИСАЛ
1) драмы и стихи
2) стихи и поэмы
3) поэмы и драмы
В фигурных скобках вместо Вергилия могут появиться фамилии других авторов. Лучше, чтобы это были авторы той же эпохи. Тогда проявит себя ещё один принцип - однородности подбора ответов к заданию. Однородность может быть относительно жанра, художественного направления, эпохи и др. Каждому испытуемому ЭВМ выдаёт только один элемент из фигурных скобок. Содержание вариативной части задания, ограниченного фигурными скобками, называется фасет. В задании может быть несколько фасетов.
2. ПОТРЕБНАЯ ГОРИЗОНТАЛЬНОГО ПОЛЕТА ПРИ
1) увеличивается
2) не изменяется
3) уменьшается
Если подтверждается факт различающейся трудности отдельных вариантов задания, то такие элементы из фасета исключаются. Число фасетов варьируется в зависимости от богатства содержания задания. Максимально возможное число вариантов задания находится перемножением числа элементов во всех трех фасетах. Три фасета, представленные элементами в фигурных скобках предыдущего задания, позволяют создать двенадцать вариантов заданий для контроля знаний данной учебной единицы, что вычисляется перемножением числа элементов в каждом фасете: 2 x 2 x 3 = 12. По мере увеличения количества фасетов и элементов в них растет и число вариантов задания.
В текущем контроле испытуемые могут потренировать себя на всех элементах фасета. Эта форма способствует организации самоконтроля - самой гуманной формы контроля знаний. Во время итогового тестирования, проводимого с помощью ЭВМ и инструментальной программы, испытуемый получает из фасета только один вариант содержания задания.
Число вариантов задания зависит от его содержания. Пример многофасетного задания:
3. ПРИ ДОЛИ 1)возрастает 2) убывает
Общее число различных вариантов этого задания для проверки одной укрупненной единицы знаний равно ста, т.е. произведению числа элементов в каждом фасете.
4. ДЛИНА ВЕКТОРА РАВНА
1) 3 4) 5 7) -5
2) 0 5) 2 8) -2
3) 1 6) -1 9) -3
Принцип вариативности успешно применяется при композиции заданий с выбором нескольких правильных ответов. Содержательную основу заданий с выбором нескольких правильных ответов составляют, главным образом, классификационные знания. Примеры: Обвести кружком номера всех правильных ответов:
5. ФУНКЦИЯ ПРИ ЯВЛЯЕТСЯ
1) показательной 8) нечетной
2) возрастающей 9) тригонометрической
3)степенной 10) постоянной
4) логарифмической 11) ни четной, ни нечетной
5) убывающей 12) вогнутой
6) периодической 13) выпуклой
7) чётной 14) монотонной
6. ПРОДУКТЫ ГОМОФЕРМЕНТАТИВНОГО
БРОЖЕНИЯ САХАРОВ
1) лактат |
5) бутират |
2) этанол |
6) фумарат |
3) пропионат |
7) изоцитрат |
4) ацетон, бутанол, Этанол |
8) водород, двуокись Углерода |
7. -
1) ехидна 5) кит
2) кенгуру 6) змея
3) утконос 7) дельфин
4) черепаха 8) лягушка
8. В БИТВЕ ПРИ {ГРЮНВАЛЬДЕ} УЧАСТВОВАЛИ
1) немцы 7) пруссы
2) поляки 8) латыши
3) татары 9) эстонцы
4) русские 10) французы
5) литовцы 11) голландцы
6) англичане 12) швейцарцы
Принцип вариативности содержания применяется не только к заданиям с выбором одного или нескольких правильных ответов, но и к заданиям открытой формы, где ответ надо дописывать. Примеры:
9. ПРАВОПИСАНИЕ ЧЕРЕДУЮЩИХСЯ ГЛАСНЫХ В КОРНЯХ ЗАВИСИТ ОТ _______.
10. {ФУГА} N {1} ОР. {87} {ШОСТАКОВИЧА} НАПИСАНА В ТОНАЛЬНОСТИ ____________. В последнем задании можно видеть четыре фасета, позволяющих, посредством замены элементов в каждом из них, проверить знание жанров и названий музыкальных произведений, написанных композиторами в разной тональности.
12. ТОК СИЛОЙ, ПРОХОДЯ ПО ПРОВОДНИКУ , ЗА ВРЕМЯ СЕКУНД ВЫДЕЛЯЕТ ___________ ДЖОУЛЕЙ ТЕПЛА.
По сути, это одно задание, в котором имеется три фасета, позволяющих, в машинном варианте, подставлять любые комбинации допустимых значений силы тока, сопротивления и времени, для проверки умения применять закон Джоуля-Ленца. Откуда и возникают параллельные, по содержанию, задания. Такие же фасеты можно сделать для проверки знаний всех физических законов и умений применять при расчётах.
Фасет содержания можно применять также и для заданий, где требуется установить правильную последовательность. Например:
13. ПОДГОТОВКА {КУЛЬТИВАТОРА} {КЛБ-1.7} К РАБОТЕ
- установка дисковых батарей "вразвал-всвал"
- навешивание культиваторов на механизм навески
- регулировка натяжения пружин
- установка ширины защитной зоны
- установка угла наклона батарей
- проверка комплектности
- проверка крепления деталей
Интересны задания, одинаковые по содержанию, но различные по форме.
14. К. МАРКС РОДИЛСЯ В ГОРОДЕ_________
15. К. МАРКС РОДИЛСЯ В ГОРОДЕ
1) Трир 3) Берлин
2) Хемниц 4) Мюнхен
5) Карлмарксштадт
Некоторые авторы считают задания открытой формы лучше и важнее заданий с выбором одного или нескольких правильных ответов[4]. Но это мнение, за некоторыми исключениями, представляется ошибочным. Не все задания открытой формы в действительности оказываются труднее и лучше заданий с выбором одного правильного ответа. Открытая форма, в бланковом варианте, очень проигрывает по критерию технологичности. Поэтому настоящие тестовые системы опираются главным образом на задания с выбором одного или нескольких правильных ответов. Задания же открытой формы применяются преимущественно тогда, когда надо проверить правописание слова, термина, формулы. За рубежом их применяют, главным образом, в процессе эмпирической апробации заданий, для продуцирования множества неправильных, но правдоподобных ответов, называемых дистракторами. С тем, чтобы затем создать качественные задания с выбором одного или нескольких правильных ответов.
Параллельность заданий теста
Параллельными называется задания, которые основаны на принципе вариативности содержания. Кроме того, они имеют примерно одинаковую эмпирическую меру трудности всех вариантов задания и сходные корреляции с вектором сумм исходных баллов испытуемых. Из данного определения видно, что параллельность заданий обеспечивается не только вариативностью содержания, но и статистической проверкой меры трудности и корреляции вариантов задания. По смыслу принцип параллельности заданий шире, чем принцип вариативности содержания. Параллельность включает в себя ещё и формальные критерии, опирается на эмпирические данные результатов испытуемых.
Различен и статус этих принципов. Вариативность является содержательно-методическим принципом разработки тестовых заданий, в то время как принцип параллельности заданий является общетеоретическим, опирающимся на статистику, а потому используется во всех формальных теориях педагогических измерений. Надо подчеркнуть, что параллельность по содержанию является только одним из необходимых условий параллельности тестовых заданий. Не все вариативные задания могут соответствовать принципу параллельности содержания. Иначе говоря, вариативность есть содержательное, но не достаточное условие для возникновения феномена параллельности вариантов тестового задания.
Идея разработки и существования параллельных вариантов тестовых заданий является важной для разработчиков тестов. Это - дорога к настоящему педагогическому тесту. В западной литературе часто ошибочно пишут о «параллельных тестах»; так же ошибочно это переводится и в текстах на русском языке. На самом деле тест создаётся один, а к нему делаются параллельные варианты каждого задания теста. Создание параллельных вариантов создаёт предпосылки для применения теоретически существенных методов проверки надежности результатов теста.
Обратимость содержания заданий
Этот принцип предполагает возможность формулирования обратных утверждений в тестовой форме. Примеры заданий открытой формы, построенных по принципу обратимости.
16. ОПЕРАЦИЯ НАХОЖДЕНИЯ ПРОИЗВОДНОЙ ФУНКЦИИ НАЗЫВАЕТСЯ______________. Обратное утверждение:
17. ДИФФЕРЕНЦИРОВАНИЕМ НАЗЫВАЕТСЯ ОПЕРАЦИЯ НАХОЖДЕНИЯ _______________. Точно так же:
18. ДИФФЕРЕНЦИАЛОМ ФУНКЦИИ НАЗЫВАЮТ ПРОИЗВЕДЕНИЕ ____________ ФУНКЦИИ НА ПРИРАЩЕНИЕ АРГУМЕНТА.
Обратное утверждение: 19. ПРОИЗВЕДЕНИЕ ПРОИЗВОДНОЙ ФУНКЦИИ НА ПРИРАЩЕНИЕ АРГУМЕНТА НАЗЫВАЕТСЯ ____________ ФУНКЦИИ.
Иногда обратимые задания меняют форму:
20. К ИЗОТОПАМ ОТНОСЯТСЯ ЯДРА, ИМЕЮЩИЕ РАЗНОЕ ЧИСЛО ___________.
21. ЯДРА, ИМЕЮЩИЕ РАЗНОЕ ЧИСЛО НЕЙТРОНОВ, ОТНОСЯТСЯ К _________.
22. К ИЗОТОПАМ ОТНОСЯТСЯ ЯДРА, ИМЕЮЩИЕ ЧИСЛО НЕЙТРОНОВ
1) разное 2) одинаковое
Обратимые задания принимают логическую форму тавтологии. Именно поэтому они никогда вместе не включаются в один тест. Например, нельзя включать в один тест такие задания:
23. ОПЕРАЦИЯ НАХОЖДЕНИЯ ПЕРВООБРАЗНОЙ НАЗЫВАЕТСЯ______________.
24. ИНТЕГРИРОВАНИЕМ НАЗЫВАЕТСЯ ОПЕРАЦИЯ НАХОЖДЕНИЯ_______________.
Если испытуемые хотя бы немного ориентируются в учебной дисциплине, то в случае тавтологии ответ для одного задания они найдут из содержания другого задания. Задания, построенные по принципу обратимости, можно использовать поочередно, в текущем и в итоговом контроле знаний. Но наибольший эффект такие задания могут дать при разработке нового поколения автоматизированных контрольно-обучающих программ, в которых фрагмент учебного материала закрепляется в сознании учащихся в форме прямых и обратных утверждении, представленных в тестовой форме. Ещё пример обратимых заданий:
25. ДИСТРОФИЧЕСКОЕ ПОРАЖЕНИЕ ТКАНЕЙ ПАРОДОНТА НАЗЫВАЕТСЯ __________.
26. ПАРОДОНТОЗОМ НАЗЫВАЕТСЯ ДИСТРОФИЧЕСКОЕ ПОРАЖЕНИЕ ТКАНЕЙ ___________.
При применении обратимых заданий возникает вопрос выбора лучшего варианта для итогового тестирования. В этот, казалось бы, несложный процесс выбора полезно привнести элементы науки и разделить работу на два этапа. На первом этапе обсуждаются педагогические и психологические соображения и аргументы, которые обычно используются для выбора вариантов. На втором этапе проводится эмпирическое опробование всех вариантов на параллельных выборках[5], после чего выбирается то задание, которое в большей степени обладает свойствами тестового задания для данного теста.
Пример заданий, только внешне похожих на параллельные и на обратимые, обнаруживается в трудах П.М.Эрдниева. Рассматриваются три вида одного и того же задания для младших школьников:
27. 6 + 3 =____ ; 6 + ___ = 9. ___ + 3 = 9.
Этот автор считал, что если решение первого задания проходит без трудностей, то решение второго совершается в форме поиска. Так же решается и третье. Откуда видно, что эти задания решаются с использованием разных операций. Для последующего изучения сложения и вычитания это оказывается важным[6]. Действительно, если для решения первого варианта нужны знания, то для решения второго и третьего вариантов используются элементы анализа, сравнения, синтеза, рассуждения, вывода, в общем, тех методов, которыми основная масса школьников владеет недостаточно. Таким образом, не всегда задания, кажущиеся внешне обратимыми, являются параллельными по содержанию и по структуре психологической деятельности.
Содержательная корректность задания
В задании не допускаются двусмысленность, неточность, ошибочность той его части, которая называется английским словом «stem»: это содержательная часть задания, взятая без ответов. В педагогической литературе встречаются задачи с ложными данными. Если представить одну из них[7] в тестовой форме, то получится следующее:
28. ЕСЛИ УГЛЫ ТРЕУГОЛЬНИКА РАВНЫ 62º, 75º И 53º, ТО ВНЕШНИЕ УГЛЫ ТРЕУГОЛЬНИКА РАВНЫ_________.
Это пример псевдозадания с некорректными данными, поскольку в евклидовой геометрии не существует треугольник, сумма углов которого не равна 180 гр.
В тест не включают и принципиально не решаемые задания. Например:
29. ЕСЛИ ПЛОЩАДЬ ПРЯМОУГОЛЬНИКА РАВНА 435 КВАДРАТНЫХ МЕТРА, ТО ЕГО СТОРОНА РАВНА ______.
Узнать длину стороны по площади невозможно[8]. Для установления корректности задания рекомендуется проверить все его логические и содержательные предпосылки. И если хотя бы одна из его предпосылок ложна, то задание сформулировано неправильно. Например, предпосылкой задания:
30. ЧИСЛО 7 ИМЕЕТ ЦВЕТ
1) красный;
2) желтый;
3) зеленый
является ошибочная мысль, что число имеет цвет.
От некорректности формулировок заданий следует отличать неистинность их содержания. Неистинность легко опровергается истинным утверждением, в то время как некорректное задание может продуцировать и правильные, и неправильные ответы, а то и вызывать недоумение. Сюда же можно отнести неточно или двусмысленно сформулированные задания, порождающие несколько правильных или условно правильных ответов.
Краткость содержания задания.
В задании не должно быть ни одного лишнего слова и даже знака. Посмотрим на пример очень короткого задания:
31. ШЕРСТЬ
1) гидрофобна
2) гидрофильна
Оно состоит из одного слова, имеет короткие ответы, абсолютно понятно всем испытуемым с первого же чтения. Ответы - однородные понятия с общим корнем («гидро»), но с противоположным смыслом, выражаемым неявно союзом «или». Студенты плохо запоминают смыслы таких слов без специальной тренировки, поэтому часто их путают. Введение заданий в систему автоматизированного самоконтроля заметно помогает усвоению требуемых понятий.
1) xy =9 5) число х кратно 2
2) 3y > 5x +4 6) все натуральные числа чётные
3) x2 + 5x -6 =0 7) произведение чисел 3 и 13 равно 49
4) число 5 – целое 8) любое число - корень уравнения х+3 =7
Как отмечал известный лингвист А.М. Пешковский, точность и легкость понимания растут по мере уменьшения словесного состава фразы и увеличения ее бессловесной подпочвы. Чем меньше слов, тем меньше недоразумений[9]. Правда, это не всегда так. Например, в заданиях по физике нередко приходиться оговаривать некоторые условия, которые утяжеляют содержание задания. В таких случаях полезно некоторые общие условия вынести в инструкцию для испытуемых, где можно написать, например при тестировании по физике: «g везде считать равным 10» и т.п.
Системность содержания.
Этот принцип означает подбор такого содержания заданий, который отвечал бы требованиям системности знаний. Помимо подбора состава заданий с системным содержанием важно иметь задания, связанные между собой общей структурой знаний. Это возможно только в тех случаях, когда задания связаны общей факторной структурой знаний. Такая связь определяется методами факторного анализа.
Системность содержания задания может быть усилена за счёт удвоения, а иногда и утроения. Т.е. под одним номером формулируются два, а иногда и три задания.
4) Горацио 8) Фортинбраса
За правильный ответ в каждом из сдвоенных заданий испытуемый получает по одному баллу, а в целом испытуемый может получить два балла. А там, где встречается три задания в одном, можно получить и три балла - за полное и правильное выполнение. Таким образом, оценки за такие задания могут варьировать от нуля до трёх. Это обстоятельство благотворно отражается и на повышении точности измерения, в связи с тем, что растет мера вариации баллов в каждом отдельном задании, а вместе с тем и вариация баллов по тесту в целом.
Если правильный ответ в каждом задании оценивать одним баллом, то в сдвоенных заданиях могут появиться оценки 2, 1 и 0, выставляемые, соответственно, за число правильных решений. Пример сдвоенного задания с выбором одного правильного ответа:
35. СОЛИ, ОБРАЗОВАННЫЕ СИЛЬНОЙ КИСЛОТОЙ И СЛАБЫМ ОСНОВАНИЕМ, ПОДВЕРГАЮТСЯ ГИДРОЛИЗУ ПО
1) аниону
2) катиону
3) аниону и катиону.
РЕАКЦИЯ СРЕДЫ ПРИ ЭТОМ
1) кислая
2) щелочная
3) нейтральная
36. МЕЖКЛЕТОЧНЫЕ ВЗАИМОДЕЙСТВИЯ С ПОМОЩЬЮ ЦИТОКИНОВ ОСУЩЕСТВЛЯЮТСЯ ЭФФЕКТОМ И СТИМУЛЯЦИЕЙ
1) анаболизма
2) катаболизма
38. ВТОРАЯ МИРОВАЯ ВОЙНА НАЧАЛАСЬ
1)1 сентября
2) 1 сентября
3) 14 сентября 1939г. 7) 3 июля 1945г.
4) 22 июня
ЗАКОНЧИЛАСЬ
1) 1 сентября
2) 1 сентября
3) 14 сентября 1939г. 7) 3 июля 1945г.
4) 22 июня 1941г. 8) 22 августа 1945г.
39. {HELIX POMATIA} ОТНОСИТСЯ К ТИПУ
1) Nemthelminthes
2) Annelide
3) Mollusca
4) Arthropude
КЛАССУ 1) Gasropode
2) Bivalvia
3) Nematoda
4) Crustacea
ОТРЯДУ 1) Bassommatophora
2) Lumbricomorpha
3) Copopoda
4) Stylopommatophora
В 1) Кракове
2) Варшаве
3) Вильно
4) Лодзи
5) Люблине
Если встречается три задания в одном, можно получить и три балла за полное и правильное выполнение. Таким образом, оценки за такие задания могут варьировать от нуля до трёх. За каждую ошибку один балл снимается. Например:
43. ВОСТОЧНАЯ ПЛОДОЖОРКА ОТНОСИТСЯ К
ОТРЯДУ 1) Diptera 3) Coleoptera
2) Homoptera 4) Lepidoptera
ОНА ПОВРЕЖДАЕТ
1) почки 3) бутоны
2) плоды 4) молодые побеги
ПРОТИВ НЕЕ ПРИМЕНЯЮТ
1) акарициды 3) феромонные ловушки
2) инсектициды 4) биологические препараты
44. СЯНГАН (ГОНКОНГ) БЫЛ ВОЗВРАЩЕН КИТАЙСКОЙ НАРОДНОЙ РЕСПУБЛИКЕ
1) США
2) Францией
3) Португалией
4)Нидерландами
5) Великобританией
В СООТВЕТСТВИИ С
1) совместной декларацией
2) мирным договором
3) Резолюцией ГА ООН
4) Конституцией КНР
В 1) 1993 2) 1994 3) 1995 4) 1996
5) 1997 6) 1998 7) 1998 8) 1999 ГОДУ
Сдвоенные задания открывают возможность проверить знания причинно-следственных отношений. Например:
45. ПАРОДОНТ – ЗАБОЛЕВАНИЕ ЭТИОЛОГИИ
1) воспалительной
2) дистрофической
3) идиопатической
4) вирусной
ВОЗМОЖНЫЕ ПРИЧИНЫ ЭТОГО ЗАБОЛЕВАНИЯ
1) стресс
2) патология прикуса
3) вирусные инфекции
4) хронические механические травмы
5) патология желудочно-кишечного тракта
6) неудовлетворительная гигиена полости рта
При применении сдвоенных заданий предъявляются повышенные требования к инструментальной контролирующей программе. Она должна позволять вводить сдвоенные и строенные задания, иметь решающие правила выставления оценок и позволять набирать такого рода ответы.
[1] Различия между этими понятиями см. в статье: Аванесов В.С. Композиция тестовых заданий. ТИМО _____________
[2] Аванесов В.С. Основы теории разработки педагогических заданий // Педагогические Измерения №1, 2004 года. С.15-21.
[3] 11. Lord F.M., Novick M. Statistical Theories of Mental Test Score. Addison Wesley Publ& Co.,
[4] Так, например, дело обстоит в российском ЕГЭ. Там волюнтаристски заданиям открытой формы даётся коэффициент «2», по сравнению с заданиями с выбором одного правильного ответа. А заданиям части «С» задан коэффициент «5». В сочетании с субъективно-комиссионными методами это образуют мощный канал возникновения ошибок измерения и коррупции. В итоге, например, русский язык в России лучше всего знают в Дагестане или в башкирском посёлке Кильмез. Такого рода информация прорывается иногда сквозь информационную блокаду. Незаконная практика засекречивания реальных данных ЕГЭ не позволяет оценить полную картину целенаправленного и массового искажения результатов. Не случайно в 2008 году Москва пытается полностью отказаться от ЕГЭ. См.: «В московских вузах в 2008 году не будет приема по результатам ЕГЭ». В Высших учебных заведениях Москвы в будущем году не будет приема на базе Единого государственного экзамена. Об этом ИТАР-ТАСС сообщил ректор МГУ им. Ломоносова Виктор Садовничий. …"Пока идет эксперимент, поэтому мы не будем учитывать Единый государственный экзамен, - сказал Виктор Садовничий. - Мы будем принимать, как обычно, в основном, письменные экзамены на индивидуальной основе".
Источник: GZT.ru http://www.gzt.ru/education/2007/10/14/151037.html Однако безответственный административный нажим на систему образования продолжается с ещё большим напором. См. также Аванесов В.С. Доживёт ли Единый государственный экзамен до 2009года? http://testolog.narod.ru
[5]Параллельными можно назвать такие выборочные совокупности испытуемых, в которых значения средние арифметических и дисперсий баллов в интересующих заданиях и тестах достоверно не различаются.
[6] Эрдниев П. М. Укрупнение дидактических единиц как технология обучения. В 2-х частях. Ч. 1, с.
[7] Груденов Я.И. Психологическое обоснование целесообразности широкого использования задач, не имеющих решений. \\ Новые исследования в педагогических науках. 1964, вып.2.
[8] Такой подход вряд ли верный. Полагают, что ученик должен знать, что не всякая задача и не при любых условиях может быть решена (Чуканцов С.М. "О задачах на реализованные ситуации с ложными данными. \\Математика в школе. 1977 № 2.). Против таких задач выступил Г.В.Дорофеев. Проверка решения текстовых задач. Математика в школе 1974, № 5.
[9] Цит.: Звегинцев В.А. К вопросу о природе языка// Вопросы философии, 1979, № 11.- С.67-78.