* Основни принципи на оценяване в образованието
Публикувано на 17 октомври 2017 в раздел Методика.
Колкото и да звучи странно на фона на това, че педагогиката се развива още от древността, количествените методи за изследване в тази наука се развиват сравнително скоро - главно във втората половина на 20-ти век. Причината за това се дължи на събирането на големи количества данни чрез компютърна техника, което дава възможност за по-широко използване на статистически методи. Така постепенно се обогатяват методите за оценяване в частност.
Оценяването е методика за събиране на данни за педагогически изследвания. То се извършва на базата на специфични измервания. Те от своя страна могат да бъдат различни видове в зависимост от вида на оценяването, което желаем да извършим. За разлика от измерванията на физични величини от материалния свят, измерванията в педагогиката не се базират на точни уреди. В педагогиката величините, които не могат да бъдат пряко наблюдаеми, се наричат "конструкт". Конструкт може да бъде интелекта на човек, неговото творческо мислене, критичното му мислене, и др. Поради причината, че не могат да се измерват пряко с точен уред, оценяването на конструкти в педагогиката се извършва чрез измерване на наблюдаван ефект върху обучаемия, който е постигнат вследствие от стимулиране чрез провеждане определен вид изпит. Цели се да бъде отчетена видима демонстрация на на проекция на конструкта по определени доколкото се може обективни критерии.
Основните компоненти на всеки познавателен конструкт, които могат бъдат измервани чрез изпит, са два:
- Знания за факти (приети за вярни твърдения), понятия (група обекти с общи характеристики), принципи (логически връзки между две или повече понятия) и процедури (алгоритмична последователност от действия за постигане на резултат);
- Умения за прилагане са знанията за постигане на определена цел.
Все пак имайте предвид, че оценяването на знания и умения често зависи от външни фактори, като например емоционално предразположение, здравословно състояние на обучаемия и др. Пиша това, за да подчертая отново, че измерванията в педагогиката са неточни.
Изпитите се извършват чрез различни видове тестове. "Тест" ще наричаме инструмент за измерване и описание на познавателен конструкт. Не го отъждествяваме само и единствено с познатите "тестове с избираем отговор" - тестовете могат да бъдат много различни видове. Резултатът от измерването чрез тест обикновено е числова оценка. Знанията е подходящо да се оценяват на изпити чрез задачи с избираем отговор, докато уменията е подходящо са се оценяват чрез задачи със свободен отговор (това разбира се не са задължителни принципи, а само препоръчителни).
Има много различни видове тестове, но общото при всички тях е, че във всеки трябва да има стандартизирани условия за провеждане на измерването. Това най-просто казано означава, че при съпоставянето на оценките на различни индивиди със сходни знания и умения трябва да се получават сходни оценки. Всеки тест се състои от една или повече задачи, които обучаемият трябва да решава. На всяко решение на всяка задача се съпоставя число - брой точки, - което се използва като компонент за изчисление на крайното обобщено число - суров тестов бал (ще опишем това понятие по-подробно надолу), който води пряко или непряко до получаването на оценка. Пряко ще бъде тогава, когато тестовия бал от отделен тест се използва за поставяне на оценката на личните постижения на отделен обучаем, а непряко когато служи за съпоставяне на постиженията на обучаемия с тези на други обучаеми (състезание) или когато се използва като компонент от обобщена оценка за цялата изследвана популация.
Измерванията на тестови бал се извършват на базата на различни видове скали. Те основно са четири на брой:
- Номиналната скала категоризира изследваните обекти според техни характеристики. Това може да е например разграничението им по пол (мъж или жена), местоживеене, вид училище, и др. С номиналната скала не се извършва аритметична обработка на резултатите от изследването, а те се използват за бъдещи проверки на хипотези (например дали момичетата се справят по-добре от момчетата, дали децата от математически гимназии имат по-висок успех по ИТ учебни предмети, и т.н.);
- Ординалната скала (още позната като "Ликертова") подрежда обектите на базата на определени техни характеристики. Най-често се вижда при провеждането на анкети. Например ако дадем една поредица от различни конкурентни продукти на множество хора и поискаме от тях да изкажат собственото си мнение за качеството на всеки отделен продукт като му поставят етикет във вид на оценка от 1 (не харесвам) до 5 (харесвам), то впоследствие можем да извършим класация на продуктите на базата на общия брой точки, които са натрупали. Именно тази класация (кой е първи, втори, трети, ...) е подреждане, което е извършено на базата на оценка чрез ординална скала. Този вид скала изисква поставянето на двуполюсен въпрос, т.е. такъв, в който има две взаимоизключващи се крайности (горещо-студено, тъмно-светло, т.н.). Незадължително, но често се използват нечетен брой деления (по този начин се позволява поставянето на избор в средата, който се счита за неутрален). Отново незадължително, но силно препоръчително е деленията да са равномерни;
- Рационалната скала съдържа равномерни деления и подрежда обектите според фиксирано начало (нула). Това например може да е класическото поставяне на оценка от училище - скала от "Слаб 2" до "Отличен 6", където за фиксирано начало слагаме оценка "Слаб 2" (ученикът не е успял да реши нито една задача), а делението е според броя решени задачи (например ако имаме четири задачи с еднаква трудност, то можем да кажем, че всяка от задачите носи по една единица към оценката на ученика). Виждате, че тази скала е абсолютна (не се променя). Измерванията на физични обекти се извършват по рационални скали (дължина, тежест, т.н.). Възможна е смяна на мерните единици (километри в мили, оценка от шестобалната система в друг вид абсолютна скала, и др.), но не е позволена промяна на нулата;
- Интервалната скала отново съдържа равномерни деления и също подрежда обектите според начало (нула), но те не са фиксирани, т.е. можем да променяме дължината както на деленията, така и да местим началото. Интервална скала може да се използва например за провеждане на тестове с избираем отговор, в които всяка задача носи точно определен брой точки, но общия сбор от точки не дава моментално крайна оценка, а крайната оценка се "нагажда" спрямо крайните резултати от всички тестове на всички обучаеми. Ако например тестът е бил с възможен брой точки от 0 до 100 и Иван е получил 80 точки, това не означава автоматично, че той няма отлична оценка, понеже не е решил всичко правилно - ако всички останали обучаеми са получили значително по-малко точки от него, това означава че тестът е бил прекалено труден и тогава може да трансформираме скалата по различен от класическия начин.
Вижда се, че номиналната и ординалната скали се използват по-скоро за групиране на обучаемите според техни характеристики, докато интервалната и рационалната скали се използват за тяхното оценяване.
Оценяването от своя страна може да се класифицира се раздели основно на два вида:
- Нормативно оценяване има тогава, когато съпоставяме резултатите на един обучаем спрямо оценките на други обучаеми от групата, която изследваме. Така например един можем да поставим оценка "отличен" по математика на ученик от езикова гимназия, защото той е с най-високи резултати от своят клас, но това не значи, че ако знанията и уменията на същия ученик бъдат измерени в група от други ученици, които са от математическа гимназия, то той би имал същата отлична оценка спрямо тях:
- Критериално оценяване има тогава, когато имаме фиксирани (абсолютни) изисквания за това какви постижения трябва да демонстрира даден обучаем, за да получи точно определена оценка. Това например са "държавни образователни стандарти", които дефинират точно какво трябва да знае и може даден ученик, за да премине в по-горен курс на обучение.
Видът на оценяването до известна степен предопределя и скалата му. Нормативното оценяване видимо променя нулата спрямо средното ниво на обучаемите в групата, т.е. то изисква наличие на интервална скала, докато критериалното оценяване винаги има фиксирана нула, т.е. то работи по рационална скала. Обикновено при нормативното оценяване за деление на скалата се взима стандартното отклонение на групата. Така краищата на скалата не са фиксирани (както слабата, така и отличната оценка се менят в зависимост от групата, която се изследва). При критериалното оценяване и двата края на скалата са фиксирани (т.е. възможно е да не се получава нормално разпределение на оценките ако тестът е прекалено труден или прекалено лесен).
При провеждане на тестовете често се използва едно понятие наречено „суров тестов бал“, което се явява междинно измерване преди получаването на крайна оценка. Например суров тестов бал може да бъде "брой решени задачи" в тест с избираем отговор. При критериално оценяване с рационална скала броя решени задачи би могъл директно да се трансформира към крайна оценка, но при нормативно оценяване с интервалната скала суровия тестов бал първо се обработва статистически (смята се средното за групата, дисперсията, от там се определя нулата и дължината на интервала) и едва след това се трансформира към оценка. Тук само ще споменем, че суровият тестов бал не се използва само и единствено за изчисляване на оценките на обучаемите, но също така е в полза и на съставителите на задачи, защото може да се използва за проверка на измерителните качества на задачите, както и за извършване на проверка за надежност на теста. Тези неща са извън обхвата на настоящата статия, но като минимум трябва да се знае, че суровите тестови балове от различни тестове не е коректно да бъдат сравнявани преди да бъде извършена статистическа обработка! Това, че два теста са по един и същи учебен предмет, и имат дори равен брой задачи, по никакъв начин не означава веднага, че суровите тестови балове са сравними. В единият тест може задачите да се окаже, че са били значително по-трудни отколкото тези в другия тест. Това е често валидно при нормативни оценявания, но понякога е проблем дори при критериални.
За финал ще кажем, че често едно или две от деленията на скалата при критериално оценяване се дефинират като „прагови стойности“. При една прагова стойност имаме критерий за покриване или непокриване на изискванията. Например при матурите има една прагова стойност, която ако не бъде покрита не се дава право на ученика да получи диплома за завършено средно образование. Друг пример за една прагова стойност са оценките по предмета "физическа култура" - покрил или непокрил изискванията от "норматива". Две или повече прагови стойности се използват по-рядко. Например в университетите има една прагова стойност за придобиване на диплома за завършване на висше образование, която е "да има поне среден 3 по всички предмети", но има и втора прагова стойност, която се използва при кандидатстване в матистратура - "да има среден успех по-голям или равен на добър 4", - както и трета прагова стойност по време на следването им когато кандидатстват за получаване на стипендия. Тук е моментът да се отбележи, че при някои изследвания се поставя "интервал на праговата стойност", т.е. границата между "покрил" и "непокрил" изискванията не е фиксирана точка, а сама по себе си е интервал. Това се прави тогава, когато измерванията са неточни и допускат грешка. Например ако даден спортист е близо, но все пак под критерия на норматива за допускане до състезание, може да му бъде даден допълнителен шанс да опита да се яви пак, докато ако друг спортист се представя трагично и е далеч от норматива, може да не получи втори шанс въобще.
Комбинирайки темата за суров тестов бал и прагова стойност, ще завършим с един пример. Вероятно сте чували от медиите когато например в Министерство на образованието се дискутира каква да е границата за брой точки на оценка "Слаб 2" от матурите. Когато прекалено много или прекалено малко хора са попаднали под праговата стойност за получаване на диплома се счита, че в тези случаи е допустимо да се "снижи" или "увеличи" праговата стойност, за да не се предизвикват социални проблеми. Тоест при матурите имаме един особен вид оценяване, което е критериално по рационална скала, но с плаваща прагова стойност, която "повлича" със себе си едниния край на скалата тогава, когато настъпи нужда (за щастие не се случва често, защото задачите се изготвят много внимателно от специалисти). Това е и причината деленията на оценките на матура между среден 3 и отличен 6 са да с точност 0,01 единици (например може да получите "много добър 4,68"), но деления между оценки "Слаб 2" и "Среден 3.00" въобще да няма.
Добави коментар