נזקים כחול-לבן
זוהר ע' ואלבוחר-אגמון, ו' (2016). נזקים כחול-לבן. הד החינוך, צ'(5), 83-80.
פרופ' ענת זוהר היא חוקרת ומרצה בבית הספר לחינוך של האוניברסיטה העברית וחברת סגל במכון מנדל למנהיגות חינוכית. בעבר הייתה יו"ר המזכירות הפדגוגית במשרד החינוך; ורד אלבוחר-אגמון עוסקת בקידום חינוך לחשיבה ולמידה בדרך החקר במזכירות הפדגוגית במשרד החינוך ומרצה להוראת מדעים במכללת אוהלו
מאמר זה מסביר את הרקע לטענות ההולכות וגוברות כנגד מבחנים מערכתיים עתירי סיכון כמו מבחני המיצ"ב, מבחני מפמ"ר, מבחני בגרות ומבחנים בינלאומיים כגון פיזה (PISA) או טימס (TIMSS). כן הוא מציג ממצאים ראשוניים מסדרת ראיונות שנערכו עם מורות ישראליות בכירות למדעים.
מבחנים מערכתיים עתירי סיכון הם אלה שכרוכים ב"שכר ועונש" למעורבים בהם כדוגמת מנהלי בתי ספר, מורים או תלמידים. הישגים גבוהים במבחנים מזכים בתגמול חיובי כמו תוספות שכר או בונוס למורים ואילו הישגים נמוכים עלולים להביא לסנקציות כמו פרסום ההישגים הנמוכים בתקשורת, נזיפות, פיטורים ואף לסגירת בית הספר. מבחן עלול להפוך לעתיר סיכון אף ללא הפעלת סנקציות של ממש, שכן די בהפעלת הלחץ על המורים כדי להשפיע על ההוראה. הוא הופך להיות כזה כשהמערכת מגיבה בהכנה נמרצת למבחנים ובהפעלת לחץ כבד על מי שקשור בהם להפסיק את מהלך הלימודים השגרתי על-מנת ללמד וללמוד לקראת הבחינה.
השימוש במבחנים מערכתיים במדינות שונות במשך כעשרים שנה מזמן בחינה של השפעותיהם לאורך זמן. במקביל, מתפתחת ביקורת נוקבת על מבחנים אלה ובמיוחד בנוגע לתרומתם למערכת החינוך.
ביקורת כללית כנגד מדידת ביצועים בתחום החברתי הושמעה על-ידי החוקר דונלד קמפבל (Campbell, 1975). טענת החוקר היא, כי ככל שמשתמשים במדד כמותי חברתי כלשהו בתהליך קבלת החלטות חברתיות, כך יהיה המדד נתון ליותר לחצים ויגדל הסיכוי שהוא יעוות וישחית את התהליכים החברתיים שהוא התכוון למדוד. זאת ועוד, אף אם הביצוע על-פי המדד הנמדד ישתפר, הביצוע הכולל ידרדר.
עקרון אחד, המשתקף מטענת קמפבל, הוא שמדד הניתן לכימות מייצג לעתים קרובות רק היבט אחד של המטרות המורכבות של הארגון. תשומת לב מוגברת להיבט זה מעוותת את שיווי המשקל בינו לבין מטרות אחרות של הארגון. עקרון שני, הקשור בטענת קמפבל הוא שהפעלת לחץ על עובדים לשפר את ביצועיהם תביא למציאת דרכים לשפר את המדד בכל מחיר, לרבות על חשבון השגת מטרות חשובות אחרות. יוצא, שהלחץ לשפר הישגים מוריד את האיכות הכוללת של הארגון.
דוגמה לעקרונות שלעיל נראית למשל בתחום המדידה שנעשתה בנוגע לתפקוד בתי החולים בתחום ניתוח הלב בארה"ב בשנות השמונים של המאה הקודמת. הממצאים מראים, שבתי החולים, שדורגו כבעלי שיעור מקרי המוות הגבוהים ביותר היו מוסדות שטיפלו בחולים עניים או בחולים שמצבם ההתחלתי היה קשה. שנה לאחר הפעלת המדד, הודו רופאים ובתי החולים שהם מסרבים לטפל בחולים קשים.
נובע מדברים אלה, שמאחר שלעובדים קל "לשחק" עם תמריצים שמבוססים אך ורק על מדדים כמותיים, אסור למערכת להישען רק על מדדים אלה, ודאי לא על מדד כמותי יחיד. במקום, על המערכת להסתמך על שילוב של מדדים כמותיים ואיכותיים תוך שימת דגש גדול יותר של האחרונים. בנוסף, עולה, שרצוי להימנע ממערכות שטומנות סיכון רב לעובדים המשתתפים בהן, בשל ההתנהגויות השליליות שהן מעוררות.
על אף הסכנות שבמבחנים עתירי סיכון, קובעי מדיניות חינוכית בעולם אימצו את השיטה של מבחנים מערכתיים סטנדרטיים שנשענים על מדד כמותי יחידי לשיפור הישגי התלמידים. נזקיהם של מבחנים אלה כוללים רמאות שיטתית, עזיבת המערכת מצד מורים, פגיעה בתלמידים חלשים ועוד. כן נכללים בנזקים אלה צמצום תכנית הלימודים הנלמדת בפועל בכיתות, הכנה מרובה לבחינה הבאה על-חשבון הוראה של תחומים שלא כלולים בה, וצמצום ההוראה רק ליעדים הנבדקים בבחינה במסגרת התחומים הכלולים בה.
הוכחה לתופעת השיפור המלאכותי בהישגים בעקבות הוראה מכוונת לקראת הבחינה נראית למשל בהשוואה שבין הישגים של תלמידים שנבחנו במבחנים עתירי סיכון בהשוואה למבחן ה-NAEP, שחובר על-ידי גוף מרכזי שאינו שייך למדינה זו או אחרת ואינו עתיר סיכון. המבחנים שחוברו במדינות עצמן הפכו למבחנים עתירי סיכון ונערכו לקראתם הכנות אינטנסיביות. השוואה זו מלמדת שבעוד שההישגים במדינות השתפרו במידה ניכרת, הישגי התלמידים במבחן ה-NAEP באותם מקצועות ומדינות לא השתפרו כלל ואף הדרדרו. מכאן, שהתמקדות רק במדד המגולם בציון אינה משקפת את המתרחש במערכת הלכה למעשה.
המאמר מתאר מחקר שכלל ראיון עם 19 מורות בכירות ומורה בכיר אחד למדעים, שמשמשים גם מדריכים למדעים במשרד החינוך או רכזי מקצוע בבתי הספר. מטרתו היתה לבחון כיצד המרואיינים תופסים את ההשפעה של המבחנים המערכתיים על תהליכי ההוראה-למידה במדעים בחטיבות הביניים בישראל. הראיונות התקיימו בסמוך למבחני ה-TIMSS, הבודקים הישגים במתמטיקה ובמדעים לכתיות ד' וח' בישראל בשנת 2011 ומבחני המיצ"ב והמפמ"ר המערכתיים במדעים.
בתקופת המחקר אף הוכרז השיפור בהישגים במבחנים מערכתיים כיעד מרכזי של משרד החינוך. לצורך זה, משרד החינוך נקט בפעולות מערכתיות ענפות למשל שינויים בתכניות הלימודים והתאמתם למפרט המבחנים הבינלאומיים, הכנת חומרי למידה ותרגול לקראת הבחינות, הנהגת מבחני מפמ"ר מערכתיים, הוספת שעות למקצועות הבחינה ותגבור בתי הספר במדריכים למקצועות אלה. בתי הספר נמצאו תחת בקרה קפדנית שבחנה אם הם אכן מלמדים את התכניות והחומרים שהוכנו לצורך זה.
המחקר העלה, שהמדיניות התקיפה של המשרד להעלאת ההישגים במבחנים המערכתיים, ההסתמכות הבלעדית על ציון מספרי יחיד, ההכנה האינטנסיבית למבחנים והמסר התקיף שהועבר לכל הנוגעים בדבר בנוגע לצורך להצליח בבחינות גרמו גם בישראל לתופעות מזיקות שמוכרות ממדינות בעולם. אלה כוללות את התופעות הבאות:
1) לחץ - כל המורים והמדריכים - ללא קשר לרמת הניסיון שלהם - דיווחו על תחושות לחץ בעוצמות שונות ועל חשש שמא יבולע להם מאת הממונים עליהם. מורים חשו לחוצים שמא לא יספיקו לעמוד בדרישות בהתאם להיקף הבחינות. מורים חשו חרדה והרגישו מאוימים. חלק מהם דיווח על קבלת נזיפות מהממונים.
2) רמאות - בראיון עלה, כי מנהלים, מורים ותלמידים נהגו ברמאות וכי תופעה זו הייתה רחבת היקף בבית הספר. המורים גילו לתלמידיהם את התשובות, מבחני המפמ"ר הגיעו למורים מבעוד מועד, חלק מהמורים הראו את השאלות לתלמידים ופתרו אותן עימם על הלוח. מורים שלא מספיקים ללמד את כל החומר מלמדים את השאלה שבבחינה או נותנים דוגמאות דומות לה. בנוסף, מורים מפנים תלמידים חלשים מחוץ לכיתה כדי שלא ישיבו על שאלות הבחינה.
3) פגיעה בהוראה, בלמידה ובהנאה - הפעלת הלחץ המערכתי לקידום ההישגים השפיעה, באופן שלילי, על איכות תהליכי ההוראה והלמידה. שינוי זה בא לידי ביטוי בצמצום במקצועות הנלמדים ובהעברת שעות ממקצועות אחרים לטובת תגבור השעות במקצועות הנלמדים לבחינה. כן הוא כלל צמצום חווית ההנאה וההנעה של תלמידים ומורים וזניחת מטרות מורכבות כמו למידה משמעותית ותהליכי הוראה לפיתוח חשיבה, לחקר וליצירתיות לטובת מטרות פשוטות הממוקדות בהצלחה בבחינה.
4) הרחבת פערים - המחקר הראה, שקיימת חוסר הלימה בין דרישות התכנית ללמד היקף רחב של נושאים - לעתים בדרגת מורכבות גבוהה - ובזמן קצוב לבין התאמת הדרישות לשונות שקיימת בין התלמידים מתוך רצון להקטין את פערי ההישגים בין אוכלוסיות שונות. לדברי המרואיינים במחקר, קצב הלמידה המהיר שנדרש בהכנה למבחנים מתאים יותר ליכולות של תלמידים חזקים ופוגע במתן מענה מתאים לתלמידים מתקשים.
לסיכום, המחקר מצביע על כך שמורים ומדריכים למדעים בישראל שהיו מעורבים בהכנה למבחנים מערכתיים עתירי סיכון מאמינים שמבחנים אלה גורמים לנזקים רבים ופוגעים באיכות ההוראה והלמידה. המחברים מציעים לפעול בשני ערוצים מקבילים: האחד, פיתוח מגוון דרכי ההערכה כך שמשקלו של המדד הכמותי יפחת וזה ישמש רק אחד מכמה מדדים – חלקם גם איכותניים. הערוץ השני יכלול הפחתת הלחץ מהמורים, הגברת האמון בהם, מתן כלים ותנאים לשיפור העבודה הפדגוגית ופיתוח דרכים חלופיות להשגת שקיפות על מה שנעשה במערכת החינוך.
ביבליוגרפיה
Campbell, D. (1975). Assessing the impact of planned social change. In G. Lyons (Ed.), Social research and public policies: The Dartmouth/OECD conference. Hanover, NH: Public Affairs Center, Dartmouth College.
הסיכום נכתב בידי ד"ר דניאל שפרלינג ממכון מופ"ת
Campbell, D. (1975). Assessing the impact of planned social change. In G. Lyons (Ed.), Social research and public policies: The Dartmouth/OECD conference. Hanover, NH: Public Affairs Center, Dartmouth College.
הסיכום נכתב בידי ד"ר דניאל שפרלינג ממכון מופ"ת