גיוון לקסיקלי: תיאוריה, פרקטיקה ומה שביניהן
אבו רביעה, א"ח (2020), גיוון לקסיקלי: תיאוריה, פרקטיקה ומה שביניהן. לקסי קיי, 13, 5-3
למרות החשיבות הרבה המוקנית לאוצר המילים במבחני השפה השונים, אין הגדרה פרקטית לאופן שבו הבודק יכול להעריך אותו. זו בעיה חשובה, מפני שבכל מבחני הבגרות בעברית של דוברים ילידים ושל דוברי שפה שנייה יש שאלות על אוצר המילים ושאלות כתיבה שבהן נבדק הלקסיקון. אוצר המילים אינו חשוב רק אצל תלמידים, אלא גם אצל סטודנטים – הנדרשים להפגין שליטה טובה בעברית כתנאי לקבלתם במוסד (אם בבחינות הבגרות והפסיכומטרי בעברית, ואם במבחן יע"ל).
המורים תופסים באופן שונה גיוון לקסיקלי ועושר לקסיקלי, מפני שהם מלמדים אוכלוסיות שונות בעלות יכולות לשוניות שונות. נוסף על כך, מורים הנבדלים זה מזה בכשירות הלשונית שלהם מעריכים באופן שונה את אותם הטקסטים. חשיפת המורים למחקרים הלשוניים על הערכת אוצר המילים, ובעיקר למחקרים העוסקים בגיוון הלקסיקלי, עשויה להקל עליהם משמעותית את המלאכה.
למשל, המורים יכולים לבדוק את גיוון אוצר המילים בכתיבה של התלמידים או של הסטודנטים באמצעות מדד ה־TTR רק בשלוש השורות הראשונות (ראו הסבר בפסקה הבאה). כך יהיו להם נתונים כמותיים מדויקים ובאמצעותם הם יוכלו לתת ציון מדויק יותר לגיוון אוצר המילים של הכותב.
TTR, או token-type ratio , היא הדרך הנפוצה ביותר לחישוב גיוון לקסיקלי. נוסחה זו, שהציג לראשונה ונדל ג'ונסון ב-1939, בודקת את הגיוון הלקסיקלי בטקסט באמצעות ספירת התבניות (types) המילים השונות, חלקי כלל התמניות (Tokens) של המילים בטקסט. תבנית היא ערך מילוני על נטיותיו השונות. למשל, המילים: "ילדים" ו"ילדות" נספרות כשתי תמניות של תבנית אחת – התבנית "ילד"; במשפט: "המורה שיבח את התלמיד ואת הוריו"- יש 6 תמניות ו־5 תבניות ("את" מופיעה פעמיים).
ככל שמספר החזרות על תבנית קטן, הגיוון הלקסיקלי עולה. גיוון לקסיקלי גבוה מצביע על אוצר מילים עשיר של הדובר או של הכותב, שכן בשל גיוון זה אין הוא צריך להשתמש בתמניות רבות של כל תבנית.
מחקרים שונים הצביעו על חיסרון מתודי במדד ה-TTR: הוא מושפע מאוד מאורך הטקסט. ההסבר לירידה זו בערכי ה־TTR עם התארכות טקסט הוא שהתבניות של האדם מוגבלות ואילו תמניותיו אינן מוגבלות. כלומר, לאדם יש מספר מסוים של מילים שונות (תבניות) זמינות על נושא כלשהו, אבל הוא יכול לכתוב או להגיד אין־סוף מילים (תמניות) על אותו נושא. יתר על כן, לעיתים קרובות הכותב או הדובר חוזר על תבניות כלשהן לשם חיזוק הטענה או לצרכים פרגמאטיים אחרים, כמו הדגשת הרעיון. מחקרים הראו שעם העלייה בגיל הנבדקים (עד לרמת כשירות מסוימת), ה־TTR דווקא יורד בשל העובדה שאורכי הטקסטים עולים עם הגיל.
חיסרון זה העסיק חוקרים רבים, והם ניסו להציע פתרונות כדי להתגבר עליו. למשל, בגישת "אוצר המילים התיאורטי מוצעת בחירה רנדומאלית של מספר מילים מהטקסט ברצף או לא ברצף, מיונן לתבניות השונות וחישוב הגיוון הלקסיקלי. כך ניתן למדוד טקסטים באורכים שונים מבלי שאורכם ישפיע על החישוב.
לסיכום, חשיפת המורים למחקרים לשוניים על הערכת אוצר המילים יכולה גם לסייע לתהליכי המחשת מושגים מופשטים. בעקבות כך בדיקת מושגים אלה, שעד כה הייתה שונה מבודק לבודק, אמורפית ותלויה באינטואיציה אישית, תהפוך לברורה, לממוסדת ולבלתי־תלויה בגחמות אישיות. יתרה מזו, הבנת ההיגיון העומד מאחורי בדיקת הגיוון הלקסיקלי יכולה להיטיב את ההערכה של הכתיבה, שכן הבודק נעשה מודע לגורמים המשפיעים על הבדיקה, כגון אורך הכתיבה, ומתחשב בהם.