ChatGPT: מה השתנה בחצי שנה?

מילות מפתח: ChatGPT בינה מלאכותית

עדי ציובן, ע' (2023). ChatGPT: מה השתנה בחצי שנה? תל אביב: מכון מופ"ת

עיקרי הדברים:

  • בתי הספר של ניו יורק כבר חזרו בהם מהאיסור שהטילו על תלמידים להשתמש בבינה מלאכותית
  • מחצית מהסטודנטים באוניברסיטת קיימברידג' השיבו בסקר כי השתמשו ב- ChatGPTכסיוע בכתיבת עבודות
  • יש המנבאים שאפליקציות מבוססות בינה מלאכותית יוכלו בתוך כשנתיים להיות מורות פרטיות נהדרות ללימוד שפות
  • חשוב לפתח את היכולת להציג למחשב שאלות-המשך שמדייקות, מחדדות ובודקות את האמינות של תשובות המכונה
  • חיוני להבהיר לתלמידים ולמורים את הצורך והחובה להתייחס לתוצרי המכונה כאל המלצה שצריך לבדוק ולאמת את נכונותה ואת התאמתה
  • מקובל לדבר על Zero shot prompting לעומת Multi shot prompts
  • המונח הראשון, שמכוון לפרומפט כללי אחד, משול לניסיון לצלוח נהר בקפיצה גדולה אחת
  • המונח השני מכוון לאסטרטגיה של הכנת פרומפטים רבים ונקודתיים, בסדרה הגיונית, מה שמשול לרעיון לבנות פלטפורמות קטנות על המים ולהשלים את צליחת הנהר בכמה קפיצות קטנות
  • השיטה הראשונה מתאימה כשאנחנו בטוחים ביכולות של הכלי בנושא המבוקש, או כשמדובר בהקשר שבו אין תשובה נכונה ולא נכונה, כמו בסיעור מוחות (למשל, כשמבקשים מהמחשב הצעות לסיסמת פרסומת למוצר מסוים)
  • בהקשרים אחרים, יש להעדיף את השיטה השנייה ולהציג למחשב סדרת שאלות נקודתיות

ביצועי הבינה המלאכותית בעברית משתפרים, בהקשרים מסוימים אפשר להשתמש בה בזהירות ובשום שכל, אבל ביצועיה בעברית עדיין נופלים מאלה באנגלית. עם זאת, בכל שפה הקסם עדיין נמצא בבינה האנושית, ולא ניתן לוותר עליה.

לסרטון הרצאה המלאה

לרכישת אוגדן פרומפטים מנצחים ללמידה ולהוראה

תוכנות הבינה המלאכותית מתבססות על אלגוריתמים סטטיסטיים, ולא באמת מבינות את העולם, את השאלות שמוצגות להן או אפילו את התשובות שהן עצמן מייצרות. המחשב לא באמת מבין שפה אנושית, אלא רק מספרים. למעשה, כל תוצר שאנחנו מקבלים מהמחשב – סרטון, תמונה או טקסט – היה נתון סטטיסטי לפני שהוא הפך למילים או לדימויים ויזואליים. עם זאת, מדובר ככל הנראה במהפכה טכנולוגית אדירה, שתשנה תחומים רבים ובהם החינוך. תשנה, אבל לא תהרוס: עדיין יהיה מקום למורים אנושיים, לבתי ספר, ללימודים ולהוראה.

דוגמה שמביעה את הצורך בשינויים בתחום החינוך אפשר למצוא בסקר שבו השיבו מחצית מהסטודנטים באוניברסיטת קיימברידג' כי השתמשו ב- ChatGPTכסיוע בכתיבת עבודות. בהקשר זה, ניתן לציין כי בתי הספר של ניו יורק כבר חזרו בהם מהאיסור שהטילו על תלמידים להשתמש בבינה מלאכותית.

שימושים אפשריים של בינה מלאכותית בלימודים:

  1. הצגת שאלות לשם קבלת מידע כללי.
  2. קבלת עזרה בהכנת שיעורי בית (עזרה בלבד, לא החלפה של התלמיד).
  3. קבלת סיוע בכתיבה: בקשת משוב והצעות לתיקון ושיפור על טקסטים שחיברנו.
  4. לימוד שפה: יש המנבאים שאפליקציות מבוססות בינה מלאכותית יוכלו בתוך שנה-שנתיים להיות מורות פרטיות נהדרות ללימוד שפות.
  5. סיוע בחיבור קוד, או בבדיקת קוד.
  6. קבלת עזרה טכנית ומעשית: ניתן לשאול את הבינה המלאכותית איך כדאי לבצע משימה מסוימת, שלב אחרי שלב.
  7. התעדכנות בחדשות ובאירועים אקטואליים.
  8. ביצוע משחקי תפקידים וסטורי-טלינג.
  9. כתיבת סיפורים, יצירת עולמות ותרחישים בדיוניים או אפשריים.
  10. ניהול שיחה: הבינה המלאכותית יכולה להיות בת שיח נחמדה, עדינה, אדיבה ולא תוקפנית – שבתנאים מסוימים יכולה לשפר את התחושה, ולסייע בעבודה בפיתוח יכולות חברתיות ורגשיות (SEL: social emotional learning).

בתחילת מרץ 2023 השיקה חברת OpenAI דגם משוכלל יותר, Gpt-4, שפתוח למנויים בתשלום לא גבוה. יכולותיו גבוהות בצורה ניכרת מהמודל הקודם, והוא הצליח לעבור בהצלחה רבה מבחני לשכה של עורכי דין ורואי חשבון. המודל החדש גם פותר חידות היגיון ובעיות מילוליות. התשובות המילוליות שהוא נותן הרבה פחות תבניתיות ושבלוניות מהמודל הקודם, GPT-3.5 שהושק בנובמבר 2022 והיה הראשון שפרץ לתודעת הציבור הרחב. הטקסטים ש-Gpt-4 מייצר נראים גמישים ואנושיים יותר.

אמנם, יש כלי בדיקה ותוכנות למיניהן, אבל ב-60% מהמקרים הם טועים לחשוב שטקסט שחיבר Gpt-4 חובר בידי בן אנוש, לעומת 20% של טעויות מסוג זה לגבי טקסטים שחיבר Gpt-3.5. מצד שני, למרות היכולות משופרות –האתגרים נשארו: התשובות שמתקבלות כלליות מדי, לעיתים המידע שגוי, מומצא-לחלוטין או לא מעודכן.

אבל יש כמה פתרונות: Gpt-4 מאפשר לחפש באינטרנט העדכני, כלומר מספק מידע מעודכן, וגם נותן הפניות נכונות ומראי מקום מדויקים למקורות אמיתיים של מידע, שמאפשרים לבדוק את אמינות התשובה המתקבלת.

Gpt-4 מאפשר גם לבצע חישובים מתמטיים גבוהים באמצעות שפה טבעית, כולל הצגת הדרך שבה הגיע לפתרון במילים ובנוסחאות.

האתגר העיקרי: ללמוד לחבר פרומפטים

האתגר שהוא אולי הגדול ביותר של מערכת החינוך, ולא רק שלה, הוא לרכוש ולשכלל את המיומנות לחבר פרומפטים, שאילתות, מתאימים, כולל שאלות המשך שמדייקות, מחדדות ובודקות את האמינות של התשובות שנותנת המכונה. אחרי הכל, מה שנכניס למערכת, זה מה שנקבל ממנה בסופו של דבר.

חיוני להבהיר לתלמידים ולמורים את הצורך והחובה להתייחס לתוצרי המכונה כאל המלצה שצריך לבדוק ולאמת את נכונותה ואת התאמתה.

אם השאלה גדולה או כללית מדי, יעלה הסיכוי לטעויות. ניתן לומר כי "הבעיה" היא בבינה המלאכותית, ו"הפתרון" הוא בבינה האנושית.

בהקשר זה, מקובל לדבר על Zero shot prompting לעומת Multi shot prompts.

המונח הראשון, שמכוון לפרומפט כללי אחד, משול לניסיון לצלוח נהר בקפיצה גדולה אחת; המונח השני מכוון לאסטרטגיה של הכנת פרומפטים רבים ונקודתיים, בסדרה הגיונית, מה שמשול לרעיון לבנות פלטפורמות קטנות על המים ולהשלים את צליחת הנהר בכמה קפיצות קטנות.

השיטה הראשונה מתאימה כשאנחנו בטוחים ביכולות של הכלי בנושא המבוקש, או כשמדובר בהקשר שבו אין תשובה נכונה ולא נכונה, כמו בסיעור מוחות (למשל, כשמבקשים מהמחשב להציע הצעות לסיסמת פרסומת למוצר מסוים). בהקשרים אחרים, יש להעדיף את השיטה השנייה.

כך לדוגמה, בשיטה הראשונה ניתן לבקש מהמחשב "תכנן פעילות לימודים לכיתה ז' בקורס מבוא לאמנות של ימי הביניים". לרוב, התוצר יהיה בינוני, כללי ולא תמיד מדויק. בשיטה השנייה ניתן לעשות הטרמה (Priming ), כלומר להכין את המחשב לקראת המשימה שאנחנו נותנים לו. זה הצעד הראשון באסטרטגיית המולטי-שוט-פרומפטינג. לאחר מכן יש להציג למחשב סדרת שאלות: תאר לי מהי אמנות בימי הביניים, תן רשימה של חמישה אמנים בולטים מימי הביניים, הסבר לי מהי אמנות של ימי הביניים ברמה של תואר ראשון בטון אקדמי וכו'.

כדי לחסוך זמן, יש להשתמש בשיטות עבודה מתאימות. לצורך זה ניתן להיעזר בחוברת אוגדן פרומפטים מנצחים ללמידה ולהוראה שהכין מרכז המו"פ של מכון מופ"ת, לפי הטקסונומיה של בלום.

לדוברי עברית, מומלץ להשתמש בכלי החינמי (נכון ליוני 2023) Claude, מנוע בינה מלאכותי של מתחרה של OpenAI בשם Anthropic.

לסיכום:

  1. הצ'ט הוא כלי סטטיסטי שלא מבין מה אנחנו כותבים, ולא מהו הוא-עצמו כותב.
  2. הכלי השתנה והשתכלל מאוד בחצי השנה הראשונה מאז יציאתו.
  3. חיוני להקפיד לבדוק את התשובות המתקבלות, שעלולות להיות שגויות, בלתי מעודכנות או לא מתאימות.
  4. גרסת GPT-4 הרבה יותר טובה מגרסת 3.5, אבל גם לה יש מגבלות, ולכן מה שחשוב הוא מה שאנחנו מכניסים למערכת:
  5. פרומפטים טובים, ממוקדים ומדויקים, יניבו תוצאות טובות; פרומפטים כלליים מדי יניבו תוצאות רעות, ויגרמו לכם להירטב בנהר שאתם מבקשים לצלוח.
  6. כלים ליצירת פרומפטים טובים ניתן למצוא באוגדן הפרומפטים של מכון מופ"ת.
  7. Claude הוא כלי בינה מלאכותית שביצועיו בעברית טובים בהרבה מאלה של המתחרים.
    עדיין אין תגובות לפריט זה
    מה דעתך?
yyya