אפילו בתקופה כזאת, בוחנים את התקשוב החינוכי

ארבעה וחצי חודשים עברו מאז המאמרון האחרון בבלוג הזה שהתפרסם דווקא ב-6 לאוקטובר. לא מדובר בעבר כל כך רחוק, אבל לפעמים נדמה שהחיים של אז שונים לחלוטין מאלה של היום. במשך תקופה ארוכה הראש לא היה פנוי לענייני תקשוב, וכאשר סוף סוף הרגשתי שאולי כבר מתאים לחזור למשהו דומה לשגרה (ושהעיסוק בתקשוב אולי יעזור להחזיר אותי לשגרה) שאלתי את עצמי אם אצל הקוראים המעטים של הבלוג הזה יש ראש לעסוק בתקשוב החינוכי. גם אם בעולם מעבר לים כתבות מעניינות בתחום המשיכו להתפרסם, היה לי קשה לחזור לכתיבה עליהם – הרי אותי העסיקו דברים בוערים יותר, וניחשתי שכך גם אצל הקוראים.

ובכל זאת, התקשוב החינוכי ממשיך לצעוד, או אולי לזחול, קדימה. (זה איננו המקום לבחון אם הכיוון הוא באמת קדימה). אבל אחרי ארבעה וחצי חודשים של דממה כאן כמעט שכחתי איך כותבים. ממילא, בחודשיים הראשונים בקושי הצצתי בדברים שהתפרסמו בתחום. אבל במשך החודשיים האחרונים סימנתי לעצמי מספר הולך וגדל של פרסומים שנראו לי ראויים להתייחסות, ונוצרה בעיה חדשה – קשה להחליט במה להתחיל. מה גם שאחרי הפסקת כתיבה כל כך ארוכה נעשה קשה לחזור למשהו שפעם היה הרגל. לאור כל זה נדמה לי שהגיוני להתחיל בנושא שהיה, וכנראה נשאר, החם ביותר – הבינה המלאכותית היוצרת (Generative AI).

לפני חודש נטשה סינגר, בניו יורק טיימס, פרסמה כתבה ארוכה:

Will Chatbots Teach Your Children?

סינגר מדווחת על פיתוח של אקדמיית ח’אן – בוט מבוסס AI שלפי סלמאן ח’אן עשוי לחולל מהפכה בחינוך. אולי ב-7 באוקטובר מדינת ישראל השתנתה ללא הכר, אבל בתקשוב החינוכי הכל כנראה נשאר כפי שהיה – אותו העדר צניעות האופייני לקברניטי הדיגיטליות שולט בו וממשיכים להבטיח לנו שבעזרת הכלים שהם מפתחים צפוי לנו עתיד חינוכי זוהר. סינגר מצטטת מהרצאת TED מלפני שנה שבה ח’אן הכריז שה-AI עתידה לחולל את השינוי החיובי הגדול ביותר אי-פעם בחינוך:

And the way we’re going to do that is by giving every student on the planet an artificially intelligent but amazing personal tutor.

סינגר איננה חדשה לתחום, ולכן כראוי היא מזכירה לנו שהחלום שרובוט זה או אחר ילמד תלמידים איננו חדש. היא סוקרת בקצרה כמה מהנסיונות המוקדמים בבניית “מכונות הוראה” משנות ה-60 של המאה הקודמת. מעניין שהיא איננה מזכירה את הסיפור הקצר של איזק אסימוב מ-1951 – The Fun They Had (יש גם תרגום לעברית) – שמתרחש בעתיד הרחוק -2157. גיבורת הסיפור, ילדה בגיל בית הספר, לומדת לבדה בבית באמצעות רובוט ומגלה שבתקופה מוקדמת יותר תלמידים למדו בכיתות עם ילדים אחרים. היא מהרהרת שזאת בוודאי היתה חוויה חיובית יותר מאשר מה שהיא חווה מול הרובוט שלה.

כידוע, הנסיונות ההיסטוריים שסינגר מזכירה לא צלחו. אבל אין זה אומר שבאופן עקרוני בוט מבוסס AI איננו יכול להקנות ידע בצורה מוצלחת. יכולות ה-AI גדולות אין-עונים מאלה של המכונות של שנות ה-60. ובכל זאת יש כאלה שסבורים שהסיכוי להצלחה עדיין קלוש. ג’פרי יונג, בכתבה ב-EdSurge, שגם היא התפרסמה לפני חודש, מביא את דבריו של סאטיה ניטה (Satya Nitta) שהוביל צוותי פיתוח ב-IBM ועבד על הפיתוח של Watson. ניטה טוען שעל אף ההישגים האדירים של ה-AI:

We’ll have flying cars before we will have AI tutors. It is a deeply human process that AI is hopelessly incapable of meeting in a meaningful way. It’s like being a therapist or like being a nurse.

(אגב, הכתבה של יונג מצטט את אותם הדברים של ח’אן שהבאתי מהכתבה של סינגר.)

כמי שפעמים רבות הביע ספק כלפי יכולת ה-AI לחולל שינויים מפליגים בחינוך, עלי להודות שקשה לא להתרשם מהישגיה. כמעט מידי יום ה-AI כובשת שטחים “אנושיים” חדשים, ולאור זה אני נמנע מלזלזל ביכולות האלה (אולי זה מחשש שה-AI תזכור שפקפקתי ביכולותיה ואי-שם בעתיד תחליט להתנקם בי). אבל בעיני נקודת התורפה של חזון המורה הרובוטי איננה שאין סיכוי שהוא ייבנה. דווקא אני סבור שבצורה זאת או אחרת יהיו מורים רובוטיים מבוססי AI בחינוך. הבעיה שלי עם הבוטים האלה נובעת מכך שהם מתבססים על תפיסה מעוותת של למה אנחנו לומדים. לקראת סיום הכתבה שלה סינגר מציינת שחזון פיתוח הבוט של ח’אן מבוסס בחלקו על אחד הספרים של סופר המדע הבדיוני ניל סטיבנסון (Neal Stephenson). לפי סינגר, באותו ספר:

an imaginary tablet-like device is able to teach a young orphan exactly what she needs to know at exactly the right moment

עבורי הקשר כאן ללמידה די עקום. אם יש ברשותי מכשיר שמסוגל להגיד לי “בדיוק את מה שעלי לדעת בדיוק מתי שאני צריך לדעת אותו”, אין כאן הוראה או למידה. בעצם, במצב הזה אין כבר צורך בהוראה. אם המידע הדרוש לי זמין ברגע הנכון, אוכל להיות בור ועם הארץ ולסמוך על הבינה המלאכותית שידאג לכך שלא אמעד. אם יש ברשותי “מורה” AI כזה אין בכלל צורך ללמוד דבר היות והלמידה מאפשרת לי להמנע ממצבים בעייתיים. הרי ה-AI כבר תדאג לכך שאינני נתקל במצבים כאלה.

“חזון” כזה מופיע ברבות מהתחזיות הטכנולוגיות שקברניטי הדיגיטליות מנבאים לנו. לא יהיה צורך בהתלבטויות או בהחלטות קשות – אלה יטופלו על ידי אותה בינה מלאכותית ש-“מבינה” את המציאות הרבה יותר טוב מאיתנו. הגישה הזאת מזכירה את התלונה שמייחסים לפבלו פיקאסו: “מחשבים הם חסרי תועלת. הם יכולים רק לתת לך תשובות”. היזמים האלה בונים עבורנו מציאות חסין אידיוטים, או לפחות חסין גורמים אנושיים שעשויים לשבש את גן העדן הטכנולוגי שנרקם עבורנו על ידי ה-AI. קברניטי הדיגיטליות כנראה אינם מבינים שמטרה מרכזית של הלמידה איננה שנימצא במציאות נטולת קשיים, אלא שתהיה לנו היכולת לצלול לתוך מציאות מורכבת ולפלס לעצמנו דרך תבונית, מוצלחת ומקורית להתמודד איתה, ולהנות מההרפתקה הזאת.

מידע מכובס היטב?

הנסיון מלמד שעל אף כל הכוונות שלי להקדיש לפחות חלק מכל קיץ לכתיבה לבלוג הזה, תמיד עולים עניינים אחרים והכתיבה לבלוג נדחקת הצידה. קיוויתי שבמשך הקיץ הזה אצליח לכתוב ביקורות על שני ספרים (שכבר התפרסמו לפני מספר שנים) שקשורים לתקשוב החינוכי. גם אם הספרים כבר אינם חדשים, לטעמי הם חשובים להבנת התחום. לכן בתחילת הקיץ התחלתי לאסוף את הפתקאות שלי ולארגן אותן למשהו פחות או יותר קוהרנטי. אבל כרגיל, הכוונות לא הפכו למעשים, ולקראת סוף הקיץ אני מגלה שהדבר היחיד שהצלחתי לכתוב עבור הבלוג הוא פתיחה יחסית קצרה למאמרון המשך למשהו שפרסמתי כאן עוד בחודש אפריל. את הפתיחה הזאת התחלתי בסוף יוני, ואולי אחרי איחור כל כך ארוך ראוי שהיא פשוט תיגנז. אבל בעיני הנושא עדיין רלוונטי, לא רק בתחום היחסית צר של החינוך, אלא באופן כלל “מידעי”. ולכן …

עוד בחודש אפריל (בגירסה המקורית של המאמרון הזה כתבתי “לפני קצת יותר מחודשיים”) קבלתי על השילוב של כלים כמו ChatGPT לתוך חיפוש מידע באינטרנט. טענתי שהשילוב הזה עתיד להעניק לנו “תשובות”, כאשר צריך להיות ברור שלפי תפיסה חינוכית בריאה “תשובות” אינן המטרה שאליה צריכים לשאוף. טענתי שכלים כמו ChatGPT מגישים לנו מידע שהוא ארוז היטב ובצורה משכנעת, וכתוצאה מכך המחפש איננו חש צורך לשאול אם המידע הזה אכן “אמין” או “נכון” אלא פשוט מקבל אותו כמוסמך. המצב החדש הזה שונה מאשר חיפוש המידע האינטרנטי ה-“מסורתי”, אותו חיפוש שעד היום ערכנו באמצעות מנועי חיפוש. בחיפוש ה-“מסורתי” התוצאות של החיפושים שלנו הוצגו כ-“הצעות” – קישורים שמזמינים אותנו להקליק עליהם, וכך לצלול פנימה לתוך מרחבי מידע שונים ומגוונים. קיבלנו על עצמנו את התפקיד של הערכת המידע וגיבוש דעה כלפי התוצאות השונות. בסביבה החינוכית החיפוש הראשוני הזה היה בסך הכל התחלה של תהליך – תהליך שהזמין אותנו לקבוע “דעה” אישית, ויש לקוות מנומקת, על הנושא אותו ביקשנו לחקור. נדרשנו למלא תפקיד פעיל בתהליך איסוף המידע – לשקול את פרטי המידע השונים שקיבלנו ולברור ביניהם לקראת נקיטת עמדה. באותו מאמרון מחודש אפריל הבעתי את דעתי שה-“תשובות” המוגשות לנו דרך טקסט שנוצר על ידי ChatGPT לכאורה מייתרות את שלב ההערכה ובכך מהוות סכנה לימודית מדאיגה.

עד כאן עיקר הטענה שלי באותו מאמרון מחודש אפריל. וכאילו אותה סכנה לא היתה מספיק בעייתית, לקראת סוף יוני, ב-The Verve, ג’יימס וינסנט (James Vincent) תיאר סכנה נוספת – סכנה שאפשר לכנות אותה לא לימודית בלבד, אלא כלל מידעית. הוא ביטא את הסכנה הזאת בכותרת המשנה של הכתבה שלו:

Generative AI models are changing the economy of the web, making it cheaper to generate lower-quality content. We’re just beginning to see the effects of these changes.

הטענה המרכזית של וינסנט היא שכבר היום הרשת מוצפת בטקסטים ובתמונות שהופקו על ידי כלים של Generative AI, ושכבר היום קיימת סכנה שהתפוקה הזאת תעלה על התפוקה ה-“אנושית”. אם עד היום כלים של Generative AI “למדו” מטקסטים ומתמונות שהיו “אנושיים” במקור, המצב הזה כבר משתנה וטקסטים רבים שנוצרים על ידי ה-AI נעשים לחלק מכובד ממאגר הטקסטים שעומד לרשות ה-AI. בעיני וינסנט ככל שהתהליך הזה ממשיך איכות המידע שמופק על ידי המערכות האלו תהיה יותר ויותר ירודה. עם זאת, זה לא ימנע מה-Generative AI להפוך למקור ה-“מידע” הראשי ברשת.

אפשר להבין למה מדובר בתהליך כמעט בלתי-הפיך. ה-Large Language Models הפופולריים היום נעזרים במאגר עצום של טקסטים שעליהם אפשר להמשיך לחבר עוד ועוד טקסטים. בתחילת הדרך המאגר הזה הוא, כמובן, כלל הכתיבה האנושית. אבל ככל שהכלים של Generative AI ממשיכים ליצור טקסטים שנעשים לחלק מהמאגר שעומד לרשות אותם מודלים, נוצר מצב שבו האמינות של המאגר הולכת ומצטמצמת. גם אם בתחילת הדרך כלי כמו ChatGPT מתבסס על מידע אמין, עם הזמן מאגר הטקסטים שממנו הוא “לומד” מזדהם, ואמיתוּת הטקסטים שמהם הכלים האלה לומדים מוטלת בספק.

וינסנט בוחן את השינוי הזה – הפקת מידע על ידי בני אדם מול הפקתו באמצעות כלי AI – במספר תחומים שונים. הוא מביא דוגמה מ-Stack Overflow, אתר שבו מתכנתים מעלים ומשיבים על שאלות תכנות. בנוגע לתשובות שה-AI מחולל הוא מצטט מנחים של האתר:

The primary problem is that while the answers which ChatGPT produces have a high rate of being incorrect, they typically look like they might be good and the answers are very easy to produce.

במילים אחרות, מה שנראה אמין נחשב “מספיק” אמין כדי שרבים יסמכו עליו, ודי מהר אנחנו מוצאים את עצמנו גולשים במדרון חלקלק לתוך מאגרי “מידע” שהם רחוקים מלהיות מהימנים.

עבור וינסנט הבעיה, או הסכנה, הגדולה ביותר נמצאת בכוונות של גוגל לשלב את ה-AI לתוך תוצאות החיפוש שלה. הוא כותב שבעקבות שילוב ChatGPT לתוך תוצאות חיפוש של Bing גוגל עורכת נסיונות של החלפת ה-traditional 10 blue links בתקצירים שה-AI מחולל. הוא מביע את החשש שהמשמעות של צעד כזה תהיה בעייתית ביותר. הוא כותב שזה עשוי להשפיע לרעה על אזורים נרחבים של הרשת שאליהם כולנו פונים (ביקורות על מוצרים, מתכונים, חדשות ועוד) ומוסיף:

In the end, Google might kill the ecosystem that created its value, or change it so irrevocably that its own existence is threatened.

כאן, אגב, חשוב לציין שהיתה בעייתיות גם באותם traditional 10 blue links. על אף העובדה שבקלות ובמהירות למדנו לסמוך עליהם, גם הם, והדרך שבה הסדר שלהם נקבע, היוו בעיה לא קטנה מבחינה מידעית.

הדאגה שלי, כמובן, איננה לקיומה של גוגל – היא בוודאי תשרוד ללא קשר לחיפושים שאני אערוך או לא אערוך. הדבר החשוב בעיני הוא איכות המידע שאפשר יהיה למצוא ברשת. לא ברור עד כמה כדאי יהיה ללמד את הסטודנטים שלנו כיצד לערוך חיפושי מידע מושכלים אם כבר מלכתחילה אמיתוּת אותו מידע שאליו הם מגיעים מוטלת בספק. אבל ממילא צריך להיות ברור שמערכות חינוך אינן מתקיימות במנותק מהעולם הסובב אותן, ובימינו “אמת” היא כבר מצרך די נדיר.

אז אולי בעצם זה לא כל כך נחוץ?

על פניו הגיוני שהעוסקים בתקשוב החינוכי יעודדו גם את הוראת התכנות בבתי הספר. התכנות היא, הרי, מרכיב מרכזי בתקשוב ובדיגיטליות – היא נמצאת בבסיס המכשירים והיישומים שבהם התקשוב בא לידי ביטוי במערכות חינוך. זאת ועוד: בחינוך, אולי אפילו יותר מאשר בחברה בכללותה, חברות המחשבים והתוכנה הם גיבורי תרבות. הן מהוות מטרה להערצה. הן מתאפיינות במקוריות, ביזמות, בחדשנות, וכמעט בכל תכונה חיובית אחרת שלקראתן מערכות החינוך של היום מבקשות לחנך. לאור זה אין זאת הפתעה שבמשך לפחות עשור בתי הספר מצטרפים לקריאה של החברות האלו שידיעת התכנות תהיה בין הכישורים החשובים ביותר שבית הספר יכול וצריך להעניק לבוגריו.

יש בקריאה הזאת, כמובן, אמירה כלכלית. אחת המטרות של מערכת חינוכית היא שהתלמיד ירכוש כישורים שיאפשרו לו להתפרנס, ובעולם טכנולוגי ידיעת התכנות היא ללא ספק כלי שבאמצעותו אפשר יהיה לרכוש מקצוע. עוד ב-2017 קלייב תומפסון (Clive Thompson) ב-Wired, תיאר את המקום שהתכנות יכול למלא במערך הכלכלי הרחב, אם כי התיאור שלו נתן יותר ביטוי לפרנסה בסיסית מאשר לאפשרות להתעשר:

What if the next big blue-collar job category is already here—and it’s programming? What if we regarded code not as a high-stakes, sexy affair, but the equivalent of skilled work at a Chrysler plant?

אצל תומפסון אין ציפייה שבעזרת ידיעת התכנות כל תלמיד יתעשר, או יהפוך ליזם, אבל לפחות בעזרתה אפשר יהיה להתפרנס בכבוד. לעומת תומפסון, בן טרנוף (Ben Tarnoff) ב-The Guardian, גם ב-2017, הטיל ספק בכדאיות לימוד התכנות. הוא כתב:

At its root, the campaign for code education isn’t about giving the next generation a shot at earning the salary of a Facebook engineer. It’s about ensuring those salaries no longer exist, by creating a source of cheap labor for the tech industry.

במילים אחרות, לפי טרנוף אם כל בוגרי מערכת החינוך יידעו את יסודות התכנות, מאגר העובדים הפוטנציאליים יהיה גדול, התחרות על מקומות העבודה תהיה ערה, והמשכורות יוכלו להיות צנועות. במקרה הזה, יותר מאשר התכנות תהווה אמצעי לפרנסה טובה, הוראת התכנות בבתי הספר משרתת את הצרכים הכלכליים של חברות הטכנולוגיה הגדולות.

לפני שבע שנים ציטטתי כאן את רוג’ר שאנק (Roger Schank – שאגב נפטר בתחילת שנת 2023) שבבלוג שלו התבטא בנושא הזה באופן עוד יותר חריף:

“Everyone should learn to code” is the new way of saying we need to create compliant factory workers and that the real purpose of school is to make sure that we are training people for the “factory jobs” of the future.

אבל הרבה השתנה מאז, ויכול להיות שעם ההתקדמות הרצינית של הבינה המלאכותית הוויכוח על נחיצות הוראת התכנות נעשה לוויכוח סרק. בתחילת חודש יוני פרהד מנג’ו (Farhad Manjoo), בניו יורק טיימס, הרהר שאנחנו נכנסים לשלב חדש בעולם התכנות – שלב שבו אין צורך בידע ייחודי בתכנות מפני שכל אחד יוכל להגיד למחשב מה הוא מבקש ממנו לעשות וה-AI “יבין” את הבקשה ויבצע אותה. מנג’ו רואה את ההתפתחות הזאת בחיוב, אבל הוא מבין שיש בה גם בעיה:

Wait a second, though — wasn’t coding supposed to be one of the can’t-miss careers of the digital age?

מנג’ו התנסה בתכנות כאשר היה ילד, והוא מציין שבעשורים שעברו מאז התכנות הפכה מעיסוק של חנונים לכישור שנחוץ לשם הפרנסה. הוא מביע אכזבה שהילדים שלו אינם מתעניינים בתכנות. אבל הוא מוסיף שיתכן מאד שבגלל ה-AI, עד שילדיו יגדלו ידיעת התכנות כבר לא תהיה נחוצה. טים סטאמר (Tim Stahmer), במאמרון חדש בבלוג שלו, מתייחס לדבריו של מנג’ו וכותב:

But the likely rise of AI that can write code better than most humans is just one more reason why putting every kid through computer science classes in K12 is still the wrong goal.

סטאמר מקשר בציטוט הזה למאמרון שהוא פרסם לפני שלוש שנים בו הוא טען:

Coding For All is the Wrong Goal

היום רבים בוודאי מסכימים עם מנג’ו שלימוד התכנות כבר איננו יכול להבטיח משרה מפרנסת. אבל עוד לפני פריצת הדרך הגדולה של ה-AI יצרה את המצב הישן/חדש הזה, סטאמר הבין שמה שתלמידי בתי הספר צריכים ללמוד איננו התכנות עצמה, אלא כיצד עולם התכנות משפיע עליהם. הוא נעזר בדוגלס רושקוף (Douglas Rushkoff) שב-2019 טען שלהבדיל מהמקובל אז שלימוד התכנות יפתח את התלמיד לעולם חדש ומפרנס, אותו לימוד תכנות מאיים לאלץ את התלמיד לשרת סביבה שבה הוא איננו אלא אובייקט שימושי לצרכי החברות הטכנולוגיות הגדולות:

It was as if the answer to a world where the most powerful entities speak in code was to learn code, ourselves, and then look for employment servicing the machines.

רושקוף טען שבמקום שידיעת התכנות תשרת את המכונות ואת חברות הטכנולוגיה, בתי הספר צריכים לראות בתכנות מרכיב חשוב של מדעי הרוח, כאשר מטרת אותו לימוד היא שהתלמיד יבין את הסביבה החדשה שנרקמת, ואת המקום שלו בה.

לפני שלוש שנים סטאמר כבר הביט על התכנות מההיבט הזה, וביקש לראות אותה בראייה חינוכית רחבה יותר. הוא כתב:

it really is past time to have a serious discussion about why K12 school exists in the first place, about what students need to know and be able to do when they finish their 13 years in our classrooms.

סטאמר הוא איש חינוך, וכזה הוא הבין שהשאלה של מקום העבודה של בוגר המערכת משנית לשאלה של איזה אדם המערכת מגדלת. בעיניו הדיון הזה היה צריך להתקיים מזמן. והיום, שלוש שנים מאוחר יותר, הצורך הזה נעשה עוד יותר חד, גם אם ספק אם הוא אכן יתקיים. אבל בכל זאת משהו כן השתנה. אם לפני מספר שנים אפשר היה לטעון שלימוד התכנות ממלא את הפונקציה הפרנסתי שרבים זיהו אותה כיעד מרכזי של בית הספר, היכולות הנוכחיות של ה-AI כבר מערערות את כדאיות ונחיצות לימוד התכנות לשם הפרנסה. ואולי זה מעניק לנו פתח לאותו בירור מעמיק יותר על מטרות החינוך שסטאמר ייחל לו.

יותר מהר מאשר אולי ציפינו!

לפני חודשיים כתבתי כאן על ההשפעה האפשרית של כלי בינה מלאכותית, ובמיוחד של ChatGPT, על תעשיות העזרה בשיעורים וכתיבת עבודות עבור סטודנטים. המאמרון ההוא התבסס על כתבה ב-EdSurge ששאלה אם הזמינות של כלי AI חינמיים תפגע בשירותים/כלים כמו Chegg. אותו מאמרון, כמו הכתבה ב-EdSurge, לא הסיק מסקנה חד-משמעית. לצד גורמים שראו בכלים האלה איום לתעשיות האלו, המנכ”ל של Chegg טען שהחברה שלו נמצאת בתהליך של שילוב כלי AI לתוך המוצרים שלה כך שהיא תוכל לשכלל את המוצרים האלה תוך חסכון בהוצאות. לכאורה נוצר איזון בין הסיכוי של שילוב השימוש של כלי AI בכלים קיימים מול האיום של ההיצע הישיר של הכלים האלה לסטודנטים. האיזון הזה הביא לכך שנציג של Chegg השיב לפנייה של Edsurge:

We do not expect ChatGPT to materially impact our business

כל זה היה בסוף פברואר. פרסומים בחדשות מלפני שבוע רומזים שאותה אמירה כנראה שייכת להיסטוריה עתיקה. לפחות בנוגע ל-Chegg, ההשפעה של כלי AI אכן מורגשת, ובגדול. כתבה באתר של CNBC מדווחת ש:

Chegg shares drop more than 40% after company says ChatGPT is killing its business

כעת מנכ”ל החברה מודה שמאז חודש מרץ ההתעניינות ההולכת וגדלה של סטודנטים ב-ChatGPT גורמת להאטה בפתיחת חשבונות חדשים ב-Chegg. עם זאת, חשוב לציין שהצניחה הדרמטית בערך החברה איננה קשורה ישירות להאטה הזאת, אלא להערכות של חברות פיננסיות שכעת אינן ממליצות על השקעה בחברות כמו Chegg, ובמקום זה נוטות להעדיף את ההשקעה בכלי AI שכמובן נכון להיום תופסים את הכותרות. כך או כך, ברור ש-Chegg נמצאת בצרות.

כצפוי, Chegg איננה החברה היחידה שמושפעת לרעה. כתבה ב-Proactive, חברה שמצהירה על עצמה שהיא “מאפשרת לחברות ומשקיעים להתחבר בצורה חכמה” מדווחת ש:

The use of generative AI, which can replicate some services and products more cheaply, is presenting a new challenge to businesses, with investors speculation the education sector is likely to see further disruption in the near future.

לפי אותה כתבה, בחודשיים האחרונים ערך המניה של Pearson, שבעבר שלטה בשוק ספרי הלימוד אבל לאחרונה התרחבה ללמידה דיגיטלית, ירדה ב-15%, ואילו אצל חברות Udemy ו-Coursera שעוסקות בקורסי MOOC נרשמה ירידה של 6%. שלושה ימים אחרי פרסום הכתבה ב-Proactive כתבה ב-The Motley Fool דיווחה על ירידה של 12% אצל Coursera. כותרת משנה של אותה כתבה מבהירה את הבעיה:

Fears mount that the robots might be coming to take over the for-profit education business.

לא ברור על מי אותה כותרת משנה אמורה לאיים, או אצל מי הפחדים האלה נערמים. הרי אין סיבה לחשוב שהכוונות של אותם רובוטים (אם אכן לרובוטים יכולים להיות כוונות) עשויות להיות טובות או רעות יותר כלפי סטודנטים או כלפי הלמידה שלהם מאשר הכוונות של אותן חברות למטרות רווח שכעת שולטות בתחום. אם ChatGPT יכול לתת מענה לשאלות של סטודנטים טוב יותר מאשר Chegg, הגיוני שסטודנטים יפנו אליו. לגבי העדיפות של כלי AI לעומת קורסים של Coursera או Udemy, לא ברור אם זה אומר משהו בנוגע לאיכות הקורסים שלהן, או על הסיבות שבגללן פונים לקורסים האלה מלכתחילה.

על אף העובדה שמנכ”ל Chegg כבר מודה שכלי AI חינמיים אכן פוגעים ברווחיות החברה שלו, כתבה ב-Financial Times טוענת שעדיין מוקדם מדי להספיד אותה, וזה מפני שיש אצלה מידע, ונתונים רבים, אודות המשתמשים שלה, מידע שכולל:

knowing students’ histories and levels of attainment, making it possible to feed them prompts that home in on gaps in their knowledge. It also has years of experience from teaching the same courses and learning from the questions other students ask.

במילים אחרות, יתכן שהנתונים הרבים שכבר נמצאים בידי חברות כמו Chegg נותנים להן יתרון שעשוי לעזור להן להחזיק מעמד ולהעניק שירות טוב יותר מאשר הכלים החינמיים. ואם כך, אולי הירידה הדרמטית בערך החברה איננה אלא ירידה רגעית.

עד היום, מלבד הכתבה מלפני חודשיים ב-EdSurge, לא פגשתי התייחסות לנושא הזה בפרסומים חינוכיים שאחריהם אני עוקב (אם כי יתכן שהיו כאלה). ולמען האמית, זה די הגיוני – רוב המקורות שאחריהם אני עוקב עוסקים בחינוך ובלמידה, וביסודו של דבר הכתבות האלו עוסקות בנושא מאד שונה – מי מרוויח ומי מפסיד כספית בתחום התקשוב החינוכי. בעצם, אין כאן שום קשר לשאלות חינוכיות.

ולקראת סיום, הערה שאיננה קשורה לאותה שמחה לאיד המרומזת שהופיעה בסיום אותו מאמרון שלי מלפני חודשיים. למרבה הצער, יותר מכל דבר אחר, העיסוק בפגיעה בערכן הכספי של החברות האלו בעקבות עלייתם של כלי AI מעיד על סדר העדיפויות של תחום התקשוב החינוכי היום: הלמידה והחינוך הם כנראה משניים לנושא המרכזי – הכסף. אבל זה כמובן איננו מפתיע.

סכנת הדעת הארוזה היטב

על אף המאמצים שלי לא להצטרף לחגיגה סביב ChatGPT וסביב AI באופן כללי, באופן די צפוי הנושא הזה נשאר, כבר זמן ממושך, נושא חם מאד בחינוך. כמות אדירה של התייחסויות מתפרסמת בעיתונות ובבלוגוספירה. כצפוי הרבה ממה שנכתב חוזר על עצמו, אבל קשה בכל זאת לא לנסות לקרוא כמה שיותר – מתוך התקווה, שלעתים קרובות מדי מתבדה, לפגוש משהו באמת מקורי ומעורר מחשבה. כמובן שלגיטימי שכל אחד יכתוב מה שהוא חושב, אבל לפעמים אני מתרשם שמספר הכותבים עולה על מספר הקוראים. כל אחד חושב שהתרומה שלו ייחודית (נו, גם אני) אבל מתקבל הרושם שהכל כבר נכתב. רק לעתים רחוקות אני נתקל בהתייחסות שנראית לי ייחודית או יוצאת דופן, או כזאת שמאירה את הנושא באור שונה מאשר הרווח. וכאשר זה קורה ראוי שאכתוב עליו.

כאשר הוא התפרסם בחודש ינואר פספסתי את המאמרון הזה של דייב קורמייה (Dave Cormier). הוא אמנם הופיע אצלי, וגם הוזכר בדברים שקראתי, אבל זה היה בסך הכל מאמרון אחד מתוך בליץ אדיר של פרסומים אחרים והוא איכשהו חמק ממני. הגעתי אליו לפני שבוע כאשר מרטין וולר (Martin Weller) הזכיר אותו במאמרון חדש שלו. רק אז הקלקתי אליו ושמתי לב שהוא בכלל איננו חדש. קורמייה הוא קנדי ששנים רבות מעורב בנושאים הקשורים לתקשוב החינוכי. הבלוג שלו כמעט תמיד מעניין, אם כי הוא מפרסם בו בתדירות יחסית נמוכה.

קורמייה איננו מתנגד ל-ChatGPT או לכלי AI דומים. הוא מציין שבעיניו ההשפעה של הכלים האלה על החינוך תהיה דומה להשפעת המחשבון על החינוך המתמטי … ואז מוסיף שארבעים שנה אחרי שהמחשבון נכנס לבתי הספר אנחנו עדיין מתווכחים על השפעתו. בהערה הזאת, עוד בתחילת המאמרון, קורמייה מצביע על כך שעל אף עשרות אלפי המילים שכבר נכתבו, עדיין מוקדם מדי לקבוע מה תהיה השפעת ה-AI.

המאמרון של קורמייה איננו עוסק ישירות בשימוש בכלי AI במערכות חינוך, אלא בהשפעתם על עולם הדעת, ובעיקר בכיצד שילובם לתוך כלי חיפוש כמו Bing ו-Google משפיע על עיצוב ההבנה שלנו. הוא מתאר את מה שאולי אפשר לכנות הבנאליות של הידע ומביע דאגה לגבי זה. הוא מתאר כיצד בתקופת הלימודים שלו הוא נהג להגיע למדף מסוים בספרייה כדי למצוא ספר מסוים, וידע ששם הוא ימצא עוד ספרים שקשורים לאותו נושא. בהמשך, השימוש במנוע חיפוש שינה את התהליך הזה, אבל עדיין היה דומה בכך שהחיפוש בגוגל אמנם לא הביא אותו למדף ספציפי בספרייה, אבל תוצאות החיפוש בכל זאת כיוונו אותו למקורות דומים שדרכם אפשר היה לבחון נושא לעומק ממגוון היבטים. מול התהליכים האלה הוא מעמיד את הפנייה ל-ChatGPT לשם חיפוש מידע ומסביר שהתוצאות של בקשת החיפוש יהיו ערבוביה של מידע שמוגש בצורה משכנעת ואפילו פסקנית, והכי חשוב, כבר ארוז. הוא כותב:

The algorithm presents me with the knowledge, already packaged.

קורמייה מדמה את המצב הזה למה שכלי ה-autotune עושה לקולות במוסיקה. ה-autotune חדר לעולם המוסיקה לפני יותר בעשרים שנה, והשימוש בו היום נפוץ ביותר. הכלי מנקה את הקול מטעויות כיוונון זעירות וכך הוא מגיש למאזין צלילים נקיים ונטולי חספוס, ובסופו של דבר נטולי ייחוד מוסיקלי. קורמייה מציין שרבים טוענים שהכלי מוציא את המרכיב האנושי מתוך תהליך יצירת המוסיקה והוא מוסיף ש:

That’s what’s going to happen to our daily knowledge use.

כמו עם autotune שמאפשר לזמרים לזייף ואחר-כך, בהקלקה על כפתור, להפוך את השירה לנקייה, נוחות השימוש בכלי AI בתהליך איתור מידע מייתרת את הצורך לצלול עמוק לתוך נושא כלשהו. הרי למה שנעמיק בחיפוש אחר מידע מדויק כאשר בהקלקה על כפתור אפשר לקבל משהו שמספיק טוב שבהחלט נראה משכנע. קורמייה שואל:

Who is going to pay you to take a week to learn about something enough so you can give an informed opinion when something that looks like an informed opinion can be generated in seconds?

חשוב להדגיש שמה שמפריע לקורמייה איננו שהמידע שמקבלים איננו נכון (אם כי גם זאת ללא ספק בעיה) אלא שהכלי הופך את ההעמקה, את הצלילה לתוך המידע כדי להבין לעומק, לדבר שאין טעם לבזבז עליו זמן. הוא מציין שעבור מומחים בתחומם הפנייה לכלי כמו ChatGPT איננה מהווה בעיה. עבורם חיפוש מידע הוא לשם העשרה מתוך בסיס ידע מוצק, ולא כדי לקבל תמונה כללית. מומחים לא יסתפקו בתוצאות חיפוש שהן ארוזות מראש (ובצורה נאה) שהכלי מגיש להם. אבל קורמייה מדגיש שבמרבית התחומים שבהם הרוב מאיתנו מבקשים לקבל מידע אנחנו טירונים (novices), ונהיה מוכנים לקבל מידע מספיק טוב, גם אם בסופו של דבר הוא שטחי, כל עוד הוא נראה לנו אמין. כמו עם ה-autotune נקבל צלילים נקיים, אבל נטולי ענין. והתוצאה בעולם הדעת, כמו בעולם המוסיקה, תהיה סתמיות משוועת.

שוב, לפי קורמייה הבעיה איננה שקל להטעות אותנו, גם אם זה אכן נכון, אלא שהסקרנות שלנו תסופק כבר ברובד נמוך ופשוט במקום שנבחר לצלול לתוך נושא כדי ללמוד אותו ממש. אפשר לטעון שזה היה המצב גם בחיפושי גוגל פשוטים כאשר על אף העובדה שמוסרים לנו שנמצאו אלפי דפים שבצורה זאת או אחרת “עונים” על השאילתה שלנו הסתפקנו באלה שבדף הראשון בלבד. אבל התוצאות האלו עדיין היו הצעות להעמקה ולא “תשובות”. עצם הגשת המידע בצורה מסודרת ולכאורה מוסמכת תגרום לנו לקבל את התוצאות כתשובה במקום כהזמנה להמשך הלמידה.

כמאזינים למוסיקה, אנחנו על פי רוב רוצים בסך הכל לשמוע מוסיקה ערבה לאוזן. ה-autotune אכן מספקת לנו את מה שאנחנו רוצים. הוא משטיח את החספוס ומגישה לנו צליל נקי. אבל מדובר בצליל נקי מדי שבסופו של דבר מלאכותי במקום אנושי. רבים מאיתנו גילינו שעל אף החספוס אנחנו מעדיפים את הצליל האותנטי יותר. אפשר לקוות שכך יהיה גם בנוגע לתוצאות החיפוש שכלים כמו ChatGPT יכולים להגיש לנו.

אז לא רק המורים יסבלו מ-ChatGPT?

משום מה אני ממשיך לאסוף ולסמן לעצמי כתבות שמתייחסות לשילוב ChatGPT בחינוך, אפילו אם קשה לי להסביר למה. הרי, בחודשיים האחרונים התפרסמו עשרות, אם לא מאות, כתבות שניסו לבחון את השפעת הכלי, ואין חדש תחת השמש. מצד אחד נמצאים אלה שטוענים שנוכחותו של כלי שמאפשר הכנת עבודות ללא מאמץ מבשרת את קץ החינוך כפי שאנחנו מכירים אותו, ואילו מולם יש הטוענים שהקלות הזאת מחייבת את החינוך לערוך בדק בית ולגבש סוג שונה של הערכה – הערכה שתנצל את ה-AI ותקדם פיתוח של חשיבה ביקורתית אצל הלומדים. וגם אם הכל כבר נכתב, הכתבות ממשיכות להתפרסם. גל חדש של כתבות התפרסם בעקבות הודעות על פיתוחם של כלים שיכולים לבחון אם הכתיבה נעשתה באמצעות AI או לא, אבל הכתבות האלו בסך הכל חזרו על מה שכבר נכתב. במהלך השנים בבלוג הזה חזרתי על עצמי די הרבה פעמים, אבל לפחות בנוגע ל-ChatGPT ניסיתי להיות קצת יותר ממושמע ולא לכתוב שוב (ושוב) את מה שכבר כתבתי. לפני כחודשיים כתבתי על הנושא והרגשתי שמיציתי את עצמי. מאז לא הרגשתי שיש לי מה להוסיף בנושא, ובחרתי לא להמשיך לדון בו.

ואחרי הפתיחה הארוכה הזאת, אני מניח שהיה צפוי שאפר את ההחלטה הזאת. אני עושה זאת בעקבות כתבה מלפני שבוע ב-EdSurge שמצביעה על קבוצה נוספת במרחב החינוכי שעשויה להפגע מכלי AI שמחוללים טקסטים. הכתבה שואלת:

Will ChatGPT Make Students Turn Away From Homework-Help Services?

על פי רוב אינני מקדיש זמן לבחינת תעשיית הסיוע בכתיבת עבודות, ולכן לא עלה בדעתי שאחד התחומים החינוכיים שעשוי להיות מושפע על ידי ChatGPT הוא הסיוע, אם חינמי ואם בתשלום, של כתיבת עבודות. אבל הדבר די הגיוני. אם ChatGPT יכול לספק כתיבת עבודות בחינם זה ללא ספק עשוי להזיק למודל העסקי של חברות שמבקשות כסף עבור אותו השירות.

גם אם הרבה אנשי חינוך מעדיפים לא להכיר בקיומן (ובוודאי לא להכיר בלגיטימיותן) החברות האלו הן ללא ספק חלק מהמערכת החינוכית בכללותה. אפשר אפילו לטעון שהחברות האלו הן לא רק מרכיב ותיק, אלא גם מרכיב חשוב, של המערכת הזאת. גם מי שרואה בזמינות של כלי AI איום על היושר האקדמי של סטודנטים בוודאי יודע שהכלים האלה אינם האיום הראשון או הבלעדי. סטודנטים תמיד הצליחו למצוא אמצעים שיאפשרו להם להשקיע כמה שפחות מאמץ ועדיין לעבור את הקורסים שלהם, ו-ChatGPT איננו אלא האיום החדש התורן.

אבל באותה מידה שכלי AI מאיימים על הפרנסה של חברות כתיבת העבודות בכך שהם מציעים “פתרון” זול יותר, אותם כלים בידיהם של החברות האלו עשויים לשכלל את ההיצע שלהן. הכתבה מביאה את דבריו של פיל היל (Phil Hill) שמסביר שחברות לכתיבת עבודות עשויות לפתח שירותים ייחודיים המבוססים על כלים כמו ChatGPT שמשכללים עוד יותר את מלאכת העזרה לסטודנטים.

אינני מכיר את שוק רכישת העבודות. אני כן יודע שכבר לא מדובר בעבודות בלבד. המבחר די גדול, ויש לפחות אתר אחד – Writing Paper Sucks – שסוקר את ההיצע הרב כדי להמליץ לסטודנטים לאן כדאי לפנות. האתר מכין סקירות על החברות השונות. סקירות אלו מתייחסות לטיב המוצר, לעלות הרכישה, לקלות התקשורת ועוד, והאתר משקלל את התוצאות ונותן ציונים על איכות השירות. נכון לשנה הנוכחית יש באתר ביקורות על 24 גופים שמציעים את שירותיהם, אם כי רק עשרה מאלה זוכים להמלצה של האתר. ויש, כמובן, מגוון רחב של שירותים אפשריים, מ-“סיוע” בהכנת שיעורי בית ועד ללימוד קורס מקוון במלואו. כתיבת עבודות ממוקמת אי-שם באמצע.

חברת Chegg היא אולי החברה המוכרת ביותר בתחום של סיוע בשיעורי בית, ומורים רבים טוענים שהיא מגישה הרבה יותר מאשר רק “סיוע”. הכתבה מדווחת שהחברה כבר משלבת AI בסיוע שהיא מעניקה:

The company already uses an older version of ChatGPT’s technology, GPT-2, to support students in their writing products with grammar, paraphrasing and sentence structure, said Chegg CEO Dan Rosensweig in a statement. “We also use it to increase speed and quality, while reducing the costs of content development,” he added.

שירותים כמו Chegg פועלים בשטח האפור שנע בין סיוע לרמאות (תלוי במי ששואלים). החברה עצמה, ובוודאי הסטודנטים שמשתמשים בה, טוענים שהם בסך הכל מעניקים/מקבלים עזרה. אם זה אכן השימוש, האסטרטגיה של רוזנצוויג נראית הגיונית. השימוש בכלי AI משפר את איכות המוצר שהחברה מספקת. ולפחות נכון לעכשיו כדאי יותר לסטודנט לשלם קצת יותר כסף ולקבל מידע מוסמך מאשר לפנות לכלי חינמי שקשה לדעת אם הוא המציא עובדות חדשות, ולא נכונות, או לא. הכתבה מצטטת את מאט טאואר (Matt Tower) בעל תור ב-Substack שסוקר את הפן העסקי של התקשוב החינוכי. טאואר מסביר למה נכון לעכשיו ידו של Chegg על העליונה:

For a student using it (AI) for answers, this introduces a risk that the information isn’t correct. Being able to refine those answers is an area where Chegg theoretically has a strong advantage, Tower adds.

מול הטענות של Chegg ושל הסטודנטים שרוכשים את עזרתה, מורים רבים סבורים שפונים ל-Chegg פשוט לקבל תשובות לשאלות בשיעורי בית, ובעיניהם השימוש הזה פסול. (יש מורים שטוענים שתרגילים שהם עצמם הכינו, יחד עם התשובות לאותם תרגילים, נמצאים במאגר של Chegg כך שכל מה שהסטודנט צריך לעשות הוא להכניס את השאלה ולקבל את התשובה.) כפי שכבר ציינתי, Chegg, וחברות לכתיבת עבודות (ול-“למידה” של קורסים שלמים), הם חלק מתעשיית “למידה” ענפה שמציעה “פתרונות” לימודיים לסטודנטים שמעוניינים להשקיע כמה שפחות זמן ומאמץ כדי לעבור את הקורסים שלהם. לגיטימיים או לא, התעשייה הזאת היא חלק מהנוף החינוכי, ותמשיך להיות חלק ממנו. מה שמעניין כאן בעיני הוא שכנראה לא רק אלה שחוששים שכלים כמו ChatGPT יחסלו כתיבת עבודות כאמצעי להערכה מרגישים מאוימים על ידו. האיום הזה מורגש גם אצל אלה שעד עכשיו הצליחו להתפרנס מכתיבת העבודות עבור הסטודנטים. אולי יש כאן דוגמה של “צרת רבים חצי נחמה”.

טוב, בסדר. אבל האם הוא יחולל שינוי?

סיימתי את המאמרון הקודם שהתפרסם כאן בתחושה של אי-נחת. הרגשתי שאני בסך הכל אספתי מספר התייחסויות על ChatGPT ויותר מדי מיהרתי לקבוע שבעיני הוא איננו הרבה יותר מאשר עוד כלי שמעורר התלהבות אבל בסופו של התהליך לא ישפיע הרבה על החינוך. משהו היה חסר. הרי אי אפשר להתכחש לעובדה שהכלי הוא לא סתם כלי כייפי. הוא ללא ספק מעורר התפעלות שיוצרת רצון לבחון אם אפשר לדרבן אותו לתוצאות מעניינות ואפילו איכותיות. מצאתי את עצמי שואל האם הזדרזתי יתר על המידה לפסול את הפוטנציאל החינוכי של הכלי.

המילה “לפסול” כמובן בעייתית. הכוונה איננה שהשימוש בו פסול. מדובר, אמנם, בכלי בעל עוצמה הרבה מעבר לזאת של בודק האיות או של בודק התחביר שהשימוש בהם היום כבר לגמרי מקובל, אבל הוא בכל זאת דומה להם – כלי שביסודו של דבר יכול לסייע בכתיבה. ואם כך, אינני רואה סיבה שלא ינצלו אותו לשם כך. הפסילה שאליה רוב גורמי החינוך מתייחסים קשורה לטענה שסטודנטים שישתמשו בו לא יכתבו בעצמם, ולכן אי-אפשר יהיה להעריך את הלמידה שלהם. הטענה הזאת נמצאת בבסיס הקריאות להגביל את השימוש בו. בעיני הקריאות האלו מוגזמות, ו-ChatGPT בעצמו, ללא התערבות מאומצת של הסטודנט בגיבוש התוצר הסופי, איננו עד כדי כך עוצמתי.

לעומת ההרהורים של אלה שכתבו ב-The Atlantic (כאן ו-כאן), אינני מרגיש שהכלי טרף את הקלפים, ומעכשיו כבר אי-אפשר לבקש מסטודנטים לכתוב עבודה על נושא מסוים ולצפות שהכתיבה תהיה מקורית (או לפחות עצמאית). אולי ChatGPT מחריף את החששות, אבל הוא בוודאי לא יוצר אותם. סביר גם להניח של-“בעיה” החדשה הזאת יימצא פתרון. בעצם, כבר עובדים על זה. כתבה ב-The Guardian מביא את דבריו של איש צוות ChatGPT שמסביר שהצוות כבר עובד על דרך לזהות עבודה שנכתבה על ידי אלגוריתם ולא על ידי בן אדם. מדובר ב:

a system for countering cheating by “statistically watermarking the outputs”. The technology would work by subtly tweaking the specific choice of words selected by ChatGPT, Aaronson said, in a way that wouldn’t be noticeable to a reader, but would be statistically predictable to anyone looking for signs of machine-generated text.

בכתבה ב-Edsurge אנחנו למדים שגם חברת TurnItIn עובדת על משהו דומה, והשיטה שלה מתבססת על אותה “חולשה” שאנשי ChatGPT מזהים. הכתבה מביאה את דבריו של סגן נשיא החברה:

“We’re very confident that—for the current generation of AI writing generation systems—detection is possible,” says Eric Wang, vice president of AI for the company.
Plagiarism is evolving, but it can still, in theory, be sussed out, he argues. That’s because unlike human writing, which tends to be idiosyncratic, machine writing is designed to use high-probability words, Wang says. It just lacks that human touch.

אני חייב להודות שאני מתקשה לראות שאמצעי הזיהוי האלה, לפחות בתחום החינוכי, באמת יצליחו להבדיל בין האלגוריתמי והאנושי. הרי מי שקורא עבודות של סטודנטים יודע שעל פי רוב מדובר בכתיבה יבשה שגם ממנה נעדר “המגע האנושי”. אני חושש שבמקום לבודד טקסט שהוכן על ידי מכונה כדי לסמן אותו כתוצר טכנולוגי, אותם כלי הזיהוי “יחשבו” שגם טקסט מקורי של סטודנטים הוא בסך הכל טקסט של מכונה.

בנוסף לפתרונות טכנולוגיים, יש גם מי שצופה פתרונות “פשוטים” יותר. בתגובה לציוץ של נשיא אוניברסיטה קונקורדיה אשר במדינת נברסקה (והמצוטט בכתבה ב-EdSurge) שמהרהר שאולי יכולות הכתיבה של ChatGPT יובילו לפיתוח של אמצעי הערכה אנושיים יותר, אב אחד צייץ, בוודאי בנימה הומוריסטית:

was telling my boyz they better get ready for oral exams.

לעומת זאת, ב-Washington Post מארקהם הייד (Markham Heid) מביא הצעה רצינית:

Make students write out essays by hand. Apart from outflanking the latest AI, a return to handwritten essays could benefit students in meaningful ways.

מארקהם הוא כנראה עיתונאי בתחום הרפואה והבריאות. הוא טוען שהכתיבה ביד מפתחת את החשיבה טוב יותר מאשר ההקלדה מול המסך, ולכן הוא חושב שיש רווח כפול בדרישה של כתיבה ביד. הוא אפילו צופה מראש את הטענה הנגדית שסטודנטים פשוט יעתיקו בכתב ידם טקסט שהוכן באמצעות ה-AI. הוא כותב שהפעולות המוטוריות הקשורות לכתיבה ביד מעודדות את הזכרון ואת הלמידה:

And those added layers of stimulation might be beneficial even when a student is merely copying an AI-written essay by hand.

אם אני מבין נכון את הטענה שלו, נדמה לי שבלי להגזים יתר על המידה אפשר לסכם (כמובן בקריצה מסוימת) שהיתרון אשר בהעתקת עבודה בכתב יד נמצא בכך שעכשיו לפחות יש סיכוי שהסטודנט יקרא את מה שהוא מגיש. לפחות עם הקביעה הזאת קשה להתווכח.

אבל הנה, מילאתי כבר מאמרון שני בהתייחסות ל-ChatGPT ואני עדיין מתקשה למצוא כיצד, אם בכלל, הוא באמת ישפיע על החינוך (אלא אם הוא באמת יחסל אותו לחלוטין שמשום מה לא נראה לי שיקרה בעתיד הנראה לעין). אבל נדמה לי שהקושי איננו בכלי, אלא בכיצד אנחנו מבינים את החינוך.

אלן לגמן (Ellen Lagemann) היא דמות מאד מוכרת בתחום ההיסטוריה של החינוך ומחקר החינוך. פעמים רבות (אם כי נדמה לי שאף פעם לא באתר הזה) יצא לי לצטט אמירה ידועה שלה אודות הכיוון אליו החינוך פנה:

One cannot understand the history of education in the United States during the twentieth century unless one realizes that Edward L. Thorndike won and John Dewey lost.

המשפט הזה, מתוך מאמר/הרצאה משנת 1988, מסכם הרבה בנוגע למצבו של החינוך היום, ולא רק בארה”ב. פניתי ל-ChatGPT ושאלתי: לאור המציאות החינוכית היום, האם נכון יהיה להגיד שתורנדייק ניצח ודיואי הפסיד. זכיתי לתשובה סתמית למדי שבסך הכל סקר בקצרה, בקווים מאד כלליים, את התפיסות של תורנדייק ושל דיואי, בתוספת סיכום הדי תפל שכל אחד מהם תרם לחינוך. הכתיבה היתה סבירה, ובעצם נראתה כמו כתיבה של סטודנט שחושש לנקוט עמדה כי הוא איננו מבין את הנושא לעומק ולכן מקווה שסקירה כללית תכסה על העדר ההבנה. שאלתי הלאה אם התשובה שקיבלתי מעידה על כך שלגמן טעתה, וקיבלתי תשובה:

It is not clear who Lagemann is or what their claim or perspective on education might be.

אם הייתי צריך לתת ציון לתשובה הזאת, על אף התשובה הסתמית, נדמה לי שהיה עלי להוסיף מספר נקודות בזכות היושר. אבל אם כתיבה כזאת היא הנורמה של ChatGPT, לא ברור שהוא מסוגל לסייע לסטודנטים בשיפור הכתיבה שלהם.

וזה מחזיר אותנו לשאלה הבסיסית: האם המיקוד שלנו הוא ביכולות הכלי או במהות החינוך. כחודש לפני יציאתו של ChatGPT ג’יין רוזנצוויג (Jane Rosenzweig), מנהלת ה-Harvard College Writing Center, התייחסה לכלים אלגוריתמיים לכתיבה. היא ביקשה להבחין בין התוצר לבין התהליך – הבחנה די מקבילה לשוני בין התפיסה של תורנדייק לבין התפיסה של דיואי. היא העירה:

If the end point rather than the process were indeed all that mattered, then there might be good reason to turn to GPT-3. But if, as I believe is the case, we write to make sense of the world, then the risks of turning that process over to AI are much greater.

וכחודש לפני-כן גם ג’ון דרון (Jon Dron), פרופסור בבית הספר למחשוב ומערכות מידע באוניברסיטה אתבסקה (Athabasca) אשר בקנדה, כתב על הכתיבה באמצעות הכלים האלה. תחילה הוא העיר על הצפוי לקרות:

I predict that traditionalists will demand that we double down on proctored exams, in a vain attempt to defend a system that is already broken beyond repair.

ובהמשך הוא ניבא שהשימוש החוזר של הטקסטים שהכלים האלה מחוללים יוביל להעתקים של העתקים שאיכותם תיעשה יותר ויותר ירודה. באופן מאד דומה לרוזנצוויג הוא המשיך:

If we don’t want this to happen then it is time for educators to reclaim, to celebrate, and (perhaps a little) to reinvent our humanity. We need, more and more, to think of education as a process of learning to be, not of learning to do, except insofar as the doing contributes to our being. It’s about people, learning to be people, in the presence of and through interaction with other people. It’s about creativity, compassion, and meaning, not the achievement of outcomes a machine could replicate with ease. I think it should always have been this way.

אין לי מה להוסיף, ומה ש-ChatGPT היה אולי מוסיף בוודאי היה רק גורע. הכלי מאד מרשים. נעים מאד לשחק איתו. אבל אם נרצה שתהיה לו השפעה חיובית על החינוך נצטרך קודם כל לקבוע באיזה חינוך מדובר.

באמת גדול, וכבר כאן

בחינוך תמיד יש “הדבר הגדול הבא” התורן – אותה המצאה חדשה שאמורה לחולל מהפכה בחינוך. לפני שנה וחצי, למשל, ציינתי שאחרי תקופה יחסית קצרה עם התואר הנחשק ה-TikTok העביר את השרביט לבינה המלאכותית. יש בוודאי אלה שעוד נשבעים שה-TikTok יכול לחולל נפלאות בחינוך, אבל נדמה שקשה להתחרות עם הצעדים הענקיים שבהם הבינה המלאכותית מתקדמת, ומשנה כל דבר שהיא פוגשת. וכגודל הצעדים, גודל תחזיות ההשפעה על החינוך. אם לגבי ה-TikTok שאלו כיצד אפשר להשתמש בו בשיעור, מול ההתקדמות של הבינה המלאכותית השאלות בעלות משקל גדול בהרבה – לאור ההתפתחויות של הבינה המלאכותית אפילו שואלים אם עדיין יש טעם במערכות חינוכיות בכלל. כך, לפחות, הדברים נראים כאשר בוחנים את ההתרגשות סביב ChatGPT.

נדמה שאין צורך להציג את יכולותיו של ChatGPT – הרי כמעט מידי יום העיתונות מדווחת על הנפלאות האלו. הדיווחים אינם שונים מהותית מאלה שהתפרסמו סביב GPT-2 כשהוא יצא לאור בפברואר 2019, או סביב GPT-3 שיצא ביוני 2020. אבל עם כל גלגול חדש יכולות הכלי מתעצמות, והדיווחים אודותיהן מלאים בעוד ועוד התפעלות. חשוב לזכור של-ChatGPT יש יתרון נוסף מעבר לעוצמתו ההולכת וגדלה: ה-Free Research Preview שלו זמין לכולם בחינם באתר אינטרנט. אם בגלגוליו הקודמים של ה-GPT הרוב הגדול של המשתמשים היו חוקרים בתחום ה-AI (ועיתונאים שכתבו, או הנחו את הכלי לכתוב, על יכולותיו) היום הוא באמת זמין לכולם.

אבל מה הוא יעשה בחינוך? ChatGPT יצא לאור רק לפני חודש אחד, ובסימניות שלי יש כבר יותר מ-20 כתבות שבדרך זאת או אחרת שואלות את השאלה הזאת ומבקשות להציע תשובה. לא פעם ציינתי כאן שלאור ההתלהבות המוכרת כלפי “הדבר הגדול הבא” הבלוג הזה מעדיף להתייחס לכלים תקשוביים חדשים קצת באיחור, אבל עם ההתייחסות הכל כך רבה של החודש האחרון נדמה שהמאמרון הנוכחי איננו סתם בא באיחור אלא ממש מאחר את הרכבת.

בתחילת דצמבר, בהפרש של שלושה ימים, The Atlantic פרסם שתי כתבות: The College Essay Is Dead ו-The End of High-School English. כפי שאפשר להבין מהכותרת, כותבי שתי הכתבות הביעו חשש גדול ממה שיקרה כאשר ChatGPT יהיה בידיהם של תלמידים וסטודנטים. ג’ף קיין (Geoff Cain) התרגש הרבה פחות. בעיניו הבעיה איננה האיום שכלי שיכול לכתוב עבודות מהווה, אלא המערכת החינוכית שרואה בכתיבת עבודות סתמיות “למידה”. בבלוג שלו הוא מגיב לכתבה הראשונה:

The goal of education is to meet the outcome of 5000 words right? Who cares how you get there? The fact that someone can give a chatbot a writing prompt and get an acceptable essay (in some cases) just means that teaching is really broken right now. We have commodified teaching and learning to such an extent that anything that can produce something can “get” a grade.

ג’ון וורנר (John Warner) מגיב בצורה דומה. וורנר הוא ללא ספק מומחה בהוראת הכתיבה. (מומלץ מאד לקרוא את ספרו Why They Can’t Write: Killing the Five-Paragraph Essay and Other Necessities, שמשם הספר בלבד אפשר להבין את דעתו על הוראת הכתיבה היום באקדמיה.) כבר הרבה לפני יציאתו של ChatGPT וורנר כתב על מחוללי טקסט. היכולות ההולכות ומתגברות של הכלים האלה אינן משנות את גישתו שבאה לביטוי בכותרת של כתבה שהוא פרסם החודש:

ChatGPT Can’t Kill Anything Worth Preserving

למייק שרפלס (Mike Sharples), פרופסור לטכנולוגיות חינוכיות באוניברסיטה הפתוחה של אנגליה, גישה דומה. עוד בחודש מאי הוא סקר את היכולות של GPT-3 וצפה את הבעיות שעכשיו צצות:

Students will employ AI to write assignments. Teachers will use AI to assess them. Nobody learns, nobody gains. If ever there were a time to rethink assessment, it’s now. Instead of educators trying to outwit AI Transformers, let’s harness them for learning.

הקהילה החינוכית בארץ עדיין לא פרסמה הרבה על הכלי, אבל בבלוג שלה השבוע לימור ליבוביץ פרסמה מאמרון חשוב. ליבוביץ מזהה את אותן הבעיות שעליהן כותבים וורנר ושרפלס ומציינת שכל החששות האלו היו צפויות מפני שבעצם המערכת החינוכית איננה מעוניינת ביצירתיות:

כל הדאגות הללו מובנות לגמרי, בהינתן שאנחנו ממשיכים בחינוך “עסקים כרגיל”, ומלמדים תלמידים לשנן ולהבחן מבלי שהם מגלים סקרנות או תשוקה ללמוד את הנושאים, ומבלי שהם מוצאים בהם משהו רלוונטי לחייהם היום ולעתידם.

בכמעט כל הכתבות בנושא ChatGPT נוהגים לבקש מהכלי לחולל לפחות חלק מהטקסט. זה כמובן נחמד, אבל למען האמת די מהר המקורי הופך נדוש. דילגתי על התענוג הזה כאן. ממילא, אם הייתי מבקש מ-ChatGPT טקסט בשביל המאמרון הזה היה עלי גם לתרגם אותו (בוודאי דרך Google Translate) ואז הייתי מסגנן אותו עד שכבר לא היה באמת הטקסט של הכלי. מה לעשות, זה כבר לא במיוחד מעניין. אני כן יכול לציין שלפני מספר שנים כאשר הצגתי קצת על מחוללי טקסט אוטומטיים נהגתי לנבא שבעתיד הלא רחוק סטודנטים יגישו עבודות שהוכנו על ידי הכלים האלה ובמקום לקרוא אותן המרצים יכניסו את העבודות ישירות לתוך כלי לבדיקה אוטומטית, וכולם יהיו מרוצים. כשנתיים אחרי כן שמחתי לקרוא בספרו המצוין של ג’וסטין רייך (Justin Reich) משנת 2020 – Failure to Disrupt – את אותו הרעיון, אבל עם תוספת מצוינת (עמ’ 189):

When I read about autowriters and autograders, I like to imagine students downloading and running computer programs that automatically write essays while instructors use computers to automatically grade those essays. While the computers instantaneously pass these essays and grades back and forth, students and instructors can retire to a grassy quad, sitting together in the warm sun, holding forth on grand ideas and helping each other learn.

הרי כאשר נשתחרר מהצורך בציונים שמדרבן את הסטודנט לחפש כלים להכין עבודות ללא מאמץ מצידו, נוכל במקום זה לנהל שיחה פתוחה שבה העיקר יהיה הלמידה. וכאשר זה יקרה נוכל להגיד תודה לכלים כמו ChatGPT שלקחו על עצמם את מלאכת הכנת העבודות. אבל עד אז בוודאי יהיו לא מעט “דברים גדולים באים” שימציאו מחדש את החינוך … שבכל זאת יישאר כמו שהיה.

אין סוף לדברים הגדולים הבאים

כאשר בלוג הזה נפתח לפני כ-15 שנים מטרתו המרכזית היתה להראות כיצד התקשוב החינוכי יכול להשפיע לטובה על תהליכי הוראה ולמידה. התקווה היתה שהדיגיטליות תוכל להוות נקודה ארכימדית לחינוך אחר. עם השנים הדיגיטליות אמנם חדרה לתוך כל היבטי מערכות החינוך, אבל יותר מאשר היא חוללה שינוי היא סייעה בקיבוע המוכר והמסורתי. וככל שהמציאות הזאת התבהרה, הבלוג הזה נעשה לבמה שבה אני מציג את מצעד האיוולת של היומרות של ה-“חדשנות” החינוכית הדיגיטלית. אבל אני חייב לשאול את עצמי אם יש בכלל טעם בהבאת הדוגמאות האלו. הרי הביקורת שאני מפרסם כאן איננה משפיעה על הזרם הבלתי-פוסק של “חידושים” שרק לעתים מאד רחוקות באמת מביאים בשורה לחינוך.

ההרהור הזה יכול להסביר את ההתלבטות שלי אם לכתוב כאן על עוד “חידוש” בו נתקלתי בשבועות האחרונים. למען האמת, קצת הופתעתי לגלות שמתייחסים ל-TikTok כחידוש. הרי הוא נמצא בשימוש נרחב כבר ארבע שנים וכמעט לא עובר יום שבו הוא איננו בחדשות בדרך זאת או אחרת. אבל לפני כחודש אתר Fast Company מסר לנו ש:

TikTok is a thriving learning community—and may be the future of education

אני, כמובן, אינני היחיד שקריאת כותרת כזאת עושה אותו לציניקן. גם טים סטאמר (Tim Stahmer) כותב עליו, ומעיר, כהערה כללית בסוף המאמרון שלו:

I sign up for pretty much any internet service that has been declared the next big thing for K12 education. I’ve also forgotten about most of them.

ואכן, הגיע זמן שמישהו יערוך רשימה של הכלים שעליהם הכריזו שהם “עתיד החינוך”. ללא ספק בדיקה כזאת תראה שברוב המקרים בסופו של דבר ההשפעה היתה די מזערית. אז הכוכב הנוכחי הוא TikTok, אבל סביר להניח שבקרוב הוא ידעך וכלי אחר יזהר. ומה מיוחד ב-TikTok? לפי הכתבה הכלי עונה על ארבעה צרכים חינוכיים:

      • הוא מעניק כוח ליוצרים
      • הוא מבטא את הערך של “ההשפעה היא ההסמכה החדשה”
      • הוא נותן ביטוי לכך שהלמידה יכולה להיות מהנה
      • הוא עונה על הצורך של למידה חברתית

כותבת הכתבה איננה מסבירה כיצד הרשימה הסתמית הזאת, רשימה שיכולה “לתאר” כמעט כל כלי חדש, מגדירה את הייחוד של TikTok, אבל ממילא בשלב הזה של הכתבה צריך להיות ברור שהיא עוסקת יותר בקידום מכירות מאשר בהשפעה על החינוך. ואכן, בהמשך אנחנו מגלים שעל אף העובדה שהתכונות של TikTok שתוארו יכולות להעניק חוויה לימודית חיובית, בכל זאת משהו חסר, והמשהו הזה (איך לא?) הוא הכלי שהכותבת מבקשת לשווק.

אינני מתנגד לשימוש ב-TikTok בסביבה הלימודית. אני אפילו בטוח שאפשר למצוא לו שימושים יעילים ואפילו לימודיים. כך היה בזמנו עם Facebook ועם Twitter, ועם שלל כלים אחרים שרבים מהם זהרו לתקופה קצרה ועם הזמן נעלמו מהנוף החינוכי, או ליתר דיוק נעשו לעוד כלי באמתחת הכלים שמורים מתוקשבים יכולים לגייס, במינון מתאים ובצורה מושכלת, בפעילות ההוראתית שלהם. אבל הכתבה ב-Fast Company איננה מביאה דוגמאות לסרטוני TikTok לימודיים. היא איננה מתארת כיצד ניתן לשלב את השימוש בו בתחום ידע זה או אחר. במקום זה אנחנו זוכים לאמירות נדושות כמו:

These are the educational experiences that work best for the teacher and learner and which can bring us into a golden age of learning—one that is accessible from anywhere, led by passionate creators and educators, and grounded in a connected community.

זאת איננה אמירה חינוכית, אלא אמירה שיווקית.

בערך שבוע אחרי פרסום הכתבה ב-Fast Company הופיעה כתבה ב-University Affairs הקנדי המדווחת על שימושים ב-TikTok בהשכלה הגבוהה. כותרת הכתבה מצליחה ליצור ציפייה ליותר תוכן מאשר הכתבה האחרת:

How producing videos on TikTok is impacting teaching

אבל הכתבה בסך הכל מביאה שתי דוגמאות (שתיהן מהמדעים), ולפחות לטעמי הן מאד סתמיות. לא מצאתי בהן, או בחשבונות שבעקבות הצפייה בסרטונים אליהן נכנסתי, משהו שהרשים אותי מבחינה לימודית. הכתבה מצטטת את המרצה של אחת הדוגמאות שמסבירה שלדעתה היכולת להסביר דברים בצורה שאנשים מבינים היא בין הכישורים החשובים והיעילים של מורה. אבל ספק אם היינו זקוקים ל-TikTok כדי להסיק את המסקנה המרעישה הזאת. התרשמתי יותר מההערה של מרצה אחרת המצוטטת בכתבה שמהרהרת בכדאיות השימוש בכלי:

For any professors interested in joining TikTok, Dr. Tilleczek recognizes the desire to try something new, or share teaching moments in a kind of digital town hall. But she urges professors to ask, “is this educative? Is there something better that we could be doing? Just because young people are [using TikTok], does it mean that the tool will somehow boost their deep learning and fundamental learning?”

אבל בשלב הזה אני שוב מוצא את עצמי שואל אם הסתמיות אשר בשימוש ה-“חינוכי” של TikTok מצדיקה מאמרון כאן. באמת התלבטתי אם יש טעם בפרסום הביקורת הזאת. ואז לפני מספר ימים נתקלתי בכתבה ב-eSchool News שאיננה מסתפקת ב-TikTok אלא מגייסת את המונח החם ביותר בעולם הדיגיטלי:

Why AI is the future of Socratic learning methods

ההבטחה כאן ממש גדולה. כולם, כמובן, בעד למידה דיאלוגית, והנה, הולכים להראות לנו כיצד הבינה המלאכותית יכולה לקדם אותה. אבל כותרת כזאת גם מעלה שאלה די גדולה: בין מי למי הדיאלוג אמור להתנהל? בכתבה קשה למצוא תשובה. במקום זה אנחנו מקבלים טקסט שלפחות עבורי מבלבל יותר מאשר הוא מבהיר:

Looking at some of the classroom techniques that involve collaboration, such as Jigsaw, Carousel, WebQuest, Graffiti Wall, Philosophical Chairs, Socratic Method, and so forth, it is easy to see how AI can enable individuals to enter a new level of learning never before experienced in a regular classroom.

כתוב כאן ש-“קל לראות”, ואני מודה שאינני מצליח לראות את הרמה החדשה הזאת – עם או בלי המשקפיים שלי. אבל אולי הביקורת שלי איננה הוגנת. הרי בהמשך הכתבה מסבירים לנו את התפקיד של הבינה המלאכותית:

It accomplishes this by providing prompts for questions in Socratic Discussions

הסבר סתמי כזה בוודאי יוצר ציפייה לעוד קצת מידע, אבל במקום שנקבל הסבר רחב יותר על הדרך שבה הבינה המלאכותית תחולל שאלות משמעותיות אנחנו זוכים לטקסט שיווקי נוסף:

Artificial intelligence has the capability to dazzle the young minds of learners who will be continuously engaged in the learning process. With the incredible capabilities that AI offers, both students and teachers will be able to engage in a continuous cycle of learning.

אז מעבר לרמז שהבינה המלאכותית יכולה למלא את התפקיד של המורה, או של תלמידים-עמיתים, בניהול הדיאלוג, נוצר הרושם שעבור כותב הכתבה הבינה המלאכותית היא פשוט קסם. פותחים את שקית האבקת ה-AI, שופכים לתוך כוס מי החינוך, מערבבים ו… יוצאת למידה נפלאה. לא שואלים כאן אם בדיאלוג סוקרטי אנחנו צריכים או רוצים מרכיב שאיננו אנושי. אבל אפילו העלאת השאלה הזאת מעניקה קרדיט רב מדי ל-“הסבר” שהוא ריק מתוכן. לגבי הכתבה הזאת סטיבן דאונס מאבד את הסבלנות ומעיר:

OK, I’m just going to call all this the utter nonsense that it is. I don’t think the editors at eSchool News are even trying any more.

אם קיימת תחרות על הדבר הגדול הבא נדמה לי שברור שהבינה המלאכותית עולה על ה-TikTok. אבל אז נשאלת השאלה … אחרי הבינה המלאכותית האם משהו אחר בכלל יכול להיות הדבר הגדול הבא? משום מה אינני חושש שהמחדשים יתקשו לחשוב על משהו.

על ה-“מלאכותית” אין ויכוח

לאחרונה העיתונות מרבה לדווח על עוד צעד משמעותי בהתפתחות הבינה המלאכותית. מספרים לנו שאם מזינים את ה-GPT-3 – מערכת AI חדשה ומהוללת – בפתיח מילולי על נושא כלשהו היא מסוגלת להשלים כתיבה של חיבור על אותו נושא תוך שמירה על סגנון עקבי וקוהרנטי. בינתיים התוצרים באנגלית (או בתרגום מעשה אדם לעברית) והם עוברים עריכה של בני אדם שבוחרים את הקטעים ה-“אנושיים” ביותר כדי להמחיש את איכות הכתיבה. ובכל זאת, הכתיבה מרשימה, במיוחד אם מתעלמים ממעידות שמבצבצות בתוצרים, מעידות שמהן אפשר להבין שמדובר בכתיבה שמאחוריה אין הבנה של ממש. וכמובן, כמו עם כל התפתחות בתחום ה-AI, הדעות חלוקות – או שיש לפנינו עוד צעד ענק לקראת בינה מלאכותית של ממש, או עוד דוגמה לאחיזת עיניים שבה לבוש מרשים ביותר מכסה על מלך שהוא עדיין ערום, או לפחות נעדר כל סממן של הבנה או תבונה.

בערך באותו הזמן של הפרסומים החדשים על הישגיה של ה-GPT-3 התפרסמה גם ידיעה בנאלית בהרבה. כתבה ב-The Verge (ובמספר מקורות נוספים) מדווחת על תלמיד שלמד להוציא ציונים גבוהים ממערכת ממוחשבת של בדיקת חיבורים. הכתבה מספרת על תלמיד בכיתה ז’ שקיבל ציון כושל עבור תשובה קצרה שהוא הקליד לתוך מערכת של חברת Edgenuity שבשימוש בית הספר שלו. אם התלמיד סיפרה שעד לעלייתו לכיתה ז’ הבן שלה היה תלמיד מצטיין, והוא התקשה להבין מה הוא עשה שעכשיו גרם לקבלת ציון כושל. האם, מרצה להיסטוריה באוניברסיטה, בחנה את המערכת של Edgenuity והחליטה לנסות “לנצח” אותה. לפי הכתבה:

Simmons watched Lazare complete more assignments. She looked at the correct answers, which Edgenuity revealed at the end. She surmised that Edgenuity’s AI was scanning for specific keywords that it expected to see in students’ answers. And she decided to game it.
Now, for every short-answer question, Lazare writes two long sentences followed by a disjointed list of keywords — anything that seems relevant to the question. “The questions are things like… ‘What was the advantage of Constantinople’s location for the power of the Byzantine empire,’” Simmons says. “So you go through, okay, what are the possible keywords that are associated with this? Wealth, caravan, ship, India, China, Middle East, he just threw all of those words in.”

ספק אם מישהו חושב שהמערכת של Edgenuity באמת “קוראת” את התשובות של התלמידים – לפחות בצורה דומה לקריאה של בני אדם. אבל אולי אני משלה את עצמי. הרי מערכות לבדיקת עבודות כתיבה של תלמידים ושל סטודנטים, מערכות שאמורות בעיקר להקל על עבודת המורה, קיימות כבר שנים רבות, ועל אף הביקורת כלפיהן יש חברות טכנולוגיות שעובדות במרץ על המשך הפיתוח של כלים כאלה.

אבל איך זה קשור ל-GPT-3? מערכת ממוחשבת שקוראת חיבור איננה שונה מהותית ממערכת ממוחשבת שכותבת חיבור. שתיהן מתיימרות להשתמש במה שמכנים בינה מלאכותית, אחת “יוצרת”, והאחרת בודקת. סמיכות הפרסומים – האחד על הכתיבה של GPT-3 שדי משכנעת (עד אשר צוללים יותר לתוך תוכן הכתיבה, כמובן) והאחר על מתן ציין על חיבורים קצרים של תלמידים – ממש מבקשת שנשאל עד כמה באמת מדובר בתבונה. אין זה מפתיע שהתשובה לשאלה היא “מעט מאד”, אם בכלל. ב-Twitter אם התלמיד מהכתבה ב-The Verge דיווחה על ההצלחה של הנסיון שלה ושל בנה:

Algorithm update. He cracked it: Two full sentences, followed by a word salad of all possibly applicable keywords. 100% on every assignment. Students on @EdgenuityInc, there’s your ticket. He went from an F to an A+ without learning a thing.

הציוץ של האם הזכירה לי את דבריו של תלמיד כיתה ז’ במדינת אורגון שעליו כתבתי כאן לפני שלוש וחצי שנים. התלמיד בחן את היתרונות ואת החסרונות של בדיקת עבודות על ידי מחשב וכתב:

If students know that they’re being graded by a computer, they could find out how it grades tests. If they do that, they could learn how to get an A on their essay.

לפני שלוש וחצי שנים התלמיד הבין את זה, ומתברר ששלוש וחצי שנים מאוחר יותר, ולמרות ההתקדמות המרשימה במערכות של בינה מלאכותית, עדיין קל מאד לעבוד על המערכות האלה.

כאשר מבינים שמערכת כמו זאת של Edgenuity לא באמת “קוראת” את החיבורים אלא סורקת אותם כדי לבדוק את מידת ההתאמה בין המילים שמופיעות במה שמוגדר כ-“תשובה נכונה” לבין המילים שמופיעות בחיבור, נדרש מאמץ קטן מאד לתת לה את מה שהיא מצפה לקבל כתשובה. כצפוי, ב-Edgenuity מכחישים שהאלגוריתם שלה הוא אשר נותן ציון לתלמידים. בציוץ של החברה בתגובה לפרסום הסיפור הזה הם טוענים:

Edgenuity does not use algorithms to supplant teacher scoring, only to provide scoring guidance to teachers. Teachers have the ability to accept or overrule suggested scores. Tests are never scored by AI and a student’s course grade is never determined by AI #algorithm #elearning

טענה זאת מוכרת היטב. היא בעצם אומרת שהחברה רק מעניקה למורים מערכת שבאמצעותה אפשר לבצע בדיקה ראשונית של חיבורים של תלמידים, ואין זה אשמתה אם המורים לא משתמשים בה כמו שצריך. אבל לא חסרים סיפורים דומים לזה שב-The Verge, וזה מעיד על כך שבתי ספר כן מסתמכים על מערכות כמו של Edgenuity לתת ציונים. אבל גם אם המערכת הזאת רק “ממליצה”, יש בתשובה של החברה מידה לא קטנה של היתממות. שוב ושוב מספרים לנו שמערכות של AI מסוגלות לעשות דברים שהמוח האנושי איננו מסוגל לעשות. ואז, כאשר נתקלים בדוגמאות שמראות עד כמה המערכות האלו רחוקות מבינה של ממש מתרצים את הכשלון בכך שמדובר רק בהמלצה. מצד אחד מפארים את “חוכמת” המערכת, אך מצד שני מזהירים לא להסתמך עליה.

כבר מספר פעמים בעבר הדגשתי שביסודה הכתיבה היא פעולה של תקשורת. אנחנו כותבים כדי למסור משהו למישהו אחר (או לעצמנו). בגלל זה, בעיני הבעיה המרכזית של השימוש במערכות בינה מלאכותית בבדיקת עבודות (מה שבדרך כלל מכונה robo-grading) איננה שהמערכת איננה מספיק טובה, אלא שהיא בכלל קיימת. כדי שתלמיד יכתוב משהו בעל ערך עליו לדעת שבן אדם יתייחס בכבוד למה שהוא כותב. מערכת בדיקה אוטומטית, עם או בלי AI, איננה מתרגשת לקריאת חיבור. היא איננה מחייכת בהנאה לקריאת טיעון משכנע או מנענעת את הראש באכזבה כשהיא פוגשת טיעון לא מוצלח. השימוש במערכות אוטומטיות לבדיקת כתיבה, אפילו אם רק לצרכים תחביריים, מחטיא את המטרה של עידוד הכתיבה כאמצעי תקשורת.

ויש עוד בעיה, בעיה שמפני שהיא בעיה חברתית אולי גדולה עוד יותר. האם מהסיפור ב-The Verge מודעת לעובדה שהמעמד הסוציו-אקונומי שלה מאפשר לה לסייע לבנה. בסיום הכתבה היא אומרת על בנה:

He’s getting an A+ because his parents have graduate degrees and have an interest in tech. … Otherwise he would still be getting Fs. What does that tell you about… the digital divide in this online learning environment?

זה מספר לנו שטכנולוגיות למידה “משרתות” אוכלוסיות שונות בדרכים שונות. אנחנו רואים את זה, למשל, כאשר תלמידים מאוכלוסיות חלשות “זוכים” לטכנולוגיות תרגול למבחנים ואילו מעודדים לתלמידים מאוכלוסיות חזקות להשתמש בטכנולוגיות לשם הרחבת הדעת והעניין. למרבה הצער, פיתוחים של בינה מלאכותית בחינוך, גם אם יהיו אמיתיים ולא רק אחיזת עיניים, לא משנים את החלוקה העלובה הזאת.