טוב, בסדר. אבל האם הוא יחולל שינוי?

סיימתי את המאמרון הקודם שהתפרסם כאן בתחושה של אי-נחת. הרגשתי שאני בסך הכל אספתי מספר התייחסויות על ChatGPT ויותר מדי מיהרתי לקבוע שבעיני הוא איננו הרבה יותר מאשר עוד כלי שמעורר התלהבות אבל בסופו של התהליך לא ישפיע הרבה על החינוך. משהו היה חסר. הרי אי אפשר להתכחש לעובדה שהכלי הוא לא סתם כלי כייפי. הוא ללא ספק מעורר התפעלות שיוצרת רצון לבחון אם אפשר לדרבן אותו לתוצאות מעניינות ואפילו איכותיות. מצאתי את עצמי שואל האם הזדרזתי יתר על המידה לפסול את הפוטנציאל החינוכי של הכלי.

המילה “לפסול” כמובן בעייתית. הכוונה איננה שהשימוש בו פסול. מדובר, אמנם, בכלי בעל עוצמה הרבה מעבר לזאת של בודק האיות או של בודק התחביר שהשימוש בהם היום כבר לגמרי מקובל, אבל הוא בכל זאת דומה להם – כלי שביסודו של דבר יכול לסייע בכתיבה. ואם כך, אינני רואה סיבה שלא ינצלו אותו לשם כך. הפסילה שאליה רוב גורמי החינוך מתייחסים קשורה לטענה שסטודנטים שישתמשו בו לא יכתבו בעצמם, ולכן אי-אפשר יהיה להעריך את הלמידה שלהם. הטענה הזאת נמצאת בבסיס הקריאות להגביל את השימוש בו. בעיני הקריאות האלו מוגזמות, ו-ChatGPT בעצמו, ללא התערבות מאומצת של הסטודנט בגיבוש התוצר הסופי, איננו עד כדי כך עוצמתי.

לעומת ההרהורים של אלה שכתבו ב-The Atlantic (כאן ו-כאן), אינני מרגיש שהכלי טרף את הקלפים, ומעכשיו כבר אי-אפשר לבקש מסטודנטים לכתוב עבודה על נושא מסוים ולצפות שהכתיבה תהיה מקורית (או לפחות עצמאית). אולי ChatGPT מחריף את החששות, אבל הוא בוודאי לא יוצר אותם. סביר גם להניח של-“בעיה” החדשה הזאת יימצא פתרון. בעצם, כבר עובדים על זה. כתבה ב-The Guardian מביא את דבריו של איש צוות ChatGPT שמסביר שהצוות כבר עובד על דרך לזהות עבודה שנכתבה על ידי אלגוריתם ולא על ידי בן אדם. מדובר ב:

a system for countering cheating by “statistically watermarking the outputs”. The technology would work by subtly tweaking the specific choice of words selected by ChatGPT, Aaronson said, in a way that wouldn’t be noticeable to a reader, but would be statistically predictable to anyone looking for signs of machine-generated text.

בכתבה ב-Edsurge אנחנו למדים שגם חברת TurnItIn עובדת על משהו דומה, והשיטה שלה מתבססת על אותה “חולשה” שאנשי ChatGPT מזהים. הכתבה מביאה את דבריו של סגן נשיא החברה:

“We’re very confident that—for the current generation of AI writing generation systems—detection is possible,” says Eric Wang, vice president of AI for the company.
Plagiarism is evolving, but it can still, in theory, be sussed out, he argues. That’s because unlike human writing, which tends to be idiosyncratic, machine writing is designed to use high-probability words, Wang says. It just lacks that human touch.

אני חייב להודות שאני מתקשה לראות שאמצעי הזיהוי האלה, לפחות בתחום החינוכי, באמת יצליחו להבדיל בין האלגוריתמי והאנושי. הרי מי שקורא עבודות של סטודנטים יודע שעל פי רוב מדובר בכתיבה יבשה שגם ממנה נעדר “המגע האנושי”. אני חושש שבמקום לבודד טקסט שהוכן על ידי מכונה כדי לסמן אותו כתוצר טכנולוגי, אותם כלי הזיהוי “יחשבו” שגם טקסט מקורי של סטודנטים הוא בסך הכל טקסט של מכונה.

בנוסף לפתרונות טכנולוגיים, יש גם מי שצופה פתרונות “פשוטים” יותר. בתגובה לציוץ של נשיא אוניברסיטה קונקורדיה אשר במדינת נברסקה (והמצוטט בכתבה ב-EdSurge) שמהרהר שאולי יכולות הכתיבה של ChatGPT יובילו לפיתוח של אמצעי הערכה אנושיים יותר, אב אחד צייץ, בוודאי בנימה הומוריסטית:

was telling my boyz they better get ready for oral exams.

לעומת זאת, ב-Washington Post מארקהם הייד (Markham Heid) מביא הצעה רצינית:

Make students write out essays by hand. Apart from outflanking the latest AI, a return to handwritten essays could benefit students in meaningful ways.

מארקהם הוא כנראה עיתונאי בתחום הרפואה והבריאות. הוא טוען שהכתיבה ביד מפתחת את החשיבה טוב יותר מאשר ההקלדה מול המסך, ולכן הוא חושב שיש רווח כפול בדרישה של כתיבה ביד. הוא אפילו צופה מראש את הטענה הנגדית שסטודנטים פשוט יעתיקו בכתב ידם טקסט שהוכן באמצעות ה-AI. הוא כותב שהפעולות המוטוריות הקשורות לכתיבה ביד מעודדות את הזכרון ואת הלמידה:

And those added layers of stimulation might be beneficial even when a student is merely copying an AI-written essay by hand.

אם אני מבין נכון את הטענה שלו, נדמה לי שבלי להגזים יתר על המידה אפשר לסכם (כמובן בקריצה מסוימת) שהיתרון אשר בהעתקת עבודה בכתב יד נמצא בכך שעכשיו לפחות יש סיכוי שהסטודנט יקרא את מה שהוא מגיש. לפחות עם הקביעה הזאת קשה להתווכח.

אבל הנה, מילאתי כבר מאמרון שני בהתייחסות ל-ChatGPT ואני עדיין מתקשה למצוא כיצד, אם בכלל, הוא באמת ישפיע על החינוך (אלא אם הוא באמת יחסל אותו לחלוטין שמשום מה לא נראה לי שיקרה בעתיד הנראה לעין). אבל נדמה לי שהקושי איננו בכלי, אלא בכיצד אנחנו מבינים את החינוך.

אלן לגמן (Ellen Lagemann) היא דמות מאד מוכרת בתחום ההיסטוריה של החינוך ומחקר החינוך. פעמים רבות (אם כי נדמה לי שאף פעם לא באתר הזה) יצא לי לצטט אמירה ידועה שלה אודות הכיוון אליו החינוך פנה:

One cannot understand the history of education in the United States during the twentieth century unless one realizes that Edward L. Thorndike won and John Dewey lost.

המשפט הזה, מתוך מאמר/הרצאה משנת 1988, מסכם הרבה בנוגע למצבו של החינוך היום, ולא רק בארה”ב. פניתי ל-ChatGPT ושאלתי: לאור המציאות החינוכית היום, האם נכון יהיה להגיד שתורנדייק ניצח ודיואי הפסיד. זכיתי לתשובה סתמית למדי שבסך הכל סקר בקצרה, בקווים מאד כלליים, את התפיסות של תורנדייק ושל דיואי, בתוספת סיכום הדי תפל שכל אחד מהם תרם לחינוך. הכתיבה היתה סבירה, ובעצם נראתה כמו כתיבה של סטודנט שחושש לנקוט עמדה כי הוא איננו מבין את הנושא לעומק ולכן מקווה שסקירה כללית תכסה על העדר ההבנה. שאלתי הלאה אם התשובה שקיבלתי מעידה על כך שלגמן טעתה, וקיבלתי תשובה:

It is not clear who Lagemann is or what their claim or perspective on education might be.

אם הייתי צריך לתת ציון לתשובה הזאת, על אף התשובה הסתמית, נדמה לי שהיה עלי להוסיף מספר נקודות בזכות היושר. אבל אם כתיבה כזאת היא הנורמה של ChatGPT, לא ברור שהוא מסוגל לסייע לסטודנטים בשיפור הכתיבה שלהם.

וזה מחזיר אותנו לשאלה הבסיסית: האם המיקוד שלנו הוא ביכולות הכלי או במהות החינוך. כחודש לפני יציאתו של ChatGPT ג’יין רוזנצוויג (Jane Rosenzweig), מנהלת ה-Harvard College Writing Center, התייחסה לכלים אלגוריתמיים לכתיבה. היא ביקשה להבחין בין התוצר לבין התהליך – הבחנה די מקבילה לשוני בין התפיסה של תורנדייק לבין התפיסה של דיואי. היא העירה:

If the end point rather than the process were indeed all that mattered, then there might be good reason to turn to GPT-3. But if, as I believe is the case, we write to make sense of the world, then the risks of turning that process over to AI are much greater.

וכחודש לפני-כן גם ג’ון דרון (Jon Dron), פרופסור בבית הספר למחשוב ומערכות מידע באוניברסיטה אתבסקה (Athabasca) אשר בקנדה, כתב על הכתיבה באמצעות הכלים האלה. תחילה הוא העיר על הצפוי לקרות:

I predict that traditionalists will demand that we double down on proctored exams, in a vain attempt to defend a system that is already broken beyond repair.

ובהמשך הוא ניבא שהשימוש החוזר של הטקסטים שהכלים האלה מחוללים יוביל להעתקים של העתקים שאיכותם תיעשה יותר ויותר ירודה. באופן מאד דומה לרוזנצוויג הוא המשיך:

If we don’t want this to happen then it is time for educators to reclaim, to celebrate, and (perhaps a little) to reinvent our humanity. We need, more and more, to think of education as a process of learning to be, not of learning to do, except insofar as the doing contributes to our being. It’s about people, learning to be people, in the presence of and through interaction with other people. It’s about creativity, compassion, and meaning, not the achievement of outcomes a machine could replicate with ease. I think it should always have been this way.

אין לי מה להוסיף, ומה ש-ChatGPT היה אולי מוסיף בוודאי היה רק גורע. הכלי מאד מרשים. נעים מאד לשחק איתו. אבל אם נרצה שתהיה לו השפעה חיובית על החינוך נצטרך קודם כל לקבוע באיזה חינוך מדובר.

באמת גדול, וכבר כאן

בחינוך תמיד יש “הדבר הגדול הבא” התורן – אותה המצאה חדשה שאמורה לחולל מהפכה בחינוך. לפני שנה וחצי, למשל, ציינתי שאחרי תקופה יחסית קצרה עם התואר הנחשק ה-TikTok העביר את השרביט לבינה המלאכותית. יש בוודאי אלה שעוד נשבעים שה-TikTok יכול לחולל נפלאות בחינוך, אבל נדמה שקשה להתחרות עם הצעדים הענקיים שבהם הבינה המלאכותית מתקדמת, ומשנה כל דבר שהיא פוגשת. וכגודל הצעדים, גודל תחזיות ההשפעה על החינוך. אם לגבי ה-TikTok שאלו כיצד אפשר להשתמש בו בשיעור, מול ההתקדמות של הבינה המלאכותית השאלות בעלות משקל גדול בהרבה – לאור ההתפתחויות של הבינה המלאכותית אפילו שואלים אם עדיין יש טעם במערכות חינוכיות בכלל. כך, לפחות, הדברים נראים כאשר בוחנים את ההתרגשות סביב ChatGPT.

נדמה שאין צורך להציג את יכולותיו של ChatGPT – הרי כמעט מידי יום העיתונות מדווחת על הנפלאות האלו. הדיווחים אינם שונים מהותית מאלה שהתפרסמו סביב GPT-2 כשהוא יצא לאור בפברואר 2019, או סביב GPT-3 שיצא ביוני 2020. אבל עם כל גלגול חדש יכולות הכלי מתעצמות, והדיווחים אודותיהן מלאים בעוד ועוד התפעלות. חשוב לזכור של-ChatGPT יש יתרון נוסף מעבר לעוצמתו ההולכת וגדלה: ה-Free Research Preview שלו זמין לכולם בחינם באתר אינטרנט. אם בגלגוליו הקודמים של ה-GPT הרוב הגדול של המשתמשים היו חוקרים בתחום ה-AI (ועיתונאים שכתבו, או הנחו את הכלי לכתוב, על יכולותיו) היום הוא באמת זמין לכולם.

אבל מה הוא יעשה בחינוך? ChatGPT יצא לאור רק לפני חודש אחד, ובסימניות שלי יש כבר יותר מ-20 כתבות שבדרך זאת או אחרת שואלות את השאלה הזאת ומבקשות להציע תשובה. לא פעם ציינתי כאן שלאור ההתלהבות המוכרת כלפי “הדבר הגדול הבא” הבלוג הזה מעדיף להתייחס לכלים תקשוביים חדשים קצת באיחור, אבל עם ההתייחסות הכל כך רבה של החודש האחרון נדמה שהמאמרון הנוכחי איננו סתם בא באיחור אלא ממש מאחר את הרכבת.

בתחילת דצמבר, בהפרש של שלושה ימים, The Atlantic פרסם שתי כתבות: The College Essay Is Dead ו-The End of High-School English. כפי שאפשר להבין מהכותרת, כותבי שתי הכתבות הביעו חשש גדול ממה שיקרה כאשר ChatGPT יהיה בידיהם של תלמידים וסטודנטים. ג’ף קיין (Geoff Cain) התרגש הרבה פחות. בעיניו הבעיה איננה האיום שכלי שיכול לכתוב עבודות מהווה, אלא המערכת החינוכית שרואה בכתיבת עבודות סתמיות “למידה”. בבלוג שלו הוא מגיב לכתבה הראשונה:

The goal of education is to meet the outcome of 5000 words right? Who cares how you get there? The fact that someone can give a chatbot a writing prompt and get an acceptable essay (in some cases) just means that teaching is really broken right now. We have commodified teaching and learning to such an extent that anything that can produce something can “get” a grade.

ג’ון וורנר (John Warner) מגיב בצורה דומה. וורנר הוא ללא ספק מומחה בהוראת הכתיבה. (מומלץ מאד לקרוא את ספרו Why They Can’t Write: Killing the Five-Paragraph Essay and Other Necessities, שמשם הספר בלבד אפשר להבין את דעתו על הוראת הכתיבה היום באקדמיה.) כבר הרבה לפני יציאתו של ChatGPT וורנר כתב על מחוללי טקסט. היכולות ההולכות ומתגברות של הכלים האלה אינן משנות את גישתו שבאה לביטוי בכותרת של כתבה שהוא פרסם החודש:

ChatGPT Can’t Kill Anything Worth Preserving

למייק שרפלס (Mike Sharples), פרופסור לטכנולוגיות חינוכיות באוניברסיטה הפתוחה של אנגליה, גישה דומה. עוד בחודש מאי הוא סקר את היכולות של GPT-3 וצפה את הבעיות שעכשיו צצות:

Students will employ AI to write assignments. Teachers will use AI to assess them. Nobody learns, nobody gains. If ever there were a time to rethink assessment, it’s now. Instead of educators trying to outwit AI Transformers, let’s harness them for learning.

הקהילה החינוכית בארץ עדיין לא פרסמה הרבה על הכלי, אבל בבלוג שלה השבוע לימור ליבוביץ פרסמה מאמרון חשוב. ליבוביץ מזהה את אותן הבעיות שעליהן כותבים וורנר ושרפלס ומציינת שכל החששות האלו היו צפויות מפני שבעצם המערכת החינוכית איננה מעוניינת ביצירתיות:

כל הדאגות הללו מובנות לגמרי, בהינתן שאנחנו ממשיכים בחינוך “עסקים כרגיל”, ומלמדים תלמידים לשנן ולהבחן מבלי שהם מגלים סקרנות או תשוקה ללמוד את הנושאים, ומבלי שהם מוצאים בהם משהו רלוונטי לחייהם היום ולעתידם.

בכמעט כל הכתבות בנושא ChatGPT נוהגים לבקש מהכלי לחולל לפחות חלק מהטקסט. זה כמובן נחמד, אבל למען האמת די מהר המקורי הופך נדוש. דילגתי על התענוג הזה כאן. ממילא, אם הייתי מבקש מ-ChatGPT טקסט בשביל המאמרון הזה היה עלי גם לתרגם אותו (בוודאי דרך Google Translate) ואז הייתי מסגנן אותו עד שכבר לא היה באמת הטקסט של הכלי. מה לעשות, זה כבר לא במיוחד מעניין. אני כן יכול לציין שלפני מספר שנים כאשר הצגתי קצת על מחוללי טקסט אוטומטיים נהגתי לנבא שבעתיד הלא רחוק סטודנטים יגישו עבודות שהוכנו על ידי הכלים האלה ובמקום לקרוא אותן המרצים יכניסו את העבודות ישירות לתוך כלי לבדיקה אוטומטית, וכולם יהיו מרוצים. כשנתיים אחרי כן שמחתי לקרוא בספרו המצוין של ג’וסטין רייך (Justin Reich) משנת 2020 – Failure to Disrupt – את אותו הרעיון, אבל עם תוספת מצוינת (עמ’ 189):

When I read about autowriters and autograders, I like to imagine students downloading and running computer programs that automatically write essays while instructors use computers to automatically grade those essays. While the computers instantaneously pass these essays and grades back and forth, students and instructors can retire to a grassy quad, sitting together in the warm sun, holding forth on grand ideas and helping each other learn.

הרי כאשר נשתחרר מהצורך בציונים שמדרבן את הסטודנט לחפש כלים להכין עבודות ללא מאמץ מצידו, נוכל במקום זה לנהל שיחה פתוחה שבה העיקר יהיה הלמידה. וכאשר זה יקרה נוכל להגיד תודה לכלים כמו ChatGPT שלקחו על עצמם את מלאכת הכנת העבודות. אבל עד אז בוודאי יהיו לא מעט “דברים גדולים באים” שימציאו מחדש את החינוך … שבכל זאת יישאר כמו שהיה.

על חלום כזה אפשר לוותר

לפני חודשיים ה-Learning Agency Lab, חברה פרטית במדינת אריזונה, יחד עם Georgia State University, הכריזו על תחרות להכנת אלגוריתם שיוכל להעריך את הכתיבה של תלמידים בגילאי חטיבות הביניים והעליונה. מטרת התחרות:

to spur the development of open-source algorithms that help struggling students dramatically improve in writing

בעוד שלושה שבועות שלב ההרשמה לתחרות תסתיים, ולפי דף ה-kaggle של התחרות נכון לעכשיו יש מעל 1600 צוותים שהכריזו על השתתפותם בתחרות.

זאת איננה התחרות הראשונה שנערכת במטרה לבנות אלגוריתם שיוכל לקרוא ולהעריך את הכתיבה של תלמידים. במהלך השנים היו רבים כאלה. פיטר גרין (Peter Greene), במאמרון בבלוג שלו, מכנה את השאיפה לאלגוריתם כזה “החלום שמסרבת למות”. גרין מצטט מדף התחרות שמוסר שנכון ליום קיימים מגוון כלים אוטומטיים למתן משוב על כתיבה, אבל כולם מוגבלות. לזה גרין מגיב בעוקצנות:

Primarily they are limited because they don’t work very well.

האם יש סיכוי שמי שיזכה בפרס של התחרות הנוכחית אכן יצליח במה שעד עכשיו נכשלו? מפעילי התחרות חושבים שהסיכוי לכך טוב, וזה משום שהם מעמידים לרשות המתחרים מאגר עצום של דוגמאות כתיבה של תלמידים – מאגר שלפי מפעילי התחרות כבר עבר בדיקה והערכה אצל “מומחים” בתחום הערכת כתיבה של תלמידים. מדובר בשני מאגרים – אחד עם 25,000 חיבורי תלמידים, והאחר עם 7,000. הערכת הכתיבה של האלגוריתם המנצח תצטרך להתאים להערכה של המומחים האנושיים.

מנהלי התחרות מסבירים את הערך החשוב אשר בבניית אלגוריתם מוצלח:

If successful, you’ll make it easier for students to receive feedback on their writing and increase opportunities to improve writing outcomes. Virtual writing tutors and automated writing systems can leverage these algorithms while teachers may use them to reduce grading time. The open-sourced algorithms you come up with will allow any educational organization to better help young writers develop.

גרין מתייחס לתחרות בכללותה עם מידה גדושה של ציניות. עבורו האלגוריתם איננו קורא (ובוודאי איננו “מבין”) את מה שהתלמיד כותב. עבור האלגוריתם החיבורים אינם כתיבה, אלא נתונים שניתן לנתח, וצריך להיות ברור שניתוח נתונים איננו דומה לקריאה אנושית. אלגוריתמים בסך הכל יכולים לבחון את אוצר המילים, את תקינות המשפטים ואת מבנה החיבור באופן כללי. בין זה לבין קריאה של ממש יש פער עצום, וגרין סבור שהתחרות לא תוכל להניב כלי מוצלח. זאת ועוד: מבחינתו יש בעיה רצינית יותר מאשר העובדה שהאלגוריתם איננו באמת בוחן כתיבה. מה שחמור יותר הוא עצם ההסתמכות על אלגוריתם שמנתק את הכתיבה האנושית מהעין האנושית שאמורה לראות אותה. לדעתו כשלון התחרות, ותחרויות דומות, מובטח:

particularly as long as some folks believe that data crunching machines can uplift young humans.

אני נוטה להסכים עם גרין, אם כי כבר פעמים רבות התברר לנו שהנבואה שהמחשב לעולם לא יוכל לעשות את מה שהאדם עושה התגלתה כמשאלת לב ואפילו כתקוות שווא. פעם אחר פעם גילינו שיש דברים “אנושיים” שהמחשב דווקא כן יכול לעשות. הרי בודק האיות ואפילו בודק התחביר של Word כבר מובנים מעליהם אצלנו. לאור זה לא מומלץ לנבא שאלגוריתם לא יוכל לעזור לתלמידים לכתוב. אבל נדמה לי שיש בתחרות הזאת בעיה יותר גדולה מאשר היכולת או העדר היכולת של המחשב לבדוק את הכתיבה של תלמידים.

לעתים קרובות התנופה לבניית כלים שיוכלו לקרוא ולהעריך את הכתיבה של תלמידים מתהדרת במונחים של שוויון הזדמנויות. כך גם עם התחרות הנוכחית. באתר התחרות מספרים לנו שתלמידים משכבות חלשות אינם לומדים לכתוב בצורה שמאפשרת להם להתקדם – הן בלימודים והן בעולם העבודה:

Unfortunately, low-income, Black and Hispanic students fare far worse, with less than 15 percent considered proficient writers.

לאור זה, פועל יוצא של המצב הזה הוא הצורך לקדם את התלמידים האלה כדי שהם יידעו לכתוב טוב יותר. ואכן, מוסרים לנו ש:

One way to help students improve their writing is to give students more opportunities to write and receive feedback on their writing.

ובהמשך ישיר של אותה פסקה אנחנו קוראים על הקושי אשר בדבר: כיצד נותנים לתלמידים האלה את המשוב הדרוש? וכאן נכנס ההערכה האוטומטית:

However, assigning more writing to students places a larger burden on teachers to generate timely feedback. One potential solution is the use of automated writing evaluation (AWE) systems, which can evaluate student writing and provide feedback independently.

אין צורך לקרוא בין השורות כדי להבין שיש כאן ריבוד מעמדי מאד ברור: ילדים משכבות אוכלוסייה מבוססות כנראה ימשיכו לזכות במשוב אנושי, ואילו ילדים משכבות חלשות יקבלו את העזרה שהטכנולוגיה מספקת. המצב הזה מעלה שאלה מעניינת: אם טכנולוגיות חינוכיות כל כך רצויות, כיצד נסביר שמכוונים אותן דווקא לאוכלוסיות החלשות? הרי ברור שהשכבות המבוססות יכולות לשלם עבור הקידמה הטכנולוגית. הבתים וכלי הרכב של השכבות האלו מצוידים בחומרות ובתוכנות החדישות ביותר. למה, אם כן, איננו שומעים דרישה מהורי השכבות האלו שהחיבורים של ילדיהם ייבדקו באמצעות אלגוריתם? זה איננו סוד שהשכבות האלו מעדיפות מגע אישי. הרובוטים החינוכיים (או ליתר דיוק ה-“הוראתיים”) פותרים את הבעיה עבור אלה שאינם יכולים לדרוש את המגע האנושי, ומשום מה מציגים את הפער המעמדי הברור הזה כדאגה לשכבות החלשות שבעצם “זוכים” לחידושים שהקידמה הטכנולוגית מציעה.

רצוי לשים לב לכך שמעבר למס השפתיים לדאגה לזמן של המורה, מטרת התחרות איננה להקל על המורה. יתכן אפילו שיש כאן מטרה סמויה – לצמצם את הצורך במורה. במסווה של סיוע לתלמידים חלשים מוציאים את המגע האנושי מהתמונה החינוכית באופן כללי, ומעבירים את הכסף שבעבר הגיע למורים לחברות הטכנולוגיות.

נדמה לי שכולם מסכימים שכדי שתלמידים ילמדו לכתוב כתיבה מוצלחת חשוב שהם יקבלו משוב. אינני שולל את המשוב הטכנולוגי כמו זה שב-Word. אמנם מעולם לא בדקתי את Grammarly, אבל אני מוכן להאמין שבאמצעותו תלמידים יכולים לקבל משוב שעוזר לשפר את כתיבתם. אבל במקרים האלה המשוב מגיע ישירות לתלמיד תוך כדי הכתיבה ומאפשר לו לשפר את הכתיבה שלו – כתיבה שבהמשך אמורה להגיע לעיניים אנושיות. התחרות הנוכחית מבקשת להוציא את העיניים האלו מהתהליך הזה. בדרך הזאת מבטלים את השאיפה לתקשורת אשר בגללה אנחנו כותבים. אם אף אחד לא יקרא את מה שתלמידים כותבים, למה שיכתבו בכלל? אבל בעיני מפעילי התחרות, בשביל אוכלוסיות חלשות “עיני” האלגוריתם כנראה מספיקות. ממילא אנחנו רוצים שהתלמידים האלה יידעו לכתוב כדי שהם יוכלו לקבל משרות עבודה סבירות, ולא מפני שמישהו באמת מעוניין בדעתם או רוצה לדעת מה שיש להם להגיד.

הוויכוח נמשך – אם למישהו עוד אכפת

יש נושאים בתחום התקשוב שמלווים אותנו שנים ארוכות – כמו, למשל הוויכוח סביב השאלה אם עדיף לסכם שיעורים באמצעות העט והנייר או בצורה דיגיטלית. לפני כחודש וחצי דניאל וילינגהם (Daniel Willingham) צייץ שרשור ציוצים שהזכיר לנו שמדובר בנושא שעליו הדעות עדיין חלוקות. הוא פתח:

Laptops vs handwritten notes? The research continues to be inconsistent.

למען האמת, בשלב הזה של שילוב המחשב לתוך הסביבה החינוכית, חשבתי שהנושא הזה כבר איננו מעסיק אותנו. יש מרצים שטוענים שעצם נוכחות המחשב הנייד (שלא לדבר על הטלפון ה-“חכם”) בשיעור מפריעה למהלך השיעור, ואפילו פוגעת ביכולת הלימוד של הסטודנט. יש גם אלה שטוענים שהעיסוק של סטודנטים במכשירים הדיגיטליים שלהם מסיח גם את דעתם של סטודנטים אחרים שדווקא מעוניינים להתרכז בשיעור, ובגלל זה הם אוסרים על השימוש בהם בשיעור. יכול להיות שיש צדק בטענה הזאת. כבר ב-2014 קליי שירקי (Clay Shirky), אדם מאד מתוקשב שכתב רבות על הטוב והחיובי אשר ב-Web 2.0, העיד שלגבי ההוראה שלו הוא קיבל החלטה קשה ואפילו מוזרה. הוא כתב:

I have just asked the students in my fall seminar to refrain from using laptops, tablets, and phones in class.

אבל המקרה של שירקי איננו קשור לדרך המועדפת לסיכום של שיעור, אלא בבעיה של קשב והיסח הדעת. היום, בעידן הקורונה, כאשר אחוז משמעותי של השיעורים ממילא מתנהל מרחוק, השאלות של מידת הריכוז של הסטודנט במתרחש בשיעור אינן מתמקדות בכלי שאיתו הסטודנט מסכם את השיעור. כמו-כן, אין אפשרות להנחות את הסטודנטים לסגור את המחשב – הרי הם זקוקים לו כדי להשתתף בשיעור.

לאור המציאות הזאת, יכול להיות שמדובר בוויכוח סרק. ובכל זאת, וילינגהם צודק – במהלך השנים התנהל ויכוח, ואפילו ויכוח חריף, וכל צד התבצר בדעתו. בשרשור שלו וילנגהם מקשר לחמישה מחקרים שונים, כולם מהעשור האחרון, ואכן, המסקנות רחוקות מלהיות חד-משמעיות. יש מי שמוצא יתרון בכתב היד, ויש מי שמוצא שההקלדה לתוך המחשב הנייד עדיף. יריית הפתיחה בדיון היה כנראה מחקרם של מולר ואופנהיימר (Mueller & Oppenheimer) מ-2014. במחקר הזה הם מצאו יתרון לסיכום בכתב היד. אבל ב-2019 מורהד (Morehead) ניסתה לשחזר את אותו המחקר, והתקשתה להסיק מסקנה ברורה. בלשון די עדינה היא קבעה:

Based on the present outcomes and other available evidence, concluding which method is superior for improving the functions of note-taking seems premature.

יכול להיות שהמחקר של מורהד היה צריך לגרום להכרזה על תיקו ולהביא להפסקת אש. אבל הסוגיה המשיכה לעורר ענין. ב-2021, אורי (Urry) ויותר מ-80 שותפים ניסו גם הם לשחזר את המחקר של מולר ואופנהיימר. וכמו מורהד, גם הם לא הצליחו להגיע למסקנה ברורה. הם כתבו:

Overall, results do not support the idea that longhand note taking improves immediate learning via better encoding of information.

האם משהו השתנה בין 2014 ל-2019 ו-2021? המכשירים הדיגיטליים בהחלט השתנו, וגם השתפרו, אבל ספק אם יש ביכולות המשופרות של אלה להביא לכך שהיום סטודנטים מצליחים לרשום סיכומי שיעורים בצורה טובה יותר עם כלים דיגיטליים מאשר לפני פחות מעשור. אבל משהו אחר כן השתנה. ככל שמכשירים דיגיטליים הפכו לחלק מהיום-יום שלנו יכולת ההקלדה – אם בהקלדה עיוורת, ואם בשתי אצבעות על הטלפון ה-“חכם” – השתפרה ונעשתה למיומנות נפוצה. סטודנטים היום כבר יודעים להקליד במהירות מספיק סבירה כך שההקלדה במכשיר דיגיטלי איננה מהווה מכשול לחשיבה מהירה. אפשר להקשיב לנאמר בשיעור וגם לסכם, מבלי לנסות לרשום מילה במילה (שלפי מספר מחקרים מעכב את יכולת הלמידה).

בשלב הזה בהכנת המאמרון הזה מצאתי את עצמי שואל שאלה שבזמן האחרון עולה כאן לעתים די קרובות: “למה?”. האם יש טעם לעסוק בסוגיה שבמידה רבה שייכת יותר לעבר מאשר להווה? אינני חייב לפרסם משהו כאן, ולכן אין בושה בלגנוז את מה שכתבתי (זאת לא תהיה הפעם הראשונה) ולא לפרסם דבר. אבל תוך כדי ההתלבטות ראיתי שגם דונלד קלארק (Donald Clark) העלה את הנושא הזה בבלוג שלו. בסוף ינואר הוא שאל (וגם ענה):

Is handwriting better than typing for note taking? Surprisingly, it’s not!

כמו וילינגהם, גם קלארק מתייחס למולר ואופנהיימר, ולנסיון של מורהד לחזור על אותו ניסוי. הוא איננו מזכיר את אורי, אבל במקום זה הוא מביא מחקר שהתפרסם ממש השנה של ווֹייר (Voyer) – מחקר שטרם קראתי במלואו. בתקציר המאמר של ווֹייר אנחנו למדים שהמחקר הנוכחי הוא מטה-ניתוח שבדק 36 מחקרים בנושא של סיכום שיעורים באמצעות כתב היד או בדרך דיגיטלי. והמסקנה?:

Overall, results showed a mean effect size (mean estimated g = -0.008, 95% CI: −0.18, 0.16) that was not significantly different from zero, suggesting no effect of notetaking approach.

מכל זה המסקנה של קלארק די הגיונית: כתיבת סיכום של שיעור במילים של הסטודנט עצמו חשוב יותר מאשר האמצעי אשר בו נערך הסיכום. הוא מציין שהגמישות בעריכה, בשמירה, ובנגישות של הסיכום הדיגיטלי מעניקות לו יתרון, אבל נדמה שהוא איננו רואה חשיבות בהמשך הוויכוח. במקום זה הוא מדגיש:

Note taking is not an end in itself, merely the start of a learning journey.

המסקנה ההגיונית הזאת עומדת בניגוד לסיכום בתקציר של המאמר של ווֹייר. אחרי שהוא מציין שהבדיקה שלו לא העלתה הבדלים משמעותיים הוא מציין:

Nevertheless, more research is required to identify moderators that might account for variability in the findings. Work using large representative samples of all ages is particularly needed.

אבל נשאלת השאלה אם זה באמת נכון. נדמה לי שאפשר לסכם שבשלב הזה הנושא מיצה את עצמו. מי שרוצה לסכם בכתב יד מוזמן לעשות זאת, וכך גם מי שמעדיף לסכם באמצעות מכשיר דיגיטלי (אם כי רצוי להיזהר מהיסח הדעת, במיוחד כאשר השיעור נעשה משעמם). ואולי אנשי המחקר יוכלו להתפנות לנושאים בוערים יותר.

על ה-“מלאכותית” אין ויכוח

לאחרונה העיתונות מרבה לדווח על עוד צעד משמעותי בהתפתחות הבינה המלאכותית. מספרים לנו שאם מזינים את ה-GPT-3 – מערכת AI חדשה ומהוללת – בפתיח מילולי על נושא כלשהו היא מסוגלת להשלים כתיבה של חיבור על אותו נושא תוך שמירה על סגנון עקבי וקוהרנטי. בינתיים התוצרים באנגלית (או בתרגום מעשה אדם לעברית) והם עוברים עריכה של בני אדם שבוחרים את הקטעים ה-“אנושיים” ביותר כדי להמחיש את איכות הכתיבה. ובכל זאת, הכתיבה מרשימה, במיוחד אם מתעלמים ממעידות שמבצבצות בתוצרים, מעידות שמהן אפשר להבין שמדובר בכתיבה שמאחוריה אין הבנה של ממש. וכמובן, כמו עם כל התפתחות בתחום ה-AI, הדעות חלוקות – או שיש לפנינו עוד צעד ענק לקראת בינה מלאכותית של ממש, או עוד דוגמה לאחיזת עיניים שבה לבוש מרשים ביותר מכסה על מלך שהוא עדיין ערום, או לפחות נעדר כל סממן של הבנה או תבונה.

בערך באותו הזמן של הפרסומים החדשים על הישגיה של ה-GPT-3 התפרסמה גם ידיעה בנאלית בהרבה. כתבה ב-The Verge (ובמספר מקורות נוספים) מדווחת על תלמיד שלמד להוציא ציונים גבוהים ממערכת ממוחשבת של בדיקת חיבורים. הכתבה מספרת על תלמיד בכיתה ז’ שקיבל ציון כושל עבור תשובה קצרה שהוא הקליד לתוך מערכת של חברת Edgenuity שבשימוש בית הספר שלו. אם התלמיד סיפרה שעד לעלייתו לכיתה ז’ הבן שלה היה תלמיד מצטיין, והוא התקשה להבין מה הוא עשה שעכשיו גרם לקבלת ציון כושל. האם, מרצה להיסטוריה באוניברסיטה, בחנה את המערכת של Edgenuity והחליטה לנסות “לנצח” אותה. לפי הכתבה:

Simmons watched Lazare complete more assignments. She looked at the correct answers, which Edgenuity revealed at the end. She surmised that Edgenuity’s AI was scanning for specific keywords that it expected to see in students’ answers. And she decided to game it.
Now, for every short-answer question, Lazare writes two long sentences followed by a disjointed list of keywords — anything that seems relevant to the question. “The questions are things like… ‘What was the advantage of Constantinople’s location for the power of the Byzantine empire,’” Simmons says. “So you go through, okay, what are the possible keywords that are associated with this? Wealth, caravan, ship, India, China, Middle East, he just threw all of those words in.”

ספק אם מישהו חושב שהמערכת של Edgenuity באמת “קוראת” את התשובות של התלמידים – לפחות בצורה דומה לקריאה של בני אדם. אבל אולי אני משלה את עצמי. הרי מערכות לבדיקת עבודות כתיבה של תלמידים ושל סטודנטים, מערכות שאמורות בעיקר להקל על עבודת המורה, קיימות כבר שנים רבות, ועל אף הביקורת כלפיהן יש חברות טכנולוגיות שעובדות במרץ על המשך הפיתוח של כלים כאלה.

אבל איך זה קשור ל-GPT-3? מערכת ממוחשבת שקוראת חיבור איננה שונה מהותית ממערכת ממוחשבת שכותבת חיבור. שתיהן מתיימרות להשתמש במה שמכנים בינה מלאכותית, אחת “יוצרת”, והאחרת בודקת. סמיכות הפרסומים – האחד על הכתיבה של GPT-3 שדי משכנעת (עד אשר צוללים יותר לתוך תוכן הכתיבה, כמובן) והאחר על מתן ציין על חיבורים קצרים של תלמידים – ממש מבקשת שנשאל עד כמה באמת מדובר בתבונה. אין זה מפתיע שהתשובה לשאלה היא “מעט מאד”, אם בכלל. ב-Twitter אם התלמיד מהכתבה ב-The Verge דיווחה על ההצלחה של הנסיון שלה ושל בנה:

Algorithm update. He cracked it: Two full sentences, followed by a word salad of all possibly applicable keywords. 100% on every assignment. Students on @EdgenuityInc, there’s your ticket. He went from an F to an A+ without learning a thing.

הציוץ של האם הזכירה לי את דבריו של תלמיד כיתה ז’ במדינת אורגון שעליו כתבתי כאן לפני שלוש וחצי שנים. התלמיד בחן את היתרונות ואת החסרונות של בדיקת עבודות על ידי מחשב וכתב:

If students know that they’re being graded by a computer, they could find out how it grades tests. If they do that, they could learn how to get an A on their essay.

לפני שלוש וחצי שנים התלמיד הבין את זה, ומתברר ששלוש וחצי שנים מאוחר יותר, ולמרות ההתקדמות המרשימה במערכות של בינה מלאכותית, עדיין קל מאד לעבוד על המערכות האלה.

כאשר מבינים שמערכת כמו זאת של Edgenuity לא באמת “קוראת” את החיבורים אלא סורקת אותם כדי לבדוק את מידת ההתאמה בין המילים שמופיעות במה שמוגדר כ-“תשובה נכונה” לבין המילים שמופיעות בחיבור, נדרש מאמץ קטן מאד לתת לה את מה שהיא מצפה לקבל כתשובה. כצפוי, ב-Edgenuity מכחישים שהאלגוריתם שלה הוא אשר נותן ציון לתלמידים. בציוץ של החברה בתגובה לפרסום הסיפור הזה הם טוענים:

Edgenuity does not use algorithms to supplant teacher scoring, only to provide scoring guidance to teachers. Teachers have the ability to accept or overrule suggested scores. Tests are never scored by AI and a student’s course grade is never determined by AI #algorithm #elearning

טענה זאת מוכרת היטב. היא בעצם אומרת שהחברה רק מעניקה למורים מערכת שבאמצעותה אפשר לבצע בדיקה ראשונית של חיבורים של תלמידים, ואין זה אשמתה אם המורים לא משתמשים בה כמו שצריך. אבל לא חסרים סיפורים דומים לזה שב-The Verge, וזה מעיד על כך שבתי ספר כן מסתמכים על מערכות כמו של Edgenuity לתת ציונים. אבל גם אם המערכת הזאת רק “ממליצה”, יש בתשובה של החברה מידה לא קטנה של היתממות. שוב ושוב מספרים לנו שמערכות של AI מסוגלות לעשות דברים שהמוח האנושי איננו מסוגל לעשות. ואז, כאשר נתקלים בדוגמאות שמראות עד כמה המערכות האלו רחוקות מבינה של ממש מתרצים את הכשלון בכך שמדובר רק בהמלצה. מצד אחד מפארים את “חוכמת” המערכת, אך מצד שני מזהירים לא להסתמך עליה.

כבר מספר פעמים בעבר הדגשתי שביסודה הכתיבה היא פעולה של תקשורת. אנחנו כותבים כדי למסור משהו למישהו אחר (או לעצמנו). בגלל זה, בעיני הבעיה המרכזית של השימוש במערכות בינה מלאכותית בבדיקת עבודות (מה שבדרך כלל מכונה robo-grading) איננה שהמערכת איננה מספיק טובה, אלא שהיא בכלל קיימת. כדי שתלמיד יכתוב משהו בעל ערך עליו לדעת שבן אדם יתייחס בכבוד למה שהוא כותב. מערכת בדיקה אוטומטית, עם או בלי AI, איננה מתרגשת לקריאת חיבור. היא איננה מחייכת בהנאה לקריאת טיעון משכנע או מנענעת את הראש באכזבה כשהיא פוגשת טיעון לא מוצלח. השימוש במערכות אוטומטיות לבדיקת כתיבה, אפילו אם רק לצרכים תחביריים, מחטיא את המטרה של עידוד הכתיבה כאמצעי תקשורת.

ויש עוד בעיה, בעיה שמפני שהיא בעיה חברתית אולי גדולה עוד יותר. האם מהסיפור ב-The Verge מודעת לעובדה שהמעמד הסוציו-אקונומי שלה מאפשר לה לסייע לבנה. בסיום הכתבה היא אומרת על בנה:

He’s getting an A+ because his parents have graduate degrees and have an interest in tech. … Otherwise he would still be getting Fs. What does that tell you about… the digital divide in this online learning environment?

זה מספר לנו שטכנולוגיות למידה “משרתות” אוכלוסיות שונות בדרכים שונות. אנחנו רואים את זה, למשל, כאשר תלמידים מאוכלוסיות חלשות “זוכים” לטכנולוגיות תרגול למבחנים ואילו מעודדים לתלמידים מאוכלוסיות חזקות להשתמש בטכנולוגיות לשם הרחבת הדעת והעניין. למרבה הצער, פיתוחים של בינה מלאכותית בחינוך, גם אם יהיו אמיתיים ולא רק אחיזת עיניים, לא משנים את החלוקה העלובה הזאת.

למה בכלל שיכתבו בבית הספר?

לפני כמעט חודשיים, בבלוג כיתתי של בית ספר במדינת אורגון, תלמיד בכיתה ז’ פרסם מאמרון:

בלוגים כיתתיים אינם נפוצים כמו שהיו לפני מספר שנים, אבל אני מניח שבכל זאת עדיין אפשר למצוא מאות כאלה, אם לא הרבה יותר, בארה”ב. למאמרון הספציפי הזה הגעתי לא מפני שהנושא מעסיק אותי (אם כי הוא כמובן עושה זאת), אלא מפני שאני מכיר את מורה הכיתה, ואני יודע שלכיתה שלו יש בלוג. המורה מעלה קישור לכל מאמרון חדש שמתפרסם בבלוג לחשבון ה-Twitter שלו, וכך אני יודע להציץ ולבדוק מה חדש בו. המאמרונים בבלוג עוסקים במבחר מאד רחב של נושאים. מעניין אותי לראות את הכתיבה של התלמידים, אבל על פי רוב אין לי סיבה לעקוב אחר הדיון שמתפתח בין התלמידים בתגובות. הפעם, מפני שהמאמרון עסק בנושא קרוב לליבי, עקבתי אחר התגובות, ואף הגבתי בעצמי. (תגובות למאמרון מחברי הכיתה התחילו להופיע רק מספר שבועות אחרי פרסמו, ומאז בערך שבוע כבר אין תגובות חדשות.)

התלמיד שפרסם את המאמרון ביקש להיות אובייקטיבי. הוא הביא טיעונים בעד ונגד המחשב כבודק הכתיבה של תלמידים. הוא כותב, למשל, שעבור המורים מלאכת הבדיקה של מה שתלמידיהם כותבים, ומתן הציון על הכתיבה הזאת, יכולה להיות מאד מלחיצה. (מעניין לציין שלא ברור כיצד הוא יודע זאת, אם כי הוא ללא ספק צודק.) הוא מציין שהיום קיימות תוכנות שמאפשרות למחשבים לבצע את הבדיקה עבור המורה, והוא כותב:

The problem, of course, is the accuracy. If computers could grade essays better than teachers, every school would have computers grade essays.
אני מניח שבזה הוא צודק, אם כי נדמה לי שכאשר הוא כותב על “דיוק” בכתיבה הוא מתכוון לאיתור שגיאות כתיב או תחביר, ולא לאיכות הטיעונים שבכתיבה. זאת ועוד: כתלמיד כיתה ז’ הוא עדיין לא פיתח את הציניות שעשויה לגרום למבוגרים ממנו להגיד שמה שמניע את בתי הספר לאמץ תוכנות כאלה איננו בהכרח הדיוק, או הרצון להקל על המורים, אלא החסכון הכספי – בטווח הרחוק, הרי, תוכנת מחשב עולה הרבה פחות מאשר המשכורת של מורה. התלמיד מוסיף שהמהירות שבה המחשב פועל היא יתרון גדול, ומדגיש שמשוב מהיר יכול לעזור לתלמיד לערוך שינויים ולשפר את כתיבתו:
If you’re making a draft, you can get a response in seconds. That leads to more writing, which ultimately leads to a better finished essay.
אפילו אם אינני מסכים עם כל מה שהוא כותב, יש כאן התייחסות רצינית. ברור שהמאמרון עומד באמות המידה שהמורה שלו העמיד כמטרות הכתיבה. אבל משהו אחר שהוא כותב – ולא ברור אם בעיניו מדובר בנקודת זכות או חובה – טיפה מוזר בעיני:
If students know that they’re being graded by a computer, they could find out how it grades tests. If they do that, they could learn how to get an A on their essay.
היכולת לדעת מה יקנה לתלמיד ציון טוב איננה קשורה לעובדה שמדובר במחשב. תלמידים מוצלחים “קוראים” את המורים שלהם ויודעים להחזיר להם את מה שהם רוצים. הם יכולים לפענח את השיקולים – של המורה או של המחשב – במתן ציון ולהתאים את עצמם אל הדרישות השונות על מנת לקבל ציונים טובים יותר. נדמה שכאשר כותב המאמרון מעלה טיעון כזה הוא מראה שהוא הבין שהרעיון הבסיסי של בית הספר איננו לקדם את הלמידה, אלא לוודא שהתלמיד הפנים את מה שבית הספר רוצה להקנות. משתמע מדבריו שהמטרה שאליה הוא מתייחס איננה כתיבה טובה יותר, כתיבה משכנעת, או כתיבה שמבטאת את הלך הרוח של התלמיד, אלא כתיבה שמקבלת ציון טוב.

ומה שמוזר במצב הזה הוא שהמאמרון מופיע בבלוג כיתתי שבו כל תלמיד כותב על נושא שמעניין אותו, וחבריו לכיתה מגיבים עם התייחסות מעודדת ועניינית. המורה שלהם (שבשנת 2016 זכה בפרס מורה השנה בתחום מדעי החברה במדינת אורגון – דבריו עם קבלת הפרס, אגב, מצביעים על אופיו המיוחד) יצר מסגרת שבה לא המורה בלבד, ובוודאי לא רק המחשב, קורא את מה שתלמידיו כותבים. פרסום הכתיבה של התלמידים בבלוג פותח את קהל הקוראים לעמיתיהם, וכך היא הופכת לכתיבה שבאמת מבקשת להביע ולשכנע. (אינני יודע כמה מבוגרים קוראים את מאמרוני התלמידים; מלבד התגובות שלי לא ראיתי תגובות של קוראים מבוגרים.) אין ספק שהמחשב יכול לסייע בכתיבה. כמעט כולנו משתמשים בבודק האיות שמיידע אותנו על שגיאות איות, ולא פעם בודק הדקדוק עוזר לנו לבנות את המשפטים שלנו בצורה מסודרת וברורה יותר. אבל למיטב ידיעתי נכון להיום עדיין לא פותחו כלים שיכולים להגיד לנו שמה שכתבנו איננו משכנע, או שהסגנון שלו איננו מעורר ענין. אלה עדיין דברים שבני אדם צריכים לעשות, ובעצם הם נמצאים בבסיס של הסיבה שאנחנו כותבים.

נדמה לי ש-12 תלמידים הגיבו למאמרון המסויים הזה. רוב התגובות ציינו שמדובר בנושא חשוב, והכותבים גם שיבחו את הכותב על כך שהוא הציג את הנושא בצורה טובה. (מאמרונים אחרים בבלוג מקבלים בערך אותו מספר של מגיבים.) כותב המאמרון ורוב המגיבים מציינים שהם מעדיפים שהמורה, ולא המחשב, יבדוק את מה שהם כותבים. לא אתווכח איתם. אבל אני חש שעבור רוב הכותבים הרעיון שמישהו יכתוב מפני שהוא רוצה לספר משהו לאנשים אמיתיים, להביע רגשות, להעלות רעיונות, או אפילו לשכנע, איננו מרכיב בדיון. נדמה שכבר בכיתה ז’ התלמידים הפנימו את תפיסת ה-schooliness הגורסת שכתיבה היא משהו שעושים בתוך בית הספר על מנת לקבל ציון. ומה שבמיוחד עצוב הוא שזה קורה אצל תלמידים שכותבים לבלוג כיתתי שמעצם קיומו נועד לתת ביטוי לכוח התקשורתי של הכתיבה. אם כבר בגיל צעיר בית הספר הצליח לשכנע אותם שמחשב יכול לקרוא את מה שהם כותבים – מחשב שיכול לבדוק, אבל לא להבין, את מה שהם כותבים – למה שהם ירצו לכתוב משהו כבוגרים? אפשר לקוות שפרויקטים כמו הבלוג הכיתתי יעזרו לשכנע אותם שיש סיבה לכתוב. אם לא – לא רק שאף אחד לא יתנגד שהמחשב יבדוק וייתן ציון, יש סיכוי טוב שניתן למחשב גם לכתוב עבורנו.

לשם זה אנחנו צריכים אותם?

יש יתרונות רבים למסמכים של גוגל (Google Docs, או היום Google Drive). אמנם הכלים של גוגל אינם עושים כל מה שכלי האופיס של מוקרוסופט עושים, אבל הם אינם עולים כסף (שזה שונה מלהיות חינם). בנוסף, מפני שהם זמינים לנו דרך האינטרנט ניתן להגיע לקבצים שעליהם אנחנו עובדים מכל מקום שיש תקשורת אינטרנטית. ואם לכל זה נוסיף שהכלים האלה מאפשרים שיתוף בקבצים ואפילו עבודה סינכרונית של מספר יוצרים, וקיבולת אחסון גדולה, צריך להיות די מובן שיש כדאיות רבה בשימוש בכלי האופיס של גוגל. אבל על אף הכדאיות הזאת, מעולם לא תיארתי לעצמי שהשימוש בכלי גוגל יתרום לתלמידים להשיג ציונים טובים יותר במבחנים הסטנדרטיים הנפוצים היום.

בגלל זה הופתעתי לקרוא את הכותרת של כתבה ב-Education Week מלפני שבוע שמסרה:

לא הופתעתי שהשימוש במסמכים של גוגל איננו משפיע על ציונים במבחנים. הרי בכלל לא תיארתי לעצמי שכך צריך להיות. אבל מהכותרת הבנתי שמישהו כנראה כן חושב כך. גם אם המחקר עצמו לא נערך על מנת לבחון את השפעת השימוש הזה על התוצאות של מבחנים (ועל זה קצת בהמשך) העובדה שכותרת הכתבה מציינת את הקשר (או אי-הקשר) רומזת שמישהו כן התעניין באפשרות של השפעה כזאת.

חשוב להבהיר שהמחקר שעליו הכתבה מדווחת מצא שלשימוש במסמכים של גוגל בבית הספר אין השפעה על ציוני התלמידים – לא לטוב ולא לרע. הכתבה מבהירה שעל אף העובדה שתלמידים שמחים להשתמש בכלים האלה:

enthusiastic usage of Google Docs has not impacted student scores on standardized writing and reading exams
כבר בשלב הזה של הכתבה חשוב לעצור ולשאול את עצמנו: אפילו אם מתייחסים לאיכות הכתיבה ולא לתוצאות במבחנים, האם יש סיבה לצפות שהעובדה שתלמידים מקלידים על גבי מקלדת ישירות לתוך מסמך שנשמר אי-שם בענן תהיה השפעה שונה מאשר ההקלדה לתוך מסמך שנשמר בדיסק קשיח של מחשב אישי? ואם כבר, האם ההקלדה לתוך תמלילן שמותקן במחשב צריכה להשפיע אחרת מאשר הכתיבה באמצעות עט על גבי נייר? כאדם שכותב ישירות לתוך תמלילן כבר שנים רבות, ולפעמים גם כותב על דף נייר, אני יכול להעיד שהכתיבות האלו שונות זו מזו, אבל אינני יכול להגיד שאחת טובה יותר מהאחרת (על פי רוב שתיהן גרועות ועילגות באותה מידה). ושוב, אני מתייחס לאיכות של מה שנכתב, ולא לציונים במבחנים שאיכשהו אמורים לבחון את יכולת הכתיבה של תלמידים.

המחקר שאליו מתייחס הכתבה נערך על 257 תלמידים בכיתה ו’ בבית ספר אחד במדינת קולורדו. 3,537 דגימות של כתיבה של התלמידים נאספו ונותחו. המחקר נערך בשנת הלימודים 2011-2012 שהיתה השנה הראשונה שבה בית הספר השתמש במסמכים של גוגל. ד”ר בינבין צ’אנג, החוקרת הראשית, היתה דוקטורנטית של מארק וורשהואר, פרופסור עם קבלות רבות בתחום האוריינות בסביבות דיגיטאליות. אני די בטוח שוורשהואר איננו רואה חשיבות גדולה בציונים במבחנים כמדד ליכולת הכתיבה של תלמידים, ואני מניח שהדוקטורנטים שלו יורשים את תפיסותיו. לאור זה, לא ברור לי מה ד”ר ז’אנג רצתה או התכוונה לגלות. אני נוטה לחשוב שהיא קיבלה מענק מחקר לבדוק משהו שונה מאשר היא באמת רצתה. כך או כך, על אף העובדה שלטעמי התוצאות במבחנים הן בין הדברים הפחות מעניינים לבדוק בנוגע לשימוש במסמכים של גוגל, הביקורת שלי כלפי המחקר איננה מופנית כלפיה.

מסמכים של גוגל מאפשרים, כזכור, עבודה משותפת על מסמכים, והמחקר כנראה ביקשה לברר אם אולי כאשר מספר תלמידים כותבים באותו מסמך נוצר מצב שבו העריכה של מסמך משפרת את איכותו. יש, כמובן, בעייתיות בסיסית במחקר שבודק איכות של כתיבה: כיצד קובעים מהי איכות, וכיצד מזהים אותה? אני מתרשם שהמחקר הזה לא הצליחה להתגבר על הבעיה הזאת. אנחנו קוראים ש:

Neither the extent of a student’s revisions, measured by the number of words added to and deleted from an original document, nor the number of times a student edited his or her document had any statistically significant impact.
ושוב, ספק אם מישהו באמת ציפה למצוא מתאם בין נתונים כמו מספר המילים שהוספו או הוסרו ממסמך, או מספר העריכות שהמסמך עבר, לבין איכות המסמך. דווקא כמעט הגיוני יותר לחפש מתאם לציונים במבחנים מפני שאלה אינם דורשים הערכה סובייקטיבית. אגב, בכתבה צוין שהחוקרים לא ידעו עד כמה התלמידים שנחקרו גם כתבו על גבי נייר. נוצר הרושם שהתייחסו לכתיבה במסמכים של גוגל כפעילות נפרדת, ייחודית, שלא היתה קשורה לפעילויות כתיבה אחרות.

הכתיבה היא בין אמצעי התקשורת החשובים, והיום, על אף ההפצה הנרחבת של צילומים ווידיאו דרך הרשת, היא כלי שתלמידים רבים בחייהם מחוץ לכיתה מרבים להשתמש בה. הם כותבים הודעות ב- SMS וב-WhatsApp וגם בכלים שמזמינים כתיבה ארוכה יותר. הם כותבים מפני שהם מבינים שהכתיבה מאפשרת להם להתקשר עם חבריהם. יש טעם שבתי הספר יעודדו את הכתיבה, ויעזרו לבני הנוער לפתח אותה. לכן, אפשר לראות חיוב ברצון לבחון את השימוש במסמכים של גוגל בכיתה – הן ככלי שמאפשר כתיבה משותפת, והן ככלי שפשוט מעודד את הכתיבה. אבל מערכת חינוכית שמעמידה את פיתוח היכולת של תלמידיה לתפקד בעולם של היום כמטרה תדגיש את השימוש בכלים כמו מסמכים של גוגל לא כדי להשיג תוצאות טובות יותר במבחנים, אלא פשוט כדי לתקשר בצורה ברורה ואפקטיבית יותר.

למה תלמידים אינם יודעים ללמוד מטקסטים דיגיטאליים?

טיפה להפתעתי, שמתי לב שהפעם האחרונה שהתייחסתי כאן לשאלות של קריאה ו/או כתיבה דיגיטאלית לעומת הכתיבה ביד והקריאה על הנייר היתה לפני יותר מחצי שנה. הדבר מפתיע מפני שהתחושה הכללית שלי היא שהנושא נמצאת באופן תדיר בכותרות. התחושה הזאת גרמה לי להתלבט אם בכלל יש טעם לכתוב על הנושא שוב עכשיו, הרי אפילו אם פער של חצי שנה בין התייחסויות בהחלט סביר, לא ברור שיש מה לחדש. באופן כללי, השאלה הבסיסית נשארת כפי שהיתה: האם הלמידה של תלמידים שקוראים טקסטים על גבי המסך טובה באותה מידה (או, סליחה, רעה באותה מידה) כמו הלמידה של תלמידים שקוראים מטקסטים מודפסים. יש מחקרים שרומזים שלמודפס יש יתרון, אבל מול אלה יש גם עדויות שככל שעובר הזמן מיומנויות הקריאה והכתיבה הדיגיטאליות נרכשות עד שבעתיד הלא רחוק לא יהיה הבדל מהותי בין הלמידה בסביבה הדיגיטאלית לעומת המודפסת. אבל גם אם אין “חדש”, לפעמים אפשר לראות את הנושא באור קצת שונה, ונדמה לי שיש אור כזה במאמרון חדש של ג’ף אוטכט.

לפני כשבועיים אוטכט כתב שמרבים לשאול אותו אם הוא חושב שצריכים לזנוח לחלוטין ספרים מודפסים. אני מניח שכל מי שעוסק בתקשוב בחינוך פגש את השאלה הזאת לפחות מספר פעמים. נדמה לי ש-“תשובה” ראויה עשויה להיות “למה בכלל חושבים שאני חושב כך?”, אבל אוטכט משיב בצורה אחרת, עם תשובה שבהחלט נראית לי. הוא מציין שאם מדובר בספרי קריאה, ממש לא איכפת לו, ושכל אחד יבחר את הפלטפורמה העדיפה אליו. עם זאת, בשדה החינוכי יש יתרונות לספרים דיגיטאליים על גבי ספרים מודפסים שהתוכן שלהם מתיישן מהר מאד. בעיניו אין כאן יתרון שהוא בהכרח יתרון מנצח, אבל הוא מוסיף:

But here’s the thing…no matter where you are in your own transition into a digital reading world we all read more digitally. Emails, Facebook, News, this blog post (unless you printed it off). Just sit back and reflect for a moment how much of your day is reading digital text. Even if you like to read before bed you probably read more online during the day.
התוספת הזאת מאד חשובה. הרי היום חלק מכובד של הקריאה של רבים מאיתנו מתרחשת על גבי מסכים, ולכן השאלה של מה עדיף הופכת כמעט ללא רלוונטית. השאלה היותר רלוונטית היא האם התלמידים שלנו רוכשים את המיומנויות הדרושות כדי שהם באמת ילמדו מהקריאה ה-“דיגיטאלית” שלהם. גם זאת, כמובן, איננה שאלה חדשה. אנשי חינוך רבים מתמודדים איתה, אם כי לא תמיד בהצלחה. במאמרון שלו אוטכט מצטט מכתבה באתר MindShift שהתפרסמה לפני שלושה חודשים, כתבה שבין שורותיה אפשר אולי לזהות חלק משמעותי של בעיית ההתמודדות.

חלק ניכר מהמאמרון ב-MindShift מתייחס לנסיון של מארק פנינגטון, מורה בקליפורניה המתמחה במיומנויות קריאה וכתיבה. פנינגטון מזהה יתרונות וגם חסרונות לשתי הפלטפורמות השונות. לגבי הנייר הוא מציין יתרון חשוב:

“You can write on the text right there,” noting that if students aren’t allowed to write in textbooks, they can use small sticky notes that come off easily. “You can also flip back and forth very easily, and spatially, there are advantages to print media.”
הוא יודע, כמובן, שבטקסט דיגיטאלי, על גבי המסך, אפשר למרקר ולהוסיף הערות, אבל…:
When Pennington’s seventh graders took the Smarter Balanced Assessment in English Language Arts on new Chromebooks last April, Pennington didn’t teach them how to use the test’s annotation feature. Students would have been able to highlight reading passages and take notes on the text to help them answer test questions. He thought it was too complicated for them to learn how to use well in time for the test.
במילים אחרות, המרקור, והוספת הערות, לתוך טקסטים דיגיטאליים אינם פעולות שמובנות מאליהן. אפשר ללמוד את השימוש בהם, אבל ברוב המקרים רצוי שמישהו יילמד את המיומנויות האלו. הבעיה היא שבלוח הזמנים הצפוף של בתי הספר העמוס במבחנים סטנדרטיים שבאמצעותם מדרגים את התלמידים ואת בתי הספר, קשה למצוא את הזמן ללמד את המיומנויות החשובות האלו לתלמידים, וזאת על אף העובדה שהן יכולות לסייע רבות להצלחה באותם מבחנים. מעניין לציין כאן שהפרשה העגומה של רכישת מכשירי iPad לכלל התלמידים בבתי הספר של לוס אנג’לס התחילה עם הרצון של מובילי המחוז להכשיר את התלמידים להתמודד עם המבחנים הממוחשבים שנעשים לחובה בבתי הספר. רק מאוחר יותר המחוז גילה שהקלדת תשובות לתוך מכשירי ה-iPad מסתירה את השאלות שעל המסך (ולכן היה צורך בהוצאה של מיליוני דולרים נוספים על רכישת מקלדות נפרדות).

אוטכט ביקורתי כלפי מערכות החינוך שאינן מקדמות למידת המיומנויות הדרושות כדי שתלמידים יוכלו ללמוד בהצלחה מטקסטים דיגיטאליים. הוא כותב:

There are a ton of things that are built into most online reading platforms that are never taught to students. Or we try to teach them the same way as we did in a print world and that doesn’t work.
הוא משוכנע שלא רק התלמידים, אלא גם המורים אינם לומדים את המיומנויות האלו. יתכן שהוא צודק, אם כי לפחות בישראל (ואני מניח במקומות רבים בעולם המערבי) מוסדות להכשרת מורים כן רואים חשיבות ברכישת מיומנויות דיגיטאליות. דווקא אם הבנתי אותו נכון, בסיום המאמרון שלו אוטכט רומז שהעובדה שבעתיד הקרוב תלמידי בתי הספר יצטרכו להבחן במבחנים דיגיטאליים רבים נותנת מקום לאופטימיות – הרי בתי הספר יצטרכו ללמד את המיומנויות הדיגיטאליות. אבל יתכן שמה שנראה כאופטימיות איננה אלא ציניות. ואם כן, אפשר להבין למה. גם כאשר (בעתיד הלא רחוק) מבחנים ייערכו על תשתיות דיגיטאליות, ספק אם מערכות החינוך ימצאו את הזמן ללמד את המיומנויות הדרושות – דרושות לא רק לעבור את המבחנים, אלא פשוט להיות אדם משכיל בעולם הדיגיטאלי.

זה לא רק עניין של אובדן

מספר כתבות שעוסקות בעדיפות הכתיבה ביד על פני ההקלדה במקלדת המחשב/הטבלט התפרסמו לאחרונה. אני חש שזה איננו רק מקרה, אלא עדות לכך שמטוטלת ההתייחסות לדיגיטאליות בחינוך מתחילה לנוע לכיוון של מציאת פגמים בסיפור האהבה של החברה שלנו עם התקשוב. בכתבות האלה אפשר למצוא, כצפוי, לא מעט נוסטלגיה – געגועים לתקופה פשוטה יותר של לפני הדיגיטאליות. לפני שבוע, ב-Time Magazine, למשל, נכתב על Five Reasons Kids Should Still Learn Cursive Writing, ובין הסיבות שבכתבה אנחנו קוראים שעדיין יש מסמכים שמצריכים את החתימה שלנו, שבלי לימוד כתב רהוט (cursive writing) תלמידים לא יוכלו לקרוא את הכרזת העצמאות (של ארה”ב, כמובן), וגם שיש ערך אסתטי לכתיבה ביד (במיוחד במכתבי אהבה).

אבל לצד הנוסטלגיה הזאת מופיעות גם טענות מדעיות – שמי שכותב ביד זוכר טוב יותר את מה שהוא רושם, למשל. מספר מחקרים מחזקים את הטענה הזאת, אם כי אני מתרשם שבכתבות שהתפרסמו לאחרונה ממחזרים מספר די קטן של מחקרים, כאשר חלק מאלה כבר הופיעו לפני מספר שנים. אבל מובא גם ביסוס מדעי שמחזק את ממצאי המחקרים, ביסוס שהולך ומתפתח עם שכלול חקר המוח. טוענים שהיום אנחנו מבינים שהכתיבה (להבדיל מההקלדה) מחזקת נתיבים במוח ולכן מביאה לזכרון טוב יותר. כתבה שהתפרסמה בניו יורק טיימס לפני שבוע (גירסה מקוצרת בעברית הופיעה באתר הארץ), למשל, מצטטת את סטניסלס דהיין, פרופסור לפסיכולוגיה קוגניטיבית:

When we write, a unique neural circuit is automatically activated. … There is a core recognition of the gesture in the written word, a sort of recognition by mental simulation in your brain.
חשוב לי להצהיר – אינני מתנגד לכתיבה ביד על גבי נייר. אמנם המאמרון הזה, מגירסתו הראשונה ועד להקלקה על “פרסם” הוכן במלואו מול המקלדת והמסך, אבל מידי יום אני גם מוצא את עצמי רושם מחשבות ותזכורות ביד. זאת ועוד: התמיכה שלי בהטמעת התקשוב בבית הספר איננה באה מתוך שלילת השימוש בעט ונייר, אלא מפני שאני משוכנע שבאמצעות הדיגיטאליות ניתן להרחיב את צרור הכלים המחשבתיים/לימודיים שעמדו לרשותנו עד היום. אני חושש, אבל, שריבוי ההתייחסויות לנושא הכתיבה ביד שהתפרסמו לאחרונה נובע מכך שיש מי שחושב שקיים מרדף פרוע אחרי כל דבר דיגיטאלי בחינוך, ושצריכים לבלום את התנופה הזאת. מול אלה שמקדמים את התקשוב מציבים תמרור שמכריז “הכלים האלה יפגעו ביכולת התלמיד ללמוד”. הנסיון הזה מדאיג אותי, במיוחד מפני שנדמה לי שביסודו נמצאת תפיסה מוטעית בנוגע להתפתחות האנושית.

לטענה שהזכרון האנושי פועל טוב יותר כאשר האדם רושם בכתב יד מאשר באמצעות מקלדת ומסך מתלווה הנחה – לפעמים סמויה ולפעמים גלויה: המוח שלנו מתאים לכתיבה ביד. בתיאור של מחקר שערכה קרין ג’יימס מאוניברסיטת אינדיאנה שמופיע בכתבה בניו יורק טיימס, אנחנו קוראים:

The researchers found that the initial duplication process mattered a great deal. When children had drawn a letter freehand, they exhibited increased activity in three areas of the brain that are activated in adults when they read and write: the left fusiform gyrus, the inferior frontal gyrus and the posterior parietal cortex.

By contrast, children who typed or traced the letter or shape showed no such effect. The activation was significantly weaker.

אין לי סיבה לפקפק בממצאים על הפעילות המוחית שהחוקרים מצאו. אבל נדמה לי שחשוב לזכור ששהקריאה והכתיבה הן תופעות מאד חדשות בהיסטוריה האנושית. לא נולדנו (כפי שאצטט בהמשך) לכתוב ולקרוא. במקום להסיק שהמוח מתאים יותר לכתיבה ביד, אולי נכון יותר לטעון שבעקבות התפתחות הקריאה והכתיבה המוח התפתח כדי לייעל ולחזק את הפעולות האלו. חשוב גם לזכור שלא פעם הטכנולוגיה היא אשר מדרבנת סוג מסויים של פעולה. בערך על הכתיב הרהוט (cursive) בוויקיפדיה, למשל, טוענים שהנוצה, כלי הכתיבה הנפוץ בתקופת התפתחות הכתיב הרהוט, השפיעה על ההתפתחות הזאת:
The origin of the cursive method is associated with practical advantages of writing speed and infrequent pen lifting to accommodate the limitations of the quill.
ההדדיות הזאת שבה המוח משפיע על הטכנולוגיה, והטכנולוגיה משפיעה על המוח, איננה מפתיעה. אבל כאשר מכירים בהדדיות, היתרון של הכתיבה ביד על ההקלדה למסך כבר לא נראית כחקוקה בסלע, ומבנה המוח איננו בהכרח “קובע” כיצד עדיף לנו לקרוא או לכתוב. בספרו “Reading in the Brain” דהיין, שממצוטט בכתבה בניו יורק טיימס, פחות או יותר כותב זאת:
The invention of reading led to the mutation of our cerebral circuits into a reading device. We gained a new and almost magical ability – the capacity to “listen to the dead with our eyes”. But reading was only possible because we inherited cortical areas that could learn to link visual graffiti to speech sounds and meanings. (ע’ 302)
מרי-אן וולף, בספרה המרתק “Proust and the Squid” כותבת משהו דומה. היא מדגישה את הגמישות של המוח שבמקום לקבע אותנו בדרכי פעולה מוצקים, מאפשרת לנו להרחיב את מגוון את פעולות שלנו:
We were never born to read. Human beings invented reading only a few thousand years ago. And with this invention, we rearranged the very organization of our brain, which in turn expanded the ways we were able to think, which altered the intellectual evolution of our species. Reading is one of the single most remarkable inventions in history; the ability to record history is one of its consequences. Our ancestors’ invention could come about only because of the human brain’s extraordinary ability to make new connections among its existing structures, a process made possible by the brain’s ability to be shaped by experience. This plasticity at the heart of the brain’s design forms the basis for much of who we are, and who we might become. (ע’ 3)
וולף ודהיין אמנם מתייחסים בעיקר לקריאה, אבל נדמה לי שהגמישות שהם מציינים תקפה גם בנוגע לכתיבה, ולאמצעים שבהם אנחנו כותבים. היום קשה לנו לבדוק אם החשיבה והזכרון של אדם שחורט מילים על חרס עם חרט חזקים או חלשים יותר מאלה של אדם שרושם את אותן המילים עם דיו על קלף. סביר מאד להניח שהחשיבה והזכרון של מי שלמד בעיקר משמיעה שונים ממי שגדל לתוך תרבות שבה הכתיבה היא האמצעי העיקרי להעברת מידע, אבל אינני יודע כיצד לקבוע איזו דרך עדיפה.

לא כל התפתחות טכנולוגית בהכרח חיובית. יש בהחלט טעם במחקרים שבוחנים אם לכלים דיגיטאליים יש עדיפות על פני כלים ישנים יותר שנועדו למלא (פחות או יותר) את אותו הצורך. אבל לעתים קרובות מדי השאלות נוסח “מה אנחנו מאבדים” מתעלמות מכך שהחשש הוא כלפי האובדן של משהו שהוא יחסית חדש בתרבות שלנו, ושחששות כאלה עלו בעבר כלפי המצאות שהיום הם מובנים מאליהם. די להזכיר את דיאלוג הפיידרוס של אפלטון שבו תמוז, מלך מצרים, דוחה את המתנה של המצאת הכתב שתיות מגיש לו בטענה שבמקום להגדיל את חוכמת האדם הוא יקטין אותה מפני שהוא יחליש את הזכרון. מתברר שהיכולת של המוח להסתגל למצבים חדשים, ולאתגרים חדשים, היא בין התכונות האנושיות החשובות ביותר. הגמישות טבועה בנו, אם כי כנראה צריכים לתת לה זמן לבוא לביטוי.

אני נשבע שכתבתי את זה בעצמי

הודות להמלצה של עודי מלכה ברשת שלובים, הגעתי לכתבה מרתקת באתר של דה מרקר (תרגום של כתבה שהופצה באמצעות רויטרס) על נסיונות לבנות יישום שיוכל לבדוק, ולציינן, חיבורים של סטודנטים. (מעניין לציין שמשום מה הכתבה בדה מרקר מלווה בצילום של מורה-רובוטית יפנית בשם סאייה שאמורה ללמד תלמידי כיתות יסוד. הופעת הבכורה של סאייה לעיתונות, אם אינני טועה, היתה לפני חמש שנים. אין קשר בין הרובוטית הגשמית הזאת לבין היישום-הרובוטי בכתבה שבודק עבודות.)

ממבטם של סטודנטים, בעיית מטלות הכתיבה היא פשוטה: צריכים לכתוב (ותוך כדי כך לשמור על כללי כתיבה נכונים, ונוקשים). אבל אפשר להגיד שזאת בעיה נקודתית עבור כל סטודנט ומשימות הכתיבה היחסית מעטות שהוא מקבל. ממבטם של המורים, מדובר בבעיה מצטברת. מארק שרמיס, דיקן הסטודנטים של בית הספר לחינוך של האוניברסיטה של אקרון (במדינת אוהיו), מתאר את ממדי הבעיה:

אם אתה מורה בתיכון ואתה נותן מטלת כתיבה, תלך הביתה עם 150 מאמרים ותצטרך עזרה.
יש היסטוריה לשאיפה לבדיקה אוטומטית של עבודות של סטודנטים. עוד בשנות ה-60 של המאה הקודמת קיוו לרתום את המחשב למשימה. אבל המחשבים של אז לא היו מסוגלים לעמוד בה. מאז, הטכנולוגיה התקדמה מאד, כך שכבר היום אפשר להיעזר ב-Intelligent Essay Assessor המשווק על ידי חברת פירסון (כן, אותה חברה ששולטת בשוק ספרי הלימוד) בעל תכונות מאד מרשימות:
הוא יכול לנתח מאמר בתוך שניות ולזהות שגיאות איות, דקדוק, ארגון ותכונות אחרות כמו גם לעודד את התלמידים לבצע תיקונים. התוכנה סורקת מילות מפתח ומנתחת דוגמאות סמנטיות, ופירסון מתפארים בכך שהיא “יכולה ‘להבין’ את המשמעות של טקסט בדיוק כמו קורא אנושי”.
כל זה טוב ויפה. בודק עבודות רובוטי בוודאי יקל על מורים ומרצים המוצפים בעבודות שמחכות לקריאה ולקבלת ציון. אבל נדמה לי שהשאיפה לייעל את הבדיקה מפספסת בנקודה אחת קטנה, אם כי די משמעותית. על פי רוב, כתיבה “מניחה” גם קריאה. אנשים כותבים מפני שהם מצפים, ואפילו רוצים, שמישהו יקרא את מה שהם כותבים. הכתבה מצטטת את תומס ג’ן, מנהל תכנית הכתיבה של הרווארד, שמעלה את הנקודה הזאת:
ג’ן אמר שהוא חושש שתלמידים יוותרו על הניסיון ליצור מטאפורה יפיפיה או אנלוגיה מלאת מחשבה עליה לא חשבו מעולם אם הם ידעו שהמאמרים שלהם לא נקראים, אלא נסרקים במשך שניה על ידי תוכנת מחשב. “אני רוצה לדעת שאני כותב לקורא אמיתי, בשר ודם, שמתרגש לשמוע את המילים שעל הדף”, אמר ג’ן, “ואני בטוח שכך מרגישים גם ילדים”.
לטעמי הוא צודק, אבל איננו מדגיש את הנקודה הזאת מספיק. יש הבדל עצום בין כתיבה לשם ציון, לבין כתיבה כדי ליצור קשר עם קורא. באמצעות בודק רובוטי ניתן להקל על עבודת המורה, אבל תוך כדי כך גם מעבירים מסר לסטודנט: אתה מבצע תרגיל; מטרת הכתיבה שלך היא קבלת ציון; הכתיבה שלך איננה מעניינת אף אחד. ספק אם זה המסר שמערכות חינוך, אם בבתי הספר או באקדמיה, רוצות להעביר לסטודנטים. סביר מאד להניח שיישום מחשבי מסוגל לבחון אם הסטודנט מיקם את הפסיקים שבמשפטיו במקום הנכון, או לוודא שהתחביר שבחיבור תקני. אבל אפילו אם הוא יכול להבין את תוכן החיבור (ויתכן שנגיע גם לזה), ספק אם הוא יוכל להוות אוזן קשבת לכותב עצמו.

בימים האחרונים גם אודרי ווטרס התייחסה לנושא הזה (איזה מזל שהפעם בדקתי את הבלוג שלה לפני הפרסום). היא מקשרת לכתבה ב-Inside Higher Ed על הנושא, וגם למחקר של שרמיס שכנראה מראה באופן משכנע שהמחשב מסוגל לבדוק כתיבה של סטודנטים לא פחות טוב מאשר מורה (הפעם לא קראתי את הכל). לווטרס נסיון בהוראת הכתיבה (ברמה אקדמית) והיא מבינה שרצוי להקל על המורים:

And oh, the labor. Grading essays – whether in comp or in other writing-heavy classes – is incredibly time-consuming. That makes the move to robot graders one of efficiency, time- and cost-savings. Grading essays is also incredibly grueling intellectually, I’d argue, as giving meaningful feedback on student writing (and by extension on student thinking) is hard work.
אבל אין זה אומר שהדרך הנכונה להקל היא בדיקה באמצעות מחשב. בעבר (אולי הרחוק, אבל בוודאי גם הלא כל כך רחוק) המשמעות של “ללמד כתיבה” היתה להנחות סטודנטים בשימוש בתבנית הסטנדרטית של בניית פיסקה. כתיבה “טובה” לא חרגה מהתבנית. היום יש תכניות כתיבה שמבקשות לפרוץ את התבנית הזאת ולגרום לסטודנט לחשוב על מה שהוא רוצה שמישהו אחר יבין. ווטרס כותבת:
College-level writing requires critical reading. It requires critical thinking. It requires tackling a “question at issue” for the community you’re a part of – whether that’s the class or the university at large. It requires thinking about assumptions – of the writer and the reader. It requires taking the reader carefully through the logic of the argument, building connections throughout the essay so that a writer’s claims are supported by reasoning throughout. It means revising. It means rethinking. It means rewriting. It is a process, not a product.
עבור סטודנטים רבים מדי הכתיבה למטלות בית ספריות רחוקה מלהיות “תהליך”. היא נתפסת כחובה שאיתה צריכים ליישר קו, כתבנית שבה צריכים לעמוד. היא בוודאי איננה משהו שעושים מתוך רצון. ורצוי, כמובן, לכתוב כמה שפחות. לעומת זאת, בפייסבוק ובצ’ט, ובמסגרות חברתיות נוספות, כותבים המון. מחקרים לא מעטים מוסרים לנו שהיום, בעקבות צמיחת כלי המדיה החברתיים, מתרחשת פריחה של ממש בכתיבה. אם היכולת להביע את עצמנו וליצור קשר עם הזולת הן מטרות מרכזית של הכתיבה, נדמה לי שהיה כדאי למערכות החינוך ללמוד מההצלחות של המדיה החברתית, במקום לחפש דרכים להשניא את הכתיבה עוד יותר על הסטודנטים.

לקראת סיום מתבקש לכתוב משהו כגון: סביר להניח שכאשר כלים לבדיקה רובוטית של הכתיבה של סטודנטים ייכנסו לשימוש, הסטודנטים ימצאו דרכים ליצור יישומים שיכינו את הכתיבה שלהם באופן אוטומטי. הבעיה של משפט כזה נמצאת בקביעת הזמן. כתבתי בלשון עתיד, אבל צריך היה לעשות זאת בלשון עבר. עוד ב-2005 שלושה סטודנטים ב-MIT תכנתו מחשב לחבר מאמר מדעי. באמצעות המחשב הם “כתבו” שני מאמרים מדעיים באמצעות שליפת מילים מתוך מאגר מילים “מדעיות” שהם בנו ושילובן לתוך מחולל משפטים ופיסקאות ששמר על כללי התחביר. כפי שהסביר אחד הסטודנטים:

We were tired of getting these e-mails from these conference people, so we thought it would be fun to write software that generates meaningless research papers and submit them.
התוצאה היתה מרשימה מאד, אם כי אולי בזכות תסמונת בגדי המלך החדשים – לא כל כך נעים להודות שלא מבינים שום דבר. אחד משני המאמרים שהוגשו להשתתפות בכנס התקבל.

המאמרים של הסטודנטים היו, בסך הכל, מתיחה. בדרך כלל נהוג להסביר את ההצלחה שלהם בנכונות של רבים בקהילה המדעית להתרשם מדברים שנשמעים נכונים, גם אם הם בסך הכל ג’יבריש. אבל מי יודע – אולי דווקא גם הסטודנטים נפלו בפח, והמאמר שלהם התקבל לכנס מפני שהוא לא רק נוצר, אלא גם נבדק, באמצעות מחשב, והמחשב הוא זה שהסיק שהכל תקין.