העתקה, מקוריות, ורווחים

שנת הלימודים מתקרבת לסיומה, וכצפוי גדל החשש שהעבודות שסטודנטים יגישו למרצים שלהם יהיו מועתקות. לא מדובר בנושא חדש. הרבה לפני עידן האינטרנט סטודנטים חיפשו, ומצאו, דרכים להתחמק ממלאכת כתיבת עבודות. יש מי שנעזרו בחברים, או שילמו כסף לסטודנטים אחרים שהצליחו לכסות את הוצאות הלימודים של עצמם על ידי כתיבת עבודות עבור אחרים. מאגרים של עבודות משנים קודמות שירתו סטודנטים שקיוו שהמרצים שלהם אינם זוכרים משנה לשנה מה הוגש להם. אך על אף העובדה שהעתקת עבודות איננה תופעה חדשה, אין ספק שמלאכת ההעתקה השתכללה עוד יותר בעידן האינטרנט.

כמו שהאינטרנט והדיגיטאליות הקלו על ההעתקה, הם גם מסוגלים לסייע במיגורה. כך, לפחות טוענות מספר חברות שפיתחו מוצרים שהם משווקים למוסדות להשכלה גבוהה. אולי המוכרת ביותר מהחברות האלו היא Turnitin שהצליחה לחדור למוסדות רבים עם ההבטחה שהמוצר שלה יקל על עבודת המרצה. אין ספק, בדיקת עבודות של סטודנטים יכולה להיות מלאכה מעייפת ומייגעת, ואם יישומי מחשב יכולים לסייע, למה לא. יישומים כאלה עשויים לחסוך זמן, ואם היישום מסוגל לעשות בשניות מה שעוזר הוראה עושה בשעות, זה חוסך גם כסף.

בפרסומים של החברות שמפיקות יישומים לבדיקת עבודות הדגש איננו על כך שזאת הדרך לתפוס ולהעניש את מי שמעתיק, אלא על כך שהן יכולות להבטיח התנהגות אתית. מה יכול להיות לא בסדר בהשגת יעד כזה? לדעתי, מספר דברים.

לפני כמעט שלוש שנים כתבתי כאן על סידרה של בדיקות שסוזן שורן (Schorn) מהאוניברסיטה של טקסס ערכה. בבדיקות שלה, ב-2007 ושוב ב-2015, שורן הגיעה למסקנה שהעתקת קטע של טקסט מתוך עבודה של סטודנט והדבקת הקטע לתוך חיפוש בגוגל היתה יותר אפקטיבית בזיהוי העתקה מאשר הכלים הייעודיים שנמכרים למוסדות להשכלה גבוהה. אבל מלאכת ההעתקה וההדבקה לתוך גוגל דורשת מאמץ מצד המרצה. אין ספק שקל יותר לתת ליישום לעשות את זה. אבל חיפוש קטע נבחר בתוך גוגל שונה מאד מסריקה כללית עוד לפני שבכלל קוראים את העבודה. כאשר מרצה בוחר קטע טקסט כדי לבדוק אותו סביר להניח שהוא עושה זאת מתוך תחושה שמשהו איננו קשורה. חשדו התעורר בעקבות העיון בטקסט. לעומת זאת, בדיקה שנעשית על ידי יישום אוטומטי מחשיד את הסטודנט לפני שהמרצה בכלל מתחיל לקרוא.

גם בישראל יש כלים שאמורים לזהות העתקות. המכללה שבה עבדתי עד לפני זמן קצר משתמשת באחד כזה. באתר החברה אנחנו קוראים:

החברה מספקת מענה ממוחשב לבעיית ההעתקות על ידי דירוג מקוריות מסמכים בעברית.
השרות כולו ניתן באמצעות האינטרנט. השרות משווה את המסמך הנבדק למקורות אינטרנטיים ולעשרות אלפי מסמכים אחרים אשר נמצאים במערכת.

יתכן שזה נכון, אם כי לקראת פרסום המאמרון הזה העתקתי שלוש פיסקאות על שמעון פרס מוויקיפדיה והגשתי אותן כעבודה. הבדיקה העלתה שמה שהגשתי היה 100% מקורי. אותו הדבר קרה בנסיון שערכתי לפני מספר חודשים עם טקסט מועתק על יצחק רבים. כנראה שכמו אצל שורן (שהבדיקה שלה ללא ספק היתה יסודית יותר משלי) יש עדיין מקום לשיפור. אבל בעיני בעיית מהימנות הבדיקה איננה הבעיה המרכזית. יש בעיות גדולות יותר.

כדי שסטודנט יוכל להגיש עבודה למרצה שלו דרך מערכת ניהול הלמידה עליו לסמן את הסכמתו בתיבה ליד הטקסט:

אני מודע ומסכים שמטלה זו תיבדק לגילוי גניבה ספרותית על ידי קבוצת דירוג מקוריות ואני מסכים לתנאי השימוש.

אין אופציה של לא להסכים. אם לא מסמנים בתיבה העבודה לא מתקבלת וכמובן שגם איננה נבדקת. האם בכך על הסטודנט להבין שחושדים בו מעצם היותו סטודנט? הרי לא בודקים את העבודה שלו מפני שמה שהוא כותב מעורר חשד; בודקים עוד לפני שבכלל קוראים.

הנסיון האישי שלי עם הכלי איננו מצביע על איכות. אם הכלי אכן "משווה את המסמך הנבדק למקורות אינטרנטיים" יכולנו לצפות שהוא היה מזהה העתקה מוויקיפדיה. במשך השנים ראיתי לא מעט עבודות מועתקות ונדמה לי שלטוב או לרע הסטודנט המעתיק בדרך כלל משקיע את אותו המאמץ בהעתקה שהוא משקיע בקורס באופן כללי. סביר להניח שאפילו אם הסטודנט חושב שהמרצה שלו איננו במיוחד נמרץ הוא יחשוב שהוא עשוי לערוך חיפוש ברשת כדי לראות אם יש העתקה. ומשום מה, זה איננו מונע ממנו להעתיק משם. כלי שאיננו מוצא העתקה שמקורה בוויקיפדיה איננה עושה את המלאכה. ובכל זאת, ככל שעוד ועוד עבודות ייכנסו למאגר העבודות שנבדקות המאגר ייעשה יותר ויותר עשיר והוא יזהה יותר ויותר העתקות.

אין לי סיבה להטיל ספק בכוונות הטובות של החברות שבונות את הכלים האלה. בלשונית "אודות" אשר באתר של הכלי שבשימוש המכללה מופיעה המשפט:

פיתוח התוכנה נעשה מתוך דאגה לרמה האקדמית של תלמידים בישראל, ומתוך שאיפה לאפשר לתלמידים, מורים, מרצים, הורים, לאתר אירועים בהם הכותב לא התנסח בלשונו שלו כמקובל בעבודה מקורית, ובכך לצמצם את ההשפעה השלילית שיש להעתקה על המעתיק בהווה ועל החברה הישראלית בעתיד.

ובכל זאת, מדובר בחברה מסחרית, והמטרה של כל חברה מסחרית היא להרוויח כסף. אם מאגר העבודות שברשותה יישאר דל סביר להניח שהיא לא תזהה הרבה העתקות, ומוסדות להשכלה גבוהה לא ירצו לשלם עבור שירותיה. וכיצד היא יכולה להגדיל את המאגר? גם זה די ברור. כל עבודה שהיא בודקת הופכת לעוד עבודה שמולה עבודות חדשות נבדקות. וכאן נשאלת שאלה אתית. הסכמתו של סטודנט שהעבודה שלו תיבדק (הסכמה שכזכור אין אפשרות לסרב לה) איננה הסכמה שישתמשו בעבודה שלו כדי לבדוק אחרות – וללא תמורה. באמצעות השימוש של עבודות מקוריות של סטודנטים החברה משפרת את הערך, ואת הרווחים, שלה. אבל הרווח הזה הוא של החברה בלבד. בתנאי השימוש אשר באתר שלה החברה מציינת שהסטודנט שומר על זכויות היוצרים שלו, אבל באותו הזמן היא מבהירה שהסטודנט מסכים שהחברה תשתמש בקניינו כדי להיות יותר רווחי. הפיסקה האחרונה בקטע על קניין רוחני אשר בתנאי השימוש מציינת זאת בבירור:

במסירת ו/או משלוח התכנים והעבודות באמצעות המערכת אתה מקנה למפעילת המערכת רישיון-חינם, כלל עולמי ובלתי מוגבל בזמן, להעתיק, לשכפל, להפיץ, לשווק, להעמיד לרשות לציבור, לשדר, לעבד, לערוך, לתרגם ולהשתמש בתכנים כאמור בכל דרך נוספת, לפי שיקול דעתה, באתר, במערכת, במאגר המידע ובכל נגזרת של הנ"ל, בכל מדיה שהיא. כאמור, רישיון זה ניתן למפעילת המערכת ללא מתן תמורה כלשהיא, לרבות אזכור ('קרדיט'), תמלוגים או טובות הנאה אחרות.

סטודנט אשר משלם שכר לימוד למוסד להשכלה גבוהה עושה זאת תוך ציפייה שבתמורה הוא באמת יזכה בהשכלה. לשם כך, בין היתר, הוא כותב עבודות ומקבל הערות (וציון) מהמרצים שלו. לא ידוע לי שבשלב כלשהו הוא גם הסכים להעשיר חברה פרטית.

וכצפוי, זה איננו הסוף. לפני שלושה חודשים, באתר Inside Higher Ed סופר בעל נסיון בהוראת הכתיבה במספר מוסדות להשכלה גבוהה ג'ון ורנר (Warner) פרסם מאמרון בו הוא דיווח על מוצר חדש של Turnitin:

Most known for their core service of hoovering up student writing and telling instructors how likely it is to be plagiarized, they will soon offer Authorship Investigation, which “will monitor and learn the writing styles of individual students and flag up content which shows considerable divergence from their previous work.” 

כלי מהסוג הזה בוודאי יוכל לזהות שמה שסטודנט מגיש למרצה איננו עקבי עם מה שהוא כבר הגיש, וזה יכול להעיד על העתקה. זה כמובן גם יכול להעיד על התפתחות ביכולת הכתיבה של הסטודנט, ואולי על כך שסגנון הכתיבה בעבודה שעוסקת בהיסטוריה שונה מסגנון הכתיבה בעבודה שעוסקת במדעים. אבל מעבר לכך, כדי שכלי כזה יצליח עליו לא רק לזהות העתקות, אלא גם לזהות מי הכותב. יהיה עליו לשמור את העבודות של כל סטודנט כך שאפשר לראות אם וכיצד הכתיבה שלו משתנה. המעקב הזה עשוי להיות דבר חיובי אם מדובר במרצה שעוקב אחר התפתחות הסטודנט, אבל כאשר חברה מסחרית עושה זאת? יש הבדל עצום.

וכמו תמיד, יש עוד. לא כל מרצה מתנגד לכלים האלה. לפני חודש מרצה באוניברסיטה של פנסילבניה פרסמה כתבה ב-Inside Higher Ed שבה היא תיארה כיצד היא נעזרת ב-Turnitin כדי לעזור לסטודנטים לשפר את כתיבתם. היא מסבירה לסטודנטים שלה שהם יכולים להגיש עבודה כמה פעמים שהם רוצים וכל פעם לקבל את הדוח של Turnitin על מידת ההעתקה בה, ואז לשפר את העבודה שוב ושוב עד שהיא נקייה ומוכנה לקבל ציון. הרעיון אכן מעניין, אם כי נדמה שבמקום לפתח את הרעיונות ואת הטיעונים בעבודה שהסטודנט מגיש הוא כל הזמן יהיה עסוק בלמצוא דרכים מוצלחות יותר להסתיר את העובדה שהעבודה איננה מקורית. בתגובה למאמרון לאורה גיבס, מרצה באוניברסיטה של אוקלהומה עם נסיון רב בקורסים מקוונים, כתבה:

I hope everybody knows that, like a weapons dealer arming both sides in a war, TurnItIn sells its services to students so that they can know in advance just how much they have to jiggle their words, consult a thesaurus, even use a paraphraser bot, etc. to beat the system. TurnItin calls it WriteCheck and they charge the students $8 per paper, or $6 if you buy a jumbopack: https://goo.gl/Jh3C1c … They even give you a few resubmissions so you can make sure you have jiggled your words enough to be ready for your school's TurnItIn.

אפשר היה לחשוב שהחברות האלו יסתפקו בכסף שהן גובות מהמוסדות שרוכשות את הכלים שלהן. אבל כאשר שני הצדדים – גם המרצה וגם הסטודנט – משתמשים בכלי התחרות המסלימה בין הרצון לזהות העתקה לבין הנסיון לכסות עליה רק מגדילה את ההכנסות.