לפני יותר משלוש שנים הקדשתי פרק ב"עושים טכנולוגיה" לבעיה שלא מספיק אנשים שמים אליה לב: חלק עצום מהקישורים ברשת שבור. הכוונה היא לקישורים יחסית ישנים שמפנים לכתבות, ראיונות, מחקרים, סרטים ואפילו לאתרים שלמים שפשוט לא קיימים יותר או שהקישור אליהם שבור.
התופעה הזו מכונה בשם Link Rot, ריקבון של הקישורים, ובמהלך השנים ניסו מספר חוקרים להבין עד כמה היא שכיחה. בפרק סיפרתי בין השאר על שני חוקרים שבדקו בשנת 2017 מה הסיכוי שמאמר שפורסם בסוף שנות התשעים יסבול מקישורים שמובילים לשגיאה 404, כלומר לריקבון של 100% וזאת לעומת מאמר שפורסם, נניח, ב-2012?
מתוצאות המחקר עלה ש-55% מההפניות שהופיעו במאמרים אקדמיים שפורסמו ב-1997, מפנים כיום לעמודים או אתרים מתים. רק 5% מהקישורים שפורסמו לפני 25 שנה מייצגים נאמנה את התוכן המקורי. 40% הנותרים סובלים מסחף בתוכן, כלומר משינויים ביחס לתוכן המקורי. מאמרים שפורסמו ב-2002 סובלים מ-40% של שגיאות 404 ואפילו במאמרים שפורסמו ב-2012 יש הפניות לקישורים מתים לחלוטין. מה קורה למאמרים שפורסמו ב-2005? 20% ריקבון.
אני מספר את זה כי התופעה הזו קיימת גם כאן, בגלוב.
בשנה הבאה הגלוב יחגוג 20 שנה לקיומו ולאורך השנים התפרסמו בו אלפי פוסטים שבתוכם יש אלפי קישורים. כמה מהם עדיין קיימים? ובכן, יש פלגין שנקרא Broken Link Checker ואני משתמש בו מדי פעם.
החוקרים שציטטתי קודם לכן טוענים שכ-20% מהקישורים שפורסמו במאמרים משנת 2005 הם קישורים שבורים והנתונים בגלוב הם ש… קצת יותר מ-20% מהקישורים שבורים. איך זה יכול להיות?
ובכן, יש כל מיני סוגים של קישורים שבורים:
יש קישורים לאתרים שלא קיימים. "רשימות" הוא אתר שכזה, אתר שאירח הרבה בלוגים. מכיוון שכל האתר נעלם, כל הקישורים שהופנו אליו נשברו (אני מזמין אתכם להיכנס לכתובת המקורית של רשימות על מנת לגלות מה קורה שם היום). בפרק ראיינתי את אורי ברוכין, אחד ממקימי "רשימות", שסיפר כמה מאמצים הם השקיעו בניסיון לשמר את התכנים ולדאוג שהקישורים לא יישברו – אבל זה לא היה תלוי רק בהם.
זו אגב לא תופעה ישראלית. יש הרבה אתרים אמריקאים, הרבה אתרים יפנים (הגלוב מאוד מחבב יפנים. מאוד) שלא קיימים וכל הקישורים שהפנו אליהם נשברו. זו אפילו לא תופעה של אתרים קטנים. גוגל השיקה שירות שנקרא Google Base, סוג של מסד נתונים מקוון, ובאחד הפוסטים סיפרנו עליו. לחיצה על הקישור מובילה לשגיאה 404 כי הם סגרו את השירות. בפוסט אחר יש קישור לטקסט שהופיע באתר מיקרוסופט על חלונות ויסטה (!) – הקישור הזה שבור.
יש אתרים ששינו את מבנה הקישורים שלהם: אתר "הארץ" שינה את מבנה הקישורים שלו, אתר NRG (זוכרים את הפח הזה?) שינה את מבנה הקישורים שלו כי היום הוא (כנראה?) חלק מ"מקור ראשון" עם מבנה קישורים אחרים. אפילו Wired שינה את מבנה הקישורים שלו מה שאומר שהכתבה נמצאת איפשהו אבל תחת קישור אחר מה שאומר שהקישור המקורי, שבור.
בחלק מהמקרים אפשר לאתר תחליף לכתבה שנעלמה או למצוא קישור מעודכן במקום הקישור המקורי, אבל מדובר בעבודת נמלים. יש בגלוב יותר מ-1,800 קישורים שבורים ובהנחה שזה עניין של 5-10 דקות עבודה על קישור בודד (להבין על מה הקישור, למצוא משהו אחר, האם יש משהו אחר?, לעדכן וכן הלאה). מדובר ביותר מ-200 שעות עבודה שבחלק מהמקרים לא יניבו תוצאה כי, כאמור, אין יותר אתר.
זה יכול לקרות אפילו בפוסט הזה.
אם בעוד 20 שנה רשת "עושים היסטוריה" לא תהיה קיימת, רן לוי עשוי להחליט להוריד את האתר של הרשת והקישור שנתתי בראש הפוסט לפרק שלי ב"עושים טכנולוגיה", יישבר. לא רק שהתופעה הזו שוברת את הלב כי היא קורעת תכנים מצוינים שבבת אחת נמחקו, לעתים לנצח, היא מדגימה עד כמה הרשת שברירית ועד כמה חשוב לתאר את הדבר הזה שאתה מקשר אליו כדי שאם תרצה, אם מישהו אחר ירצה, לאתר את המקור, זה יהיה אולי, איכשהו, אפשרי.
כתיבת תגובה