קישורים, קישורים מתים, ואתר "הארץ"

1. בגלוב ישנם 8,817 קישורים לידיעות, כתבות, אתרים וסרטונים. לא רע. יש גם בגלוב 348 קישורים מתים, לינקים שמובילים לשום מקום פשוט מכיוון שהאתר נסגר או שהטקסט שאליו מפנה הקישור כבר לא קיים. זה רע מאוד.

מדי פעם, כשיש לי כמה דקות פנויות, אני עובר על הפוסטים האלו (זו חתיכת עבודת פרך) ומנכש את הקישורים המתים, אחד אחד. עבודת הניכוש גילתה לי משהו שלא שמתי לב אליו. בעבר, קישור לטקסטים באתר "הארץ", היו סוג של תעודת ביטוח. הקישור תמיד עבד, גם אחרי שנים. מאז שאתר "הארץ" עבר רביזיה לפני כשנה, כמות הקישורים המתים שקשורים באתר "הארץ" זינקה בערך פי 500 מיליון. כל קישור שני לא עובד. לפעמים כל קישור ראשון.

המסקנה שלי היא אחת: אם יש קישור לטקסט מתוך אתר "הארץ" וטקסט דומה מתוך Ynet או נרג' או וואלה, "הארץ" מקבל עדיפות אחרונה. במילים אחרות: לקשר כמה שפחות לאתר "הארץ".

2. בדיוק לפני שנה, ב-7 לאוקטובר 2008, התקיים דיון מעניין בפוסט של ולווט. בדיון, טען גדי להב מ"הארץ":

כל תכני המהדורה המודפסת עולים לרשת, רק לא מקוטלגים תחת המטריה "המהדורה המודפסת" אלא מחולקים למדורים השונים.

יתכן שלפני שנה זה היה נכון. היום, זה לא נכון. חלק לא מבוטל מעיתון "הארץ", בעיקר חלקים מהטוש, אינו עובר לאתר האינטרנט של העיתון ואם הוא עובר אז כנראה שהוא מוחבא בצורה כל כך מוצלחת שאני לא מצליח למצוא אותו.

אני מניח שהסיבה לכך היא לעודד אנשים לעשות מנוי על העיתון המודפס.

האם זה עודד אותי לעשות מנוי על העיתון המודפס? לא.
האם אני נחשף פחות לתכני "הארץ"? כן.
האם "הארץ" מפיק תועלת מכך שיש פחות תכנים של "הארץ" ברשת, מכך שהם מוחבאים בצורה קסומה בתוך האתר? לא יודע. כנראה שמישהו חושב שכן.

36 מחשבות על “קישורים, קישורים מתים, ואתר "הארץ"

  1. יש הרבה כתבות בהארץ שכלל לא מועלות לאתר, לעיתים כתבות מועלות במהלך היום, כלומר מספר שעות אחרי המהדורה המודפסת, כנרראה לצורך רענון האתר.

    חמור מזה אם אתה רוצה לחפש כתבה שראית לפני מספר ימים/ שעות לעתים גוגל הינו הדרך היחידה למצוא משהו כי באתר עצמו מספר הקישורים דל להחריד. מאז השינוי האתר בלתי נסבל.

    האם הם מוחקים מהאתר כליל כתבות ישנות? כלומר עבור אותם לינקים מתים מהארץ, האם ניסית לחפש את הכתבות דרך גוגל, יכול להיות שהיית מוצא לינקים אחרים לאותם כתבות.

    אגב, את אוסף הבאנרים למעלה (היום יש את ג'ון לוק מאבודים) עצבת בעצמך או לקחת מאיפשהו?

  2. אורי – צודק, תודה.
    ג'ו – כל ההעדרים בגלוב הם פרי עבודתם של מבקרי הגלוב. ברוב המקרים אם תשים את העכבר על ההעדר (מבלי ללחוץ) תגלה מי הכין אותו.

  3. רמת הכתיבה (והעריכה) בדהמרקר מתדרדרת פלאים – ואני מנוי על הארץ כבר יותר מ 12 שנה.

    רק בחודש האחרון קראתי כמה של כתבות בנושאי טכנולוגיה שמראות בבירור כי הכתב/מתרגם-ללא-קרדיט-למקור אינו מבין את הנושא עליו הוא התבקש לכתוב/לתרגם-לשכתב.

    גם הצביעות של הדהמרקר בכל נושא אתרי הפורקס שמפאת היותם המפרסם מספר #1 זכו להעלמת עין, מרגיזה ומטילה ספק בשיקולי הדעת המערכתיים. רק לאחר האווטינג בכלכליסט, הצטרף הדהמרקר למבט הביקורתי ואתמול הזדעזע הכותב מהגירסה האינטרנטית של "חברות הסיגריות" שפירנסו (ועדיין מפרנסות) את האכסניה שלו כל כך הרבה שנים ולא זכו לכתבת תחקיר אחת.

    לכן זה לגמרי לא רע שלא ניתן להגיע לכל תכני העיתון גם ברשת.

    ואכן אני מחפש אלטרנטיבות, אולי ידיעות וכלכליסט? אולי.

  4. יובל
    אני לא יודע אם אני היחיד ששם לב , אבל בשנה האחרונה יש המון לינקים שבורים באתר של "הארץ" עצמו – לפחות אחת לשבוע אני מקליק על לינק ומגיע ל404.

    זהר
    אני שמח שגם אנשים אחרים חושבים ככה . לקרוא את דהמרקר הפך להיות איזה סוג של בדיחה – בעיני השיא היה השטות הזו עם "מסודרים" , אבל באופן כללי זה הפך יותר לצהובון כלכלי מאשר לעיתון כלכלי (זו גם דרך לבדל את עצמך מהמתחרים אני מניח)

  5. מצטרף למגמה (מי אמר שזה לא כיף ללכת עם העדר? חמים ונעים פה!!) – אכן, העדר התכנים של הארץ ברשת גרם לירידת החשיפה שלי אליהם. למרות ששקלתי מדי פעם לעשות מנוי למהדורה המודפסת, לא עשיתי כן.
    אני מקבל את "ישראל היום" בחינם לדלת ביתי, ומדור הספורט שלהם הוא מהמשובחים. את כל שאר התוכן-המוכתב-ע"י-שלדון-חבר-של-ביבי אני בין כה לא קורא, כך שהמידע שאני ניזון ממנו מגיע בעיקר מהאיטנרנט.
    חבל שהארץ הורידו את העיתון המלא, במשך הרבה שנים הקפדתי לקרוא אותו ברשת. עכשיו נותרו רק הניוזלטרים, פחות שווים בעליל.

  6. אני מזדהה עם יוסי, אכן הרבה מאוד 404 ב'הארץ'.
    לגבי הטיעונים של יובל, מסכים עם כולם אבל התייאשתי כבר די מזמן מהנכונות של מישהו ב'הארץ' לשים קצוץ לכיווני. אני כבר לא קהל היעד של העיתון משום שזה מכוון עבור קוראי הטוש, ועבור העיתון, קוראי הארץ הוותיקים הם ספיחים שעתידים להיעלם או להיכנע למגמה.

  7. יתרונו של 'הארץ' בעיני הוא בכיסוי נרחב של נושאים שלא קשורים לישראל – כולל כתיבה מגזינית – בעיתונים היומיים. בתחום הזה אין לו מתחרים, ולכן חבל מאוד שהתוכן המקוון שלו מוגבל.

    תיקון: אין לו מתחרים בעברית – קוראי האנגלית יכולים לקרוא ברשת על כל דבר ועניין.

  8. הארץ כן מעלים את כל התכנים מהמהדורה המודפסת לאינטרנט. הם רק לא מקשרים אליהם.

    קחו את הידיעה שמופיעה עכשיו בראש אתר הארץ. המספר שלה הוא 1119431

    http://www.haaretz.co.il/hasite/pages/ShArtPE.jhtml?itemNo=1119431

    הנה ידיעה שלא קושרה משום מקום ולכן לא נכנסה לגוגל

    http://www.haaretz.co.il/hasite/pages/ShArtPE.jhtml?itemNo=1119420

    21 פחות מהקישור הראשון. מצאתי את זה באופן רנדומאלי.

    מישהו רק צריך לסרוק את אתר הארץ בשיטה הזאת וליצור "אינדקס צללים" של כל תכני הארץ.

    התחלתי לעשות את זה פעם אבל לא היה לי כח לקדם את הפרוייקט. וגם אין לי ממש אינטרס לעזור ל"הארץ" להפסיק לכרות את הענף שעליהם הם יושבים. אם הם רוצים להתאבד, שיהיה להם לבריאות.

  9. במקומות שמהם אני בא, כשכותבים משהו על חברה או שירות, נוהגים לבקש תגובה. האם מה שמקובל עיתונאית לא חל על הבלוג שלך, יובל?

    ולגופו של עניין:
    1. כיום כל תכני המהדורה המודפסת עולים לרשת. לא כולם מופיעים בדף הבית של הארץ, מן הסתם. תכני דה מרקר לא עולים עוד באתר הארץ – אלא באתר דה מרקר. כולם.
    2. אין שום מדיניות "שבירת לינקים" ישנים. אין לנו שום אינטרס לשבור לינקים ישנים. לכל היותר מדובר בתקלה בשל מעבר משיטה מסויימת של ייצור יו.אר.אלים לשיטה אחרת לפני כשנה. אני באופן אישי הצלחתי לצפות בכל הדוגמאות שנתת ללינקים שבורים, אבל אם יש לך דוגמאות כאלה, אני אשמח לקבל אותם כדי שנבדוק מה הבעיה.
    3. כנ"ל לגבי 404 באתר הארץ יש לכם דוגמאות? שילחו לי ונטפל בכך

  10. גדי, אני מבקש את תגובתך

    התכנים של הידיעה בכתובת הבאה לא מופיעים בחיפוש בגוגל או ביאהו, אף על פי שהידיעה פורסמה אתמול

    http://www.haaretz.co.il/hasite/pages/ShArtPE.jhtml?itemNo=1119220

    אני משער שלא הופיע אליה קישור מאף דף שמוכר על ידי הרובוטים של גוגל או יאהו. זאת אומרת שהיא למעשה לא פורסמה אלא נמצאת על שרתי "הארץ" בלבד.

    זאת ההנחה שלי.

    האם יש לך הסבר אחר להנחה שלי?

    תודה.

  11. וכדי להשלים את השאלה שלי.

    בתגובה אלי בפוסט ההוא של ולווט לפני שנה כתבת

    1. האנלייזר היה אתמול באתר, בעיקרון אין סיבה להעלות זאת שוב. זה רק מדגים את הבעיה שאיתה אנו מתמודדים: שמצפים שנעלה את מה שהיה אתמול בעיתון, אפילו אךם דיווחנו על כך 18 שעות קודם לכן.

    2. תכני המהדורה המודפסת עולים במדורג, ובשאיפה ללא כפילות עם תכנים שעלו באתר עוד קודם לכן, כמו האנלייזר. בסופו של דבר כל התכנים מופיעים באתר

    בחיפוש גוגל חדשות מצאתי רק איזכור אחד לחברה "כפרית תעשיות", מאתר כלכליסט. זאת אומרת שהידיעה שאת הקישור שלה פרסמתי למעלה, לא הופיעה אצלכם בשום גרסה ובשום אחד מהאתרים שלכם.

  12. גדי (15) – תודה רבה על תגובתך.

    באשר לשאלתך, התשובה היא לא. אולי זה בגלל שאתה בא מעיתון ואני בא מבלוג. מצד שני, זה רעיון לא רע. בפעם הבאה שאכתוב על אתר "הארץ" אתאם עם מערכת הבלוג צלם שיצלם אותך, אשלח את הטקסט להגהה ואז לעריכה ואז לגרפיקה ואז לעימוד, אדפיס אותו ואמכור אותו בדוכנים.

    1. כמו שכתבתי: "ואם הוא עובר אז כנראה שהוא מוחבא בצורה כל כך מוצלחת שאני לא מצליח למצוא אותו." – אז ברכותיי, אני לא מצליח למצוא את כל תכני המהדורה המודפסת. אבל חזקה עליך שמה שאתה אומר מדויק והם שם, איפשהו.

    2. לא זכור לי שכתבתי של"הארץ" יש "מדיניות של שבירת לינקים". תודה על כך שאתה עונה על משהו שאף אחד לא האשים אותך בו. הדבר היחיד שכתבתי הוא שהלינקים שבורים. הסיבה שלא מצאת לינקים שבורים בדוגמאות שנתתי היא שבשעות האחרונות תיקנתי את כל הלינקים באופן ידני בהתאם להסבר שניתן לי על ידי יואב. אכן מוזר שלא מצאת לינקים שבורים אחרי שתיקנתי אותם אחד אחד.

    אני לא כל כך מבין על איזו תקלה אתה מדבר. שיניתם את מבנה הלינק (כפי שאתה עצמך כתבת), אז מה הפלא שהלינקים הקודמים לא עובדים? שוב, אני מפנה אותך לתגובתו של יואב שמסביר מה צריך למחוק ומה צריך להוסיף כדי שהלינק יעבוד.

  13. חנן,

    יש הסבר אחר לתופעה שאתה מתאר (אם כי קשה לי להאמין שזה ההסבר האמיתי). ניתן להורות לגוגל ולכל מנוע חיפוש אחר המכבד את עצמו לא לעקוב אחרי לינקים. זה מאוד פשוט ומיושם (בחוכמה יש לציין) אפילו כאן בגלוב. לדוגמא, גם אחרי שפרסמת פה את הלינק, גוגל לא "תראה" אותו. (או שמא גוגל לא "יראה" אותו…?)

  14. חנן: בהמשך לתגובתי הקודמת, אני חושב שההסבר שנתתי קרוב לאמת יותר ממה שחשבתי בתחילה.

    אין לי כח להכנס להסברים טכניים (לא שהם מסובכים כל כך) אבל ארמוז שכדאי להסתכל על קוד המקור של הדף שחנן נתן, ולחפש את המילים noindex, nofollow. לא מדובר כאן באקדח מעשן, אבל בכל זאת הייתי מהמר שהארץ מסיבות כלשהן לא רוצה שגוגל יאנדקס את כל התוכן שלו.

  15. למגיב שתהה מה האלטרנטיווה לטוש ההולך ומידרדרר – אני מזמן עברתי לכלכליסט, לפחות ברשת. רמת העריכה שם כמעט מושלמת, והרמה של התכנים, בעיקר הטכנולוגיים, מגשימה את המקצועיות של הארץ של פעם. נכון, גם הם נגועים בשלל חוליי העיתונות הכלכלית שהמרקר מדרדר אותם אליהם (רשימת 10000 האנשים המשפיעים ביותר על רחוב סוקולוב בגבעתיים) אבל זה בהחלט מאגר כתבות הטכנו' הכי טוב בעברית.  

  16. בויקיפדיה יש פתרון קל לבעיה של "הארץ" – הקישורים ל"הארץ" (וגם ללמהרשת ולאחרים לצורך העניין) מופיעים בתבנית המקבלת כפרמטר את מספר הידיעה. התבנית מתורגמת לקישור כאשר הדף המכיל אותה נטען. אם אחד האתרים משנה את המבנה (בלי לשנות את מספר הידיעה) פשוט משנים את התבנית כך שתיצור את הקישור במבנה החדש.
    בטח אפשר לעשות משהו דומה בוורדפרס.

  17. חנן, מבדיקה שערכתי מתברר שהכתבה הספציפית הזאת לא עלתה לדה מרקר בשל טעות אנוש. בעיקרון, תכני המהדורה המודפסת עולים לרשת אבל אנחנו מפעילים שיקול דעת כדי למנוע פרסומים כפולים או פרסומים המופיעים באתרים אחרים שלנו.
    אם תעשה בדיקה סטטיסטית תגלה שהידיעות שאינן עולות הן מיעוט קטן.

    יובל, לבקש תגובה הוא עניין של הגינות בסיסית, בלי קשר לפורמט שאתה משתמש בו.
    בכלל, לא ברור לי למה הניסיון שלי לספק תשובות למה שאתה מעלה כאן מתקבל על ידך בכזו ציניות, שלא לומר התנשאות. זה מייצר תחושה שאינך מעוניין בשיחה אלא רק בהטחת האשמות, למרות שבלוג הוא פורמט של שיחה, לא?
    מה גם שלא נראה לי שהדיון פה נפגע מכך שהגבתי. היית יכול לשלוח לי לינק ולבקש את תגובתי. בלוגרים אחרים נוהגים לעשות זאת, מבלי להדפיס את הפוסטי בפורמט של נייר.

    ושוב, לגופו של עניין:
    שינינו את מבנה הלינק כך שגם הלינקים הקודמים יעבדו. והם אכן עובדים. אבל כמו בכל מהלך, יתכן וחלק מהלינקים לא יעבדו וחשבתי שאתה מפנה אליהם.
    לגבי מציאת תכנים מהמהדורה המודפסת: מטרתו של האתר איננה להיות מראה מקום של המהדורה המודפסת, אלא לפעול בצורה המתאימה ביותר למדיום שבו הוא קיים. לכן אנו גם משנים כותרות, ולא מעלים תכנים שהועלו יום קודם לכן. יש גם תכנים שעולים בעכבר או במרקר למרות שהופיעו בעיתון, כיוון שיש בכך היגיון מבחינת SEO.
    לכן, בחינת האתר על בסיס הפרמטר "האם ניתן למלוא בו תכנים שהופיעו במהדורה המודפסת" אינה רלוונטית.

  18. גדי, צר לי אם נפגעת. כוונתי לא היתה לנהוג בציניות ובטח לא בהתנשאות. מאידך חשבתי שזה נכון לציין שאתה מעלה טיעונים שאף אחד לא העלה אותם רק כדי לדחות אותם. זו חוכמה קטנה מאוד.
    אני לא מעוניין בהטחת האשמות אבל אני בהחלט מעוניין להביע את דעתי (וכמו שאתה רואה, אתה בהחלט מוזמן להביע את דעתך, גם אם היא שוללת לחלוטין את שלי) ובמקרה הזה דעתי מבוססת על הניסיון האישי שלי: עשרות לינקים הפכו שבורים מאז שעברתם את השינויים שלכם לפני כשנה.

    לא אדבר בשמם של אחרים אלא רק בשמי – אני לא בוחן את האתר על בסיס הפרמטר "האם ניתן למצוא בו תכנים שהופיעו במהדורה המודפסת". אני כן בוחן את השאלה הבאה: "והיה ואני מעוניין למצוא כתבה שהופיעה במהדורה המודפסת האם אני מסוגל למצוא אותה ועד כמה זה קל לי?"
    אם זה המבחן, הרי שלצערי הרב (ואני אומר זאת ללא שמץ של ציניות), אתם מקבלים ציון מספיק בקושי, אם לא נכשל.

  19. גדי: לגבי 404: אני די בטוח שהווב מאסטר של הארץ יכול לראות בלוגס שלו בדיוק אילו כתובות הביאו את הגולש באתר להודעת שגיאה 404. אולי זה יהיה יותר יעיל לבקש ממנו לבדוק האם יש לינקים באתר שנותנים שגיאת 404.

  20. יובל,
    אנחנו בוחנים את האתר בצורה המתבקשת: מספר גולשים, מספר דפים נצפים וזמן שהיה באתר. בכל הפרמטרים האלה יש עליה משמעותית בשנתיים האחרונות.
    לגבי איתור ידיעה מהמהדורה המודפסת בקלות יתרה, צר לי שזו הרגשתך. אני מקווה שנוכל לקבל שירות טוב יותר בעתיד

  21. יובל: ישנו תוסף לוורדפרס שמוצא אוטומטית לינקים שבורים ומאפשר לך להחליפם או להסירם דרך ממש הניהול, עובד בובה! אם תצטרך עזרה בהתקנה או בשימוש בו, תרגיש חופשי לשלוח לי מייל או לשלוח לי @ בטוויטר.

    זיגמונד

  22. הבעיה שלי עם אתר הארץ היא שהם עדיין חושבים במושגים של עיתון.
    למשל: עכשיו 10:30 ביום שישי, וידיעת הספורט הכי מאוחרת באתר היא מאתמול ב-9:30 בבוקר. יותר מ-24 שעות. ככה לא עושים חדשות באינטרנט.

  23. גדי, בוא נסכם שאם אתם לא עושים SEO – תתחילו, ואם אתם עושים SEO – הגיע הזמן לדרוש הסברים מספק השרות. ליצור הפניות אוטומטיות כשמחליפים מבנה כתובות זה אלף-בית של SEO, שלא לדבר על בניית היררכיה הגיונית של תוכן ויצירת מבנה כתובות סביר מלכתחילה (והפרמטרים במבנה הכתובות החדש שלכם כואבים לגוגל בעיניים).

    להסתפק בעלייה כלשהי, אפילו הכפלה, במספר גולשים, מספר דפים נצפים וזמן שהיה באתר כשהמספרים הללו יכולים לגדול פי 50 זה עצוב.

  24. 28. גדי להב:

    8 באוקטובר 2009, בשעה 16:48

    יובל,
    אנחנו בוחנים את האתר בצורה המתבקשת: מספר גולשים, מספר דפים נצפים וזמן שהיה באתר. בכל הפרמטרים האלה יש עליה משמעותית בשנתיים האחרונות.

    גדי, סחתיין על הפרמטרים המתבקשים. תעברו לפורנו, תראו מה זה עליה משמעותית.

  25. מדובר באתר שמבחינה תוכנית ותשתיתית אפשר לתאר אותו הכי טוב במילה גרוטאה, ושהקוראים היחידים שלו הם מעט האנשים שקוראים הכל או שמוצאים נחמה מסוימת בפשטות של העבר (כמו אלה שעוד שומעים תקליטי ויניל, או מתעקשים לנסוע בפיאט אונו מודל 82'). עמוס שוקן באופן מסורתי לא מעוניין להשקיע כסף באתר חדשות, ולכן בהשפעת סגן המו"ל שכר את שירותיהם של אנשים שיוכלו להפיק מהגרוטאה את המיטב. אולי במידה מסוימת של צדק מבחינתם, אלא שיש לזה מחיר.

    בכל מה שקשור לעריכת האתר, הם הביאו מה שנקרא "אנשי תוכן". כאלה שאין להם על פניו מושג בעיתונות, אין להם סדר יום, אבל הם יודעים שצריך לשים בכותרת את המילים "הישרדות" או "תחת" או "סקסי" כדי שיקליקו עליה יותר. אין להם מה להגיד, אבל הם עובדים קשה כדי לעשות לזה אופטימיזציה בגוגל. הם עובדים למען המותג ובשביל למשוך מפרסמים. כשזה סדר העדיפויות – הקישורים, השגיאות ואיכות הטקסטים, כך נראה, פחות מעניינים אותך.

  26. בין הטענות המוצדקות על אתר הארץ לבין האיכות של החומרים של דה מרקר אין דבר וחצי דבר. דה מרקר הוא העיתון הכלכלי האחרון במדינה שהוא נקי מאינטרסים. מספיק היה לראות את הפוסטר של הסעודה האחרונה עם נוחי דנקנר שכיכב באמצעו במוסף החג של הכלכליסט כדי להבין מאיפה משתין הדג שם. אבל לבריאות, יש גם קהל לאתר האינטרנט המוביל וואן שרכשה ידיעות אחרונות, עכשיו יש קהל לאותו סוג תקשורת מתחנף גם בזירה הכלכלית.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *