יותר מדי מידע פוגע באמת

אחת ההרצאות המעניינות בכנס עוסקת בגילוי ראיות אלקטרוניות, הרצאה שניתנה על ידי אחד המומחים הגדולים בארה"ב בתחום הזה, עו"ד ראלף לוסי, שכתב שני ספרים בנושא.

לטענתו, מערכת המשפט האמריקאית מבוססת על האמת אבל הבעיה היא שעם כל המידע שמצטבר, לא ניתן למצוא את האמת ולכן לא ניתן להביא את המידע לשופט כדי שיקבל את ההחלטה הנכונה. העובדה הזו, טוען, לוסי, עשויה להרוס את מערכת המשפט האמריקאית.

מיקרוסופט למשל, משלמת כ-10 מיליון דולר למשפט וחלק ניכר מההוצאות קשורות לאיתור המידע שנמצא אצלה. זה עולה כל כך הרבה כסף כי מערכת המשפט האמריקאית מחייבת את החברות לגלות את כל המידע שיש להן, ושרלוונטי למקרה, גם אם הוא מזיק לך. עובד ממוצע מבזבז המון זמן מדי יום על למצוא מידע שהוא עצמו ייצר. כעת תארו לעצמכם מה קורה כאשר חברה חיצונית מחפשת מידע בתוך ערימת המידע של החברה שלך בניסיון למצוא מידע שקבור איפשהו בתוך מאגרי המידע שלה (שאינו מובנה) ושנכתב לפני ארבע שנים על ידי עובד אחד בחברה שעובדים בה כמה אלפי, או עשרות אלפי עובדים.

סוכנות אחת שתפקידה היה לעזור לאנשים שאיבדו את הבתים שלהם היתה צריכה להיענות לצו בית משפט שבו היא נדרשה להציג עדויות. עורכי הדין של הסוכנות הזו הוציאו 6 מיליון דולר, כ-9% מהתקציב של הסוכנות כדי להיענות לצו. הם היו צריכים לבדוק 400 מילות מפתח ב-660 אלף הודעות דואר אלקטרוני והמסמכים המצורפים להן, כ-80% מהודעות הדואר האלקטרוני של הסוכנות באותה התקופה. החלק המענין הוא שהסוכנות הזו בכלל לא היתה חלק מהתביעה. התובעים טענו שיש לסוכנות מידע והשופט הוציא צו אבל הסוכנות עצמה לא היתה חלק מהתביעה. היא עדיין נדרשה להוציא 6 מיליון דולר כדי להציג ראיות במשפט שהיא לא חלק ממנו.

המחירון הוא בערך 5 דולר לקובץ (זה בדרך כלל נע מ-3 דולר ועד 10 דולר לקובץ) שנבדק. הסיבה היא שבני אדם (אם טוענים שעורכי דין הם בני אדם הממממ) עוברים על הקבצים בניסיון להחליט האם הם מתאימים כראייה או לא, כיצד לקטלג אותם וכן הלאה. ב-1 ג'יגה-ביית של מידע יש כ-16 אלף קבצים, כלומר כ-80 אלף דולר לג'יגה.

אם יש 20 עדים בתביעה, כל אחד מפיק כ-25 אלף הודעות דואר אלקטרוני וכ-25 אלף קבצים מצורפים אליהם (באופן ממוצע) – כל העניין הזה עולה מיליון דולר. גם אם מצמצמים את הרשימה כך שיקראו רק את ההודעות הדואר האלקטרוני הרלוונטיות, זה עולה כחצי מיליון דולר. וזה רק הודעות דואר אלקטרוני, שלא לדבר על ויקי, תמונות, דפי אינטרנט, סריקות של מסמכים ועוד. לארגונים רבים פשוט אין כסף להתעסק עם זה.

מעניינת במיוחד העובדה שאחת הסיבות המרכזיות שארגונים מסתבכים קשורה לעובדה שהם שומרים הכל. אם הם היו מוחקים את הודעות הדואר האלקטרוני – והם יכולים, הם לא מחויבים לשמור אותן – לא היתה להם בעיה. אבל הם שומרים – למה למחוק, יש מקום! – ולכן הם חייבים לגלות את המידע (וזאת בניגוד לדואר קולי שנמחק תוך שניה אחרי שמאזינים לו).

איזה יופי של מלכוד. אתה רוצה לשמור את המידע כדי שיעזור לך לנהל את הזיכרון הארגוני, אבל אותו מידע הוא זה שמסבך אותך.

אחד המשתתפים בכנס סיפר עכשיו שהוא עובד עם "בנק אוף אמריקה" והבנקאי שלו הודיע לו שהוא לא יכול יותר להתכתב איתו בדואר אלקטרוני. בבנק החליטו שהם לא נותנים יותר לעובדים שלהם לכתוב ללקוחות או לקבל הודעות אלקטרוניות מלקוחות. הכל בשיחות טלפון ושום דבר לא מוקלט. מטורף!

23 מחשבות על “יותר מדי מידע פוגע באמת

  1. כידוע, מקש ה-DELETE הוא המקש הכי פחות משומש במקלדת. כולנו "פולנים" של "אולי נצטרך את זה פעם". לכן ההשקעה הטובה ביותר בטווח הזמן הנראה לעין הוא בחברות אחסון, זה רק יגדל (ולא, אין לי מניות מלבד באוברדראפט שלי בעו"ש).
    השלב הבא, אני מהמר, יהיה שהחברות יבצעו מחיקה מכוונת לאחר תקופה או יצפינו את הארכיבים ואח"כ "לא ימצאו את המפתח" ברגעי האמת…

  2. חץ (2) – אתה טועה. יש חברות מסוג מאוד מסוים (ביטחוניות בעיקר) שמחויבות לשמור מיילים ל-5 שנים. שאר החברות, כך הוסבר לנו, לא מחויבות על פי חוק לשמור. אבל שומרות.

  3. זה מאוד מעודד לגלות שנכון לעכשיו לפחות, איסוף המידע האובססיבי של תאגידים על הלקוחות/משתמשים שלהם לא יכול לשמש אותם לצורכי רשע. מצד שני סביר להניח שפייסבוק למשל כן מקטלג את כל מה שמוזן אליו מה שהופך את העלויות של העיון במידע להרבה יותר נמוכות…

    מה גם שהגיוני לשער שהבעיה הזו תיפתר בתוך כמה שנים כאשר יומצאו אלגוריתמים מתוחכמים לניהול מידע.

  4. פוסט מעולה – טוב לדעת שיותר ויותר אנשים נחשפים לנושאים האלו.

    פנים רבות לניהול ידע בארגונים, וזה רק אחד מהם.

    יונתן, הגורם האנושי תמיד ישאר בתמונה, וגם יהיה חלק משפיע ממנה. כל מי שעבד עם מערכות מידע, גם ברמה גבוהה יותר של חיפושAI, Businss Intelligence וכיוצ"ב יודע היטב שגם אלגוריתמים מתוכננים ומתופעלים על ידי אנשים. ניהול הידע ( הארגוני, האנושי ובכלל ) בתקופה שבה כל שניה מועלים כ 15 שעות של וידאו ליוטיוב ע"י המשתמשים הוא משימה כבירה (את הנתון לגבי יוטיוב אמר מתיו גלוזבאך, מנהל בגוגל, לפני פחות מחודש).

  5. יונתן השני – אתה טועה לדעתי – פייסבוק אולי מקטלג את הכול בדרך כלשהי, אבל גם המידע חפיש לחלוטין ונגיש, עדיין לא קיים (וכנראה שגם לא יהיה קיים בשנים הקרובות) האלגוריתם הממוחשב שמסוגל לעבור על כל המידע הזה ולהבין את שלל ההקשרים שלו ולהבין מה רלוונטי לדיון המשפטי ומה לא. לצורך זה נדרש עדיין מוח אנושי, ולא סתם מוח אנושי, אלא כזה שמכיר את תחום העיסוק (הרי מי שאינו בנקאי לא יצליח להבין דבר מרצף של מיילים פנימיים של בנק) ואת החברה בה עוסקים.

    והפוסט הזה מתחיל להסביר מדוע החברה בה אני עובד (בלי לחשוף שמות, מדובר בענקית מעולם האחסון ששולחת בלוגרים ישראליים על חשבונה לכנסים בניו יורק), שבוודאי מסוגלת לקבל מחירים טובים על אמצעי אחסון, מפעילה מגבלות על כמות האימיילים רשאים לשמור שהיו מצחיקות את שירותי הווב החינמיים.

  6. יובל, על פי סרביינס אוקסלי מ 2002, חברות מחויבות לשמור מסמכים הנוגעים להתנהלות הפיננסית שלהן. בחברות ציבוריות אמריקאיות גדולות, זה הרי בערך כל אימייל שני, אז הן שומרות את הכל.
    אולי החוק לא קובע במפורש לגבי דואר אלקטרוני, אבל קובע שצריך לשמור מסמכים שמצביעים על התנהלות פיננסית, התנהלות חשבונאית תקינה, והשמדה של המסמכים הללו היא עבירה חמורה והפרעה למהלך חקירה תקין. בגלל זה צמח בשנים האחרונות שוק אדיר של מוצרים שמיועדים לשמירה על מדיניות ארכיון דואר אלקטרוני, מחיקה מסודרת של דואר אלקטרוני וכו'.
    אפשר לקרוא הסבר כאן:
    http://articles.techrepublic.com.com/5100-10878_11-5034345.html
    החוק עצמו:
    http://en.wikipedia.org/wiki/Sarbanes-Oxley_Act

    כזכור החוק הגיע במטרה להגן על משקיעים מכל מיני פרשיות כמו אנרון. שם תפסו את החבר'ה יושבים וגורסים כמו משוגעים כשהרשויות הגיעו לבצע מעצרים וחקירות.

  7. מומי – בדיוק+בולשיט.
    חברות אכן מחויבות לשמור מסמכים הנוגעים להתנהלות הפיננסית שלהן ומתכנת, מנהל מוצר, מעצב ואפילו סגן נשיא, לא עוסקים בהתנהלות פיננסית. הם עובדים.
    אסור לך למחוק מסמכים שאתה יודע שקשורים לחקירה שמתנהלת (ואגב, או שעשויה להתנהל נגדך) אבל מייל ביני ובין המתכנת שיושב לידי בו אנו דנים באיזה פיצ'ר במוצר – מה הסיבה בדיוק לשמור את זה?

  8. אם אסור למחוק מסמכים שקשורים לחקירה שעשויה להתנהל נגדך, אז איך אתה יודע שיום אחד לא יאשימו אותך בהשמדת ראיות?

  9. וחוץ מזה סרביינס-אוקסלי הוא אחד החוקים היותר מטומטמים ומזיקים בשנים האחרונות. החוק יצר נטל עצום על חברות קטנות ובעצם חיזק מונופולים ולא הגן על האינטרסים של המשקיעים הקטנים בכלל

  10. אז ככה: חייבים להחזיק כל דואל שקשור להתנהלות פיננסית. אבל אם יתברר שחלק מהדואל נמחק, לך תוכיח שמה שנמחק לא היה פיננסי. הדרך היחידה להוכיח שלא מחקת שום דבר שקשור ב-SOX היא, כמובן, לא למחוק כלום, והחברות נאחזות בכך באדיקות. (לצערן הרב)

  11. הרגע שוחחתי עם 3 חברים שמשמשים כ-Sys Admin בחברות שונות ושלושתם טענו אותו דבר: הם לא יודעים לגבי חוק כזה, אבל ההוראה שהנהלה נתנה זה לשמור את כל האימיילים (יוצא ונכנס) כולל הצמדות וכו' מיום הקמת החברה. המשתמש יכול למחוק מהמחשב שלו, אבל המשתמש אינו יכול למחוק שום מייל מהשרת. זה לפחות מה שהם אמרו לי.

  12. חץ – שזה בדיוק מה שטענתי (כלומר מה שאותו עו"ד שהרצה בפנינו טען): אין כזה חוק אבל כולם שומרים. ולכן אחר כך מסתבכים.

  13. למעשה התכוונתי לקשר ל-SOX, ואז התחרטתי בתחושה שאולי אני לא מבין מספיק טוב על מה אני מדבר, אפילו לאחר רענון קצר. לתחושתי מס' 14 מכוון לדבר הנכון – לך תוכיח שאין לך אחות.
    אגב, מתקופה קצרה ביותר בחברת HP ומקריאת הנהלים שם, מה שחץ אמר בתגובה 15 (והוסיפו אחרים כאן) הוא מדויק – נפחי תיבות המשתמשים הוא מצומצם ביותר, כדי לאפשר לגבות את כולן "לנצח".

  14. מניסיון, בארץ בנק לאומי והבינלאומי לא מתכתבים עם לקוחותיהם. נראה לי שאין להם יותר ממערכת מייל פנימית בלבד.
    לא ידוע לי איך זה בבנקים האחרים פה.

  15. בארץ, גופים פיננסיים, לא מתכתבים עם לקוחות, גם בגלל שהוראות המפקח על הבנקים מקשות על "קבלת הוראות מלקוחות באמצעות אימייל". גם בנק המזרחי שכיום מיישם מערכת מסג'ינג, עושה זאת באמצעות אפליקציה וובית.

    מכיוון שעבדתי בפירמת רו"ח גלובלית, אני זוכר היטב שהאמריקאים מקפידים לתייק היטב כל נייר עבודה, ומקפידים גם להשמיד את מה שלא צריך. זה דווקא בגלל SOX.

    לגבי אימייל, העניין מורכב יותר, ולכן פעמים רבות לא מוכנים להתכתב בנושאים מסוימים – האימייל הפך לתכתובת רשמית…

  16. בבנק לאומי אפשר לקבל את הדואר של הבנק בתיבת דוא"ל בתוך האתר(הם אפילו מנסים לפתות אנשים לעשות זאת בעזרת כוס קפה – ברור היתרון להם החיסכון בנייר) אבל את המיילים שהם שולחים לי הם מוחקים באדיקות לאחר חצי שנה (וזה רק מילים) אבל כנראה שעכשיו הסיבה ברורה.

  17. "המחירון הוא בערך 5 דולר לקובץ (זה בדרך כלל נע מ-3 דולר ועד 10 דולר לקובץ) שנבדק. הסיבה היא שבני אדם (אם טוענים שעורכי דין הם בני אדם הממממ) עוברים על הקבצים…"
    נראה לך שעורכי דין עוברים על זה? בשביל זה יש מתמחים.

  18. נשמע כהרצעה מרתקת ביותר, לא זכור לי שהנושא עלה לדיון אצלנו בארץ הקודש (אולי בגלל החקיקה הלא מספיק מפותחת בתחום המחשבים?).
    הנושא נשמע עוד יותר אקוטי כאשר חושבים על התחומים החמים בשוק: archiving, de-dup …., כלומר לשמור הכל הכל הכל וכמה שיותר.
    אולי יש פה נתח שוק הולך וגדל לתחום החיפוש הפנים אירגוני והלא ממש תחרותי (דוגמא כמו Google Search Appliance ) ??? או שאולי אפשרות לסטנדרט בין כל היצרנים לטובת FrameWork מסויים בתחום ???
    בכל מקרה נקודה באמת מעניינת.

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *