ביום רביעי בשבוע שעבר המחלקה להנדסת תעשייה וניהול באוניברסיטת בן גוריון אירחה את הכהן הגדול של ויזואליזציה של מידע, הלא הוא פרופ' בן שניידרמן. לפני כמה חודשים, לכבוד יום הולדתו של בן, האתר visual-literacy.org הפך את האיש עצמו לממשק אחד גדול לשיטות ויזואליזציה שונות (מומלץ להקליק ולשחק קצת):

לא יכולתי להחמיץ הזדמנות לראות את זה מקרוב, אז נסעתי לב"ש.
בעיית התיקים הרפואיים האלקטרוניים
ההרצאה עסקה בויזואליזציה של מידע רפואי, וספציפית בתפעול של תיקים רפואיים אלקטרוניים. באופן כללי, רפואה היא אחד התחומים התוססים והמרתקים יותר שקיימים בהנדסת אנוש (כמו גם בעוד הרבה מקצועות אחרים), ובעיית התיקים הרפואיים האלקטרוניים (EMR, או EHR - electronic health/medical records) היא בין הסוגיות שתופסות הכי הרבה כותרות לאחרונה, לא מעט בזכות פועלו של שניידרמן. הבעיה עם התיקים האלה היא די טריוויאלית: יש בהם הרבה מאוד מידע שזקוק לעיבוד, ולנו, מה לעשות, יש לא כזה הרבה מוח שמסוגל לעבד אותו. המצב הולך ומחמיר עם כל בדיקה חדשה שנוספת לארסנל הרפואי, ובמסגרת התפשטות התקשוב בחיינו והגברת תשומת הלב לנושא הבריאות, מספר הכלים שעומדים לרשות הרופאים רק הולך וגדל (שמעתי אפילו ששוקלים להעביר חוק להארכת משך ההריון בחודש נוסף, כי נשים הרות לא מספיקות לבצע את כל הבדיקות הדרושות). אם כך, כמות המידע בתיקים הרפואיים גדלה מיום ליום, וכל פיסת מידע מקבלת יותר ממדים, יותר משמעויות, יותר קשרים פנימיים עם סוגי מידע אחרים בתיק, ובעיקר כל המידע הזה הופך להרבה הרבה יותר מסובך.
אחת הסיבות לכך שהנושא מקבל תשומת לב כה רבה היא שהמצב הוא חמור במיוחד במרכז העולם, קרי בארה"ב. לא בגלל שיש שם יותר בדיקות או יותר מחלות מאצלנו, אלא פשוט כי המערכת שלהם מיושנת בצורה מפתיעה. רוב התיעוד הרפואי שלהם מתרחש על גבי נייר, בכתב היד הרפואי המפורסם, ואם ברצונך לעבור לקופת חולים אחרת, אתה מבקש יפה את התיק שלך (תיק פיזי, קלסר עבה כזה, או כמה קלסרים במקרים רבים) לוקח אותו ביד, והולך איתו לרופא החדש.
בקיצור, ה-EMR מציבים למעשה שתי בעיות: א' - שהם כמעט ולא בשימוש, וב' -גם כשכבר משתמשים בהם, לאף אחד לא ברור איך לעשות זאת היטב. לאף אחד חוץ מבן שניידרמן, כמובן. הבעיה הראשונה לא באמת קשורה לשימושיות מעבר להכרה בעובדה הפשוטה שמחשב עדיף על נייר. היא קשורה לבירוקרטיה ופוליטיקה והרבה מאוד כסף, כמו שאפשר להסיק מהעובדה שאחת התוכנות הראשונות שקיבלו את האישורים הדרושים לניהול העסק הייתה HealthVault של מיקרוסופט, ולאחרונה גם גוגל השיקה שירות תיקים רפואיים מקוונים בשם Google Health (כנראה שבגוגל הבינו שאין מה לדבר עם הממסד ומוטב כבר להעביר את ניהול התיקים הרפואיים של האנשים לידיהם של האנשים עצמם - רעיון מהפכני משהו).
הבעיה השנייה, כפי שטוען שניידרמן, היא של ויזואליזציה של מידע. יש לנו כמויות אדירות של מידע על כל מטופל. המידע הוא מסוגים שונים מאוד. כל בדיקה מודדת משתנה ייחודי, על סקאלה משלו, עם רמות משלו ומשמעויות משלו. בין השאר, יש צורך לראות את הסיכום הכללי של המידע, להיות מסוגל להיכנס לרזולוציה גבוהה של הנתונים, לסנן רק את המידע הרלוונטי, ולמצוא דפוסים שחוזרים על עצמם. וכל זה יכול להיות בתוך מדד ספציפי, בתוך קבוצה של מדדים, ומעבר לכל המדדים. ובסוף צריך גם להבין מה כל זה אומר. החלק האחרון הזה של ההבנה חופף לתחום גדול נוסף של מדעי המחשב ברפואה: מערכות תומכות החלטה. מערכות אלו מסוגלות לקחת את המידע שנותנים להן, לפרש אותו באמצעות האלגוריתמים הנכונים, ולהציע לרופא את הפירוש שהתקבל יחד עם דרך הפעולה המומלצת. אבל זה לא חלק מבעיית התיקים הרפואיים. זו בעיה הרבה יותר רחבה, ואינה מוגבלת רק לרפואה, אבל כמו תמיד, ברפואה היא חמורה במיוחד כי יש פשוט יותר מדי מידע שדורש ניתוח (יש טענות שכמות הידע הרפואי מוכפלת כל 18 חודשים), ומחיר הטעות הוא כזה שאף אחד לא מוכן להסתכן.
ויזואליזציה של מידע רפואי
שניידרמן מספק את ההגדרה הבאה של ויזואליזציה של מידע:
"תצוגה גראפית דחוסה וממשק משתמש לתפעול של כמויות רבות של פריטים (106 - 102), שייתכן כי נגזרו ממבני נתונים גדולים יותר, אשר מאפשרים למשתמש להגיע לתגליות, החלטות או הסברים כלשהם לגבי דפוסים קיימים (מגמות, גושים, פערים, חריגים), קבוצות של פריטים, או פריטים נפרדים". קליל ואלגנטי, כמו שמקובל באקדמיה. התרגום שלי לשפת אנוש הוא "הצגה מובנת של דברים" (Understandable presentation of stuff).
ההנחיות שלו לעיצוב מערכות ויזואליזציה הן כדלהלן:
- תצוגה חזותית של מרכיבי השאילתה
- תצוגה חזותית של תוצאות
- פעולות מהירות, מצטברות והפיכות
- בחירה ע"י הצבעה (לא הקלדה)
- משוב מתמשך ומיידי
- הפחתת שגיאות
- עידוד חקירת המידע
בנוסף להנחיות הנ"ל, בן הציג שקף נוסף שהכיל את המנטרה של ויזואליזציה של מידע. בשקף היו כעשר שורות, אז לא הספקתי לרשום את כולן, אבל ארבעת הראשונות היו:
- Overview, zoom & filter, details-on-demand
- Overview, zoom & filter, details-on-demand
- Overview, zoom & filter, details-on-demand
- Overview, zoom & filter, details-on-demand
אחרי המבוא התיאורטי הזה עברנו לסקירת כמה מהפרוייקטים שיצאו מהמעבדה של בן אל השוק החופשי. המוטיב המרכזי היה חברת Spotfire, שהוקמה ע"י אחד מתלמידיו של בן, זכתה להצלחה רבה בקרב חברות תרופות ומחקר גנטי, ולאחרונה ממוצבת יותר ככלי בינה עסקית (BI) לבקרת ייצור, שיווק, ניהול שרשראות אספקה וניתוח פיננסי. כאן אפשר לראות הדגמה של התוכנה בפעולה. לוקח לזה קצת זמן להיטען, אבל אם רוצים להבין על מה בן באמת מדבר, זה בגדר צפיית חובה.
כמו כן, שמענו על Microsoft Amalga, שזה פלטפורמה שנבנתה עבור הקהילה הרפואית. היא מאפשרת שילוב והצגה של מידע ממקורות רפואיים שונים מאוד, ויוצרת מהם תמונה מקיפה של ההיסטוריה הרפואית של המטופל. בין השאר, התוכנה עושה שימוש בפרויקט נוסף מהמעבדה של שניידרמן, שמו PatternFinder, ולמרבה ההפתעה הוא יודע למצוא דפוסים שחוזרים על עצמם במבני נתונים גדולים. בויקיפדיה אפשר למצוא תיאור מאוד מחמיא ומבטיח של התוכנה, ועל פניו נראה שהתמונה העגומה שראינו בתחילת הפוסט הולכת ומתבהרת והופכת לחלק מתמונה הרבה יותר גדולה שהיא גם ורודה למדי, הידועה בשם Microsoft Healthcare Vision, והמתוארת בסרטון הבא:
הפרויקט הרלוונטי ביותר לנושא ההרצאה היה LifeLines, כי הוא עוסק ספציפית בויזואליזציה של ההיסטוריה הרפואית של המטופל. התוכנה מציגה בעיות רפואיות, תקופות אישפוז, ונטילת תרופות בתור קווים אופקיים על ציר הזמן, שעל גבי קווים אלה נמצאים אירועים נקודתיים כגון ביקורי רופא, בדיקות או הערות כלשהן. עובי וצבע הקווים מעידים על קשרים בין האירועים ומובהקותם, והמשתמש יכול לשנות את רזולוציית הזמן על מנת לשלוט על כמות הפירוט המוצגת. לדעת החוקרים, התוכנה יכולה להפחית את הסבירות לפספוס פרטים חשובים, לעזור באיתור מגמות וחריגות ולהפוך את הגישה לפרטים לחלקה ומהירה יותר.
ויזואליזציה של מידע לא רפואי
לבל נחשוב שהוא פעיל רק בתחום הרפואי, שניידרמן הזכיר גם שני פרויקטים מעניינים שקשורים לויזואליזציה בתחומים אחרים.
כיאה לאדם שעוסק בתצוגה מובנת של דברים, בן דואג לתת לפרויקטים שלו שמות מובנים וברורים (ומי שאוהב את ספרי Discworld ייזכר ב-Leonard of Quirm). את ה-PatternFinder כבר הזכרנו, ולא מפתיע שתוכנה שמאפשרת לעקוב אחרי תהליכים במימד הזמן והגאוגרפיה תקרא GeoTime. תוצר טיפוסי של התוכנה נראה כך (תלחצו, תלחצו):

מה שאנחנו רואים כאן זה את המסלול הגאוגרפי (צירים X ו-Y), הטמפורלי (ציר Z), והעוצמה (גודל הבועית) של כמה הוריקנים שהכו בארה"ב בתקופה מסוימת, כשהנחש הצהוב למעלה זה הוריקן קטרינה המפורסם.
הפרויקט האחרון שהוזכר עסק בשיטה לסידור מידע הירארכי על שני מימדים, כלומר כך שיראו גם את ההירארכיה וגם מדד נוסף כלשהו. השיטה של שניידרמן נקראת TreeMap והיא מקצה שטח מסוים לכל פריט בהירארכיה. את השטח הזה היא מחלקת לתת-הפריטים המרכיבים את אותו הפריט, בהתאם לגדלים היחסיים שלהם על אותו מדד נוסף. כנראה שהיישום המפורסם ביותר של הרעיון הוא מפת החדשות. התוכנה עוברת על המון אתרי חדשות, ומחלקת את כל החדשות לשבע קטגוריות, המיוצגות ע"י רצועות אופקיות. הגובה של כל רצועה מייצג את כמות החדשות השייכות לקטגוריה זו (מלמעלה למטה: בינלאומי, מדיני (ארה"ב, כמובן), כלכלי, טכנולוגיה, בידור, בריאות). בתוך כל רצועה רוחבו של כל פריט משקף פעם נוספת את כמות החדשות המתייחסות לפריט זה. אם עומדים עם העכבר על פריט מסוים, אפשר לראות את הכותרת ותת-הכותרת של הכתבה, ואת מספר הכתבות הנוספות בנושא (המספר שקובע למעשה את גודל הפריט בתצוגה).
על מנת להבין יותר טוב את האתר, מומלץ מאוד לוודא שבפינה הימנית התחתונה שלו, מעל הבלוקים של בידור ובריאות, מסומן layout: standard.
עד כאו ההרצאה של בן שניידרמן. מאוד שמחתי לראות שחוקרים בקנה מידה כזה מגיעים אלינו. לצערי הפרסום על ההרצאה היה רק בתוך המחלקה (בן הגיע כאורחו של פרופ' יואכים מאייר), ולכן הגיעו יחסית מעט אנשים. מצד שני, בזכות זה האירוע היה באווירה מאוד ביתית ואינטימית, ובתום ההרצאה בן נשאר לדבר עם כל מי שרצה. בכל זאת, אני מקווה שבפעם הבאה יותר אנשים יזכו להזדמנות לשמוע אותו, ואולי אפילו ניתן יהיה לארגן משהו במסגרת UPA ישראל.
ויטלי
פוסטים קודמים בנושא ויזואליזציה:
לו הייתי טאפטי.
Infographicofee.