אם אי פעם עמדתם במטבח וחתכתם עוגה לחתיכות לא שוות, אתם
מכירים את הבעיה:
כולם רוצים לדעת מי קיבל יותר.
וזה בדיוק מה שהיסטוגרמה עושה —
רק בלי ויכוחים ובלי פירורים על השיש.
היסטוגרמה היא אחת הדרכים הפשוטות והחזקות להבין איך
הנתונים שלנו מתפלגים: איפה
יש הרבה, איפה יש מעט, ואיפה מתחבא החתן הנעלם של עוגת יום ההולדת.
אז מה זה בכלל היסטוגרמה?
תחשבו על מגש גדול של ריבועי בראוניז.
כל שורה מייצגת טווח של ערכים למשל:
0–5 דקות אפייה מוקדמת מידי,
5–10 דקות — עדיין חי בפנים,
10–15 — מושלם,
15–20 — נשרף קצת אבל סבבה עם גלידה.
כל טווח כזה הוא “דלי” (bin),
וכל דלי מספר לנו כמה נתונים נפלו בו.
במילים אחרות:
היסטוגרמה היא כמו לספור כמה אנשים הגיעו לכל דוכן בקומזיץ —
רק עם קמח ושוקולד.
למה צריך את זה?
כי נתונים גולמיים יכולים לבלבל.
אתם יכולים להחזיק 200 מספרים, ולא להבין שום דבר.
אבל ברגע שמחלקים אותם לטווחים מסודרים?
פתאום הכול ברור.
היסטוגרמה עוזרת לנו לראות:
- האם הנתונים נוטים לצד מסוים
- האם יש זנב ארוך (כמו עוגה
שנמשכה יותר מיד)
- האם יש שתי פסגות (אהה—זה
כששתי קבוצות אוכל שונות ניסו לשתף מגש אחד)
- והכי חשוב: האם הנתונים בכלל נורמליים, או שהם מתנהגים כמו בצק שלא שמע על
שמרים.
דוגמה טעימה במיוחד
נניח שאתם בודקים כמה זמן לוקח לכל אחד להכין קפה בבוקר.
אספתם נתונים:
- יש אנשים שלוקחים 30 שניות
- יש כאלה שצריכים 3 דקות
- ויש את אלו ששוכחים להדליק את הקומקום
(7–8 דקות בדרך כלל)
עכשיו תעשו היסטוגרמה, ופתאום תגלו שהקבוצה השלישית היא
מיעוט קטן אבל רועש (קבוצת “בבוקר אל תדברו איתי”).
והנה לכם תובנה יומיומית דרך גרף בסיסי.
רגע של הומור
היסטוגרמה היא הגרף היחיד בעולם שאומר לך את האמת בפנים:
“יש לך יותר מדי נתונים שנשרפו… אולי
כדאי לבדוק את התנור.”
סיכום
היסטוגרמה היא כמו חיתוך מדויק של עוגה:
היא מראה איפה הנתונים מרוכזים,
איפה הם דלילים,
ומי קיבל את החתיכה הגדולה בלי שבכלל שמנו לב.
בכל פעם שאתם מקבלים נתונים חדשים,
אל תתחילו ישר לחשב ממוצעים ושונות.
תנו מבט בהיסטוגרמה.
היא תספר לכם את הסיפור לפני שאתם בכלל שואלים.
ביס אחד של הבנה — ושל סטטיסטיקה שמוגשת בטעם טוב.

אין תגובות:
הוסף רשומת תגובה