תארו לכם שאתם אופים שלוש עוגות שונות: אחת שוקולד, אחת וניל ואחת
תות. אתם מזמינים את החברים לטעימה עיוורת ומבקשים מהם לדרג כל עוגה מ-1 עד 10.
בסוף אתם מסתכלים על שלושה ממוצעים:
- שוקולד קיבלה 8.5
- וניל קיבלה 7.8
- תות קיבלה 6.9
אבל רגע – האם הפערים האלו באמת מעידים שעוגת השוקולד מנצחת, או שסתם יצא לכם מדגם שבו אוהבי שוקולד היו הרוב? כאן נכנס לתמונה ניתוח שונות (ANalysis Of VAriance), או בקיצור ANOVA.
מה זה ANOVA?
ANOVA הוא הכלי
שבודק אם הממוצעים של כמה קבוצות שונים זה מזה באמת או שההבדלים הם רעש
אקראי.
- השערת האפס
(H₀): כל הקבוצות זהות
בממוצע.
- השערה חלופית
(H₁): לפחות קבוצה אחת
שונה.
במילים פשוטות – אנחנו שואלים:
"האם יש טעם להכריז מנצחת, או שכולן בערך אותו דבר?"
איך זה עובד (בלי להפחיד)
ANOVA משווה
בין שני סוגי שונות:
- שונות בין קבוצות: כמה רחוקים הממוצעים זה מזה.
- שונות בתוך קבוצות: כמה הטועמים לא מסכימים בינם לבין עצמם בתוך
כל קבוצה.
אם השונות בין הקבוצות גדולה משמעותית מהשונות בתוך הקבוצות → כנראה
שיש הבדל אמיתי.
דוגמה מתוקה במיוחד
נניח ש-15 טועמים דירגו כל עוגה.
- אם כל טועמי השוקולד נתנו ציונים גבוהים,
והטועמים של התות הסכימו שהיא בינונית, הפערים יהיו ברורים → ANOVA יגיד "כן, יש הבדל מובהק".
- אבל אם כל אחד דירג אחרת (אחד אוהב שוקולד, השני שונא תות, השלישי לא אוהב מתוק בכלל), השונות בתוך הקבוצות תהיה גדולה מדי, והמבחן יגיד "חברים, אין מנצחת ברורה – תעשו דו-קרב טעימות נוסף."
הומור סטטיסטי קטן
אפשר לחשוב על ANOVA כשופט בתחרות בישול:
- אם כל השופטים מסכימים שעוגה אחת הכי טעימה
→ הכרזה חגיגית על המנצחת. 🏆
- אם כל שופט אומר משהו אחר → השופט הסטטיסטי
מרים גבה ואומר: "חברים, זה לא מובהק, תחזרו למטבח."
ואחרי שמוצאים הבדל…
אם ANOVA אומר שיש הבדל, עדיין
צריך לבדוק בדיוק איפה. בשביל זה עושים מבחני
המשך (Post-Hoc) – למשל מבחן LSDשמגלה אילו זוגות של
עוגות שונים זה מזה.
סיכום
ANOVAהוא כלי
נהדר כשיש לכם יותר משתי קבוצות ורוצים לדעת אם יש מנצחת ברורה. הוא מציל אותנו
מלעשות עשרות מבחני t, ומחזיק את התחרות
הוגנת.
אז בפעם הבאה שמישהו יגיד "ברור שעוגת השוקולד הכי טובה",
תוכלו לשאול:
האם זה מובהק סטטיסטית או שאתה סתם רעב ?

אין תגובות:
הוסף רשומת תגובה