נניח שאתם עורכים מסיבת טעימות עם שתי קבוצות אנשים: צעירים ומבוגרים.
אתם מגישים שלושה סוגי פיצות – מרגריטה, פפרוני וטבעונית – ורוצים לדעת:
“האם ההעדפה של הטעם תלויה בגיל, או שכל אחד בוחר מה שבא לו בלי קשר לגיל?”
כדי לענות על זה, אנחנו משתמשים ב־מבחן χ² לאי־תלות – מבחן שבודק אם יש קשר בין שני משתנים קטגוריים (במקרה הזה: גיל והעדפת
פיצה).
מה
בודקים במבחן?
המבחן משווה בין מה שציפינו לראות אילו המשתנים היו בלתי תלויים
לגמרי (כלומר – בחירות אקראיות לגמרי) לבין מה שבאמת קרה.
- השערת אפס
(H₀): המשתנים אינם
תלויים → העדפת פיצה לא קשורה לגיל.
- השערה חלופית
(H₁): יש תלות → הגיל
משפיע על בחירת הפיצה.
איך זה
עובד בפועל
- בונים טבלת שכיחויות: למשל:
|
מרגריטה |
פפרוני |
טבעונית |
סה"כ |
|
|
צעירים |
20 |
30 |
10 |
60 |
|
מבוגרים |
35 |
15 |
10 |
60 |
|
סה"כ |
55 |
45 |
20 |
120 |
- מחשבים שכיחויות צפויות: מה
היינו מצפים לקבל אילו הבחירות היו עצמאיות (לפי מכפלת שורות ועמודות חלקי
הסה"כ).
- מחשבים סטטיסטי
χ²: סכום הפערים בריבוע חלקי הצפוי עבור כל תא.
- משווים לערך קריטי: אם סטטיסטי המבחן גדול מדי → דוחים את השערת
האפס.
דוגמה
מתובלת
אם יוצא שהסטטיסטי גדול במיוחד, זה אומר שיש קשר: למשל – צעירים
בוחרים פפרוני הרבה יותר ממה שציפינו, ומבוגרים דווקא מעדיפים מרגריטה.
אם הסטטיסטי קטן → אין סיבה לחשוב שיש קשר, כנראה שכולם פשוט אוהבים
פיצה בלי קשר לגיל.
קצת
הומור סטטיסטי
אפשר לחשוב על מבחן אי־תלות כמו שף שמסתכל על התוצאות ושואל:
“האם באמת הצעירים והמבוגרים טועמים דברים שונים, או שזה רק נראה לי כי
אני עומד ליד השולחן של הפפרוני?”
אם התשובה מובהקת – השף ימליץ להכין יותר פפרוני למסיבת הצעירים הבאה.
אם לא – כולם יקבלו את אותו תפריט.
סיכום
מבחן χ² לאי־תלות הוא דרך נהדרת לבדוק קשר בין
משתנים קטגוריים:
- גיל והעדפת אוכל
- מין ובחירת תחום לימוד
- סוג לקוח וסוג מוצר נרכש
במקום לנחש, אנחנו נותנים לנתונים לדבר.

אין תגובות:
הוסף רשומת תגובה