יום חמישי, 20 בנובמבר 2025

מבחן χ² לאי־תלות – האם ההעדפות שלנו באמת קשורות?

נניח שאתם עורכים מסיבת טעימות עם שתי קבוצות אנשים: צעירים ומבוגרים. אתם מגישים שלושה סוגי פיצות – מרגריטה, פפרוני וטבעונית – ורוצים לדעת:

האם ההעדפה של הטעם תלויה בגיל, או שכל אחד בוחר מה שבא לו בלי קשר לגיל?”

כדי לענות על זה, אנחנו משתמשים ב־מבחן χ² לאי־תלות מבחן שבודק אם יש קשר בין שני משתנים קטגוריים (במקרה הזה: גיל והעדפת פיצה).

 מה בודקים במבחן?

המבחן משווה בין מה שציפינו לראות אילו המשתנים היו בלתי תלויים לגמרי (כלומר – בחירות אקראיות לגמרי) לבין מה שבאמת קרה.

  • השערת אפס (H₀): המשתנים אינם תלויים → העדפת פיצה לא קשורה לגיל.
  • השערה חלופית (H₁): יש תלות → הגיל משפיע על בחירת הפיצה.

 איך זה עובד בפועל

  1. בונים טבלת שכיחויות: למשל:

מרגריטה

פפרוני

טבעונית

סה"כ

צעירים

20

30

10

60

מבוגרים

35

15

10

60

סה"כ

55

45

20

120

  1. מחשבים שכיחויות צפויות: מה היינו מצפים לקבל אילו הבחירות היו עצמאיות (לפי מכפלת שורות ועמודות חלקי הסה"כ).
  2. מחשבים סטטיסטי χ²: סכום הפערים בריבוע חלקי הצפוי עבור כל תא.
  3. משווים לערך קריטי: אם סטטיסטי המבחן גדול מדי → דוחים את השערת האפס.

 דוגמה מתובלת

אם יוצא שהסטטיסטי גדול במיוחד, זה אומר שיש קשר: למשל – צעירים בוחרים פפרוני הרבה יותר ממה שציפינו, ומבוגרים דווקא מעדיפים מרגריטה.
אם הסטטיסטי קטן → אין סיבה לחשוב שיש קשר, כנראה שכולם פשוט אוהבים פיצה בלי קשר לגיל.

 קצת הומור סטטיסטי

אפשר לחשוב על מבחן אי־תלות כמו שף שמסתכל על התוצאות ושואל:

האם באמת הצעירים והמבוגרים טועמים דברים שונים, או שזה רק נראה לי כי אני עומד ליד השולחן של הפפרוני?”

אם התשובה מובהקת – השף ימליץ להכין יותר פפרוני למסיבת הצעירים הבאה.
אם לא – כולם יקבלו את אותו תפריט.

סיכום

מבחן χ² לאי־תלות הוא דרך נהדרת לבדוק קשר בין משתנים קטגוריים:

  • גיל והעדפת אוכל
  • מין ובחירת תחום לימוד
  • סוג לקוח וסוג מוצר נרכש

במקום לנחש, אנחנו נותנים לנתונים לדבר.


אין תגובות:

הוסף רשומת תגובה

הטעות הסטטיסטית הכי יקרה שאתם עושים — ואתם אפילו לא יודעים

תארו לעצמכם שאתם מנהלים מסעדת שף. בסוף הערב, אתם עוברים על הצלחות שחזרו מהשולחנות למטבח כדי להבין מה הלקוחות אהבו. אתם רואים שהצלחות של הסטי...