יום חמישי, 30 באוקטובר 2025

רגרסיה – לא מה שחשבתם

כשאנשים שומעים את המילה "רגרסיה" הם לפעמים חושבים על פסיכולוגיה ("הוא חזר אחורה לגיל הילדות") או על פוליטיקה ("המצב במדינה הולך אחורה"). אבל בסטטיסטיקה רגרסיה היא לא חזרה אחורה – היא אחד הכלים הכי חכמים שיש לנו כדי להבין איך דברים קשורים אחד לשני.

מהי רגרסיה?

רגרסיה היא שיטה שמנסה להסביר קשר בין משתנים.
המשתנה שאנחנו רוצים לנבא נקרא תלוי (כי הוא "תלוי" בגורמים אחרים), והמשתנים שמסבירים אותו נקראים בלתי תלויים )כי הם מתנהגים כאילו הם לא סופרים אף אחד(.

דוגמה קלאסית:

  • תלוי: מחיר דירה 🏠
  • בלתי תלויים: גודל הדירה, מספר חדרים, מרחק למרכז העיר, והאם יש שכנים שמנגנים מתופפים ב-3 בבוקר.

קו ישר בעולם עקום

ברגרסיה ליניארית אנחנו מנסים להתאים קו ישר לנתונים. כן, אנחנו לוקחים את כל הכאוס של החיים ומציירים עליו קו ישר – כי לפעמים זה מספיק טוב.
הקו הזה אומר לנו בערך:

כל פעם שאתה מוסיף מטר רבוע לדירה – המחיר עולה ב-X שקלים (בהנחה ששום דבר אחר לא משתנה).”

דוגמה מהמטבח

נניח שאתם מנסים להבין מה משפיע על הצלחת עוגת השמרים שלכם:

  • תלוי: גובה העוגה אחרי האפייה
  • בלתי תלויים: זמן לישה, טמפרטורת תנור, כמות שמרים, מצב הרוח שלכם בבוקר.

אתם אוספים נתונים מ-20 ניסיונות אפייה (כן, זה תירוץ לאפות הרבה), מריצים רגרסיה ומגלים:

  • כל דקה נוספת בלישה → העוגה גבוהה יותר ב-0.5 ס”מ.
  • כל 10 מעלות מעל 180° → העוגה יורדת (כנראה נשרפת).
  • מצב רוח טוב בבוקר? לא נמצא מובהק סטטיסטית… אבל אולי זה פשוט כי במדגם קטן קשה למדוד אושר. 😄

זהירות – מלכודות בדרך

רגרסיה היא כלי נהדר, אבל אפשר ליפול בה בקלות:

  • בלבול בין סיבה ותוצאה: אם גילינו שצריכת גלידה קשורה לטביעה בים, זה לא אומר שגלידה מסוכנת – אולי פשוט מדובר בקיץ.
  • השמטת משתנים חשובים: אם שכחתם להוסיף למודל את סוג הקמח, אל תתפלאו שהעוגה לא יוצאת.
  • הערכת יתר: מודל טוב מסביר, לא חוזה עתידות. אם אתם משתמשים ברגרסיה לנבא את תוצאות האירוויזיון ב-2030 – קחו את זה בעירבון מוגבל.

סיכום

רגרסיה היא כמו מתכון טוב – היא עוזרת לנו להבין מה גורם למה, באיזה מינון, ומה צפוי לקרות אם נשנה משהו. אבל כמו במטבח, צריך לדעת איך להשתמש בה: לא לשים יותר מדי מרכיבים (מודל מסובך מדי), ולא פחות מדי (מודל חסר טעם).

בפעם הבאה שתשמעו "רגרסיה", אל תיבהלו – תחשבו על זה כמו קו ישר שעוזר לעשות סדר בבלגן. ואולי גם תאפו עוגה בדרך.

 

יום ראשון, 26 באוקטובר 2025

התפלגות מעריכית – כמה זמן עד שהעוגה נשרפת

יש דברים בחיים שקורים “פתאום”.
אתה שם עוגה בתנור, מתפנה לרגע לטלפון
ופתאום ריח שרוף ממלא את המטבח.

מה הסיכוי שזה יקרה?
ובכן… הסתברותית, אתה חי בתוך התפלגות מעריכית.

 כשזמן ההמתנה הופך להסתברות

התפלגות מעריכית עוסקת ב־הסתברות שמשהו יתרחש בזמן מסוים,
כאשר לא יודעים מתי בדיוק זה יקרה — רק את הקצב שבו זה קורה בממוצע.

נשמע מסובך?
בואו נתרגם את זה למונחים של מטבח.

אם בממוצע עוגה נשרפת פעם כל 40 דקות,
ההתפלגות המעריכית תענה על השאלה:
מה הסיכוי שהעוגה תישרף תוך פחות מ־10 דקות?
או מה הסיכוי שתחזיק מעמד שעה שלמה בלי טרגדיה?

 למה זה חשוב?

ההתפלגות המעריכית היא בעצם “שעון ההסתברות” של העולם.
היא מתארת כמה זמן ייקח עד שהאירוע הבא יתרחש
בין אם זו עוגה נשרפת, טלפון שמצלצל, לקוח שמגיע, או מטוס שמאחר.

בהנדסה, משתמשים בה כדי למדל תקלות במכונות.
בכלכלה – לזמן בין עסקאות.
ובמטבח – לזמן עד שהשף אומר “אוי לא!” 😅

🧁 תכונה ייחודית – חוסר זיכרון

הקטע המגניב הוא שההתפלגות הזאת לא זוכרת את העבר.
אם העוגה לא נשרפה במשך 30 דקות,
זה לא משנה הסיכוי שתישרף בדקה הבאה נשאר בדיוק אותו דבר.

מבחינה סטטיסטית קוראים לזה תכונת חוסר זיכרון.
מבחינה קולינרית, זה נקרא חוסר למידה מטעויות.

 דוגמה מהחיים

תחשבו על מונית שעוברת ברחוב בתל אביב.
בממוצע, מגיעה מונית כל 10 דקות.
השאלה היא – אם כבר חיכיתם 9 דקות,
האם זה אומר שהמונית תגיע בקרוב יותר?

לא בהכרח.
בהתפלגות מעריכית, כל רגע הוא התחלה חדשה.
(כן, גם במוניות וגם באפייה...(

😂 רגע של הומור סטטיסטי

התפלגות מעריכית היא כמו תנור ישן
אתה אף פעם לא יודע מתי בדיוק הוא יחליט לחרוך הכול,
אבל אתה יודע שזה יקרהבסוף.

סיכום

אם החיים שלכם מרגישים כמו רצף של “פתאום זה קרה”,
כנראה שאתם חיים לפי התפלגות מעריכית.

היא מזכירה לנו שלמרות שאנחנו אוהבים שליטה וזמן מדויק,
בחיים — כמו באפייה — לפעמים הכול עניין של הסתברות.

אז בפעם הבאה שתשמעו צפצוף מהתנור,
תזכרו: זה לא מזל רע
זו פשוט פונקציית סיכון 😅

הקשר בין ההתפלגות המעריכית להתפלגות הפואסונית

אם הפואסון עוזר לנו להבין כמה פעמים משהו קורה בפרק זמן מסוים (למשל – כמה עוגיות נשרפות בשעה 🍪),
ההתפלגות המעריכית עוזרת לנו להבין כמה זמן עובר בין השריפה האחת לשנייה 🔥

שתי ההתפלגויות האלה הן בעצם זוג מושלם במטבח הסטטיסטי:
פואסון סופר את האירועים, ומעריכית מודדת את הזמן ביניהם.
אז אם אהבתם את הריח של ההסתברות הזו
כנסו לפוסט על ההתפלגות הפואסונית

https://tastingstatistics.blogspot.com/2025/09/blog-post_25.html

יום רביעי, 22 באוקטובר 2025

הסתברות מותנית – כשכבר טעמת ביס אחד

תארו לעצמכם שאתם פותחים את המקרר בלילה ומחפשים משהו מתוק.
יש עוגה עם שוקולד, ויש עוגה עם תותים.
אם אתם כבר יודעים שמישהו חיסל חצי מהמגש – מה הסיכוי שהביס הבא שלכם ייפול על תות? 🍓

ברוכים הבאים לעולם של הסתברות מותנית המקום שבו כל מידע חדש משנה את התמונה.

מה זה בעצם הסתברות מותנית?

במילים פשוטות:
הסתברות מותנית היא השאלהמה הסיכוי שמשהו יקרה, בהנחה שכבר קרה משהו אחר?

כלומר, אנחנו לא מתחילים מאפס.
יש לנו רמז, הקשר, או מידע מוקדם – והמידע הזה משנה את ההסתברות.

דוגמה יומיומית:
אם אתה יודע שיצאה עוגת שוקולד מהתנור, הסיכוי שתריח ריח של קקאו גבוה מאוד.
אבל אם אתה יודע שזו עוגת גבינה… הסיכוי ירד דרמטית.

 בואו נבשל את זה יחד

נניח שיש לכם קופסה עם 10 עוגיות:
5
 עם שוקולד צ’יפס ו־5 רגילות.
העוזר במטבח לקח אחת — ואתם רואים פירורים של שוקולד על השולחן.

עכשיו אתם שואלים:

אם אני יודע שיש שוקולד על השולחן, מה הסיכוי שהוא לקח עוגיית שוקולד?”

זו בדיוק הסתברות מותנית:
הסתברות לאירוע אחד )העוזר לקח עוגיית שוקולד), בהנחה שקרה אירוע אחר )נשארו פירורים של שוקולד).

כלומר, ההסתברות “מותנית” במידע שכבר יש לנו.

 איך זה שונה מהסתברות רגילה?

בהסתברות רגילה אנחנו מדברים על סיכוי כולל – בלי לדעת מה קרה קודם.
אבל בהסתברות מותנית – אנחנו מעדכנים את דעתנו על סמך ראיות.

זה מה שגורם לה להיות לב ליבו של החשיבה הסטטיסטית – היא הגיונית.
אנחנו לא מתעלמים מהמידע, אלא מתאימים את ההסתברות למצב.

 מתכון לחיים (ולמטבח)

הסתברות מותנית נמצאת בכל מקום:

  • אם עוגה כבר נשרפה פעם אחת – הסיכוי שתשרף שוב תלוי כמה זמן תשאיר אותה בתנור הפעם.
  •  אם בדיקה רפואית חיובית, מה הסיכוי שבאמת יש מחלה – תלוי כמה היא נדירה באוכלוסייה.
  •  ואם משתמש לחץ על פרסומת, מה הסיכוי שיקנה – תלוי איזה מוצר זה היה.

רגע של הומור סטטיסטי

הסתברות מותנית היא כמו ריח חזק במטבח
ברגע שהוא מופיע, אתה כבר יודע הרבה יותר על מה קורה שם.

סיכום

כל החלטה טובה בחיים – ובאפייה – היא מותנית במידע שיש לך.
לפני שאתה מעריך סיכוי, תשאל את עצמך:

מה אני כבר יודע?”

כי במציאות, בדיוק כמו בעוגה,

הביס הראשון משנה את הטעם של כל השאר 🍰 

יום שישי, 17 באוקטובר 2025

התפלגות גיאומטרית – כמה ניסיונות עד שהלחם סוף־סוף יוצא טוב

נניח שאתם מנסים לאפות לחם מחמצת. בפעם הראשונה הוא יצא דחוס,
בשנייה – שרוף,
בשלישית – כמעט טוב,
וברביעית… סוף־סוף יצא מושלם!

כמה ניסיונות הייתם צריכים עד להצלחה הראשונה?
ברכותיי – הרגע ביצעתם ניסוי גיאומטרי בלי לדעת!

מהי התפלגות גיאומטרית?

ההתפלגות הגיאומטרית עוזרת לנו לענות על השאלה:

כמה ניסיונות ייקח עד ההצלחה הראשונה?”

זהו מודל שבו כל ניסיון עצמאי (אם לחם ראשון נשרף, השני לא בהכרח יישרף או לא יישרף), לכל אחד אותה הסתברות הצלחה (p),
ואנחנו סופרים לא כמה הצלחות היו, אלא באיזה ניסיון הצלחנו לראשונה.

לדוגמה:

  • כמה פעמים תצטרכו להרים בצק עד שהוא יתפח כמו שצריך?
  • כמה פעמים תנסו מתכון חדש עד שיצליח?
  • כמה פעמים תצטרכו לצפות בעוגה בתנור עד שתפסיקו לפתוח את הדלת מוקדם מדי? 😅

 רגע של הומור סטטיסטי

ההתפלגות הגיאומטרית היא כמו לאפות בלי ספר מתכונים:
אתם יודעים שבסוף זה יצליח – רק לא יודעים באיזה ניסיון.

או כמו שאומרים באקדמיה:

אין כישלונות – יש רק תצפיות עד להצלחה הראשונה.”

סיכום

ההתפלגות הגיאומטרית מלמדת אותנו על סבלנות סטטיסטית.
לפעמים צריך כמה ניסיונות עד שמגיעים לתוצאה הרצויה – וזה בסדר.
היופי במתמטיקה (ובבישול) הוא שגם אם לא תמיד מצליחים,
אפשר לחשב בדיוק כמה סיכוי יש שבפעם הבאה זה יעבוד.

אז בפעם הבאה שהלחם יוצא שטוח – אל תתייאשו.

זה לא כישלון, זו פשוט תצפית נוספת במדגם. 😄 

יום שני, 13 באוקטובר 2025

מבחן טיב התאמה – כשסטטיסטיקה בודקת אם המתכון באמת מצליח

תארו לכם שאתם אופים עוגיות בארבעה טעמים: שוקולד, וניל, בוטנים וריבה. אתם מצפים שכולם יאהבו את כל הטעמים באותה מידה – כלומר שכל אחד ייבחר בכ-25% מהמקרים. אבל האם זה באמת קורה במציאות?
כאן נכנס לתמונה מבחן טיב ההתאמה (Goodness of Fit Test) – מבחן סטטיסטי שבודק אם הנתונים שלכם תואמים את מה שחשבתם שיקרה.

 מה בודקים במבחן?

מבחן טיב ההתאמה עונה על השאלה:

האם ההתפלגות שראינו בפועל דומה להתפלגות הצפויה, או שהחיים (או הטועמים) הפתיעו אותנו?”

אנחנו משווים בין שכיחויות צפויות (מה שחשבנו שיקרה) לבין שכיחויות נצפות )מה שבאמת קרה.(
אם ההבדלים קטנים – יופי, המודל מתאים לנתונים שלנו.
אם ההבדלים גדולים – צריך לחשוב מחדש על ההנחות שלנו (או אולי פשוט להכין פחות עוגיות בטעם ריבה 😅).

 איך זה עובד בפועל (בלי להפחיד)

  1. קובעים השערת אפס (H₀): ההתפלגות בפועל תואמת את הצפויה (למשל – 25% לכל טעם).
  2. סופרים נתונים: כמה אנשים בחרו בכל טעם עוגייה.
  3. מחשבים סטטיסטי מבחן χ²: סכום הפערים בריבוע מחולק בתדירות הצפויה (כדי להעניש פערים גדולים יותר).
  4. משווים לערך קריטי: אם התוצאה גבוהה מדי → דוחים את H₀ ומבינים שהמציאות לא מתנהגת כמו שחזינו.

דוגמה מתוקה

נניח שחילקתם 100 עוגיות וקיבלתם את התוצאות הבאות:

  • שוקולד – 40
  • וניל – 30
  • בוטנים – 20
  • ריבה – 10

ציפיתם ל-25 מכל סוג. חישוב מהיר יראה שהפערים גדולים יחסית, במיוחד לטובת השוקולד. מבחן χ² יגיד לכם שהסיכוי לקבל פיזור כזה במקרה הוא נמוך – ולכן כנראה שהחברים שלכם באמת מעדיפים שוקולד, וזה לא סתם "רעש אקראי".

 הומור סטטיסטי קטן

אפשר לחשוב על מבחן טיב התאמה כמו שף שמסתכל על תבנית מאפים ואומר:

רגע, למה כל הקרואסונים מהצד הימני נעלמו? זה לא מה שהמתכון הבטיח!”

אם אתם מצפים לחלוקה שווה בין הטעמים אבל מוצאים תבנית ריקה בצד אחד – כנראה שההעדפות של האורחים לא אחידות.

סיכום

מבחן טיב ההתאמה הוא דרך פשוטה לבדוק אם מה שקורה במציאות תואם למה שציפינו שיקרה.
בין אם מדובר בעוגיות, בקלפי הגרלה, או בתוצאות סקר – המבחן עוזר לנו להחליט אם הנתונים "מתאימים" למודל שלנו או שמישהו שבר את הכללים.

בפעם הבאה שאתם מחלקים מנות במסיבה – תזכרו: אם כולם חוטפים רק את עוגיות השוקולד, אתם לא צריכים לנחש – אתם יכולים לבדוק את זה סטטיסטית. 

הטעות הסטטיסטית הכי יקרה שאתם עושים — ואתם אפילו לא יודעים

תארו לעצמכם שאתם מנהלים מסעדת שף. בסוף הערב, אתם עוברים על הצלחות שחזרו מהשולחנות למטבח כדי להבין מה הלקוחות אהבו. אתם רואים שהצלחות של הסטי...