יום שני, 29 בספטמבר 2025

הסקה על מדגם אחד – מה אפשר ללמוד מכף אחת של מרק

נניח שאתם מבשלים סיר מרק ענק ורוצים לדעת אם יצא מספיק מתובל. אתם לא תטעמו את כל הסיר (כי אז לא יישאר מה לאכול…), אלא תיקחו כף אחת. השאלה היא:

האם הכף הזאת מייצגת את כל הסיר?”

זה בדיוק הרעיון של הסקה על מדגם אחד שימוש במדגם קטן כדי להסיק מסקנות על האוכלוסייה כולה.

 מה זה בעצם הסקה על מדגם אחד?

הסקה על מדגם אחד בודקת אם ממוצע, שיעור או פרמטר אחר באוכלוסייה שווה לערך מסוים.
לדוגמה:

  • אתם רוצים לבדוק אם ממוצע הציונים בכיתה באמת שווה ל-80.
  • או אם שיעור האוהבים של המתכון החדש שלכם הוא לפחות 70%.

אנחנו לוקחים מדגם קטן, מחשבים סטטיסטי (למשל ממוצע או שיעור הצלחה), ואז בודקים – האם מה שמצאנו רחוק מדי מהערך שציפינו לו, או שזה עדיין סביר?

 השלבים בגדול

  1. השערת אפס (H₀): מניחה שערך האוכלוסייה שווה לערך שבחרנו (למשל μ=80).
  2. השערת חלופית (H₁): מניחה שהערך שונה (או גדול/קטן ממנו).
  3. איסוף נתונים: בוחרים מדגם אקראי, כמו טעימה מכף מרק.
  4. סטטיסטי מבחן: מחשבים t-statistic או z-statistic (תלוי אם השונות ידועה).
  5. קבלת החלטה: אם הסטטיסטי קיצוני → דוחים את H₀ ואומרים שהמציאות שונה מהשערה.

 דוגמה מהמטבח

אתם רוצים לדעת אם לפחות 70% מהאורחים אוהבים את העוגיות החדשות שלכם.

  • חילקתם טעימות ל-30 אנשים → 24 אמרו “טעים!”
  • שיעור הצלחה במדגם = 24/30 = 0.8 (80%)
  • מבצעים מבחן השערות ובודקים אם 80% שונה באופן מובהק מ-70%.
    אם מתקבל p-value קטן מ-0.05 → אפשר להיות די בטוחים שהעוגיות באמת אהובות על רוב האנשים, ולא סתם נפלתם על קבוצה אוהבת מתוק.

הומור סטטיסטי קטן

הסקה על מדגם אחד זה כמו לטעום ביס אחד מהעוגה ולסמוך על זה שהיא כולה טעימה.
אבל אם לקחתם ביס מקצה שנשרף, יכול להיות שתגיעו למסקנה שגויה… לכן חשוב שהמדגם יהיה אקראי ולא רק “מה שקרוב לכף”.

סיכום

הסקה על מדגם אחד היא הבסיס של קבלת החלטות מבוססות נתונים.
היא מאפשרת לנו לבדוק אם הערכים שאנחנו מוצאים מתאימים למה שציפינו, או שמצאנו משהו חדש.

בפעם הבאה שאתם טועמים מרק, תדעו שאתם בעצם עושים ניסוי סטטיסטי קטן. ואם הוא מלוח מדי – אולי תבדקו עם עוד כף לפני שתחליטו על פסק הדין הסופי. 😉 

יום חמישי, 25 בספטמבר 2025

התפלגות פואסון – איך הסתברות מסבירה למה לפעמים מגיעים שני שליחים בו־זמנית

בואו נדבר רגע על אחת ההתפלגויות הכי מגניבות בהסתברותהתפלגות פואסון.
כן, זה נשמע כמו שם של מאפה צרפתי (“אשמח לפואסון עם קרם ברולה בצד”), אבל למעשה מדובר בכלי שמסביר הרבה מאוד תופעות יומיומיות.


אז מה זה בכלל פואסון?

התפלגות פואסון עונה על שאלה פשוטה:

מה הסיכוי שמספר מסוים של אירועים יתרחש בפרק זמן (או שטח) קבוע?”

אנחנו לא מתעסקים מתי בדיוק האירועים יתרחשו, אלא בכמה מהם נקבל.

דוגמאות מהחיים:

  •  כמה משלוחי פיצה יגיעו לשכונה בשעה.
  •  כמה מכוניות יעברו ברמזור בדקה.
  •  כמה שיחות יגיעו למוקד שירות בין 14:00 ל־15:00.
  •  כמה הודעות וואטסאפ תקבלו בזמן הרצאה משעממת במיוחד.

דוגמה טעימה במיוחד

נגיד שבממוצע מגיעים 4 משלוחי פיצה לשעה לשכונה שלכם.
פואסון מאפשר לחשב:

  • הסיכוי שלא יגיע אף שליח (מצב חירום )
  • הסיכוי שיגיעו בדיוק 3 משלוחים
  • והסיכוי שתהיה מתקפת פיצות ותשאלו את עצמכם אם השכונה הפכה לסטודיו של תוכנית בישול.

וזה הקסם – למרות שהאירועים מקריים, יש סדר מתמטי שיכול לנבא את התדירות שלהם.


למה זה מעניין אותנו?

כי אנחנו חיים בעולם מלא “אירועים מקריים” – תאונות, פניות למוקד, לייקים לפוסטים, אפילו כוכבים נופלים.
במקום לחשוב שזה כאוטי לחלוטין, פואסון נותן לנו מסגרת להבין:

  • מה סביר
  • מה נדיר
  • ומה “חריג סטטיסטית

לדוגמה: אם בממוצע מגיעות 4 פיצות לשעה, והגיעו 12 תוך חצי שעה – כנראה קרה משהו מיוחד (או שמישהו חגג יום הולדת עם מבצע 1+1).


קצת הומור סטטיסטי

בואו נודה בזה – אף אחד לא באמת מתרגש ממספרים על נייר.
אבל ברגע שמבינים שפואסון מסביר למה אתם תמיד נתקעים מאחורי שלושה אוטובוסים ברצף, או למה הרופא תמיד מזמן שני מטופלים בדיוק לאותה שעה – זה נהיה משעשע (וקצת פחות מעצבן).


סיכום

התפלגות פואסון היא דרך אלגנטית להבין את הכאוס שסביבנו.
היא לא תגיד לכם מתי בדיוק יגיע השליח הבא, אבל היא תסביר לכם למה לא צריך להילחץ כששניים מגיעים בבת אחת – זה פשוט טבע הדברים (וההסתברות).

אז בפעם הבאה שמישהו יתלונן על “מזל רע” או “יום עמוס במיוחד”, תגידו לו בחיוך:

חבר, זה לא מזל – זה פואסון.” 😉 

יום ראשון, 21 בספטמבר 2025

אמידה נקודתית – איך להמר נכון (בלי קזינו)


נניח שאתם רוצים לדעת מהו הגובה הממוצע של הסטודנטים בכיתה. אתם לא באמת הולכים למדוד את כולם (כי מי יש לו כוח?). אז אתם בוחרים 10 מתנדבים, מודדים אותם, מחשבים ממוצע ומכריזים:
זהו הגובה הממוצע של כלל הכיתה!”
מזל טוב – הרגע ביצעתם אמידה נקודתית.


מה זה בעצם אמידה נקודתית?

אמידה נקודתית היא סוג של "ניחוש חכם" לפרמטר באוכלוסייה.

  • אם יש לנו פרמטר כמו ממוצע אמיתי (התוחלת) , אנחנו לא יודעים אותו.
  • אז אנחנו לוקחים מדגם, מחשבים ממוצע, ואומרים: "כנראה שזה הממוצע של כולם".

זה כמו לטעום כף אחת מהמרק ולקבוע אם צריך מלח – סומכים על הכף שתייצג את כל הסיר.


דוגמה מתוקה מהמטבח

אתם רוצים לדעת כמה אנשים אוהבים את עוגיות השוקולד שלכם. לא תעברו דלת-דלת, נכון?
אז מחלקים טעימות ל-20 אנשים במשרד.

  • 15 אמרו “טעים!” → האומדן שלכם הוא 15/20=0.75.
  • אתם רציניים ומכריזים: "75% מהאנשים בעולם אוהבים את העוגיות שלי!"

האם זה נכון? אולי. אולי פשוט יצא שיום חמישי ומישהו הביא קפה טרי.


יתרונות וחסרונות

יתרון: פשוט, מהיר, ונותן תשובה – כמו להזמין פיצה.
חיסרון: עלול להטעות – אם טעמתם כף אחת מהמרק והיא הייתה מלוחה מדי כי תפסתם חתיכת גוש מלח, כל הסיר קיבל "תדמית" שגויה.

בגלל זה לפעמים כדאי לשלב עם אמידה מרווחית (רווח סמך) כי נחמד לדעת נקודה, אבל אפילו נחמד יותר לדעת שיש סיכוי של 95% שהאמת נמצאת בתחום שבחרנו.


מה עושה אומדן ל"טוב"

  • חסר הטיה: בממוצע הוא קולע בול.
  • יעיל: עם פחות שונות → פחות סיכוי שתקבלו תוצאה קיצונית כמו "כולם גמדים".
  • עקבי: ככל שמגדילים מדגם, האומדן מתקרב לאמת – כמו טועם יין שמשתפר עם כל כוס.

מוסר השכל

אמידה נקודתית היא אחלה התחלה – אבל כמו בכל מתכון טוב, צריך לדעת מתי להוסיף עוד תיבול (כמו אמידה מרווחית או מבחני השערות). בפעם הבאה שאתם עושים מדגם קטן, זכרו – זו רק טעימה מהמציאות, לא כל הסיפור.

    

יום שישי, 19 בספטמבר 2025

השערות סטטיסטיות – איך לדעת אם אתם צודקים (ולא סתם רעבים)

בואו נודה בזה – כולנו עושים השערות כל הזמן. "המסעדה החדשה בטוח טובה יותר", "הקפה בפינת הרחוב תמיד חזק מדי", "השנה הסטודנטים שלי יהיו יותר רציניים". הבעיה היא שבדרך כלל אנחנו בודקים את זה בשיטת "נראה לי" – שהיא נהדרת לדיוני סלון, אבל קצת פחות כשצריך החלטות רציניות. כאן נכנס לעזור לנו מבחן השערות סטטיסטיות.


מהי השערה סטטיסטית?

השערה היא כמו ניחוש מלומד, אבל עם כבוד: היא טענה על המציאות.

  • השערת האפס (H₀): "הכול רגיל, אין שינוי."
  • השערת המחקר (H₁): "משהו מעניין קורה פה."

חושבים על זה כמו על סדרת מתח: H₀ הוא החשוד הראשי – נשאיר אותו בכלא עד שהנתונים יוציאו אותו זכאי.


איך בודקים השערות – במטבח ובחיים

נגיד שאתם אופים שתי עוגות גבינה: אחת קלאסית ואחת עם טוויסט (למשל, תוספת ביסקוויטים). אתם אוספים דירוגים מעשרה טועמים.

  1. אוספים נתונים כן, זה השלב שבו אתם מכינים עוד עוגה (כיף).
  2. מחשבים סטטיסטי מבחן איזה מספר שמראה כמה גדול ההבדל באמת.
  3. קובעים רמת מובהקות כמה סיכוי לטעות מוכנים לספוג (נגיד 5%).
  4. מקבלים החלטה אם ההבדל מספיק גדול, מכריזים: "העוגה החדשה מנצחת!"

הטעויות שאפשר לעשות (וזה קורה לכולם)

  • טעות סוג ראשון: דוחים את H₀ סתם כך → חושבים שהעוגה טובה יותר למרות שכולם נימוסיים מדי כדי לומר שהיא בינונית.
  • טעות סוג שני: לא דוחים את H₀ → משאירים את העוגה החדשה במגירה למרות שהיא להיט אמיתי.

החכמה היא לבחור רמת מובהקות וגודל מדגם שמאזנים בין הסיכונים – כדי שלא תפספסו את ההזדמנות לעוגה טובה יותר, אבל גם לא תבזבזו זמן על מתכון גרוע.


מוסר השכל

בדיקת השערות היא בעצם מערכת סינון. היא מגנה עלינו מהסקת מסקנות פזיזות ומלמדת אותנו לחשוב פעמיים לפני שאנחנו מחליטים לשנות מתכון, תרופה או מדיניות ציבורית.


 

יום שלישי, 16 בספטמבר 2025

התפלגות נורמלית – הפעמון שמופיע בכל מקום

ההתפלגות הנורמלית, המכונה גם התפלגות גאוסית או “עקומת הפעמון”, היא אחת מההתפלגויות המרכזיות ביותר בסטטיסטיקה ובמדעי הנתונים. היא מופיעה בכל כך הרבה תחומים – מחינוך ורפואה ועד לאפייה במטבח. מה שמיוחד בה הוא הצורה – פעמון סימטרי – ומה שהיא מספרת לנו על איך נתונים מתפזרים סביב הממוצע.

 עוגיות במגש – רובן דומות, מעט קיצוניות

נניח שאתם אופים תבנית גדולה של עוגיות. למרות שהשתמשתם באותו מתכון, לא כל עוגייה זהה: חלק יצאו קצת יותר גדולות, חלק קטנות יותר.

  • רוב העוגיות קרובות מאוד לממוצע – הן דומות זו לזו.
  • מעט עוגיות גדולות במיוחד או קטנות במיוחד – הן “הזנבות” של הפעמון.

אם נשקול את כולן ונסרטט גרף, נגלה שההתפלגות נראית כמו עקומת פעמון – זה בדיוק היופי של ההתפלגות הנורמלית: רוב הערכים קרובים לאמצע, ומעטים מתרחקים.

 טמפרטורת הקפה – יציבות עם שונות טבעית

דוגמה אחרת היא טמפרטורת הקפה. נניח שאתם מכינים 50 כוסות קפה עם אותה מכונה. רוב הכוסות יצאו בטווח די צפוי, למשל סביב 92 מעלות צלזיוס. אבל חלק יהיו חמות יותר (94°) וחלק קרות יותר (90°).
אם נשרטט גרף של כל המדידות, נקבל צורת פעמון יפה – רוב המדידות קרובות למרכז, ומעטות קיצוניות יותר.

 זמני משלוחי פיצה – ככה זה בחיים עצמם

גם בחיים האמיתיים אנחנו רואים דפוס נורמלי.
אם תמדדו זמני משלוח של 100 פיצות, תגלו שתמיד יש ממוצע מסוים (למשל 35 דקות), רוב המשלוחים מתרכזים סביבו, ומעטים קצרים או ארוכים במיוחד.

ההתפלגות הנורמלית בעצם מתארת מצב שבו “הרגיל” נפוץ מאוד, והחריגים נדירים.

מאפיינים חשובים של ההתפלגות הנורמלית

  1. סימטריה הגרף סימטרי סביב הממוצע.
  2. הממוצע, החציון והשכיח שווים כולם נמצאים באותו מקום באמצע הפעמון.
  3. חוק שלושת הסיגמאות בערך:
    •  68% מהערכים נמצאים בטווח סטיית תקן אחת מהממוצע.
    •  95% מהערכים נמצאים בתוך שתי סטיות תקן.
    •  99.7% מהערכים נמצאים בתוך שלוש סטיות תקן.

החוק הזה מאפשר לנו לחזות במדויק עד כמה ערכים קיצוניים הם נדירים.

 למה זה חשוב לנו?

  • במחקר הרבה בדיקות סטטיסטיות מבוססות על ההנחה שהנתונים מתפלגים נורמלית.
  • במטבח התפלגות נורמלית מסבירה למה רוב הבצקים מצליחים דומה, גם אם לא זהים.
  • ביום-יום היא עוזרת לנו להבין תופעות חברתיות, בריאותיות וכלכליות: גובה של אנשים, ציוני מבחנים, טעויות במדידות – כולם לרוב מתפלגים נורמלית.

לסיכום

ההתפלגות הנורמלית היא “חוק טבע” של העולם הסטטיסטי. היא מלמדת אותנו שגם אם יש שונות בין תצפיות, יש דפוס כללי שחוזר על עצמו: רוב הדברים מתרכזים סביב הממוצע, ומעטים נמצאים בקצוות.

בפעם הבאה שתסתכלו על מגש עוגיות, כוסות קפה, או זמני משלוחי פיצה – זכרו שאתם בעצם רואים עקומת פעמון בפעולה. 

הטעות הסטטיסטית הכי יקרה שאתם עושים — ואתם אפילו לא יודעים

תארו לעצמכם שאתם מנהלים מסעדת שף. בסוף הערב, אתם עוברים על הצלחות שחזרו מהשולחנות למטבח כדי להבין מה הלקוחות אהבו. אתם רואים שהצלחות של הסטי...