ביסים של סטטיסטיקה

ברוכים הבאים לבלוג, סטטיסטיקה היא כמו בישול – שילוב נכון של מרכיבים מוביל לתוצאה טובה. בבלוג הזה נגלה איך מדגם הוא כמו טעימה, הסתברות כמו תיבול וניתוח נתונים כמו זמן אפייה מדויק. המטרה: להראות שסטטיסטיקה לא חייבת להיות יבשה, אלא יכולה להיות פשוטה, מהנה ואפילו טעימה. סטטיסטיקה פשוטה, טעימה ושימושית — לחוקרים, סטודנטים ואנשים שרוצים להבין נתונים בלי להיבהל.

יום חמישי, 25 בדצמבר 2025

P-Value: למה זה לא מה שכולם חושבים שזה

דמיינו שאתם מבשלים מרק.
טעמתם.
לא רע… אבל משהו מוזר.

ואז מישהו שואל את השאלה הקטלנית:

“זה באמת יצא שונה…
או שאתה רק מדמיין?”

ברגע הזה נכנס למטבח אורח קבוע מהסטטיסטיקה:
ה־P-Value (מובהקות התוצאה בעברית)

אז מה זה בעצם ?P-Value

P-Value הוא לא:

ההסתברות שההשערה שלך נכונה ❌
מדד לכמה התוצאה “חשובה” ❌
חותמת “אמת מדעית” ❌

P-Value הוא כן:

ההסתברות לקבל תוצאה כמו שראינו (או קיצונית יותר),
בהנחה שאין שום אפקט אמיתי.

במטבח:

מה הסיכוי שטעם כזה מוזר היה קורה
אם באמת לא שינינו כלום במתכון?

ניסוי המרק (גרסה סטטיסטית)

נניח:

השערת האפס: הוספת מלח לא משנה את הטעם
אתם מוסיפים מלח
הטועמים אומרים: “וואו, זה שונה!”

עכשיו שואל ה-P-Value

אם באמת מלח לא משנה כלום,
מה הסיכוי שהיינו שומעים תגובה כזו?

אם הסיכוי קטן מאוד →
מתחילים לחשוד שהמלח כן עשה משהו.

הקסם של 0.05 (ולמה הוא קצת בעייתי)

אם
P < 0.05
כולם נרגעים:
✔️ “מובהק!”
✔️ “אפשר לפרסם!”
✔️ “תביאו עוגה!”

אבל שימו לב:

0 049 ≠ אמת מוחלטת
0 051 ≠ שטויות

זו לא חומת ברלין.
זה יותר כמו קו דק במתכון:
“בערך כפית”.

טעויות נפוצות (מאוד)

❌ “P-Value קטן אומר שהאפקט חזק”
❌ “אם אין מובהקות – אין אפקט”
❌ “עוד קצת נתונים ונגיע ל-0.05” (אל תעשו את זה בבית!)

P-Value לא אומר:

כמה האפקט גדול
כמה הוא חשוב
אם זה יעבוד מחר

הוא רק אומר:

“זה לא נראה מקרי לגמרי.”

אז איך משתמשים בו נכון?

✔️ ביחד עם גודל אפקט
✔️ עם היגיון וידע תחומי
✔️ בלי פולחן דתי סביב 0.05

או כמו במטבח:

גם אם המרק “מובהק”
עדיין צריך לטעום.

סיכום ביסי

P-Value הוא לא שופט.
ואפילו לא שף ראשי.

הוא רק הטועם שאומר:

“אם באמת לא עשית כלום –
זה היה קורה כל כך מוזר?”

ואת ההחלטה הסופית?

.כמו תמיד, משאירים לשכל הישר

יום חמישי, 18 בדצמבר 2025

Skewness – ההטיה של ההתפלגות

דמיינו תבנית עוגה.
הכנסתם את אותו בלילה בדיוק, אותו זמן בתנור –
אבל כשמוציאים, מגלים שרוב העוגות יצאו בגודל דומה,
ועוגה אחת… ענקית.

העוגה החריגה הזו לא משנה את המתכון,
אבל היא כן משנה את צורת ההתפלגות.
כאן בדיוק נכנסת לתמונה Skewness – הטיה.

אז מה זה בעצם Skewness?

Skewness מודדת עד כמה ההתפלגות סימטרית –
או במילים פשוטות:
לאיזה צד “נמרח הזנב” של הנתונים.

אם ההתפלגות סימטרית – אין הטיה
אם הזנב ארוך ימינה – הטיה חיובית
אם הזנב ארוך שמאלה – הטיה שלילית

הזנב הוא לא המקום שבו “רוב הנתונים”,
אלא המקום שבו נמצאות ההפתעות.

הטיה חיובית (Right Skewed)

רוב הערכים קטנים,
אבל יש כמה ערכים גדולים במיוחד שמושכים את הזנב ימינה.

דוגמה מהמטבח:
רוב העוגיות שוקלות 20–22 גרם,
אבל שתיים יצאו 40 גרם. תוצאה מעניינת:
הממוצע > החציון

כי העוגיות הכבדות “דוחפות” את הממוצע למעלה.

דוגמאות מהחיים:

משכורות
זמני המתנה
מחירי דירות

הטיה שלילית (Left Skewed)

רוב הערכים גבוהים,
אבל יש כמה ערכים קטנים מאוד שמושכים שמאלה.

דוגמה:
מאפינס שנאפו מצוין,
אבל אחד נשרף ונשקל הרבה פחות.

כאן קורה ההפך:
הממוצע < החציון

למה Skewness חשובה?

כי מספר אחד לא מספר את כל הסיפור.

שני עסקים יכולים להציג אותו ממוצע הכנסות,
אבל:

אחד יציב וסימטרי
והשני עם הרבה “נפילות” ומעט הצלחות גדולות

בלי להבין את ההטיה,אנחנו עלולים לטעות בפרשנות, בהחלטות, ובאסטרטגיה.

ביס זהירות

ממוצע לבד יכול להטעות
בהתפלגות מוטה, החציון לעיתים מספר את הסיפור האמיתי
תמיד כדאי “להציץ בהיסטוגרמה” לפני שמסיקים מסקנות

השורה התחתונה

Skewness היא כמו טעימה קטנה לפני ההגשה:
היא לא אומרת כמה יש, אלא איך זה מתחלק.

ובסטטיסטיקה,
כמו בבישאל, הצורה חשובה לא פחות מהכמות.

יום חמישי, 11 בדצמבר 2025

הגרף ששינה את עולם הרפואה

או: איך אחות אחת הצילה אלפי חיילים בזכות דיאגרמה חכמה

רוב האנשים מכירים את פלורנס נייטינגייל כ"אמא" של הסיעוד המודרני.
אבל הרבה פחות יודעים שהיא הייתה גם סטטיסטיקאית מבריקה,
והיא אחראית לאחד הרגעים ההיסטוריים שבהם גרף אחד שינה מדיניות של מדינה שלמה.

כן, לא מאמר, לא ניסוי ענק, לא צעקה ציבורית.
גרף.

הבעיה: יותר חיילים מתו מהזיהומים מאשר מהקרב

במהלך מלחמת קרים (1853–1856), נייטינגייל נשלחה לנהל את בתי החולים של החיילים הבריטים.
כשנכנסה לשטח, היא נחרדה לגלות:

תנאים סניטריים ירודים
חדרים צפופים
מים מזוהמים
תמותה עצומה שלא קשורה בכלל לפציעות קרב

למעשה, רוב החיילים לא מתו מהקרבות,
אלא ממחלות שנגרמו מהתנאים בבתי החולים.

נייטינגייל הבינה שמשהו חייב להשתנות.
אבל איך משכנעים ממשלה ואנשי צבא קשוחים להאמין לכך?

הפתרון: דיאגרמת “ורד” גאונית

נייטינגייל ידעה שאם תראה מספרים בלבד, אף אחד לא יקרא.
אז היא בנתה גרף חדשני:
Rose Diagram מעין “גרף עוגה” שמחולק למקטעים,
כאשר כל מקטע מייצג חודש, וגודל המקטע מראה את מספר מקרי המוות.

אבל היה פה טריק:
היא צבעה את המקטעים כך שברור מיד:

כחול = מוות מזיהומים
אדום = מוות מפציעות
שחור = סיבות אחרות

התוצאה הייתה מכה חזותית:
רואים במבט אחד שזיהומים הורגים פי כמה מאשר אויבים.

הדיאגרמה הייתה ברורה, חדה ובלתי ניתנת להתנגדות.
זו הייתה תקשורת סטטיסטית מושלמת.

ומה קרה בעקבות זה?

הגרף של נייטינגייל הוצג בפני הממשלה הבריטית.
לראשונה בהיסטוריה, מקבלי החלטות ראו בצורה ברורה:

האויב האמיתי הוא לא הצבא הרוסי, אלא הזיהומים.

בעקבות הגרף:

שופרו מתקני האחסון והרחצה
הוגדרו תקנים לחיטוי
הוכנסו מערכות ניקוז
התמותה ירדה בצורה דרמטית

זה היה אחד הרגעים הראשונים בהיסטוריה שבהם סטטיסטיקה הכתיבה מדיניות בריאותית.

דוגמה קולינרית — בסגנון הבלוג שלך

תאר לעצמך שאתה מנהל מטבח גדול.
יש תלונות שהעוגות נשרפות.

אתה מנסה להבין למה:
המתכון? התנור? הטבחים?

אם תציג טבלה ארוכה, אולי יתעלמו ממנה.
אבל אם תיצור גרף עוגה שמראה שה־80% מהעוגות שנשרפו היו בתנור מס’ 3 ,
במבט אחד כולם יבינו:
הבעיה היא לא המתכון, אלא התנור.

זה בדיוק מה שעשתה נייטינגייל, רק שבמקום עוגות, מדובר היה בחיי אדם.

ביס מסכם

האירוע ההיסטורי שבו פלורנס נייטינגייל יצרה דיאגרמה ששינתה את מערכת הבריאות הבריטית,
מראה כוח עצום:
לא רק לאסוף נתונים, אלא להציג אותם בצורה שמספרת סיפור שאי אפשר להתעלם ממנו.

סטטיסטיקה טובה לא רק מגלה אמת, היא גורמת לאנשים לפעול.

יום שבת, 6 בדצמבר 2025

סטטיסטיקה תיאורית: המתכון הסודי לנתונים

ברוכים הבאים לעוד "ביס" של סטטיסטיקה! היום נכין מנה מיוחדת במטבח הסטטיסטי: סטטיסטיקה תיאורית. כמו שילוב תבלינים מוצלח, סטטיסטיקה תיאורית עוזרת לנו לארגן ולסכם כמות גדולה של נתונים גולמיים לכמה נתוני מפתח שקל לטעום ולהבין. במקום ללעוס אלפי מספרים, נקבל תקציר תמציתי וטעים של הנתונים.

סטטיסטיקה תיאורית היא שיטת הסיכום של עולם הנתונים: היא לוקחת כמות גדולה של מספרים ומזקקת אותם לכמה מדדים פשוטים. תחשבו על שף שבסוף היום מדווח כמה מנות הוכנו, מה גודל המנה הממוצעת, איזה תבלין שלט, והאם הייתה מנה חריגה במיוחד. כך אפשר להבין מהר את התמונה הכללית בלי לטעום כל מנה ומנה.

בסטטיסטיקה תיאורית יש כמה מדדים מרכזיים שכדאי להכיר. נכיר אותם בעזרת דימויים מהמטבח:

המדדים המרכזיים: ממוצע, חציון, שכיח

ממוצע (Average) – חשבו על הממוצע כעל "השף המאזן". זה הערך שהיינו מקבלים אילו חילקנו את כל הכמויות שווה בשווה בין כולם. דמיינו שלכל עוגייה שהכנתם יש מספר אחר של שוקולד צ'יפס; אם תאספו את כל השוקולדים מכל העוגיות ותפזרו בחזרה באופן שווה, כמות הצ'יפס בכל עוגייה תהיה הממוצע. כך הממוצע נותן מושג על ה"טעם הכללי" של הנתונים.
חציון (Median) – החציון הוא ה"מנה האמצעית". זה הערך שנמצא בדיוק באמצע כשרושמים את הנתונים מהקטן לגדול. למשל, אם סידרתם 7 עוגיות לפי משקלן, העוגייה הרביעית (האמצעית) היא החציון. היתרון בחציון: ערך קיצוני במיוחד (נגיד עוגה ענקית בין כמה קטנות) אמנם יקפיץ את הממוצע, אבל לא ישנה את החציון – הוא יישאר באמצע בלי קשר לגודל החריג.
שכיח (Mode) – השכיח הוא ה"טעם הנפוץ ביותר" בנתונים, כלומר הערך שמופיע הכי הרבה פעמים. למשל, אם אפיתם 8 עוגיות: ל-4 מהן הכנסתם 8 שוקולדים, ל-3 מהן 10 שוקולדים, ולאחת הרפתקנית 12 – הכמות השכיחה של צ'יפס לעוגייה היא 8 (כי 8 הופיע במירב העוגיות).

מדדי פיזור: שונות וסטיית תקן

שונות (Variance) – שונות מודדת כמה הנתונים מפוזרים סביב הממוצע, כלומר את מידת הגיוון. אם כל העוגיות יצאו די דומות, השונות נמוכה – המטבח שמר על אחידות. אבל אם עוגייה אחת יצאה ענקית ואחרת זעירה, יש הרבה "שונות" בקולקציית העוגיות. שונות גבוהה פירושה שהמנות (הנתונים) יצאו מאוד מגוונות (פעם מלוח מדי, פעם מתוק מדי), ושונות אפס אומרת שכל המנות יצאו זהות לגמרי (נדיר מאוד במציאות).
סטיית תקן (Standard Deviation) – סטיית התקן אומרת לנו באופן טיפוסי בכמה ערך חורג מהממוצע, והיא נמדדת באותן יחידות כמו הנתון עצמו. במילים פשוטות, אפשר לחשוב עליה כמדד של עד כמה העוגיות שונות בגודלן: אם סטיית התקן קטנה – כמעט כל העוגיות דומות (המתכון עקבי); אם היא גדולה – חלק מהעוגיות יצאו ענקיות וחלק פצפוניות. סטיית התקן מספרת לנו כמה הפתעות אפשר לצפות בכל נגיסה, ביחס לטעם הממוצע.

לסיכום, סטטיסטיקה תיאורית הופכת הר של מספרים לכמה ביסים קלים לעיכול. הממוצע, החציון והשכיח מציגים את הערך המרכזי או הנפוץ, בעוד השונות וסטיית התקן מגלות עד כמה הנתונים מגוונים. כך הנתונים הגולמיים הופכים ל"מתכון" ברור: כמה מתוק, כמה חריף, ומה המרקם הכללי. בפעם הבאה שתסתכלו על טבלת מספרים, זכרו שבין השורות מסתתר שף סטטיסטי קטן שמסכם לכם את הארוחה. בתיאבון!

כדי להגיע לרמת הדיוק הזו במטבח הביתי, הציוד הוא חלק בלתי נפרד מהתהליך. למי שרוצה להצטייד, מצורף הקישור. רכישה דרך הקישור הזה היא דרך נהדרת לתמוך בהמשך הפעילות של "ביסים של סטטיסטיקה" ולעזור לבלוג לצמוח, ללא עלות נוספת עבורכם.

לצפייה במוצר באמזון

*כחלק מתוכנית השותפים של אמזון, אני עשוי להרוויח עמלה על רכישות מתאימות.