זה קורה כמעט בכל מצגת.
מישהו מראה רגרסיה,
מצביע על מספר ואומר בגאווה:
“R² = 0.91.”
והקהל?
מתרשם.
מהנהן.
לפעמים כבר משתכנע.
אבל רגע לפני שמגישים את העוגה —
כדאי להבין מה באמת מסתתר מאחורי
המספר הזה.
אז מה זה R², בפשטות?
R² מודד:
איזה חלק מהשונות ב־Y
המודל מצליח להסביר
בעזרת המשתנים שבחרנו.
אם
R² = 0.8
80% מהשונות בנתונים
מיוחסת למודל.
זה הכול.
לא:
- אם
המודל נכון
- לא
אם הוא סיבתי
- ולא
אם הוא ינבא טוב מחר
דוגמה מהמטבח
נניח שאנחנו מנסים להסביר:
ציון טעם של עוגה
בעזרת:
- זמן
בתנור
- טמפרטורה
אם R² גבוה:
כנראה ששני המשתנים האלה
באמת מסבירים חלק גדול מההבדלים בטעם.
אבל —
זה עדיין הסבר, לא חיזוי.
למה R² כל כך מרשים?
כי הוא:
- מספר
אחד
- בין
0 ל־1
- גדול
= “נראה טוב”
R² גבוה
נותן תחושה ש:
✔️ “תפסנו את הסיפור”
✔️ “המודל חזק”
✔️ “אפשר לסמוך עליו”
וכאן מתחילות הבעיות.
למה R² עלול להטעות?
R² תמיד אוהב עוד משתנים
אם נוסיף עוד ועוד משתנים —
R² כמעט
תמיד יעלה.
גם אם:
- הם
לא חשובים
- הם
מקריים
- או
שהם עובדים רק על המדגם הזה
העוגה גדלה —
גם אם הוספנו רק קצפת.
כאן נכנס
Adjusted R²
Adjusted R² שואל שאלה חכמה יותר:
האם השיפור בהסבר
באמת מצדיק את המורכבות שהוספנו?
הוא:
- “מעניש” על משתנים מיותרים
- יכול
לרדת כשמודל מסתבך סתם
- נותן
תמונה יותר הוגנת
אם:
- R² עולה
- אבלAdjusted R² לא
זה סימן אזהרה
🚨
R² גבוה ≠ חיזוי טוב
וזו אולי הטעות הכי נפוצה.
R² מודד:
כמה טוב המודל מסביר
את הנתונים שכבר ראינו.
אבל חיזוי אמיתי שואל:
איך המודל יתנהג
על נתונים חדשים לגמרי?
אפשר:
- R² גבוה
- וחיזוי
גרוע
במיוחד אם:
- יש overfitting
- המדגם
קטן
- או
שהעולם השתנה
שוב המטבח
מודל עם R² =
0.95 אומר:
“אני
מסביר מצוין את העוגות שכבר אפינו.”
חיזוי טוב אומר:
“אני יודע
מה יקרה
בעוגה הבאה.”
וזו שאלה הרבה יותר קשה.
אז מה כן עושים?
לא זורקים את
R².
פשוט לא סוגדים לו.
משתמשים בו:
✔️ יחד עם
Adjusted R²
✔️ יחד עם בדיקת שאריות
✔️ יחד עם ולידציה / נתוני בדיקה
✔️ ועם היגיון תחומי
R² הוא התחלה —
לא פסק דין.
סיכום ביסי
R² עונה על שאלה אחת בלבד:
“כמה
מהשונות
הצלחתי להסביר כאן ועכשיו?”
Adjusted R² שואל:
“האם לא
הסתבכתי סתם?”
וחיזוי אמיתי שואל:
“האם זה
יעבוד גם מחר?”
ובסטטיסטיקה, כמו במטבח:
עוגה
שמרשימה על השיש
לא תמיד יוצאת טוב בפעם הבאה

אין תגובות:
הוסף רשומת תגובה