יום שישי, 23 בינואר 2026

R² ברגרסיה: למה הוא מרשים, למה הוא מטעה — ומה Adjusted R² וחיזוי אמיתי באים לתקן

זה קורה כמעט בכל מצגת.

מישהו מראה רגרסיה,
מצביע על מספר ואומר בגאווה:

“R² = 0.91.”

והקהל?
מתרשם.
מהנהן.
לפעמים כבר משתכנע.

אבל רגע לפני שמגישים את העוגה
כדאי להבין מה באמת מסתתר מאחורי המספר הזה.

אז מה זה R², בפשטות?

 מודד:

איזה חלק מהשונות ב־Y
המודל מצליח להסביר
בעזרת המשתנים שבחרנו.

אם  R² = 0.8

80%  מהשונות בנתונים
מיוחסת למודל.

זה הכול.

לא:

  • אם המודל נכון
  • לא אם הוא סיבתי
  • ולא אם הוא ינבא טוב מחר

דוגמה מהמטבח

נניח שאנחנו מנסים להסביר:
ציון טעם של עוגה

בעזרת:

  • זמן בתנור
  • טמפרטורה

אםגבוה:

כנראה ששני המשתנים האלה
באמת מסבירים חלק גדול מההבדלים בטעם.

אבל
זה עדיין הסבר, לא חיזוי.

למהכל כך מרשים?

כי הוא:

  • מספר אחד
  • בין 0 ל־1
  • גדול = “נראה טוב

גבוה נותן תחושה ש:
️ “תפסנו את הסיפור
️ “המודל חזק
️ “אפשר לסמוך עליו

וכאן מתחילות הבעיות.

למהעלול להטעות?

 תמיד אוהב עוד משתנים

אם נוסיף עוד ועוד משתנים
 כמעט תמיד יעלה.

גם אם:

  • הם לא חשובים
  • הם מקריים
  • או שהם עובדים רק על המדגם הזה

העוגה גדלה  —
גם אם הוספנו רק קצפת.

כאן נכנס  Adjusted R²

Adjusted R² שואל שאלה חכמה יותר:

האם השיפור בהסבר
באמת מצדיק את המורכבות שהוספנו?

הוא:

  • מעניש” על משתנים מיותרים
  • יכול לרדת כשמודל מסתבך סתם
  • נותן תמונה יותר הוגנת

אם:

  •  עולה
  • אבלAdjusted R²  לא

זה סימן אזהרה 🚨

 גבוה ≠ חיזוי טוב

וזו אולי הטעות הכי נפוצה.

 מודד:

כמה טוב המודל מסביר
את הנתונים שכבר ראינו.

אבל חיזוי אמיתי שואל:

איך המודל יתנהג
על נתונים חדשים לגמרי?

אפשר:

  •  גבוה
  • וחיזוי גרוע

במיוחד אם:

  • יש  overfitting
  • המדגם קטן
  • או שהעולם השתנה

שוב המטבח

מודל עם R² = 0.95 אומר:

אני מסביר מצוין את העוגות שכבר אפינו.”

חיזוי טוב אומר:

אני יודע מה יקרה
בעוגה הבאה.”

וזו שאלה הרבה יותר קשה.

אז מה כן עושים?

לא זורקים את  .
פשוט לא סוגדים לו.

משתמשים בו:
יחד עם  Adjusted R² 
יחד עם בדיקת שאריות
יחד עם ולידציה / נתוני בדיקה
ועם היגיון תחומי

 הוא התחלה  —
לא פסק דין.

סיכום ביסי

 עונה על שאלה אחת בלבד:

כמה מהשונות
הצלחתי להסביר כאן ועכשיו?”

Adjusted R²  שואל:

האם לא הסתבכתי סתם?”

וחיזוי אמיתי שואל:

האם זה יעבוד גם מחר?”

ובסטטיסטיקה, כמו במטבח:

עוגה שמרשימה על השיש
לא תמיד יוצאת טוב בפעם הבאה  

אין תגובות:

הוסף רשומת תגובה

הטעות הסטטיסטית הכי יקרה שאתם עושים — ואתם אפילו לא יודעים

תארו לעצמכם שאתם מנהלים מסעדת שף. בסוף הערב, אתם עוברים על הצלחות שחזרו מהשולחנות למטבח כדי להבין מה הלקוחות אהבו. אתם רואים שהצלחות של הסטי...