ביסים של סטטיסטיקה: R² ברגרסיה: למה הוא מרשים, למה הוא מטעה

יום שישי, 23 בינואר 2026

R² ברגרסיה: למה הוא מרשים, למה הוא מטעה — ומה Adjusted R² וחיזוי אמיתי באים לתקן

זה קורה כמעט בכל מצגת.

מישהו מראה רגרסיה,
מצביע על מספר ואומר בגאווה:

“R² = 0.91.”

והקהל?
מתרשם.
מהנהן.
לפעמים כבר משתכנע.

אבל רגע לפני שמגישים את העוגה —
כדאי להבין מה באמת מסתתר מאחורי המספר הזה.

אז מה זה R², בפשטות?

R² מודד:

איזה חלק מהשונות ב־Y
המודל מצליח להסביר
בעזרת המשתנים שבחרנו.

אם R² = 0.8

80% מהשונות בנתונים
מיוחסת למודל.

זה הכול.

לא:

אם המודל נכון
לא אם הוא סיבתי
ולא אם הוא ינבא טוב מחר

דוגמה מהמטבח

נניח שאנחנו מנסים להסביר:
ציון טעם של עוגה

בעזרת:

זמן בתנור
טמפרטורה

אם R² גבוה:

כנראה ששני המשתנים האלה
באמת מסבירים חלק גדול מההבדלים בטעם.

אבל —
זה עדיין הסבר, לא חיזוי.

למה R² כל כך מרשים?

כי הוא:

מספר אחד
בין 0 ל־1
גדול = “נראה טוב”

R² גבוה נותן תחושה ש:
✔️ “תפסנו את הסיפור”
✔️ “המודל חזק”
✔️ “אפשר לסמוך עליו”

וכאן מתחילות הבעיות.

למה R² עלול להטעות?

R² תמיד אוהב עוד משתנים

אם נוסיף עוד ועוד משתנים —
R² כמעט תמיד יעלה.

גם אם:

הם לא חשובים
הם מקריים
או שהם עובדים רק על המדגם הזה

העוגה גדלה —
גם אם הוספנו רק קצפת.

כאן נכנס Adjusted R²

Adjusted R² שואל שאלה חכמה יותר:

האם השיפור בהסבר
באמת מצדיק את המורכבות שהוספנו?

הוא:

“מעניש” על משתנים מיותרים
יכול לרדת כשמודל מסתבך סתם
נותן תמונה יותר הוגנת

אם:

R² עולה
אבלAdjusted R² לא

זה סימן אזהרה 🚨

R² גבוה ≠ חיזוי טוב

וזו אולי הטעות הכי נפוצה.

R² מודד:

כמה טוב המודל מסביר
את הנתונים שכבר ראינו.

אבל חיזוי אמיתי שואל:

איך המודל יתנהג
על נתונים חדשים לגמרי?

אפשר:

R² גבוה
וחיזוי גרוע

במיוחד אם:

יש overfitting
המדגם קטן
או שהעולם השתנה

שוב המטבח

מודל עם R² = 0.95 אומר:

“אני מסביר מצוין את העוגות שכבר אפינו.”

חיזוי טוב אומר:

“אני יודע מה יקרה
בעוגה הבאה.”

וזו שאלה הרבה יותר קשה.

אז מה כן עושים?

לא זורקים את R².
פשוט לא סוגדים לו.

משתמשים בו:
✔️ יחד עם Adjusted R²
✔️ יחד עם בדיקת שאריות
✔️ יחד עם ולידציה / נתוני בדיקה
✔️ ועם היגיון תחומי

R² הוא התחלה —
לא פסק דין.

סיכום ביסי

R² עונה על שאלה אחת בלבד:

“כמה מהשונות
הצלחתי להסביר כאן ועכשיו?”

Adjusted R² שואל:

“האם לא הסתבכתי סתם?”

וחיזוי אמיתי שואל:

“האם זה יעבוד גם מחר?”

ובסטטיסטיקה, כמו במטבח:

עוגה שמרשימה על השיש
לא תמיד יוצאת טוב בפעם הבאה

ביסים של סטטיסטיקה

יום שישי, 23 בינואר 2026

R² ברגרסיה: למה הוא מרשים, למה הוא מטעה — ומה Adjusted R² וחיזוי אמיתי באים לתקן

אין תגובות:

הוסף רשומת תגובה

הפוסטים הפופולריים ביותר

לעקוב במייל