💡 학습 팁: 조금 더 쉽고 재미있게 공부하고 싶으신가요? 이 페이지는 중학생도 이해할 수 있는 친절한 ‘쉬운 해설판’입니다! 원문을 나란히 읽고 싶으시다면 📖 직역본 보기 메뉴를 활용하세요!

3.1 Simple Linear Regression

3.1 단순 선형 회귀 (단일 재료(X)로 매상(Y) 예측하기)

Simple linear regression lives up to its name: it is a very straightforward approach for predicting a quantitative response $Y$ on the basis of a single predictor variable $X$. It assumes that there is approximately a linear relationship between $X$ and $Y$. Mathematically, we can write this linear relationship as 머신러닝과 통계적 학습의 세계에서 가장 처음 꺼내 드는 기본 무기인 _단순 선형 회귀(Simple linear regression)_는 그 담백한 이름값을 톡톡히 해냅니다. 왜냐하면 오직 단 1개의 힌트(원인 변수 $X$)만 쥐고서 수치로 된 결과(응답 $Y$)를 때려 맞춰보는 아주 직관적이고 1차원적인 훈련법이기 때문입니다. 이 기법은 세상만사가 $X$ 와 $Y$ 사이에 대충 자를 댄 듯한 정직한 비례(선형) 관계를 이룬다고 순진하게 믿고 시작합니다. 배운 사람답게 이것을 수학 공식으로 세련되게 풀면 다음과 같이 일직선의 방정식으로 적힙니다.

\[Y \approx \beta_0 + \beta_1 X \quad (3.1)\]

You might read “$\approx$” as “is approximately modeled as”. We will sometimes describe (3.1) by saying that we are regressing $Y$ on $X$ (or $Y$ onto $X$). 공식 중간에 낀 구불구불한 물결 기호 “$\approx$” 는 ”~ 모양으로 대충 얼버무려 근사 모델링된다” 라는 뉘앙스로 읽어주시면 됩니다. 또한 통계학자들의 허세 가득한 은어로는 식 (3.1) 이 하는 짓을 가리켜 ‘$Y$ 변수를 $X$ 변수 위로 엎어버려 회귀시킨다(regressing $Y$ on $X$)’ 라고 멋들여지게 부르기도 합니다.

For example, $X$ may represent TV advertising and $Y$ may represent sales. Then we can regress sales onto TV by fitting the model 쉬운 예시를 들어보죠. 우리가 사장님이라 치고, 힌트 변수 $X$ 가 ‘올해 들이부은 TV 광고비’를 뜻하고 결과물 $Y$ 가 ‘이번 달 팔려나간 매상 sales‘를 가리킨다고 가정해봅시다. 그렇다면 우리는 다음과 같은 모델 공식을 끼워 맞추어 보면서 sales(매출)가 TV(광고) 덕분에 어떻게 오르내리는지(회귀하는지) 패턴을 그려볼 수 있게 됩니다.

\[\text{sales} \approx \beta_0 + \beta_1 \times \text{TV} \quad (3.2)\]

In Equation 3.1, $\beta_0$ and $\beta_1$ are two unknown constants that represent the intercept and slope terms in the linear model. Together, $\beta_0$ and $\beta_1$ are known as the model coefficients or parameters. Once we have used our training data to produce estimates $\hat{\beta}0$ and $\hat{\beta}_1$ for the model coefficients, we can predict future sales on the basis of a particular value of TV advertising by computing 위 방정식들(3.1, 3.2) 안에서 알짱거리는 $\beta_0$ 와 $\beta_1$ 이란 녀석들은, 우리가 감히 죽었다 깨어나도 완벽히 알 길이 없는 우주의 진리 숫자들입니다. 하나(_절편)는 티비 광고가 0원일 때도 팔리는 기본 바닥 매출 수치를 나타태고, 다른 하나(기울기)는 돈을 태울 때마다 매출이 치솟는 각도를 나타내죠. 이 두 녀석을 묶어서 멋진 말로 모델 무기의 계수(coefficients) 또는 파라미터(parameters) 라고 칭합니다. 만약 우리가 과거의 장부 기록(훈련 데이터)을 요리조리 분석해서 저 신의 숫자들과 얼추 비슷할 것 같은 가짜 인간용 추정치인 $\hat{\beta}_0$ 여분의 타진 값과 $\hat{\beta}_1$를 기어이 구출해 냈다고 칩시다. 그렇다면 우리는 이 숫자를 공식에 박아 넣어 향후 회장님이 “TV에 이만큼 돈 쓸 건데 매출 얼마 나올까?” 물어보실 때 다음과 같은 계산을 돌려 바로 대답할 수 있게 됩니다.

\[\hat{y} = \hat{\beta}_0 + \hat{\beta}_1 x \quad (3.3)\]

where $\hat{y}$ indicates a prediction of $Y$ on the basis of $X = x$. Here we use a hat symbol, $\hat{ }$, to denote the estimated value for an unknown parameter or coefficient, or to denote the predicted value of the response. 여기 수식 3.3 통에 나온 $\hat{y}$ 은 당신이 $X$ 값에 임의의 원인 $x$를 쑤셔 넣었을 때 툭 튀어나오리라 기대되는 $Y$ 의 가짜 예측치 점수를 상징합니다. 통계 동네의 국룰 암호가 하나 있는데요, 어떤 무서운 수학 기호 위에 꼬깔모자 모양의 햇(hat) 기호, 즉 $\hat{ }$ 모양이 씌워져 있다면 쫄지 마세요. 이건 “신의 계시로 얻은 진짜 절대 진리 값이 아니라, 우리가 불완전한 점들을 모아 나름대로 최대한 기를 써서 어림잡아 예측해 본 가짜 추정치 기록물입니다!” 라고 자백 표시를 남겨두는 귀여운 표식 기호일 뿐이니까요.

Sub-Chapters (하위 목차)

3.1.1 Estimating the Coefficients (계수 추정)

📖 쉬운 해설판으로 이동하기

장부에 적힌 200개의 진짜 데이터를 보고, 가장 오차가 적은 최적의 붕어빵 예측 선을 긋기 위해 $\beta_0$와 $\beta_1$ 값을 추측해 내는 ‘최소 제곱법’이라는 마법 파훼법을 배웁니다.

3.1.2 Assessing the Accuracy of the Coefficient Estimates (계수 추정치의 정확도 평가)

📖 쉬운 해설판으로 이동하기

우리가 열심히 선을 긋긴 그었는데, 이 가짜 선이 진짜 우주의 법칙과 얼마나 일치하거나 오차가 날지(표준 오차, 신뢰 구간) 평가해 보고 확률 법정에서 승소해 봅니다.

3.1.3 Assessing the Accuracy of the Model (모델의 정확도 평가)

📖 쉬운 해설판으로 이동하기

그래서 최종적으로 우리 식당의 임시 매상 예측기가 만약에 성적표를 받는다면? $R^2$(설명력 점수)라는 잔인한 채점표를 통해 우리 모델의 우수성을 채점해 봅니다.

< 3. Linear Regression

3.1.1 Estimating the Coefficients >

서브목차