학교공부/범주형

로지스틱회귀분석

싱싱한복초이 2024. 4. 18. 18:45

https://heytech.tistory.com/123

 

[통계] 로지스틱 회귀분석(Logistic Regression)의 이해

📚 목차 1. 로지스틱 회귀분석 정의 2. 로지스틱 회귀분석의 등장 배경 3. Odds(오즈 또는 승산) 및 Odds Ratio (오즈비 또는 승산비) 3.1. Odds(오즈 또는 승산) 3.2. Odds Ratio (오즈비 또는 승산비) 4. 연결

heytech.tistory.com

1. 왜 logπ1π로 변화시켜주는가?


p(X)[0,1]의 범위를 가지기 때문에 ln{p(x)}의 x축의 범위인 [0,]를 커버할 수 가 없음.


이를 보완하고자 p(X)π1π로 치환하여

logit=lnπ(x)1π(x)=β0+β1X1+...+βkXk+ϵ
이 모형을 사용

 

2. log 오즈비와 같은 형태
xi가 1 증가할 때 특정 이벤트가 발생하지 않을 확률 대비 이벤트가 발생할 확률의 상대적인 비율(오즈비)는 exp(βi)라고 할 수 있다.

 

3. "연결함수(Link Function)이란 범주형 목표변수 수준의 확률을 연속형 척도로 변환하는 함수로, 목표변수와 설명변수의 관계를 선형 회귀분석을 활용해 모델링하는 함수를 의미한다. 대표적인 연결함수로는 logit이 있다."

 

- 범주형 로지스틱 회귀모델: 목표변수의 범주가 3개 이상인 경우 로지스틱 회귀모델로 이항 로지스틱 모델의 확장
- 순서형 로지스틱 회귀모델: 목표변수가 순서를 가질 때 사용하는 로지스틱 회귀모델로, 정규분포의 누적분포 함수(PDF)인 프로빗 연결함수 사용