회귀분석에서 독립변수는 Exogenous/non-stochastic 해야 함에도, 다음의 3가지 경우 내생성(Endogeneity) 문제가 발생한다:
1. Omitted Variables(제외된 독립변수)
예) X=출석률, y=성적; 이 때 Z=Motivation은 X, y와 동시에 영향을 줌
2. Strategic Behavior(전략적 행동)
예) x=가격, y=수요량; 높은 수요가 예상될 때 높은 가격 책정
3. Measurement Errors(추정 오차)
예) x=지능, y=연봉; 실제 지능 대신 IQ를 대신할 경우
이렇게 내생성이 문제가 될 경우, 독립변수 X는 ε와 상관관계가 있게 되고, 또 다른 변수가 X, y와 영향을 주고 있으며, OLS estimator β는 inconsistent한 estimator가 된다. 이를 해결하기 위해선 Instrument Z를 잘 선정하여 2 Stage Least Square (2 SLS) Estimation을 해야 한다.