본문 바로가기
DS & AI/통계

[용어기초] 모수적 방법, 비모수적 방법

by 뒹굴거리는프로도 2023. 7. 20.
반응형

 

모수적(statistical parametric)과 비모수적(non-parametric)은 통계학에서 사용되는 두 가지 주요한 접근 방식이다.
모수적 방법은 특정한 가정을 기반으로 하기 때문에 가정이 잘 맞지 않을 경우 결과가 왜곡될 수 있는 단점이 있다. 반면에 비모수적 방법은 분포에 대한 가정이 없기 때문에 보다 유연하게 데이터를 분석할 수 있지만, 데이터의 양이 많을 때 계산적으로 더 복잡해질 수 있다.


1. 모수적 방법


모수적 방법은 데이터를 특정한 확률 분포에 맞는 모수(parameter)로 설명하려는 접근 방식이다. 이 방법에서는 데이터의 분포가 어떤 모수들의 함수로 표현될 수 있다고 가정한다.
모수적 방법은 통계적 가정을 기반으로 하며, 일반적으로 정규 분포, 이항 분포, 포아송 분포 등과 같은 특정한 확률로 분포를 가정한다.

모수적 방법은 모수 추정, 가설 검정, 회귀 분석 등의 통계적 분석을 수행하는 데 주로 사용된다.

  • 모수 추정 :
    모수 추정은 통계학에서 표본 데이터를 기반으로 모집단의 특성을 추정하는 과정을 말한다.
    모수는 모집단의 특성을 나타내는 파라미터로, 예를 들면 평균, 분산, 비율 등을 말한다.

    모수 추정은 주어진 표본 데이터를 사용하여 모집단의 모수 값을 추정하는 것을 목표로 한다. 이를 위해 통계적 추정 방법을 사용한다. 대표적인 모수 추정 방법은 최대 가능도 추정법(maximun likelihood estimation, MLE)이다. MLE는 주어진 데이터를 기반으로 모수 값을 선택하여, 주어진 데이터가 관찰될 확률을 최대화하는 모수 값을 추정한다.

  • 가설 검정 :
    모수적 방법의 가설 검정은 통계학에서 모집단의 모수에 대한 가설을 검정하는 절차를 의미한다.
    가설 검정은 주어진 표본 데이터를 사용하여, 모집단의 모수에 대한 주장을 통계적으로 평가하는 방법이다. 
    가설 검정은 보통 두 가지 가설을 설정한다. 귀무가설(H0)과 대립가설(H1)이다. 귀무가설은 일반적으로 모집단의 모수에 대한 특정한 주장이며, 대립가설은 귀무가설의 반대를 나타낸다. 가설 검정은 귀무가설을 기각하거나 채택하는 결론을 내림으로써 모집단의 특성에 대한 통계적인 추론을 수행한다.

    가설 검정은 주로 다음과 같은 절차를 따른다.

    1. 가설 설정 : 귀무 가설과 대립 가설을 설정한다. 귀무가설은 일반적으로 어떤 효과나 차이가 없다는 주장이며, 대립가설은 귀무가설의 반대를 주장한다.
    2. 유의 수준 설정 : 유의수준(또는 유의수준 a)은 가설 검정에서 귀무 가설을 기각하기 위한 허용 오차의 수준을 나타낸다. 일반적으로 0.05(5%) 또는 0.01(1%)이 널리 사용되는 유의 수준이다.
    3. 검정 통계량 계산 : 주어진 표본 데이터를 사용하여 검정 통계량을 계산한다. 검정 통계량은 표본 데이터와 귀무가설 사이의 관련성을 측정하는 값으로, 예를 들면 t-통계량, F-통계량 등이 사용될 수 있다.
    4. 기각 영역 결정 : 유의 수준과 검정 통계량을 사용하여 기각 영역을 결정한다. 기각 영역은 귀무가설을 기각할 수 있는 검정 통계량의 범위를 나타낸다.
    5. 결론 도출 : 검정 통계량이 기각 영역에 속하는지 여부를 확인하여 귀무가설을 기각하거나 채택한다. 만약 검정 통계량이 기각 영역에 속한다면, 귀무가설을 기각하고 대립가설을 채택한다.

  • 회귀 분석 :
    회귀 분석은 종속 변수와 한 개 이상의 독립 변수 간의 관계를 모델링하고, 이를 통해 종속 변수의 값을 예측하거나 독립 변수의 영향력을 분석하는 통계적 기법이다. 모수적 방법을 사용하는 회귀 분석에서는 종속 변수와 독립 변수 사이의 선형 관계를 가정하고, 이를 통해 모델의 회귀 계수를 추정한다. 

    모수적 회귀 분석에서는 일반적으로 선형 회귀 모델을 사용한다. 선형 회귀 모델은 종속 변수와 독립 변수들 간의 선형 관계를 나타내는 수학적 모델이다. 일반적인 형태의 선형 회귀 모델은 다음과 같다.

    Y = β0 + β1X1 + β2X2 + ... + βkXk + ε

    여기서,
    Y는 종속 변수 (예: 판매량, 가격 등)
    X1, X2, ..., Xk는 독립 변수들 (예: 광고비, 인구 수 등)
    β0, β1, β2, ..., βk는 회귀 계수 (모수)로, 독립 변수들의 가중치
    ε는 오차항으로, 모델이 설명하지 못하는 불확실성이나 잔차를 나타냄

    모수적 회귀 분석은 주어진 표본 데이터를 사용하여 회귀 계수인 β0, β1, β2, ..., βk 를 추정한다. 일반적으로 최소 제곱법(least squared)을 사용하여 회귀 계수를 추정한다. 최소 제곱법은 실제 종속 변수 값과 모델로 예측한 값의 차이인 잔차를 최소화하는 회귀 계수를 선택한다.
    이후 주로 잔차 분석, 결정 계수(coefficient of determination), 가설 검정 등을 통해 모델의 적합성을 평가한다. 여기서 잔차 분석은 모델이 데이터에 얼마나 적합한지를 평가하고, 모델이 가정한 가정들이 만족하는지 확인하는 것이다.

 


2. 비모수적 방법


비모수적 방법은 데이터의 분포에 대한 특정한 가정을 하지 않고, 데이터의 순위나 순서를 기반으로 분석을 수행하는 방법이다.
비모수적 방법은 자유도가 적거나 분포에 대한 가정이 어려운 경우에 유용하다.
비모수적 방법은 중앙값 검정, 부트스트래핑(bootstrap), 순위 테스트 등의 분석에 사용될 수 있다.
비모수적 방법은 데이터의 순위나 순서를 이용하여 추론을 수행하기 때문에 분포에 대한 가정이 필요하지 않다.

반응형