Excel 데이터 분석 (분산 분석)

2023. 12. 6. 18:47Excel

 

분산 분석이란 ?

 

쉽게 설명하자면

 

간 질환을 앓고있는

 

A환자와

 

B환자가 있다.

 

질병의 정도를 측정하는 값이 " 간수치  " 라고 한다면

 

두 환자의 간수치를 측정하고 평균을 비교해본 뒤

 

B환자에게 새로 개발중인 신약을 투여해본다.

 

그러고 다시 두 환자의 간수치를 측정하고 평균을 비교해본 뒤

 

복용 전 데이터와 복용 후 데이터를 비교해보는것이다.

 

 

 

 

분산 분석도 종류가 있는데

 

2개의 집단에는 T-Test

 

3개 이상 일 때에는 ANOVA 라고 한다.

 

 

우리는 T-Test를 먼저 배워보자

 

T-test를 하기 전 해야할 것이 있는데

 

F-검정이다.

 

두 집단의 분산이 같은지를 검정해보는 것이다.

 

F 검정을 하게되면 P-Value 라는 P 값이 나오는데

 

이것이 0.05보다 크면 두 집단의 분산은 같다.

 

이것이 0.05보다 작으면 두 집단의 분산은 다르다.

 

로 정의한다

 

위와같이 

 

P 검정을 해서 분산이 같으면

 

Student's t-test를 써주고

 

분산이 다르면 

 

Welch's t-test를 써준다.

 

등분산성을 검정해 상황에 맞는 t-test 방법을 사용하기 위해 이러한 일련의 과정( F 검정) 을 거친다.

 

 

엑셀에서 앞의 F검정에서의 P값이 0.05보다 컸으면 "등분산 가정 두 집단" 을 사용하면되고

 

0.05보다 작으면 "이분산 가정 두 집단" 을 사용해주면 된다.

 

위와같은 해석을 낼 수 있다.

 

결국  T-TEST는 

 

집단1은 가만히 두고 집단 2에 어떠한 영향을 줬을때 P값이 0.05보다 작으면 집단2에 영향을 준 사건이 두 집단의 평균 차이에 유의미한 영향을 미쳤다고 해석한다.

 

쉽게 말하면 아까

 

간수치 환자 데이터의 P값이 0.05보다 작으면 무언가 변화가 있었다는 것이고

 

0.05보다 크면 변화가 없다는 의미다.

 

이제 이것을 엑셀에서 사용해보자

 

먼저 변화를 볼 수 있는 19년도 ~ 20년도 하반기 까지의 매출액이 담긴 자료를 구해오자

 

 

첫 번째로 구할 것은 

 

19년 상반기 매출과 19년 하반기 매출의 평균 차이 검정이고

 

두 번째로 구할 것은

 

 19년 상반기 매출과 20년 상반기 매출의 평균 차이 검정이다.

 

 

먼저 분산분석을 해주자

 

T -TEST 전 항상 F검정을 해야한다.

 

변수 1에는 19년 상반기

 

변수 2에는 19년 하반기를 넣어줬다

 

출력범위를 설정해 확인을 누르자

 

 P값이 나오는데 

 

0.05보다 크다..

 

두 집단의 분산은 다르지 않다라는 뜻이다.

 

즉 변화가 없다 

 

이러한 것을 등분산이라고 부른다

 

우리는 등분산이라는것을 알았으니

 

T-TEST를 진행해보자

 

데이터분석을 눌러

 

 

 

T-검정 등분산 가정 두 집단을 누른 뒤

 

똑같이 범위를 상반기 하반기를 넣어주고 

 

확인을 눌러주면

 

위 값이 나오는데 우리는 여기서

 

P(T<=t) 양측 검정 을 확인해주자

 

0.05보다 크다 ..

 

즉 상/하반기 매출 평균의 차이는 없다.

 

라고 해석해주면 된다.

 

 

이제 두번쨰 가설을 진행해보자

 

두번째 가설이 뭐였냐면

 

19년 상반기 매출과 20년 상반기 매출의 평균 차이 검정이다.

 

과정을 전부 위와 같이 하되

 

범위를 설정할때 19년 상반기를 1변수/ 20년 상반기를 2변수에 넣어주면된다.

 

 

F검정을 하니 

 

P값이 0.05보다 작다.

 

상/하반기의 매출 분산이 다르다 

즉 변화가 있다라는 뜻

 

이럴떄 우린 이분산이라고 한다.

 

다시 T검정 이분산을 해보자 

 

P값 양측이 0.05보다 작은것을 확인 할 수 있다.

 

따라서 얘는 

 

상 하반기의 매출 평균이 다르다 라고 해석할 수 있다.

 

끗 !