Excel(26)
-
Excel 시계열 데이터 분석
시계열 데이터란 시간에 흐름에 따라 발생하는 데이터 미래 데이터 예측 업무에 사용된다. 보통 주가에 사용되거나 날씨에 사용된다. 여러개의 방법이 있는데 주식같은경우 하나의 주식만 보는게 아닌 장을 봐야하기에 다변량을 봐야한다. 지수평활법을 배울예정이다. 쉽게 보자면 알파를 늘려가면서 예측한다 단순 지수 평활법의 목적은 모든 수치들의 대한 예측값과 실제값들의 오차가 적은 최적의 알파를 찾는것이다. 이것을 하는 함수를 배워보자. 예측할 것은 30년 31년 32년의 매출로 33년의 매출을 예측하는것이다. 함수를 쓰고 예측할 날짜인 33년 열행을 눌러주자 그 다음 인수인 values에 3년치의 매출을 넣어주자 그리고 타임라인에 3년치의 타임라인을 넣어주자 예측값을 구해준다 그러고 그래프를 만들어준다면 깔끔하게 ..
2023.12.06 -
Excel 회귀분석 *단순회귀분석, 다중회귀분석*
회귀 분석은 종속 변수와 독립변수간의 관계를 파악하는 분석이다 독립변수란? 예를 들어 광고비에 의한 매출 변화가 궁금할때 우리가 지출한 광고비가 독립변수이다. 종속변수는 독립변수에 따라 저절로 설정되는 값이자 알고싶은 매출액이다. 하늘색 동그라미를 보면 규칙적으로 올라가는게 보인다. 이것을 정비례 관계라고한다. 규칙적으로 올라가다보니 우리는 미래값도 예측이 가능해진다. 회귀분석의 종류는 2 가지가 있는데 아까 예시를 든 광고비에 따른 매출이 궁금하다면 단순 회귀분석 광고비, 교육비, 판매비 여러가지에 따른 매출이 궁금하다면 다중 회귀분석을 사용한다. 단순 회귀분석은 결정계수를 보면 되고 다중 회귀분석은 조정된 결정 계수를 보면 된다. 만약 광고비로 단순 회귀분석을 했고 결정계수가 0.937이 나왔다면 광..
2023.12.06 -
Excel 데이터 분석 (분산 분석)
분산 분석이란 ? 쉽게 설명하자면 간 질환을 앓고있는 A환자와 B환자가 있다. 질병의 정도를 측정하는 값이 " 간수치 " 라고 한다면 두 환자의 간수치를 측정하고 평균을 비교해본 뒤 B환자에게 새로 개발중인 신약을 투여해본다. 그러고 다시 두 환자의 간수치를 측정하고 평균을 비교해본 뒤 복용 전 데이터와 복용 후 데이터를 비교해보는것이다. 분산 분석도 종류가 있는데 2개의 집단에는 T-Test 3개 이상 일 때에는 ANOVA 라고 한다. 우리는 T-Test를 먼저 배워보자 T-test를 하기 전 해야할 것이 있는데 F-검정이다. 두 집단의 분산이 같은지를 검정해보는 것이다. F 검정을 하게되면 P-Value 라는 P 값이 나오는데 이것이 0.05보다 크면 두 집단의 분산은 같다. 이것이 0.05보다 작으..
2023.12.06 -
Excel 데이터 분석 도구 추가하기 / 상관 관계 분석 및 활용하기
엑셀을 켜준 뒤 파일을 눌러 옵션에 들어와주자 추가기능에 들어가주자 분석 도구 팩을 눌러 아래에 관리(A): Excel 추가 기능 이동 부분에서 이동을 눌러주자 분석 도구 팩을 체크해 확인을 눌러주면 데이터 탭 맨 우측에 데이터 분석이라는 항목이 생긴것을 볼 수 있다. 이것을 이제 어떻게 사용하는지 알아보자 먼저 상관분석의 이해와 활용을 배워보자 선형적 : x가 증가할떄 y가 선 형식으로 증가하는지 비선형적 : x가 증가할떄 y가 파도형식처럼 비선형으로 증가하는지 상관 관계란 하나의 변수가 증가할때 또 다른 하나의 변수도 같이 증가하는지 아니면 하나의 변수가 증가할때 다른 하나의 변수는 감소하는지 관계를 살펴보는것 이러한 것들을 살펴보는 방법으로 상관계수를 활용한다 상관 계수란? 수식을 외울 필요 없다...
2023.12.06 -
Excel로 만드는 BOXPLOT과 산점도
BOXPLOT은 데이터 분석을 할때 많이 그리게된다. 엑셀로도 간단하고 쉽게 만들 수 있다 찾을 범위를 눌러 삽입에서 히스토그램- 상자수염을 눌러주면 된다. 산점도는 데이터를 점으로 표현해 흩어져 있는 정도를 파악하기 용이한 그래프이다 만드는법은 똑같이 데이터 범위를 지정하고 분산형 차트에서 분산형을 눌러주면 된다. 추세선 추가도 가능하다. 서식도 변경이 가능하다
2023.12.05 -
Excel 탐색적 데이터 분석 (기초 통계랑 분석)
EDA로 불리는 탐색적 데이터 분석은 말 그대로 데이터 자체가 가지고 있는 본연의 의미를 탐색하는 것 탐색적 데이터 분석을 어떻게 하냐에 따라 데이터의 결과가 달라진다. VAR 분산이란? 데이터의 흩어짐 마트에서 10만원어치의 구매가 평균이라면 A라는 사람이 200원어치, B라는 사람이 50만원어치를 구매했다면 분산이 크다 라고 한다 평균과 가까울 수록 분산이 적다라고 함 RAW DATA를 이용해서 기초통계량을 계산해보자 RAW DATA의 Sales로 구해보자 함수들로 쉽게 구할 수 있다.
2023.12.05