상관분석이란 ?
- 변수들 사이의 관련성 유무를 판단하는 분석
예) 대한민국 2-30대 남녀 결혼율과 출산율
(X를 남녀결혼율, Y로 출산율로 놓고 그래프를 그리면 알수 있을 것이다.
결혼한 만큼 출산을 한다면 비례관계가 있을 것이다.
그런데 요즘 무자식상팔자라서 자녀없는 가정도 있으니 자세힌 모른다.)
회귀분석이란 ?
상관분석에서 관련성이 있다고 판명되었을 때
특정 변수값(독립변수)에 대응하는 변수값(종속변수)을 예측하는 분석
그럼 예제를 풀어보자.
(문제의 출처 : 영지문화사 현대통계학)
| 상점번호 | 광고료(X) 단위 : 10만원 |
총 판매액(Y) 단위 : 100만원 |
| 1 | 4 | 9 |
| 2 | 8 | 20 |
| 3 | 9 | 22 |
| 4 | 8 | 15 |
| 5 | 8 | 17 |
| 6 | 12 | 30 |
| 7 | 6 | 18 |
| 8 | 10 | 25 |
| 9 | 6 | 10 |
| 10 | 9 | 20 |
회귀분석을 해보자.
만약 광고료로 200만원을 지출한다면 어느정도의 매출을 기대할 수 있을까?
먼저 문제를 풀기전에 데이터를 입력하자.
그 전에 회귀분석을 할 수 있는 모드로 바꾸자.
사진 속 빨간 선 안에 MODE를 눌러서 사진속의 화면이 뜨면
3번 REG를 선택하자. 3을 누르면 되겠지?ㅎㅎ
(참고로 REG는 리그렉션이라는데 영어는 내가 약해서ㅏㅓㅠㅇㄴ리유녕리ㅜ)
REG를 택하면 이게 뜨는데 1번 LIN을 선택한다. 선형의 리니어다. 영어 어렵...아니 귀찬타..![]()
다시 또 저 문제를 풀기 위해 표 안의 데이터를 입력해야 하는데
빨간 선 안의 컴마를 눌러 X값과 Y값을 구분짓는다.
즉 X는 4, Y는 9다. (첫번째 데이터 값)
그리고 사진속 빨간 선 안의 M+를 입력한다. 메모리를 넣는다는 뜻이다.
그럼 이렇게 n = 1 이라고 뜨는데
데이터 쌍을 하나 입력했다는 뜻이다.
그럼 자연히 두번째 데이터 X = 8 , Y = 20 을 넣는다.
이제 데이터 입력하는건 네놈의 몫이다.
10개 모두 입력했는가?
그럼 이 화면이 나오게 해보자.
연두색 안의 SHIFT를 먼저 누르고 그 다음 S-VAR을 누른다.
그럼 사진소그이 화면이 나오면
빨간색으로 가르켜진 방향키로 →을 눌러 본다. 두번 누르면
이렇게 A B R 이 나온다.
R은 상관계수를 말한다.
1에 가까울수록 관련성이 있다는 것이다.
문제에서처럼 광고료와 판매액은 강한 상관관계가 있음을 알 수 있다.
0.92뭐시기가 나온다.
R의 범위는
-1 ≤ R ≥ 1
이며
단위에 상관없이 상관계수 값은 같은 걸 가르킨다고 해서 무명수라고 한다.
그냥 한번 웃어줘라.
그리고 오른쪽 방향키를 한번 더 누르거나
또는 이미 저질러버렸으면 (R을 구했으면)
그냥 다시 시크하게
SHIFT누르고 S-VAR누르면 되니까 걱정마라.
이제 본격적으로 문제 풀어보자.
아이쿠, 길다.
필자는 머리속에 지우개가 들은건지 문제가 기억안난다.
문제 : 만약 광고료로 200만원을 지출한다면 어느정도의 매출을 기대할 수 있을까?
그냥 내가 사진 혼동이 있어서 몇개는 삭제했는데
그냥 당신이 on버튼을 누르고 빈화면에서 아래와 같이 해도 좋다.
아니면 그냥 R값 나온 상태에서 바로 문제 풀어도 된다.
광고료 단위가 10만원이었다. (문제 낸 사람 참 고약하다
)
그러니 20을 써야지?
그리고 20만원을 썼으니 미지의 Y(매출액)을 곱한 값.
아래와 같다.
이렇게 하려면
20을 누르고 그냥 바로 SHIFT누르고 S-VAR에서 Y에 ^표시를 얹은걸 눌러라. 그리고 = 눌러라.
이렇게 말이다.
답은 49.904어쩌구.
즉 광고료로 200만원을 투자하면 예상매출이 4900만원어쩌구저쩌구(Y 판매액의 단위는 100만원)라는 거다.
그리고 계산을 끝냈으면
그 계산을 위해 입력했던 데이터들을 지워줘야 한다. 이른바 리셋이랄까.
데이터 지워주는 건...
http://blog.daum.net/nsgi2000/1177
에 가라. 맨 아래에 나와있다
정말로 계산기를 이용해서 회귀직선식은 쓰지 않았다.
사실 쓰기 귀찮다.
관심종자라 관심받겠다고
잘난척하겠다고 이 글 쓰는데
지금 새벽2시다.
내가 왜 이 짓을 하는 건가.
더 이상 알려줄 것이 없다.
하산해라.
가라.