PGR21.com
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다.
통합 규정을 준수해 주십시오. (2015.12.25.)
Date 2014/04/01 16:54:20
Name La Luna
Subject [질문] 통계의 기초 개념 잡혀 있으신 분?
년도        가계소비지출(Y)        가처분 소득(X)
1990년         96,948          171,557
1991년         117,044          207,936
1992년         134,958          237,255
1993년         153,300          267,552
1994년         182,579          314,024
1995년         214,415          360,495

1) 추정식을 만들어보자
2) a_hat과 b_hat을 구해보자
3) X의 편차(X_1-X_bar)와 Y 편차(Y_i-Y_bar )의 합들이 0 에 가깝다는 것을 확인해 보자
4) 잔차의 합이 0 혹은 0에 가깝게 된다는 것을 확인해 보자
5) 잔차와 설명변수(X) 곱의 합이 0 혹은 0에 가깝게 되는 것을 확인해 보자

---------------------------------------------------------------------
개념을 아는 것과 실제 적용해 본다는 것에 이렇게 격차가 클 줄은... -0-

1. 문제에 일단 추정식은 1차 방정식 하나 임의로 세워보면 될 것 같고, 이걸 대충 y=0.5x+10,000 정도로 찍었습니다.
2. 그리고 A_hat B_hat 구해보라는데 y=ax+b 에서 a, b 의 추정치? 여기서 부터 꼬입니다... 그냥 임의로 찍어보란 뜻인가요?

3. 편차의 합들은 당연히 0 아닌가요? 그런데 왜 0에 가깝다는 걸 확인해보란건지;
4. 편차와 잔차의 차이는 모집단이냐, 표본집단이냐 차이 아닌가요? 그니까 위 모집단에서 임의로 두세개만 골라서 표본을 만들란건지...
5. 이건 일단 잔차의 예시만 구하면 그냥 엑셀로 곱해보면 되겠네요.

*만우절이라 답변에도 믿음이 안 갈거 같아요...
*이 글에 어울리는 자음은 뭘까요. ㅋ 쓸 곳이 없더라구요 ㅜ

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
14/04/01 17:08
수정 아이콘
단순선형회귀 같은데 2번은 그냥최소제곱법으로 추정하시면 됩니다. 엑셀로도 가능하고요.
34는 당연히0이고요.
5번은 최소제곱으로 추정하는과정에서 기울기에 관해 편미분과정에서 간단히 유도됩니다.
14/04/01 17:13
수정 아이콘
오오 적어주신게 바로 교수님이 설명하셨던 바로 그거네요. 막 편미분 나오고 혼자서 2시간 내내 설명해주시던!

근데 2번은 구하라는게 그냥 아무 숫자 구해서 뺀 뒤 그 합 최소로 하는 식을 엑셀에 적으란 건가요?
14/04/01 17:19
수정 아이콘
제가 지금 모바일이라 작성이 힘든데
y=b0+b1x+eps 에서
eps=y-b0-b1x입니다.
이를 제곱한 합인 편차제곱합을 최소화하는 방법이 최소제곱추정법인데요.
제곱합을 최소화하는 건 당연히 미분값이 0이되도록하는 값이라 b0 b1에 각각 편미분하신 후 연립하여 추정량을 구하는 거라고 생각하시면 됩니다.
직접계산해보시면 아시겠지만
b0hat=ybar-b1hat*xbar 이고
b1hat=sxy/sxx 입니다.
엑셀기능에 회귀분석이있을텐데 자동으로 계산해줍니다. 아니면 통계패키지같은걸 이용하셔도 되고요.
데이터가 적으니 손이나 계산기로도 가능은 할것 같군요..
14/04/03 18:12
수정 아이콘
친절한 답변 적어주셔서 감사합니다. 지금 이 댓글 폰으로 쓰면서도 답답한데 저 글을 어떻게 적어주셨는지! 과제 마무리 하느라 인사가 늦었는데 편차랑 잔차 차이를 결국 이해못하고 적어냈습니다 ㅜ
14/04/03 19:01
수정 아이콘
도움이 되셨다니 다행이네요.
확인하실진 모르겠지만 궁금하신 부분에 몇가지 적어보면..

우선 단순성형회귀에 관해 말씀드리면 데이터는 당연히 선형식을 따르지 않습니다.
위에 주어진 데이터 6개의 dimension이 6이라면 이를 적합시키기 위해선 당연히 6차 다항식이 필요하죠.
그런데 선형회귀에선 이 데이터를 단순히 1차 다항식인 직선으로 적합시키려고 하는 것입니다.
즉 우리의 데이터가 선형식을 따른다고 가정하고 출발하는 것이죠.
여기서 문제가 생깁니다. 각각의 데이터가 완전한 선형이 아니기 때문에 가정한 모형에서의 오차가 생기겠죠.
이렇게 생긴 랜덤오차를 ε(편차)라고 부릅니다.
단순선형회귀의 ε 는 표준정규분포를 따른다는 가정을 아마 수업시간에 배우셨을텐데요.
y=b0+b1x+ε라는 식에서 b0(intersep)와 b1(slope)로 데이터를 설명 할 수 없는 부분은 편차인 ε때문이라고 가정하는 것이죠.

그 다음 과정이 바로 b0와 b1을 추정하는 부분입니다. 직선식으로 적합을 시켰으니 그 직선식이 무엇인지를 알아야겠죠.
그리고 추정하는 과정은 위에 댓글에 적은 부분과 같고요.
http://en.wikipedia.org/wiki/Simple_linear_regression 를 보시면 아시겠지만
b0hat과 b1hat은 우리가 얻은 data인 Yi 들과 Xi들의 식으로 표현됩니다.
즉 데이터를 가장 잘 설명하는 추정량을 구하는 것이죠.

이제 이렇게 얻은 추정량(계수)들을 이용하여 처음에 가정한 모형식인 y=b0+b1x+ε에서 b0와 b1자리에 추정량을 넣어줍니다.
결국 이러한 데이터 분석의 목적은 예측을 하기 위해서인데 모형을 세우고 계수를 찾는데서 끝난다면 아무 의미 없겠죠?
그러니 추정량을 통해 추정식을 구하고 이를 통해 새로운 관측값(예를들어 지금 경우엔 1996년의 가처분소득(X))을 얻었을때
1996년의 가계소비지출(Y)을 예측하는 것이죠.

그럼 다시 돌아가서 추정식 yhat = b0hat + b1hat * x 을 얻었는데
사실 생각해보면 데이터는 처음에 말했지만 당연히 완전한 선형식을 이루기 힘듭니다. 그렇다면
1996년의 가처분소득(X)가 주어졌을때 위 추정식의 X자리에 넣어주면 1996년의 가계소비지출(Y)을 예측한 값인 yhat값이
나올텐데요.
실제 1996년의 가계소비지출(Y)와 추정한 모형을 통해 예측한 값인 1996년의 가계소비지출(Yhat)값이 같을까요?
운이좋아 같을 수도 있지만 당연히 같지가 않겠죠? 이렇게 생긴 (y-yhat)을 잔차라고 부르는 것입니다.

정리하자면 편차는 가정한 모형에서 생긴 오차의 개념으로 우리가 관측할 수 없는 값입니다.
모형을 세우며 생긴 어쩔수 없는(?) 오차인 셈이죠.
하지만 잔차는 관측할 수 있는 값입니다. 실제값-추정값이기 때문이죠.
이렇게 오차를 관측할 수 없기 때문에 모형의 평가에 있어선 잔차를 이용 할 수 밖에 없겠고요.

SST=SSR+SSE인 관계식도 아마 보셨을텐데 여기서 SSE가 잔차제곱합이라고 배우셨죠?
그럼 총변동 SST는 일정한데 SSE가 작은 값일수록 모형에서 오차에 의한 비율은 작고
가정한 모형식에 의해 설명되는 부분인 SSR, 즉 회귀제곱합이 크다가 되는 것이고
그럼 우리가 세운 선형식이 데이터를 잘 설명한다고 볼 수 있겠죠.

사실 회귀식을 세우고 계수를 추정하고 이런건 중요하진 않습니다. 모형의 평가와 진단부분이 훨씬 더 중요한 부분이죠..
적다보니 뭔가 길어진 것 같은데..
혹시 더 궁금하신 부분 있으시면 제가 아는 한 답변드리겠습니다.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
40060 [질문] 본 영상에 쓰인 음악을 알고 싶습니다. 정지연491 14/08/12 491
39430 [질문] 쇼미더머니 질문입니다 [5] 베네딕트컴버배치1235 14/08/04 1235
38187 [질문] xbox 360 패드 컴퓨터 연결이 가능한가요? [4] 야릇한아이1957 14/07/17 1957
37508 [질문] 박신혜 이 광고 어떻게 들리나요? [12] 타나토노트2019 14/07/08 2019
34767 [질문] Xbox 360 중고 관련 [1] dokzu1277 14/06/04 1277
33916 [질문] 차량 블랙박스 추천부탁드립니다 [4] Dawn1267 14/05/25 1267
33751 [질문] 핸드폰을 구매하려고 합니다. [4] dpi974 14/05/23 974
33015 [질문] T다이렉트샵 아이패드 구입에 대해서 궁금한게 있습니다. [2] 유라2030 14/05/13 2030
32339 [질문] 장애 혹은 기형으로 더 우월한 운동능력을 보유한 사례가 있나요? [39] 낭만토스3175 14/05/05 3175
32301 [질문] 다크소울2 pc버전 질문입니다. [2] 스물다섯번째밤1574 14/05/05 1574
32292 [질문] 컴퓨터 견적 짜봤는데, 좀 살펴봐주세요... [24] 나이트메어1390 14/05/04 1390
32163 [질문] 조립PC 견적 문의 [4] Galatico_1011 14/05/03 1011
32145 [질문] 어머니께서 중국에서 약(420만원 어치)을 사오셨습니다. [20] 똥깔장군4616 14/05/02 4616
31818 [질문] 이런 류의 노래는 또 무엇이 있을까요? [4] 인간흑인대머리남캐995 14/04/28 995
31371 [질문] [피파3] 비싼 카드를 현금화 하고 싶은데 가능할까요? [7] Gakky2538 14/04/22 2538
29804 [질문] 통계의 기초 개념 잡혀 있으신 분? [5] La Luna1626 14/04/01 1626
29486 [질문] chic의 good time과 queen의 another one bite the dust... 이거 표절일까요? [5] Darwin40781480 14/03/28 1480
29472 [질문] 대출 관련 질문 드려요. [1] 레페리온621 14/03/27 621
29174 [질문] 미천한 공학도가 C언어 질문드립니다. [5] 常勝882 14/03/24 882
27860 [질문] 맥북 고르는것 도와주세요. [11] Siver Tiger898 14/03/09 898
27128 [질문] 이어폰 추천 부탁 드립니다 모모홍차634 14/02/28 634
26300 [질문] 유튜브 기본 설정을 고화질로 할 수는 없나요? [1] redcard3575 14/02/17 3575
24495 [질문] 기차 경적음 나는 악기(?) 구매하고 싶습니다. [3] ThisisZero1193 14/01/24 1193
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로