Baron & Kenny 매개,조절효과/조절효과

학위논문통계 2021. 1. 22. 20:21

가끔 조절된 매개효과를 물어보시는 분들이 있는데요.

 

이건 교수가 시킨 건지 아니면 본인이 검색해서 좀 어려워 보니까 하시려는 것인지. ...

 

이것 구글에서 검색해보면 무슨 소리 찌껄이는지 잘 모릅니다. 그리고 이렇게 하자 저렇게 하자 다양하게 주장하고요. 그러니까 통계적으로 확고하게 인정받는 방법이 아직 아닙니다. 그리고 통계 패키지에 들어 있지도 않고요. 구굴 검색하면 SPSS에서 macro로 돌리는 것은 있네요.

 

 

이것은 AMOS에서 다중집단 분석하시면 됩니다. 조절변수를 평균을 중심으로 평균보다 낮은 저집단, 평균보다 높은 고집단 해서 2개의 데이터를 만들고 구조방정식을 돌리면 됩니다. 그럼 저집단 데이터에서 구조방정식 돌리고, 여기서 회귀계수값이 나오고 또 고집단에서도 구조방정식 돌리고 그리고 여기서 회귀계수 값을 구하고요. 이렇게 저집단과 고집단 구조방정식에서 나온 회귀계수값이 유의적인 차이가 있는지 보는 것입니다. 이게 조절효과입니다.

 

 

이게 왜 잘 이해가 안되냐면 이야기가 좀 깁니다.

 

논문에 많이 나오는 조절효과 검증하는 방법은 Baron & Kenny(1986)이 주장한 방법입니다. 통계학에서는 그냥 상호작용항(interaction term)을 넣은 것에 불과합니다. 그래서 통계학에서는 조절효과 이런 말을 쓰지 않습니다. 주효과(main effect)나 상호작용효과(interaction effect)라고 이런 말을 합니다.

 

그런데 이 Baron & Kenny(1986) 논문에 조절효과뿐만 아니라 매개효과도 보는 방법이 나옵니다. 3단계로 회귀분석을 해서 매개효과가 있는지 없는지 보는 것입니다. 그런데 이 방법이 논리적으로 좀 문제가 있고, 따라서 설명도 그리 직관적이지도 않고 명쾌하지도 않습니다. 지금 이 조절된 매개효과가 이 Baron & Kenny 방식의 연장선에서 이론을 전개하기 때문에 이해가 잘 안되는 것입니다. 매개효과 보는 것만 해도 그리 명쾌하지 않는데 여기에 조절변수까디 더 들어가니까 복잡한 것이죠.

 

옛날에는 구조방정식이 많이 쓰이기 전에는 이 Baron & Kenny 방식을 많이 썼습니다. 그런데 지금은 이거 거의 쓰지 않습니다.

 

 

 

앞에서 이야기한 것처럼 그냥 AMOS에서 구조방정식 돌리고 조절변수가 있으면 다중집단 분석을 하시면 됩니다. 조절변수 몇 개 넣어서 다중집단 분석 몇 개 더 추가하면 박사학위 논문 수준으로 인정받을 수 있습니다.

 

 

다중집단 분석을 할 때는 비표준회귀계수를 가지고 표를 만들어야 합니다. 그래야지 두 집단의 회귀계수 차이를 검증하는 z값의 부호랑 일치 합니다. 표준회귀계수를 쓰면 z 값 부호랑 일치하지 않는 경우가 생깁니다.

 

 

가끔 의뢰하시는 분들 보면 남들이 잘 안하는 어려운 분석 방법, 프로그램을 쓰면 굉장히 뛰어난 논문이 될 거라고 생각하시는 분들이 있는 것 같습니다. 가장 편하고 효율적인 방법을 찾아 쓰시면 됩니다.

 

 

예를 들어 R에 관해서 많이들 물어들 보십니다. 구조방정식도 R에서 하시려고 하는 분들이 있고요. 그냥 AMOS에서 하시면 됩니다. 본인이 직접하시려면 AMOS 가장 초보적인 책을 사서 간단한 것부터 해보시고, 약간의 시행착오를 겪으시면 웬만한 작업은 다 할 수 있습니다.

 

저도 미국가자 마자 R을 했는데요. 그리고 굉장히 좋아했습니다. 그 당시는 S라고 했고, 유닉스 웍스테이션에 공짜로 깔려 있었습니다. 그런데 S가 상업용 S-plus로 바뀌고 PC용도 나왔습니다. 그러다가 망했고, S을 좋아했던 사람들이 모여서 공짜 프로그램 R을 만든 것입니다. 그래서 프로그램이 서로 호환이 됩니다.

 

 

R은 원래 통계프로그램으로 나온 것이 아닙니다. data manipulation이라고 데이터 변형 작업을 위해서 나온 것입니다. matlab 비슷한 프로그램입니다. 그리고 R 프로그램은 컴파일러가 아니고 interpreter이기 때문에 프로그램이 매우 쉽습니다. 기본적인 컴퓨터 프로그램 로직을 이해하면 쉽게 재미있게 배울 수가 있습니다.

 

 

그래서 반복적인 작업을 하거나 아니면, 아니면 기존의 상업용 통계프로그램에 나오지 않는 이론적인 수준의 작업을 할 때는 이 R이 꼭 필요합니다.

 

일반적인 논문 수준의 통계 프로그램은 그냥 기존에 있는 상업용 프로그램을 사용하시기 바랍니다.

 

 

 

그러면 Baron & Kenny 방식의 회귀분석을 이용한 조절효과를 SPSS에서 어떻게 하는지 한번 보죠. 간단하게 쓰겠습니다. 시간이 없어서요.

 

 

1) 독립변수와 조절변수를 표준화를 합니다. 표준화를 하지 않으면 다중공선성 문제가 심각하게 일어날 수 있습니다. 종속변수도 표준화해도 되지만 그래프를 여러개 그릴 것이 아니면 표준화하지 많고 원 변수 그대로 쓰시기 바랍니다.

 

조절변수가 범주형 변수이면 이 변수는 표준화해서는 안되지요. 성별같이 이진 더미변쉬이면 이건 0, 1로 다시 코딩하셔야 합니다. 안해도 통계 결과 유의적인지 아닌지, 즉 t 값은 전혀 안 변하는데 표 해석이 쉽게 됩니다.

 

이 표준화하는 방법은 SPSS에서 간단합니다. SPSS에서 기술통계 메뉴를 하면 선택항목으로 표준화가 있습니다. 이것 체크하면 데이터 뒤쪽에 표준화된 독립변수와 종속변수를 자동으로 붙여 줍니다.

 

 

2) 표준화된 독립변수와 조절변수를 곱해서 새로운 변수를 만듭니다. SPSS에서 변환메뉴을 선택해서 이 곱한 상호작용항 변수에 적당한 이름을 붙입니다. 그럼 이 곱하기 한 상호작용 변수가 또 뒤에 새로 생깁니다.

 

 

3) 마지막으로 회귀분석 메뉴에 가서 독립변수에 독립변수, 조절변수, 그리고 독립*조절 상호작용항을 넣고 돌리면 됩니다. 그래서 조절효과를 보는 것은 상호작용항에 해당하는 변수가 유의적인지, 또 부호가 +인지, -인지 보시면 됩니다.

 

 

 

여기서 상호작용항, 즉 조절효과가 유의적으로 나오지 않으면 어떻게 해야 할 까요. 조절효과를 여러개 보는 논문이면 이 중에서 1, 2개 유의적인 조절효과가 나오면 됩니다. 다 유의적으로 나온 논문이 있으면 이건 오히려 표를 마사지했을 가능성이 많습니다.

 

 

그런데 전부 다 조절효과가 없다고 하면 이건 심각한 문제입니다. 그럼 이 조절효과 보는 의미가 없는 것이거든요.

 

이 경우 조절변수가 연속형 변수이면 이진 변수로 변형을 해서 한번 다시 해 보시기 바랍니다. 이진 변수, 즉 더미 변수로 할 경우가 더 잘 나옵니다.

 

통상 이진, 더미변수로 만들 때는 특별한 이론이 없으면 평균을 중심으로 낮은 집단은 0, 높은 집단은 1로 코딩하시면 됩니다.

 

이건 SPSS에서 어떻게 할 까요. 표준화된 조절변수를 복사해서 데이터 맨 뒤에 하나 복사를 하시기 바랍니다. 작업 중 무슨 실수를 할지 모르기 때문에 원 표준화 조절변수를 데이터에 그냥 놔두고 복사한 표준 조절변수를 가지고 작업을 하는 것이 좋습니다. 아니면 다른 변수로 코딩하라고 하면 됩니다.

 

그럼 SPSS에서 변환==> 같은 변수로 코딩 변경, 여기서 제일 낮은 값에서 0까지는 0으로 코딩, 0에서 가장 높은 값까지는 1로 코딩하라고 명령하면 맨 뒤에 있는 복사된 표준화 조절변수는 평균 이하는 0, 평균 이상은 1로 더미변수로 변합니다. 이 더미 변수를 가지고 독립변수와 곱하기 해서 상호작용항을 만들고 위의 이야기한 방법으로 회귀분석에서 독립변수, 더미화 된 조절변수, 그리고 곱하기 한 상호작용항 변수를 넣으면 됩니다.

 

여기서 왜 평균을 기준으로 하지 않고 0으로 하냐면 지금 표준화된 조절변수로 작업을 하는 것이거든요. 이 표준화 변수는 원 변수의 평균이 0으로 되어 있습니다. 당연히 표준편차는 1이죠.

 

 

그래도 유의적인 조절효과가 나오지 않고, 꼭 논문을 써야 한다면 0을 중심으로 하지 않고 표준편차가 -1 이하인 경우 저집단 즉, 0으로, 표준편차가 1 이상인 경우를 고집단, 1로 코딩하면 됩니다. 그 대신 그 중간에 있는 집단은 분석에서 사용되지 않기 때문에 표본 수가 많이 줄어들어 통계 결과의 신뢰성 문제가 생기기는 합니다. 중간 부분은 어떻게 하면 될까요. 이건 -11 사이는 결측값으로 하라고 하면 됩니다. 그럼 이 결측값이 들어 있는 데이터는 회귀분석에서 자동으로 제외되어 분석합니다.

 

 

우리나라에서는 위계적 회귀분석이라고 해서 3단계를 하라고 되어 있는데 이건 사실 필요없습니다. 조절효과를 보려면 마지막 3단계에서 상호작용항만 보면 됩니다.

 

 

다음에는 간단히 수식을 써서 보여주고 표 값이 뭘 의미하는지 이것도 설명하겠습니다.

 

 

 

 

비밀댓글입니다
비밀댓글입니다
조절효과가 있는 것입니다.

블로그 글 틀린 것입니다.

조절효과는 직선의 기울기에서 차이가 있는 것을 보는 것이고요 2번째 모형은 주효과라고 볼 수 있는데 이것 y절편에서 차이가 있는지 보는 것입니다.

솔직히 1단계, 2단계 필요없는 작업입니다.

한국 사회과학 교수들이 잘 몰라 잘못된 관행으로 계속 해 오고 있는 것입니다.