데이터 > 활성 데이터셋 > 긴 형식에서 넓은 형식으로 데이터셋 모양바꾸기...
Data > Active data set > Reshape data set from long to wide format...
간혹, ID를 갖는 주체(subject, 주로 사람 또는 집단의 개체)가 반복적으로 사례 값을 갖는 데이터가 있다. 또는 시간의 경과/어떤 사건 전후에 따른 변화값을 갖는 개체들을 다루는 분야에서는 흔한 데이터 형식일 수 있다.
carData 패키지에 포함된 OBrienKaiser, OBrienKaiserLong 데이터를 살펴보자.
https://rcmdr.kr/95
먼저 OBrienKaiserLong 데이터를 살펴보자. id 변수를 보면 개체 번호(subject)가 반복됨을 알 수 있다. phase 변수는 pre, post, fup가 hour 변수는 1, 2, 3, 4, 5가 반복된다.
전체 240개의 사례는 16개의 개체, 각 개체별 3개의 단계 (pre, post, fup), 각 단계별 5개의 시간대(1, 2, 3, 4, 5)의 score를 1 ~ 11까지 갖는다. 개체 1 ~ 5는 control 집단으로, 개체 6 ~ 9는 A 처방 집단, 개체 10 ~ 16는 B 처방 집단이며, 개체는 여성과 남성 각각 8명씩이다.
새롭게 만드는 변형된 데이터셋의 이름은 활성데이터셋이름Wide로 기본 설정되어있다. OBrienKaiserLong 데이터셋에서 개체를 나타내는 id 변수를 <Subject ID 변수(하나선택)>으로, 변화되는 값을 갖는 요인형 정보 hour, phase를 <Within-subjects 요인 (하나 또는 그 이상 선택)>으로, 변화되는 값인 score를 <상황에 의해 다양화되는 변수 (하나 또는 그 이상 선택)>에서 선택한다.
R Commander 맨 아래에 있는 알림글을 살펴보면,
주석: 데이터셋 OBrienKaiserLong(은)는 240 행과 6 열을 가지고 있습니다.
주석: 데이터셋 OBrienKaiserLongWide(은)는 16 행과 17 열을 가지고 있습니다.
라는 정보를 확인할 수 있다. treatment, gender 변수는 그대로 사용되지만, score별로 hour.phase의 요인 값이 표기되는 형식으로 변수가 15개 생성된다. score.hour(1~5).phase(pre, post, fup) 순서가 되겠다.
?ReshapeDatasetDialogs # Rcmdr 패키지의 ReshapeDatasetDiaglogs 도움말 보기
'Data > Active data set' 카테고리의 다른 글
15. Convert all character variables to factors (0) | 2022.02.10 |
---|---|
14. Reshape data set from wide to long format... (0) | 2022.02.10 |
17. Export active data set... (0) | 2019.09.08 |
16. Save active data set... (0) | 2019.09.08 |
12. Remove cases with missing data... (0) | 2019.09.08 |