그래프 > 분위수-비교 그림...
Graphs > Quantile-comparison plot...
분위수-비교 그림은 수치형 변수 사례 값의 분포적 경향성을 확인하는데 사용된다. 또한 변수들의 관계에 대한 수리적 계산 과정에서 발생하는 잔차(Residuals)들의 분포적 특징을 확인하는데 활용할 수 있다.

Linux 사례 (MX 21)

Prestige 데이터셋에 있는 수치형 변수중에 income 변수를 선택해보자.

Linux 사례 (MX 21)

<선택기능> 메뉴 창을 열면, income 변수의 특징을 맞춰 볼 분포들을 선택하는 기능이 있다. 기본 설정으로 되어있는 정규분포를 많이 사용한다. 오른쪽에 있는 <그림 이름표>에 출력될 그래프의 정보를 담는 내용을 입력할 수 있다.

Linux 사례 (MX 21)

정규분포적 특징 안에서 income 변수의 사례적 흐름을 시각적으로 확인할 수 있다. 오른쪽 상단에 두 개의 이상치가 있는데, general.managers, physicians 직업이라고 알려준다.

Linux 사례 (MX 21)
with(Prestige, qqPlot(income, dist="norm", id=list(method="y", n=2, 
	labels=rownames(Prestige)), ylab="income (수입)", 
    main="income 변수의 분위수-비교 그림"))
Linux 사례 (MX 21)

아래 그래프는 income 변수 대신 education 변수를 선택해서 정규분포적 특징 안에서 살펴본 것이다. income 변수에 비해서 이상치들이 적게 보인다.

Linux 사례 (MX 21)

아래 그래프는 Prestige 데이터셋에 포함된 prestige 변수의 분위수-비교 그림의 시각화 결과이다. 정규분포적 특징 안에서 prestige 변수의 사례들이 분포되어 있음을 알 수 있다.

Linux 사례 (MX 21)

참고로 income 변수에 log 계산을 한 후 분위수-비교 그림을 그려보자. 원래의 income 변수보다 정규분포적 특징이 강화된다.

Linux 사례 (MX 21)

?qqPlot  # car 패키지의 qqPlot 도움말 보기

x<-rchisq(100, df=2)
qqPlot(x)
qqPlot(x, dist="chisq", df=2)

qqPlot(~ income, data=Prestige, subset = type == "prof")
qqPlot(income ~ type, data=Prestige, layout=c(1, 3))

qqPlot(lm(prestige ~ income + education + type, data=Duncan),
	envelope=.99)

https://rcmdr.kr/m/205

2. Residual quantile-comparison plot...

모델 > 그래프 > 잔차 분위수-비교 그림... Models > Graphs > Residual quantile-comparison plot... 데이터셋을 활성화시키고, 분석 모형을 만들었다면, '모델 > 그래프 > 잔차 분위수-비교 그림...' 메뉴 기능..

rcmdr.kr

+ Recent posts