'R Commander' 태그의 글 목록 (4 Page)

모델 > 그래프 > 영향 그림...

Models > Graphs > Influence plot...

데이터셋을 활성화시키고, 분석 모형을 만들었다면, '모델 > 그래프 > 영향 그림...' 메뉴 기능을 사용할 수 있다. carData 패키지의 Prestige 데이터셋을 이용하여 연습해보자.

먼저, Prestige 데이터셋을 활성화 시키자. '데이터 > 패키지에 있는 데이터 > 첨부된 패키지에서 데이터셋 읽기...' 메뉴 기능을 선택하고, 다음 화면에서 carData 패키지에 포함된 데이터셋들 중에서 Prestige를 찾아서 선택한다. 그러면, R Commander 상단의 <활성 데이터셋 없음> 버튼이 'Prestige'로 바뀐다.

Prestige 데이터셋을 이용하여 LinearModel.1 모형을 만든다. '통계 > 적합성 모델 > 선형 모델...' 메뉴 기능을 이용할 수 있다.

LinearModel.1 <- lm(prestige ~ education + log(income), data=Prestige)
summary(LinearModel.1)

LinearModel.1 모형이 활성화된 이후, '모델 > 그래프 > 영향 그림...' 메뉴 기능을 선택하면 아래와 같은 하위 화면이 등장한다.

?influencePlot   # car 패키지에 있는 influencePlot 도움말 보기

'Models > Graphs' 카테고리의 다른 글

6. Influence index plot... (0)	2022.06.21
2. Residual quantile-comparison plot... (0)	2022.06.21
4. Added-variable plots... (0)	2022.06.20
3. Component + residual plots... (0)	2022.06.20
7. Effect plots... (0)	2022.03.09

모델 > 그래프 > 추가-변수 그림...

Models > Graphs > Added-variable plots...

'모델 > 그래프 > 추가-변수 그림...' 메뉴 기능은 데이터셋이 활성화되고, 분석 모형이 만들어진 이후 사용할 수 있다. carData 패키지의 Prestige 데이터셋을 이용하여 연습해보자.

먼저, Prestige 데이터셋을 활성화 시키자. '데이터 > 패키지에 있는 데이터 > 첨부된 패키지에서 데이터셋 읽기...' 메뉴 기능을 선택하고, 다음 화면에서 carData 패키지에 포함된 데이터셋들 중에서 Prestige를 찾아서 선택한다. 그러면, R Commander 상단의 <활성 데이터셋 없음> 버튼이 'Prestige'로 바뀐다.

Prestige 데이터셋을 이용하여 LinearModel.1 모형을 만든다. '통계 > 적합성 모델 > 선형 모델...' 메뉴 기능을 이용할 수 있다.

LinearModel.1 <- lm(prestige ~ education + income, data=Prestige)
summary(LinearModel.1)

LinearModel.1 모형이 활성화된 이후, '모델 > 그래프 > 추가-변수 그림...' 메뉴 기능을 선택하면 아래와 같은 하위 화면이 등장한다.

기본 설정으로 추천된 사항들을 그대로 사용하자. 예(OK) 버튼을 누른다.

avPlots(LinearModel.1, id=list(method="mahal", n=2))

회귀선에서 멀리 떨어져 있다고 추천된 2개의 사례들을 Prestige 데이터셋에서 제거해보자. general.managers가 중복되기 때문에 모두 3개의 사례가 삭제된다. 사례 삭제는 R Commander 상단에 있는 <데이터셋 편집하기> 버튼을 누르고 해당 사례를 찾아 삭제하는 방식을 취했다.

LinearModel.2 <- lm(prestige ~ education + income, data=Prestige)
summary(LinearModel.2)

앞서 만든 LinearModel.1과 비교해보자.

avPlots() 함수를 이용하여 새롭게 만든 LinearModel.2의 실제 회귀계수를 앞서 만든 그래프와 비교해보자.

'Models > Graphs' 카테고리의 다른 글

6. Influence index plot... (0)	2022.06.21
2. Residual quantile-comparison plot... (0)	2022.06.21
5. Influence plot... (0)	2022.06.21
3. Component + residual plots... (0)	2022.06.20
7. Effect plots... (0)	2022.03.09

모델 > 그래프 > 성분 + 잔차 그림...

Models > Graphs > Component + residual plots...

데이터셋이 활성화되고 통계적으로 분석된 모형이 만들어진 경우, '모델 > 그래프 > 성분 + 잔차 그림...' 메뉴 기능을 사용할 수 있다. carData 패키지의 Prestige 데이터셋을 이용하여 연습해보자.

먼저 Prestige 데이터셋을 활성화 시킨다. '데이터 > 패키지에 있는 데이터 > 첨부된 패키지에서 데이터셋 읽기...' 메뉴 기능을 통해서 carData 패키지에서 Prestige 데이터셋을 찾아서 선택하면 된다. 그러면, R Commander 상단의 <활성 데이터셋 없음> 버튼이 'Prestige'로 바뀐다.

Prestige 데이터셋을 이용하여 LinearModel.1, LinearModel.2 라는 두 개의 모형을 차례로 만든다. '통계 > 적합성 모델 > 선형 모델...' 메뉴 기능을 이용할 수 있다.

LinearModel.1 <- lm(prestige ~ education + log(income), data=Prestige)
summary(LinearModel.1)
LinearModel.2 <- lm(prestige ~ education + income, data=Prestige)
summary(LinearModel.2)

그리고 두 모형의 '성분 + 잔차 그림...'을 차례로 만든다. 먼저 R Commander 상단의 <모델: LinearModel.1> 을 선택한 후, '모델 > 그래프 > 성분 + 잔차 그림...' 메뉴 기능을 선택한다.

crPlots(LinearModel.1, smooth=list(span=0.5))

crPlots(LinearModel.2, smooth=list(span=0.5))

'Models > Graphs' 카테고리의 다른 글

6. Influence index plot... (0)	2022.06.21
2. Residual quantile-comparison plot... (0)	2022.06.21
5. Influence plot... (0)	2022.06.21
4. Added-variable plots... (0)	2022.06.20
7. Effect plots... (0)	2022.03.09

모델 > 수치적 진단 > 비선형성에 대한 RESET 검정...

Models > Numerical diagnostics > RESET test for nonlinearity...

데이터셋 하나를 만들어보자. x, y1, y2라는 변수를 가진 rawData라는 데이터셋이다.

x <- c(1:30)
y1 <- 1 + x + x^2 + rnorm(30)
y2 <- 1 + x + rnorm(30)
rawData <- as.data.frame(cbind(x, y1, y2))

rawData 데이터셋을 활성화시키자. <활성 데이터셋 없음>을 누르면 활성데이터셋 후보에 rawData가 있을 것이다. 두개의 단순 회귀 모형을 만든다.

RegModel.1 <- lm(y1 ~ x, data=rawData)
summary(RegModel.1)
RegModel.2 <- lm(y2 ~ x, data=rawData)
summary(RegModel.2)

'모델 > 수치적 진단 > 비선형성에 대한 RESET 검정...'을 RegModel.1, RegModel.2에 각각 시행한다. RESET 검정의 하위 메뉴 창이 등장한다. 기본 설정을 그대로 사용하고, 예(OK) 버튼을 누른다.

RESET은 Regression Equation Specification Error Test의 약자이다.

RegModel.1과 RegModel.2의 분포적 특징을 산점도를 활용하여 먼저 시각적으로 살펴보자.

첫째 그래프인 plot(y1, x)의 점들의 분포는 선형이라는 보다는 이차방정식적(quadratic)으로 보인다. 그렇다면, lm(y1 ~ x)라는 선형 회귀 모형을 lm(y1 ~ x + I(x^2))라는 이차방정식적 회귀 모형으로 변화시켜 만들어볼 수 있지 않을까?

RegModel.1_1 <- lm(y1 ~ x + I(x^2), data=rawData)
summary(RegModel.1_1)

RegModel.1_1이 RegModel.1보다 모형의 설명력이 높다고 할 수 있다.

'Models > Numerical diagnostics' 카테고리의 다른 글

3. Durbin-Watson test for autocorrelation... (0)	2022.06.21
6. Response transformation... (0)	2022.06.20
5. Bonferroni outlier test (0)	2022.06.18
1. Variance-inflation factors (0)	2022.06.14

모델 > 수치적 진단 > 변환 반응하기...

Models > Numerical diagnostics > Response transformation...

어느 데이터셋이 활성화되고, 그 데이터셋을 활용한 분석 모형이 만들어지면, '모델 > 수치적 진단 > 변환 반응하기...' 메뉴 창이 활성화된다.

carData 패키지의 Prestige 데이터셋을 이용하여 연습해보자. 먼저 Prestige 데이터셋을 활성화시킨다. '데이터 > 패키지에 있는 데이터 > 첨부된 패키지에서 데이터셋 읽기...' 메뉴 기능을 통하여 carData 패키지에서 Prestige 데이터셋을 찾아서 선택한다. 다음, Prestige 데이터셋을 활용하여 선형 모델을 만든다. '통계 > 적합성 모델 > 선형 모델...' 메뉴 기능을 선택하여 모형을 만든다.

data(Prestige, package="carData")
LinearModel.1 <- lm(prestige ~ education + income, data=Prestige)
summary(LinearModel.1)

'모델 > 수치적 진단> 변환 반응하기...'메뉴 기능을 선택하면, 다음과 같은 하위 메뉴창이 등장한다. 기본 설정을 이용하자. 예(OK) 버튼을 누른다.

선형 모델을 구성하는 어느 설명변수 또는 설명변수들의 정규성을 향한 변환 기법은 '통계 > 요약 > 정규성을 향해서 변환시키기...' 메뉴 기능을 통해서 연습할 수 있다.

https://rcmdr.tistory.com/198

9. Transform toward normality...

통계 > 요약 > 정규성을 향해서 변환시키기... Statistics > Summaries > Transform toward normaltiy... 어느 데이터셋을 활성화시키면, '통계 > 요약 > 정규성을 향해서 변환시키기...' 메뉴 기능이 아래와 같이..

rcmdr.kr

한편, 위에 있는 선형 모델, LinearModel.1의 반응변수의 변환 값은 1.2017(Est Power)이다. 이 값을 이용하여 모형을 보다 최적화하는 방법은 아래와 같다.

LM.1_pT <- powerTransform(LinearModel.1, family="bcPower")
LinearModel.1_pT <- lm(bcPower(prestige, LM.1_pT$roundlam) ~ education + income, data=Prestige)
summary(LinearModel.1_pT)   #LinearModel.1의 변환 모형 요약 정보
summary(LinearModel.1)      #LinearModel.1의 요약 정보

bcPower(Prestige$prestige, LM.1_pT$roundlam)  # 변환된 prestige 변수 사례 값
Prestige$prestige                             # 원래의 prestige 변수 사례 값

'Models > Numerical diagnostics' 카테고리의 다른 글

3. Durbin-Watson test for autocorrelation... (0)	2022.06.21
4. RESET test for nonlinearity... (0)	2022.06.20
5. Bonferroni outlier test (0)	2022.06.18
1. Variance-inflation factors (0)	2022.06.14

통계 > 요약 > 정규성을 향해서 변환시키기...

Statistics > Summaries > Transform toward normaltiy...

어느 데이터셋을 활성화시키면, '통계 > 요약 > 정규성을 향해서 변환시키기...' 메뉴 기능이 아래와 같이 활성화될 것이다.

carData 패키지에 포함된 Prestige 데이터셋을 이용하여 연습해보자.

'데이터 > 패키지에 있는 데이터 > 첨부된 패키지에서 데이터셋 읽기...' 메뉴 기능을 선택한후 carData 패키지에 있는 Prestige 데이터셋을 찾아서 선택한다. 그러면, R Commander 상단에 있는 <활성 데이터셋 없음> 이라는 버튼이 'Prestige'로 바뀌면서 '통계 > 요약 > 정규성을 향해서 변환하기...' 메뉴 기능을 이용할 수 있게 된다. 이 메뉴를 선택한다. 그러면, 아래와 같은 화면이 등장한다. Prestige 데이터셋에서 정규성을 향해서 변환시킬 변수를 선택하는 메뉴 창인데, income 변수를 선택해보자.

car 패키지에 포함된 powerTransform() 함수를 사용하여 출력창에 아래와 같은 결과를 생산한다. 출력내용에서 'Est Power'값으로 제시하는 0.1793을 확인한다. Prestige 패키지에 있는 income 변수에 0.1793 승(제곱)을 하면, 그 사례 값들은 정규 분포적 특성으로 변환될 수 있다는 의미이다.

'통계 > 요약 > 정규성 검정...' 메뉴 기능이 있다. 이 기능을 사용하여, Prestige 데이터셋의 income 변수와 정규성을 향해서 변환된 income 변수의 새로운 변수, 편의상 variable_Income,의 정규성 검정을 시도해보자.

https://rcmdr.kr/88

8. Test of normality...

통계 > 요약 > 정규성 검정... Statistics > Summaries > Test of normality... 수치형(numeric, integer) 변수들 중에서 하나를 선택한다. 기본 설정에 Shapiro-Wilk의 정규성 검정법이 선택되어 있다. 수입(연..

rcmdr.kr

먼저, 변환된 변수를 Prestige 데이터셋에 추가해야 한다. '데이터 > 활성 데이터셋에 있는 변수 관리하기 > 새로운 변수 계산하기...' 메뉴 기능을 통하여 income 변수가 변환된 variable_Income 변수를 만들어보자. '계산 표현식'에 income^0.1793이 입력된 것을 확인한다. 여기서 0.1793은 powerTransform() 함수를 통하여 앞서 추출한 income 변수의 승(제곱) 값이다.

Prestige 데이터셋에 variable_Income 이라는 새로운 변수가 추가된다. 이제 '통계 > 요약 > 정규성 검정...' 메뉴 기능을 선택하고, 차례로 두번의 정규성 검정을 진행한다. 첫번째는 income 변수로, 두번째는 variable_Income변수를 선택한다. 두개의 정규성 검정 결과를 비교하기 위해서다. 아래 화면은 두번째 검정, variable_Income 변수를 선택하는 메뉴 창이다.

두번의 정규성 검정에서 제시하는 유의 확률값을 살펴보자. variable_Income 변수의 정규성 검정 결과는 p-value=0.07573으로 variable _income 변수는 정규분포적 특징을 갖는다고 할 수 있다.

?powerTransform  # car 패키지의 powerTransform 도움말 보기

# Box Cox Method, univariate
summary(p1 <- powerTransform(cycles ~ len + amp + load, Wool))
# fit linear model with transformed response:
coef(p1, round=TRUE)
summary(m1 <- lm(bcPower(cycles, p1$roundlam) ~ len + amp + load, Wool))

# Multivariate Box Cox uses Highway1 data
summary(powerTransform(cbind(len, adt, trks, sigs1) ~ 1, Highway1))

# Multivariate transformation to normality within levels of 'htype'
summary(a3 <- powerTransform(cbind(len, adt, trks, sigs1) ~ htype, Highway1))

# test lambda = (0 0 0 -1)
testTransform(a3, c(0, 0, 0, -1))

# save the rounded transformed values, plot them with a separate
# color for each highway type
transformedY <- bcPower(with(Highway1, cbind(len, adt, trks, sigs1)),
                        coef(a3, round=TRUE))
## Not run: scatterplotMatrix( ~ transformedY|htype, Highway1) 

# With negative responses, use the bcnPower family
m2 <- lm(I1L1 ~ pool, LoBD)
summary(p2 <- powerTransform(m2, family="bcnPower"))
testTransform(p2, .5)
summary(powerTransform(update(m2, cbind(LoBD$I1L2, LoBD$I1L1) ~ .), family="bcnPower"))

## Not run:  
  # takes a few seconds:
  # multivariate bcnPower, with 8 responses
  summary(powerTransform(update(m2, as.matrix(LoBD[, -1]) ~ .), family="bcnPower"))
  # multivariate bcnPower, fit with one iteration using starting values as estimates
  summary(powerTransform(update(m2, as.matrix(LoBD[, -1]) ~ .), family="bcnPower", itmax=1))

## End(Not run)

# mixed effects model
## Not run: 
  # uses the lme4 package
  data <- reshape(LoBD[1:20, ], varying=names(LoBD)[-1], direction="long", v.names="y")
  names(data) <- c("pool", "assay", "y", "id")
  data$assay <- factor(data$assay)
  require(lme4)
  m2 <- lmer(y ~ pool + (1|assay), data)
  summary(l2 <- powerTransform(m2, family="bcnPower", verbose=TRUE))

## End(Not run)

'Statistics > Summaries' 카테고리의 다른 글

8. Test of normality... (0)	2022.02.13
7. Correlation test... (0)	2022.02.13
6. Correlation matrix... (0)	2022.02.13
5. Table of Statistics... (0)	2022.02.13
4. Count missing observations (0)	2022.02.13

도구 > Rcmdr 선택기능 저장하기...

Tools > Save Rcmdr options...

R Commander를 사용하다보면, 기본 설정을 조금 바꾸고 싶은 생각이 들 때가 생긴다. 화면의 글씨가 너무 커 보이거나, 입력창과 출력창의 크기를 바꾸고 싶거나, 사용하는 폰트를 바꾸거나 등등의 고민이 생길 수 있다.

1. 아래 화면의 폰트 크기를 10에서 9로 바꾸고자 한다.

2. 입력창의 줄의 갯수를 10에서 9로 바꾸고자 한다.

3. 출력창의 줄의 갯수를 20에서 25로 바꾸고자 한다.

아래 메뉴 창에서 '대화록 글 폰트 크기(점)'을 9포인트로 바꾼다. '스크립트와 출력물 폰트 크기(점)'을 역시 9포인트로 바꾼다.

Commander 옵션 메뉴 창에서 '스크립트 창 높이 (줄)'을 9로 바꾼다. '출력물 창 높이 (줄)'을 25로 바꾼다.

바꾸고 싶은 설정 항목에 모두 수정을 가했다면, 'R Commander 다시 시작' 버튼을 누른다. 몇 몇 사항을 저장할 것인가를 질문한 뒤, R Commander가 다시 시작된다. 그렇다면 이 설정 변경을 R과 R Commander를 시작할 때마다 매번 반복해야 할까? 그렇지 않다. '도구 > Rcmdr 선택기능 저장하기...' 기능은 변경된 설정을 저장하여 다음에 R Commander가 시작될 때, 변경된 설정으로 시작하게 만드는 기능이다. '도구 > Rcmdr 선택기능 저장하기...'메뉴 기능을 선택하면 아래와 같이 새롭게 작성된 .Rprofile 파일을 저장할것인가를 묻는다. 화면 아래 오른쪽에 있는 예(OK) 버튼을 누르자.

그러면, 아래와 같은 다음 화면으로 이동한다. 사용자 디렉토리에 .Rprofile 파일에 변경된 설정을 저장할 것인가를 최종 묻는 것이다. Save 버튼을 누른다. 그러면 변경된 설정이 저장되어 다음부터 R Commander는 변경된 설정으로 시작하게된다.

모델 > 수치적 진단 > Bonferroni 이상치 검정

Models > Numeric diagnostics > Bonferroni outlier test

변수들의 조합으로 어느 모형을 만들었을 때, 일반적으로 그 모형은 제한된 설명력의 범위를 갖는다. '모델 > Bonferroni 이상치 검정' 기법은 어느 사례가 모형의 수리적 설명 범위 밖에 있는지를 찾는 방법이다.

carData 패키지에 있는 Prestige 데이터셋을 이용하여 연습해보자.

https://rcmdr.tistory.com/143

Prestige 데이터셋

carData > Prestige data(Prestige, package="carData") help("Prestige") Prestige {carData} R Documentation Prestige of Canadian Occupations Description The Prestige data frame has 102 rows and 6 col..

rcmdr.kr

아래와 같이 Prestige 데이터셋을 불러오고, LinearModel.1을 만들고, outlierTest를 해보자.

data(Prestige)
LinearModel.1 <- lm(prestige ~ education + income, data=Prestige)
summary(LinearModel.1)
outlierTest(LinearModel.1)

1) 먼저, '데이터 > 패키지에 있는 데이터 > 첨부된 패키지에서 데이터셋 읽기...' 메뉴 기능을 통하여 carData패키지에서 Prestige 데이터셋을 선택하고, 예(OK) 버튼을 누른다. Prestige 데이터셋이 활성화될 것이다.

2) '통계 > 적합성 모델 > 선형 모델...'메뉴 기능을 열고, 'prestige ~ education + income'의 회귀식을 입력한다. 그러면, LinearModel.1의 선형 모형 요약정보가 화면에 출력될 것이다.

3) '모델 > Bonferroni 이상치 검정'메뉴 기능을 선택하면, 출력물을 생산한다.

newsboys라는 이름을 가진 사례가 LinearModel.1의 모형식으로 설명력으로 보면 이상치에 해당된다는 의미가 된다. 여러개의 모형을 추가로 만들고, 'Bonferroni 이상치 검정'을 차례로 해보자.

data(Prestige)
LinearModel.1 <- lm(prestige ~ education + income, data=Prestige)
summary(LinearModel.1)
outlierTest(LinearModel.1)
LinearModel.2 <- lm(prestige ~ education + income + education:income, data=Prestige)
LinearModel.3 <- lm(prestige ~ education + log(income), data=Prestige)
LinearModel.4 <- lm(prestige ~ education + income + type, data=Prestige)
outlierTest(LinearModel.1)
outlierTest(LinearModel.2)
outlierTest(LinearModel.3)
outlierTest(LinearModel.4)

LinearModel.2, LinearModel.3, LinearModel4 등을 위와 같이 만들었을때, 어떤 이상치가 발견될까.

LinearModel.2와 LinearModel.3는 farmers를, LinearModel.4는 medical.technicians를 이상치로 발견한다.

'Models > Numerical diagnostics' 카테고리의 다른 글

3. Durbin-Watson test for autocorrelation... (0)	2022.06.21
4. RESET test for nonlinearity... (0)	2022.06.20
6. Response transformation... (0)	2022.06.20
1. Variance-inflation factors (0)	2022.06.14

모델 > 델타 방법 신뢰 구간...

Models > Delta method confidence interval...

'모델 > 신뢰구간...'메뉴 기능을 carData 패키지에 있는 Prestige 데이터셋을 이용하여 연습해보자. 먼저 '데이터 > 패키지에 있는 데이터 > 첨부된 패키지에서 데이터셋 읽기...'메뉴 기능을 통하여 Prestige 데이터셋을 불러온다.

https://rcmdr.tistory.com/143

data(Prestige, package="carData")
LinearModel.1 <- lm(prestige ~ education + income + education:income, data=Prestige)
summary(LinearModel.1)

교육(education)과 수입(income)이라는 설명변수의 조합으로 직업의 사회적 권위(prestige)에 대한 선형모형, LinearModel.1을 만들었다. LinearModel.1의 요약 정보는 아래와 같다.

LinearModel.1의 계수(Coefficients) 정보에는 투입된 설명변수들의 영향력에 대한 추정치(Estimate)가 있다. '모델 > 델타 방법 신뢰 구간...'은 추청치들 사이의 비율을 계산하여 그 값의 신뢰 구간을 점검하는 기법이다.

?DeltaMethod   #DeltaMethod 도움말 보기

모델 > 부트스트랩 신뢰 구간...

Models > Bootstrap confidence intervals...

'모델 > 신뢰구간...'메뉴 기능을 carData 패키지에 있는 Prestige 데이터셋을 이용하여 연습해보자. 먼저 '데이터 > 패키지에 있는 데이터 > 첨부된 패키지에서 데이터셋 읽기...'메뉴 기능을 통하여 Prestige 데이터셋을 불러온다.

https://rcmdr.tistory.com/143

Prestige 데이터셋

carData > Prestige data(Prestige, package="carData") help("Prestige") Prestige {carData} R Documentation Prestige of Canadian Occupations Description The Prestige data frame has 102 rows and 6 col..

rcmdr.kr

data(Prestige, package="carData")
LinearModel.1 <- lm(prestige ~ education + income + education:income, data=Prestige)
summary(LinearModel.1)

교육(education)과 수입(income)이라는 설명변수의 조합으로 직업의 사회적 권위(prestige)에 대한 선형모형, LinearModel.1을 만들었다. LinearModel.1의 요약 정보는 아래와 같다.

LinearModel.1의 계수(Coefficients) 정보에는 투입된 설명변수들의 영향력에 대한 추정치(Estimate)가 있다. '모델 > 부트스트랩 신뢰 구간...'은 반복 측정 기법을 이용하여 추정치를 계산한다.

부트스트랩 메뉴 창에는 여러개의 선택 기능이 있다. 기본설정으로 추천되는 항목들을 그대로 유지한채 예(OK) 기능을 선택해보자.

.bs.samples <- Boot(LinearModel.1, R=999, method="case")
plotBoot(.bs.samples)
confint(.bs.samples, level=0.95, type="bca")

'모델 > 부트스트랩 신뢰 구간...'메뉴 바로 위에 '모델 > 신뢰 구간...'메뉴 기능이 있다. 이 때 쓰이는 함수가 위의 출력물 결과창에서 보는 것처럼 Confint()이다. '부트스트랩 신뢰 구간...' 기능은 신뢰 구간을 구하는 Confint()함수에 LinearModel.1을 바로 객체로서 사용하는 것이 아니라, 위에 화면 상단에서 보듯이 .bs.samples를 객체로 사용한다. .bs.samples라는 객체는 Boot()를 사용하여 만들어진다. Boot()는 LinearModel.1 모형을 활용하여 필요한 정보를 추출하는데, 1번의 분석이 아닌 'R=999' 처럼 999회 반복 추출을 한다. 이 과정은 과거 컴퓨터의 성능이 낮을 때는 매우 많은 시간을 요구하는 기능이었으나, 컴퓨터 성능의 향상으로 시간이 많이 단축되었다.

그렇다면, 왜 'R=999'처럼 반복 추출을 통한 분석을 999회 실시하여 방대한 분석 자료를 만들까. 자료는 일반적으로 제한된 사례수에 의하여, 또는 이론적인 분포를 적용하기 어려운 불규칙한 특징을 갖기가 쉽다. 규칙을 정한 반복 추출 과정을 통한 분석 결과가 일정한 패턴을 갖기를 기대하면서 보다 이론적 분포에 가깝거나, 1회적 분석 결과가 갖는 오류 가능성을 축소시키고자 하는 목적으로 부트스크랩 기법을 사용하게 된다.

위의 출력물에서 Confint()의 객체를 LinearModel.1을 쓴 경우, .bs.samples를 쓴 경우, 95% 범위내에서 회귀 계수의 범위가 어떤 차이를 보이는지 비교할 수 있을 것이다. 아래 '모델 > 신뢰 구간...' 기능 설명을 참고할 수 있다.

https://rcmdr.tistory.com/193

Confidence intervals...

모델 > 신뢰 구간... Models > Confidence intervals... '모델 > 신뢰구간...'메뉴 기능을 carData 패키지에 있는 Prestige 데이터셋을 이용하여 연습해보자. 먼저 '데이터 > 패키지에 있는 데이터 > 첨부된 패키..

rcmdr.kr

?Boot    # car 패키지에 있는 Boot 함수 도움말 보기

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Rcmdr.kr: An R Commander User in Korea

R Commander

5. Influence plot...

'Models > Graphs' 카테고리의 다른 글

4. Added-variable plots...

'Models > Graphs' 카테고리의 다른 글

3. Component + residual plots...

'Models > Graphs' 카테고리의 다른 글

4. RESET test for nonlinearity...

'Models > Numerical diagnostics' 카테고리의 다른 글

6. Response transformation...

'Models > Numerical diagnostics' 카테고리의 다른 글

9. Transform toward normality...

'Statistics > Summaries' 카테고리의 다른 글

Save Rcmdr options...

5. Bonferroni outlier test

'Models > Numerical diagnostics' 카테고리의 다른 글

Delta method confidence interval...

Bootstrap confidence intervals...

+ Recent posts

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역