배우고 느낀 것들
[언데분] 6주차, 7주차 본문
mode 값(최빈값)은 패키지로만 구현 가능 -> 차라리 함수 그냥 만들어 쓰자!
myt = ldt$length
mymode= function(x){
myt = table(x)
names(myt)[myt==max(myt)]
}
mymode(var)
mode는 굳이 고려 안하는 이유: range가 넓거나, 연속 분포일 경우 겹칠 확률이 어차피 적기 때문에 무의미함.
Interquartile range(사분범위):
왜? -> outlier 값 제거하기 위한 기준으로 사용될 수 있음, 정규분포가 아닌 경우 유용함.
IQR(A) # A의 IQR 값
summary(A) # 1st qu 구해서 1.5 IQR 빼고 더하면 이상치 범위 확인 가능
히스토그램 반복적으로 만들기
#기본형 히스토그램
hist(A, main = "Word length", xlab = "Number of letters", col = "yellow")
#확률 함수
hist(A, main = "Word length", xlab = "Number of letters", col = "yellow", prob = TRUE)
#선 그리기 : A에 대해 density를 기준으로 보조선을 그림. lwd는 선의 굵기
lines(density(A), lwd = 1.5)
#평균에 대한 보조선 -> mean 대신 median도 가능
abline(v = mean(A), col = "red", lwd = 1)
#legend: 범례, x: 범례 위치 cex:범례 사이즈
legend(x = "topleft", c("mean", "median"), col=c("red", "blue"), lwd = 1, cex = 0.5)
R에서 모형 저장하기
1)
jpeg("test.jpg")
> hist(A)
> dev.off()
2)
사진 우클릭해서 저장
Comments