Notice
Recent Posts
Recent Comments
Link
«   2025/05   »
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31
Archives
Today
Total
관리 메뉴

배우고 느낀 것들

[언데분] 6주차, 7주차 본문

카테고리 없음

[언데분] 6주차, 7주차

낑깡H 2022. 10. 18. 16:13

mode 값(최빈값)은 패키지로만 구현 가능 -> 차라리 함수 그냥 만들어 쓰자! 

 

myt = ldt$length 

mymode= function(x){
  myt = table(x)
  names(myt)[myt==max(myt)]
}
mymode(var)

mode는 굳이 고려 안하는 이유: range가 넓거나, 연속 분포일 경우 겹칠 확률이 어차피 적기 때문에 무의미함. 

 

Interquartile range(사분범위):

왜? -> outlier 값 제거하기 위한 기준으로 사용될 수 있음, 정규분포가 아닌 경우 유용함. 

 

IQR(A) # A의 IQR 값 

summary(A) # 1st qu 구해서 1.5 IQR 빼고 더하면 이상치 범위 확인 가능

 

히스토그램 반복적으로 만들기

 

#기본형 히스토그램
hist(A, main = "Word length", xlab = "Number of letters", col = "yellow") 

#확률 함수 
hist(A, main = "Word length", xlab = "Number of letters", col = "yellow", prob = TRUE) 

#선 그리기 : A에 대해 density를 기준으로 보조선을 그림. lwd는 선의 굵기 
lines(density(A), lwd = 1.5)

#평균에 대한 보조선 -> mean 대신 median도 가능 
abline(v = mean(A), col = "red", lwd = 1)

#legend: 범례, x: 범례 위치 cex:범례 사이즈
legend(x = "topleft", c("mean", "median"), col=c("red", "blue"), lwd = 1, cex = 0.5)

R에서 모형 저장하기

 

1)
jpeg("test.jpg")
> hist(A)
> dev.off()


2) 
사진 우클릭해서 저장 

Comments