[언데분] 6주차, 7주차

Notice

Recent Posts

Recent Comments

Link

« 2025/07 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

배우고 느낀 것들

[언데분] 6주차, 7주차 본문

카테고리 없음

[언데분] 6주차, 7주차

낑깡H 2022. 10. 18. 16:13

mode 값(최빈값)은 패키지로만 구현 가능 -> 차라리 함수 그냥 만들어 쓰자!

myt = ldt$length 

mymode= function(x){
  myt = table(x)
  names(myt)[myt==max(myt)]
}
mymode(var)

mode는 굳이 고려 안하는 이유: range가 넓거나, 연속 분포일 경우 겹칠 확률이 어차피 적기 때문에 무의미함.

Interquartile range(사분범위):

왜? -> outlier 값 제거하기 위한 기준으로 사용될 수 있음, 정규분포가 아닌 경우 유용함.

IQR(A) # A의 IQR 값 

summary(A) # 1st qu 구해서 1.5 IQR 빼고 더하면 이상치 범위 확인 가능

히스토그램 반복적으로 만들기

#기본형 히스토그램
hist(A, main = "Word length", xlab = "Number of letters", col = "yellow") 

#확률 함수 
hist(A, main = "Word length", xlab = "Number of letters", col = "yellow", prob = TRUE) 

#선 그리기 : A에 대해 density를 기준으로 보조선을 그림. lwd는 선의 굵기 
lines(density(A), lwd = 1.5)

#평균에 대한 보조선 -> mean 대신 median도 가능 
abline(v = mean(A), col = "red", lwd = 1)

#legend: 범례, x: 범례 위치 cex:범례 사이즈
legend(x = "topleft", c("mean", "median"), col=c("red", "blue"), lwd = 1, cex = 0.5)

R에서 모형 저장하기

1)
jpeg("test.jpg")
> hist(A)
> dev.off()

2)
사진 우클릭해서 저장

Comments

배우고 느낀 것들

[언데분] 6주차, 7주차 본문

[언데분] 6주차, 7주차

티스토리툴바