일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
Tags
- throws 키워드
- 실행 예외
- 예외 처리
- 일반 예외
- 항해99
- 개발자취업
- 코딩테스트준비
- 다중 catch 블록
- try-catch-finally 블록
- 예외클래스
- 99클럽
- 예외
- til
- 로켓펀치 #취준컴퍼니 #취업 #일상 #취준생
Archives
- Today
- Total
목록빅데이터 R (3)
innn
2022.07.31
워드 클라우드는 문자형 데이터를 다루는 대표적인 데이터 분석기법 가령 저장명도 늘 영어로 해야함 전세계적으로 관심을 갖는 건 구글 트렌드에서 찾으면 됨.. 국내 데이터는 네이버 데이터랩을 이용할것 워드클라우드는 R을 이용해서 R에 뿌려진 데이터를 자바에서 실핼하게 하면됌(프론트엔드로 보여지게하고) 원유 가격 등 주식 시세에 영향을 미치는 요인들을 독립변수라 한다. 독립변수가 한 개인건 단순 회귀 독립변수가 두 개 이상인 건 다중 회귀 R엔느 없지만 머신러닝에는 다항 회귀가 있다. 예를 들면 기상청의 날씨 자료를 이용해서 아이스크림 판매량을 알 수 있는 것 스피드가 1위치에 가면 1인데 제동거리는 -가 된다. 스피드가 1일때, 제공거리가 마이너스로 나오는 것이 최대 약점 그래서 2차함수로 하는 게 정확하다..
빅데이터 R
2022. 7. 31. 20:26
단일변수 범주형 자료 탐색
평균값은 평균인데, 데이터의 의미가 중앙값이 왜 중요하냐면, 평균값에 튀는 숫자 120같은게 있으면 의미가 없다. 이럴때 중앙값을 많이 본다. 그래서. 절사 평균이란, 관측된 자료값 중에서 작은 값의 하위 n프로와 큰값의 상위n프로를 제외하고 나머지를 가지고 평균 계산하는거 왜? 튀는 값을 뺴고 평균을 재기 위해서.
빅데이터 R/R
2022. 7. 17. 20:48