일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 예외 처리
- 예외
- 다중 catch 블록
- try-catch-finally 블록
- throws 키워드
- 일반 예외
- 실행 예외
- til
- 99클럽
- 예외클래스
- 항해99
- 개발자취업
- 로켓펀치 #취준컴퍼니 #취업 #일상 #취준생
- 코딩테스트준비
- Today
- Total
innn
2022.07.31 본문
워드 클라우드는 문자형 데이터를 다루는 대표적인 데이터 분석기법
가령
저장명도 늘 영어로 해야함
전세계적으로 관심을 갖는 건 구글 트렌드에서 찾으면 됨..
국내 데이터는 네이버 데이터랩을 이용할것
워드클라우드는 R을 이용해서 R에 뿌려진 데이터를 자바에서 실핼하게 하면됌(프론트엔드로 보여지게하고)
원유 가격 등 주식 시세에 영향을 미치는 요인들을 독립변수라 한다.
독립변수가 한 개인건 단순 회귀
독립변수가 두 개 이상인 건 다중 회귀
R엔느 없지만 머신러닝에는 다항 회귀가 있다.
예를 들면 기상청의 날씨 자료를 이용해서 아이스크림 판매량을 알 수 있는 것
스피드가 1위치에 가면 1인데 제동거리는 -가 된다.
스피드가 1일때, 제공거리가 마이너스로 나오는 것이 최대 약점
그래서 2차함수로 하는 게 정확하다.
로지스틱 회귀 분석은 LM이 아니라 GLM() 함수를 쓴다.
훈련 세트에 너무 과다하게 학습 못하도록 훼방 놓는것
기울기를 작게 만들기 위해서, 라쏘 회귀를 많이 쓰이는 것.
회귀 모델을 쓸땐 리치 혹은 라쏘 회귀를 많이 쓴다.
시각화 하는데는 R이 제일 편하고
프레딕션할 땐 다중회구ㅣ를 쓸지 단순으로 쓸지 본인 프젝에 맞게 쓴다.
오늘 얘기한 CSV데이터들이 있는 거라면 판다스를 배워서 (스크립트 랭귀지라서 금방 알수 있음) 배워서 넘파일에 ㅁ분석할 수 있다.