이번 시험은 많이 부족했다.
확실히 코딩 부분에서 약점을 많이 보인 것 같다.
이번 시험은 안될 것 같으니 반성과 함께 다음 시험을 위한 준비를 미리 해둬야겠다.
1. 전체적인 코딩 process 세우기
2. 모델링/예측/점수평가 방법 확실하게 숙지(roc accuracy rmse f1스코어 에러안나게 돌리는 방법 / 배열과 형태 등을 모두 확인
3. 모델 수정(하이퍼파라미터 변경) 해서 모델 auc나 f1스코어 높이는법 연습
4. 스케일링 했을때 안했을때 차이 확인
단답형 개념 공부
JSON / 최소제곱법 / Box cox / 차원축소
som / 정규성 / svm / 드롭아웃 / 스쿱
f1 스코어 계산. 조화평균. 정확도 정밀도 같은 개념 필공부(recall 0.8 precision 0.6)
작업형 개념 공부
1. 사분위수 구하기 - 3사분위수와 1사분위수 차이 - 절대값씌우기 - 소수점이하 버림-정수처리-R에서 [1] oo 이중에 [1] 안나오게 cat 로 표시하는 방법
: cat 함수 사용법
: 정수처리와 반올림, 버림 함수
2. 데이터 처리 및 조건 정리. 좋아요, 매우좋아요 2개를 더해서 그레이트 파생변수 생성. 그레이트/총넘버 비율이 0.4-0.5 사이를 필터링. 유형은 video. 총 갯수는?
: 데이터 정렬 및 처리 방법
3. 넷플릭스 데이터 필터링 제작사 영국 단독, 제작일 2018-1월 인 것들 몇개 있는가?(데이터 취급해서 필터링 하는 방법 필요)
결측치 , 빈칸 등이 있었다고 함.
: 날짜형 데이터 필터 및 정리 방법 숙지
작업형2
0.5 초중반
데이터1 train 가족단위로 분류.
데이터2 test 를 가족단위 분류해 보아라.
(test 데이터셋에는 가족단위 행이 없음)
F1 스코어 기준으로 젤 좋은 것 찾기.
과적합일시 감점우려있음.
가족단위 factor화. (Factor와 int 섞여있음).
Train 데이터를 7대3으로 나눠서 모델링.
모델 하나 선정한 후 test 데이터를 모델에 넣어서 결과 추출
제출은 csv 형태로 아래처럼 만들기
'자기계발 > 자격증' 카테고리의 다른 글
[빅데이터 분석기사] 자격증 취득 후기(총정리), 공부 방법, 합격 팁, R 이냐 python이냐? (2) | 2022.07.21 |
---|---|
[빅데이터 분석기사] 실기 후기 - 대구 시험장 선택 (영진직업전문학교) (0) | 2022.06.26 |
[빅데이터 분석기사] 실기 모의고사 3회 - 1/2 (R tool 사용) (0) | 2022.06.21 |
[빅데이터 분석기사] 실기 모의고사 2회 - 2/2 (0) | 2022.06.20 |
[빅데이터 분석기사] 실기 모의고사 2회 - 1/2 (0) | 2022.06.19 |
댓글