자기계발/자격증

[빅데이터 분석기사] 6/25 실기 후기 및 다음 시험을 위한 준비

혁이e 2022. 6. 25.

이번 시험은 많이 부족했다.
확실히 코딩 부분에서 약점을 많이 보인 것 같다.

https://m.blog.naver.com/konistech1004/222501556166?imageCode=MjAyMTA5MTBfMjI1%2FMDAxNjMxMjU3MTUzMDcz.o9q96IeQocJ6e6sReNgT-lOxEsotpMYV_0AXEuslsMcg.luUzPceV4DhkZxKpBv41td1EluRSOIV6csnkCgcOf-Ag.PNG.konistech1004


이번 시험은 안될 것 같으니 반성과 함께 다음 시험을 위한 준비를 미리 해둬야겠다.

1. 전체적인 코딩  process 세우기
2. 모델링/예측/점수평가 방법 확실하게 숙지(roc accuracy rmse f1스코어 에러안나게 돌리는 방법 / 배열과 형태 등을 모두 확인
3. 모델 수정(하이퍼파라미터 변경) 해서 모델 auc나 f1스코어 높이는법 연습
4. 스케일링 했을때 안했을때 차이 확인

단답형 개념 공부
JSON / 최소제곱법 / Box cox / 차원축소
som / 정규성  / svm / 드롭아웃 / 스쿱
f1 스코어 계산. 조화평균. 정확도 정밀도 같은 개념 필공부(recall 0.8 precision 0.6)

작업형 개념 공부
1. 사분위수 구하기 - 3사분위수와 1사분위수 차이 - 절대값씌우기 - 소수점이하 버림-정수처리-R에서 [1] oo  이중에 [1] 안나오게 cat 로 표시하는 방법
: cat 함수 사용법
: 정수처리와 반올림, 버림 함수

2. 데이터 처리 및 조건 정리. 좋아요, 매우좋아요 2개를 더해서 그레이트 파생변수 생성. 그레이트/총넘버 비율이 0.4-0.5 사이를 필터링. 유형은 video. 총 갯수는?
: 데이터 정렬 및 처리 방법

3. 넷플릭스 데이터 필터링 제작사 영국 단독, 제작일 2018-1월 인 것들 몇개 있는가?(데이터 취급해서 필터링 하는 방법 필요)
결측치 , 빈칸 등이 있었다고 함.
: 날짜형 데이터 필터 및 정리 방법 숙지


작업형2
0.5 초중반

데이터1 train 가족단위로 분류.
데이터2 test 를 가족단위 분류해 보아라.
(test 데이터셋에는 가족단위 행이 없음)

F1 스코어 기준으로 젤 좋은 것 찾기.
과적합일시 감점우려있음.

가족단위 factor화. (Factor와 int 섞여있음).
Train 데이터를 7대3으로 나눠서 모델링.
모델 하나 선정한 후 test 데이터를 모델에 넣어서 결과 추출

제출은 csv 형태로 아래처럼 만들기

 

 

댓글

💲 추천 글