빅분기 실기5 [빅데이터 분석기사] 6/25 실기 후기 및 다음 시험을 위한 준비 이번 시험은 많이 부족했다. 확실히 코딩 부분에서 약점을 많이 보인 것 같다. 이번 시험은 안될 것 같으니 반성과 함께 다음 시험을 위한 준비를 미리 해둬야겠다. 1. 전체적인 코딩 process 세우기 2. 모델링/예측/점수평가 방법 확실하게 숙지(roc accuracy rmse f1스코어 에러안나게 돌리는 방법 / 배열과 형태 등을 모두 확인 3. 모델 수정(하이퍼파라미터 변경) 해서 모델 auc나 f1스코어 높이는법 연습 4. 스케일링 했을때 안했을때 차이 확인 단답형 개념 공부 JSON / 최소제곱법 / Box cox / 차원축소 som / 정규성 / svm / 드롭아웃 / 스쿱 f1 스코어 계산. 조화평균. 정확도 정밀도 같은 개념 필공부(recall 0.8 precision 0.6) 작업형.. 자기계발/자격증 2022. 6. 25. [빅데이터 분석기사] 실기 모의고사 3회 - 1/2 (R tool 사용) 모의고사 3회 연습 풀이 R 코드이다. (1) 필답형 CDC (Change Data Capture) / 강화 학습 / 모멘텀 / 다차원 척도법 랜덤 포레스트 / 데이터 비식별화 / 임베디드 기법 / k-익명성 / DBSACN 알고리즘 / 이익 도표(Gain chart) (2) 작업형 1. R의 esoph 데이터 세트를 이용, 환자 수(ncases)와 대조군 수(ncontrols)를 합한 새로운 칼럼인 관측자 수(nsums)를 생성하고, 음주량과 흡연량에 따른 관측자 수의 이원교차표(two-way table)를 생성하여 확인하고 카이제곱 값을 구하시오. # 데이터 로드 > ds str(ds) 'data.frame': 88 obs. of 5 variables: $ agegp : Ord.factor w/ 6 .. 자기계발/자격증 2022. 6. 21. [빅데이터 분석기사] 2회 기출문제 연습(R 코드) - 3/3 빅데이터 분석기사, 빅분기 실기 중 가장 어려운 작업형 2유형 연습 코드이다. 이 문제는 전체적인 데이터 분석의 Flow 를 따라가는 것이 중요하다고 생각한다. kdata 데이터자격검정 공식 홈페이지의 실기 체험하기에서는 -. 데이터 전처리 , Feature Engineering, 분류 알고리즘 사용, 초매개변수 최적화, 모형 앙상블 등이 수반되어야 함 -. 수험번호.csv 파일이 만들어지도록 코드 제출 -. ROC-AUC 평가지표에 따라 모델 성능 채점 -. 데이터 저장은 다음과 같이 데이터 테이블 형식임. 이 점들을 고려해서 작업형 제2유형 기출문제 풀이를 진행하였다. 이전과 마찬가지로 R 을 사용하였고, 모든 것을 완벽하게 하기 보다는 적당하게 알짜만 가져가서 부분점수를 노리는 공략이다. 데이터 전.. 자기계발/자격증 2022. 6. 16. [빅데이터 분석기사] 2회 기출문제 연습(R 코드) - 1/3 2회 기출문제를 R 을 활용하여 연습해 본 결과물이다. 문제를 복원하는 것은 문제가 될 수도 있으니 필답형은 개념만 공유하고, 작업형은 실습한 코드를 공유 한다. (정답이 아닐 수도 있지만, 어느 정도 부분점수는 당연히 기대할 수 있을 것이다) (1) 필답형 이상치 / 평균대치법 / 초매개변수 / 비지도학습 / 과대적합 / 후진 소거법 / 부스팅 GBM(Gradient Boost Machine) / 노드 계산(가중치, bias 포함) / ROC 곡선 (2) 작업형 1. BostonHousing 데이터 세트에서 crim 항목의 상위에서 10번째 값으로 상위 10개의 값을 변환하고, age 80 이상인 값에 대해서 crim 평균을 구하시오. # BostonHousing 데이터 불러오기 > library(ml.. 자기계발/자격증 2022. 6. 14. [빅데이터 분석기사] 실기 작업형 1 R 코드 - TEST체험하기 (dataq 예시문제) 빅데이터 분석기사 실기를 준비하고 있다. 장기간 사용하려면 파이썬이 용이하지만 단기간에 합격하기에는 R 이 용이하다는 얘기가 있어 R 로 공부하고 있는데, 빅분기 실기 R 코드들이 많지 않아 정리하면서 진행하려고 한다. R 에 대해 깊이 있게 공부하기 보다는, 시험 합격을 목표로 하여 제한적으로 공부하는 글이니 빅분기 실기 준비하시는 분들에게 많은 도움이 되면 좋겠다. 기본적인 R 사용법은 위키독스에서 R 기본서를 참고하며 실습 한번 해보면 되는데, 금방 할 수 있다. 기초 문법만 일단 실습을 하고, 시험 준비를 시작하면 된다. 중급 문법과 실제 분석 case들은 시험에 맞게 따로 준비. https://wikidocs.net/book/4315 Must Learning with R (개정판) MustLea.. 자기계발/자격증 2022. 6. 14. 이전 1 다음 💲 추천 글