반응형 자기계발/자격증17 [빅데이터 분석기사] 자격증 취득 후기(총정리), 공부 방법, 합격 팁, R 이냐 python이냐? 오늘은 빅데이터 분석기사 합격 후기 를 마지막으로 남기고자 한다. 일단 글쓴이는 통계학이나 컴퓨터 전공자는 아니며, 개인적인 호기심으로 파이썬은 어떤 것이고 R 은 어떤것이고 하는 기본서 한권정도는 읽은 상태였다(Base 가 0 는 아님) 필기 공부기간은 3주, 마지막 1주일은 빡세게 했음. 실기 공부기간은 2주, 역시 마지막 1주일은 빡세게 함. 우선 인증.. 1. 최종 합격 자격증 2. 상세 내용 (취득 점수) 1) 필기 필기는 위기였다. 아슬아슬했다. 시험이 초창기고 매회 계속 내용들이 바껴서 기본서들이 좋다 싶은 것들은 없었다. 아에 책에 없는 개념들도 시험에 많이 나오는 수준이었으니, 지엽적인 것 말고 굵직굵직한것들만 외워서 60점을 목표로 하자. [빅데이터 분석기사] 필기 합격 후기, 공부 방.. 자기계발/자격증 2022. 7. 21. [빅데이터 분석기사] 실기 후기 - 대구 시험장 선택 (영진직업전문학교) 빅데이터 분석기사 실기 시험장 후기이다. 대구 영진직업전문학교에 갔다왔고, 차 있는 사람들에게는 괜찮은 선택지가 될 것 같다. 실기 결과가 안좋을 것 같은데, 준비 잘 해서 다음 시험도 이곳에서 칠 예정이다. (9시쯤 도착했고 학교 주차장에 주차가 가능했다. 주차 대수가 몇대 안되서 일찍 가야 주차가 가능할 것 같음) 네이버 지도뷰랑 똑같이 생겼다. 애증의 빅데이터 분석기사 시험. 이번 시험은 별관에서 진행. 본관에서도 다른 자격증 시험이 진행되고 있었다. 교실이 2개밖에 안되는거 보니 아직 응시인원이 많지는 않은 것 같다. 응시자 유의사항. 9시30분까지 입실 해야 한다. 무료 특강이 많다. 열원설치 ERP 용접 강의는 취업에도 도움이 많이 될 것 같다. 내가 조금만 젊었더라도.. 오늘의 시험장인 4층.. 자기계발/자격증 2022. 6. 26. [빅데이터 분석기사] 6/25 실기 후기 및 다음 시험을 위한 준비 이번 시험은 많이 부족했다. 확실히 코딩 부분에서 약점을 많이 보인 것 같다. 이번 시험은 안될 것 같으니 반성과 함께 다음 시험을 위한 준비를 미리 해둬야겠다. 1. 전체적인 코딩 process 세우기 2. 모델링/예측/점수평가 방법 확실하게 숙지(roc accuracy rmse f1스코어 에러안나게 돌리는 방법 / 배열과 형태 등을 모두 확인 3. 모델 수정(하이퍼파라미터 변경) 해서 모델 auc나 f1스코어 높이는법 연습 4. 스케일링 했을때 안했을때 차이 확인 단답형 개념 공부 JSON / 최소제곱법 / Box cox / 차원축소 som / 정규성 / svm / 드롭아웃 / 스쿱 f1 스코어 계산. 조화평균. 정확도 정밀도 같은 개념 필공부(recall 0.8 precision 0.6) 작업형.. 자기계발/자격증 2022. 6. 25. [빅데이터 분석기사] 실기 모의고사 3회 - 1/2 (R tool 사용) 모의고사 3회 연습 풀이 R 코드이다. (1) 필답형 CDC (Change Data Capture) / 강화 학습 / 모멘텀 / 다차원 척도법 랜덤 포레스트 / 데이터 비식별화 / 임베디드 기법 / k-익명성 / DBSACN 알고리즘 / 이익 도표(Gain chart) (2) 작업형 1. R의 esoph 데이터 세트를 이용, 환자 수(ncases)와 대조군 수(ncontrols)를 합한 새로운 칼럼인 관측자 수(nsums)를 생성하고, 음주량과 흡연량에 따른 관측자 수의 이원교차표(two-way table)를 생성하여 확인하고 카이제곱 값을 구하시오. # 데이터 로드 > ds str(ds) 'data.frame': 88 obs. of 5 variables: $ agegp : Ord.factor w/ 6 .. 자기계발/자격증 2022. 6. 21. [빅데이터 분석기사] 실기 모의고사 2회 - 2/2 작업형 2 1. 고객의 대출 정보인 Loan 데이터 세트에서 전체 데이터를 7:3 으로 훈련 / 테스트 데이터로 분할하고, 테스트 데이터로 고객의 대출상환 (loan_status)을 예측하고 csv 포맷으로 제출하시오. → 해설 이상. 정보 부족한 문제임 → 대출상환 (loan_status)가 PAIDOFF 인 경우는 삭제하고, 다른 경우일 때만 가지고 모델링 연습 # 데이터 로드 > ds str(ds) 'data.frame': 500 obs. of 11 variables: $ Loan_ID : chr "xqd20166231" "xqd20168902" "xqd20160003" "xqd20160004" ... $ loan_status : chr "PAIDOFF" "PAIDOFF" "PAIDOFF" "PAI.. 자기계발/자격증 2022. 6. 20. [빅데이터 분석기사] 실기 모의고사 2회 - 1/2 모의고사 2회 공부 자료. 길가면서도 폰으로 항상 읽어보면서 공부할 것. (1) 필답형 연관규칙 분석 / 매개변수(Parameter) / 준지도학습 / 데이터 레이크 / LOD (Linked Open Data) ETL (Extract Transform Load) / K-평균 군집화 / 기술 통계 / 데이터 프로파일링 / 앙상블 기법 (2) 작업형 1. ISLR 패키지의 Carseat 데이터 세트에서 매출(Sales)의 이상값을 제외한 데이터를 훈련 데이터로 선정할 때, Age 의 표준편차를 구하시오(이상값은 평균보다 1.5 표준편차 이하거나 이상인 값이다) # 데이터 로드 및 확인 > data(Carseats) > ds str(ds) 'data.frame': 400 obs. of 11 variables:.. 자기계발/자격증 2022. 6. 19. [빅데이터 분석기사] 실기 모의고사 1회 - 2/2 작업형 제2 유형 모델 분석이다. 이문제들은 항상 까다로운 것 같다. 1. iris 데이터 세트에서 Species rpart, svm 예측 모형을 만든 후 높은 Accuracy 값을 가지는 모델의 예측값을 csv 파일로 제출하시오. 분석 순서는 데이터 결측치 확인 - 데이터 정규화(표준화) - 모델분석(회귀분석, 변수선택, 앙상블(랜덤포레스트) - 결과출력 순서로 진행하였다. # 데이터 로드 > data("iris") > ds str(ds) 'data.frame': 150 obs. of 5 variables: $ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ... $ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 .. 자기계발/자격증 2022. 6. 18. [빅데이터 분석기사] 실기 모의고사 1회 - 1/2 빅데이터 분석기사 실기 모의고사를 풀이해 보았다. (1) 필답형 크롤링 / 메타데이터 / 차원의 저주 / 요인분석 / CART / 단순 확률 대치법 분포 시각화 / 등분산성 / 단계별 선택법 / 엘보우 기법 (2) 작업형 1. BostonHousing 데이터 세트에서 본인 소유의 주택 가격(medv)에서 상위 50개의 데이터에 대해서 최소값으로 변환한 후 타운별 1인당 범죄율(crim)이 1 이상인 데이터의 평균은 ? > library(mlbench) > library(dplyr) > data("BostonHousing") > ds str(ds) 'data.frame': 506 obs. of 14 variables: $ crim : num 0.00632 0.02731 0.02729 0.03237 0.06.. 자기계발/자격증 2022. 6. 17. [빅데이터 분석기사] 2회 기출문제 연습(R 코드) - 3/3 빅데이터 분석기사, 빅분기 실기 중 가장 어려운 작업형 2유형 연습 코드이다. 이 문제는 전체적인 데이터 분석의 Flow 를 따라가는 것이 중요하다고 생각한다. kdata 데이터자격검정 공식 홈페이지의 실기 체험하기에서는 -. 데이터 전처리 , Feature Engineering, 분류 알고리즘 사용, 초매개변수 최적화, 모형 앙상블 등이 수반되어야 함 -. 수험번호.csv 파일이 만들어지도록 코드 제출 -. ROC-AUC 평가지표에 따라 모델 성능 채점 -. 데이터 저장은 다음과 같이 데이터 테이블 형식임. 이 점들을 고려해서 작업형 제2유형 기출문제 풀이를 진행하였다. 이전과 마찬가지로 R 을 사용하였고, 모든 것을 완벽하게 하기 보다는 적당하게 알짜만 가져가서 부분점수를 노리는 공략이다. 데이터 전.. 자기계발/자격증 2022. 6. 16. [빅데이터 분석기사] 2회 기출문제 연습(R 코드) - 2/3 빅데이터 분석기사 실기 2회 기출문제 풀이 R 연습 2번째이다. 이번에도 작업형 1유형 문제 두가지를 풀어보았고 R 코드와 실행 결과는 다음과 같다. 이번에도 저작권 관련해서 문제를 복원할 순 없고, 비슷한 느낌으로다가 풀어보았다. 1. 주어진 데이터를 첫번째 행부터 80%까지를 훈련 데이터로 추출하고, 'total_bedrooms' 변수의 결측값(NA)을 'total_bedrooms' 변수의 중앙값으로 대체하고 대체 전/후의 표준편차 차이의 절대값을 구하여라. # 데이터 불러오기 > ds str(ds) 'data.frame': 20640 obs. of 10 variables: $ longitude : num -122 -122 -122 -122 -122 ... $ latitude : num 37.9 37.. 자기계발/자격증 2022. 6. 15. [빅데이터 분석기사] 2회 기출문제 연습(R 코드) - 1/3 2회 기출문제를 R 을 활용하여 연습해 본 결과물이다. 문제를 복원하는 것은 문제가 될 수도 있으니 필답형은 개념만 공유하고, 작업형은 실습한 코드를 공유 한다. (정답이 아닐 수도 있지만, 어느 정도 부분점수는 당연히 기대할 수 있을 것이다) (1) 필답형 이상치 / 평균대치법 / 초매개변수 / 비지도학습 / 과대적합 / 후진 소거법 / 부스팅 GBM(Gradient Boost Machine) / 노드 계산(가중치, bias 포함) / ROC 곡선 (2) 작업형 1. BostonHousing 데이터 세트에서 crim 항목의 상위에서 10번째 값으로 상위 10개의 값을 변환하고, age 80 이상인 값에 대해서 crim 평균을 구하시오. # BostonHousing 데이터 불러오기 > library(ml.. 자기계발/자격증 2022. 6. 14. [빅데이터 분석기사] 실기 작업형 1 R 코드 - TEST체험하기 (dataq 예시문제) 빅데이터 분석기사 실기를 준비하고 있다. 장기간 사용하려면 파이썬이 용이하지만 단기간에 합격하기에는 R 이 용이하다는 얘기가 있어 R 로 공부하고 있는데, 빅분기 실기 R 코드들이 많지 않아 정리하면서 진행하려고 한다. R 에 대해 깊이 있게 공부하기 보다는, 시험 합격을 목표로 하여 제한적으로 공부하는 글이니 빅분기 실기 준비하시는 분들에게 많은 도움이 되면 좋겠다. 기본적인 R 사용법은 위키독스에서 R 기본서를 참고하며 실습 한번 해보면 되는데, 금방 할 수 있다. 기초 문법만 일단 실습을 하고, 시험 준비를 시작하면 된다. 중급 문법과 실제 분석 case들은 시험에 맞게 따로 준비. https://wikidocs.net/book/4315 Must Learning with R (개정판) MustLea.. 자기계발/자격증 2022. 6. 14. 이전 1 2 다음 💲 추천 글 반응형