빅분기 실기 R 코드3 [빅데이터 분석기사] 실기 모의고사 2회 - 2/2 작업형 2 1. 고객의 대출 정보인 Loan 데이터 세트에서 전체 데이터를 7:3 으로 훈련 / 테스트 데이터로 분할하고, 테스트 데이터로 고객의 대출상환 (loan_status)을 예측하고 csv 포맷으로 제출하시오. → 해설 이상. 정보 부족한 문제임 → 대출상환 (loan_status)가 PAIDOFF 인 경우는 삭제하고, 다른 경우일 때만 가지고 모델링 연습 # 데이터 로드 > ds str(ds) 'data.frame': 500 obs. of 11 variables: $ Loan_ID : chr "xqd20166231" "xqd20168902" "xqd20160003" "xqd20160004" ... $ loan_status : chr "PAIDOFF" "PAIDOFF" "PAIDOFF" "PAI.. 자기계발/자격증 2022. 6. 20. [빅데이터 분석기사] 실기 모의고사 1회 - 1/2 빅데이터 분석기사 실기 모의고사를 풀이해 보았다. (1) 필답형 크롤링 / 메타데이터 / 차원의 저주 / 요인분석 / CART / 단순 확률 대치법 분포 시각화 / 등분산성 / 단계별 선택법 / 엘보우 기법 (2) 작업형 1. BostonHousing 데이터 세트에서 본인 소유의 주택 가격(medv)에서 상위 50개의 데이터에 대해서 최소값으로 변환한 후 타운별 1인당 범죄율(crim)이 1 이상인 데이터의 평균은 ? > library(mlbench) > library(dplyr) > data("BostonHousing") > ds str(ds) 'data.frame': 506 obs. of 14 variables: $ crim : num 0.00632 0.02731 0.02729 0.03237 0.06.. 자기계발/자격증 2022. 6. 17. [빅데이터 분석기사] 2회 기출문제 연습(R 코드) - 2/3 빅데이터 분석기사 실기 2회 기출문제 풀이 R 연습 2번째이다. 이번에도 작업형 1유형 문제 두가지를 풀어보았고 R 코드와 실행 결과는 다음과 같다. 이번에도 저작권 관련해서 문제를 복원할 순 없고, 비슷한 느낌으로다가 풀어보았다. 1. 주어진 데이터를 첫번째 행부터 80%까지를 훈련 데이터로 추출하고, 'total_bedrooms' 변수의 결측값(NA)을 'total_bedrooms' 변수의 중앙값으로 대체하고 대체 전/후의 표준편차 차이의 절대값을 구하여라. # 데이터 불러오기 > ds str(ds) 'data.frame': 20640 obs. of 10 variables: $ longitude : num -122 -122 -122 -122 -122 ... $ latitude : num 37.9 37.. 자기계발/자격증 2022. 6. 15. 이전 1 다음 💲 추천 글