일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- Programmers
- Python
- 파트5
- sarima
- GridSearchCV
- 데이터분석전문가
- TimeSeries
- Quant
- SQL
- 백테스트
- Crawling
- 데이터분석
- 빅데이터분석기사
- docker
- 파이썬 주식
- 토익스피킹
- 비트코인
- 변동성돌파전략
- hackerrank
- 파이썬
- 주식
- lstm
- ADP
- PolynomialFeatures
- 실기
- 볼린저밴드
- 코딩테스트
- 프로그래머스
- randomforest
- backtest
- Today
- Total
목록실기 (5)
데이터 공부를 기록하는 공간

XGBOOST로 해보기 # 데이터불러오기 X_train = pd.read_csv("C:/Users/###/Downloads/빅데이터분석기사 실기/[Dataset] 작업형 제2유형/X_train.csv",encoding='cp949') X_test = pd.read_csv("C:/Users/###/Downloads/빅데이터분석기사 실기/[Dataset] 작업형 제2유형/X_test.csv",encoding='cp949') y_train = pd.read_csv("C:/Users/###/Downloads/빅데이터분석기사 실기/[Dataset] 작업형 제2유형/y_train.csv",encoding='cp949') print(X_train.shape, X_test.shape, y_train.shape) X_t..

import pandas as pd import numpy as np train = pd.read_csv("./house-prices-advanced-regression-techniques/train.csv") test = pd.read_csv("./house-prices-advanced-regression-techniques/test.csv") y_train = train['SalePrice'] # null data 확인 ex_cols = train.isnull().sum().sort_values(ascending=False).head(6).index.tolist() # null data drop train.drop(ex_cols,axis=1, inplace=True) train.drop('Id',ax..

XGBOOST를 활용해서 예제문제를 풀어보려고 한다. 1. 데이터불러오기~ 데이터전처리 2. 싸이킷런 래퍼 + 그리드서치 3. 파이썬 래퍼 1. 데이터불러오기~데이터전처리 # 출력을 원하실 경우 print() 활용 # 예) print(df.head()) # 답안 제출 예시 # 수험번호.csv 생성 # DataFrame.to_csv("0000.csv", index=False) ######## 1. 라이브러리 임포트 import pandas as pd import numpy as np from sklearn.preprocessing import StandardScaler from sklearn.preprocessing import LabelEncoder from sklearn.model_selection i..
15~19회 실기 문제 그루핑 1. 기계학습 (분류문제) - 철강 다중분류(17)(15회), 고객이탈(19회), 고객등급 다중분류(15)(18회) 1.1 데이터 전처리 및 EDA, 시각화 - 결측치 - 데이터 분할 - 범주형 변수/ 연속형 변수 처리 - 상관분석 - 변수선택(VIF) - 파생변수 생성 1.2 모델링 및 평가 - 분류분석 3개 이상 만들기 - logistic cut-off value 찾기 - SVM 규제하기 등 - CSV 파일로 결과 제출하기 - RandomForest, 인공신경망 - confusion_matrix 해석 - precision/sensitivity 결과 출력 - ROC_AUC, F1_Score - 모델 성능개선방안 제시 2. 기계학습 (회귀문제) - 집값 예측(17회) 2.1..