일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- Python
- 데이터분석
- 파트5
- lstm
- 변동성돌파전략
- hackerrank
- 볼린저밴드
- 데이터분석전문가
- 파이썬 주식
- 백테스트
- GridSearchCV
- 실기
- SQL
- docker
- TimeSeries
- sarima
- 토익스피킹
- ADP
- 코딩테스트
- 프로그래머스
- Programmers
- PolynomialFeatures
- Quant
- backtest
- randomforest
- Crawling
- 주식
- 파이썬
- 비트코인
- 빅데이터분석기사
- Today
- Total
목록STUDY/ADP, 빅데이터분석기사 (17)
데이터 공부를 기록하는 공간

kaggle > restaurant revenue 1. EDA import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import warnings warnings.filterwarnings('ignore') pd.options.display.max_columns=None train_df = pd.read_csv("./restaurant-revenue-prediction/train.csv") test_df = pd.read_csv("./restaurant-revenue-prediction/test.csv") train_df['part'] = 'train' test_df['part'] = 'test..

kaggle > forest cover type 1. 데이터 임포트 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import warnings warnings.filterwarnings('ignore') train = pd.read_csv("./forest-cover-type-prediction/train.csv") test = pd.read_csv("./forest-cover-type-prediction/test.csv") print(train.shape, test.shape) train = pd.read_csv("./forest-cover-type-prediction/train.cs..

1. EDA 및 데이터 전처리 2. 다중공선성 처리 3. Train/Valid/Test set으로 분리하기 4. 교호작용 고려 모델링 및 평가 # library import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns # data train = pd.read_csv("./house-prices-advanced-regression-techniques/train.csv") test = pd.read_csv("./house-prices-advanced-regression-techniques/test.csv") # data shape print(train.shape, test.shape) # data s..
15~19회 실기 문제 그루핑 1. 기계학습 (분류문제) - 철강 다중분류(17)(15회), 고객이탈(19회), 고객등급 다중분류(15)(18회) 1.1 데이터 전처리 및 EDA, 시각화 - 결측치 - 데이터 분할 - 범주형 변수/ 연속형 변수 처리 - 상관분석 - 변수선택(VIF) - 파생변수 생성 1.2 모델링 및 평가 - 분류분석 3개 이상 만들기 - logistic cut-off value 찾기 - SVM 규제하기 등 - CSV 파일로 결과 제출하기 - RandomForest, 인공신경망 - confusion_matrix 해석 - precision/sensitivity 결과 출력 - ROC_AUC, F1_Score - 모델 성능개선방안 제시 2. 기계학습 (회귀문제) - 집값 예측(17회) 2.1..