일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- PolynomialFeatures
- 실기
- ADP
- SQL
- docker
- 토익스피킹
- 코딩테스트
- Crawling
- sarima
- GridSearchCV
- 변동성돌파전략
- 파이썬
- Python
- 데이터분석
- lstm
- Programmers
- hackerrank
- 파트5
- 비트코인
- randomforest
- 주식
- 볼린저밴드
- 파이썬 주식
- 빅데이터분석기사
- 데이터분석전문가
- 프로그래머스
- backtest
- Quant
- 백테스트
- TimeSeries
- Today
- Total
목록회귀분석 (2)
데이터 공부를 기록하는 공간

import pandas as pd import numpy as np train = pd.read_csv("./house-prices-advanced-regression-techniques/train.csv") test = pd.read_csv("./house-prices-advanced-regression-techniques/test.csv") y_train = train['SalePrice'] # null data 확인 ex_cols = train.isnull().sum().sort_values(ascending=False).head(6).index.tolist() # null data drop train.drop(ex_cols,axis=1, inplace=True) train.drop('Id',ax..

kaggle > restaurant revenue 1. EDA import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import warnings warnings.filterwarnings('ignore') pd.options.display.max_columns=None train_df = pd.read_csv("./restaurant-revenue-prediction/train.csv") test_df = pd.read_csv("./restaurant-revenue-prediction/test.csv") train_df['part'] = 'train' test_df['part'] = 'test..