일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 실기
- ADP
- GridSearchCV
- 프로그래머스
- Crawling
- 파이썬 주식
- sarima
- randomforest
- Python
- 백테스트
- hackerrank
- 코딩테스트
- Quant
- 비트코인
- PolynomialFeatures
- 토익스피킹
- 주식
- 빅데이터분석기사
- 변동성돌파전략
- SQL
- 파이썬
- backtest
- 파트5
- 데이터분석
- Programmers
- docker
- lstm
- 데이터분석전문가
- TimeSeries
- 볼린저밴드
- Today
- Total
목록classification (2)
데이터 공부를 기록하는 공간

XGBOOST로 해보기 # 데이터불러오기 X_train = pd.read_csv("C:/Users/###/Downloads/빅데이터분석기사 실기/[Dataset] 작업형 제2유형/X_train.csv",encoding='cp949') X_test = pd.read_csv("C:/Users/###/Downloads/빅데이터분석기사 실기/[Dataset] 작업형 제2유형/X_test.csv",encoding='cp949') y_train = pd.read_csv("C:/Users/###/Downloads/빅데이터분석기사 실기/[Dataset] 작업형 제2유형/y_train.csv",encoding='cp949') print(X_train.shape, X_test.shape, y_train.shape) X_t..

1. 데이터 전처리 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns df = pd.read_csv("./mobile_cust_churn/mobile_cust_churn.csv") df.drop(columns=['Unnamed: 0','id'], axis=1, inplace=True) target = 'CHURN' features = df.columns.tolist()[:-1] numeric_features = df.select_dtypes(include=['int64']).columns.tolist() category_features= [] for col in features: if co..