# 필요한 라이브러리 설치
!pip install pykrx tensorflow matplotlib pandas numpy scikit-learn
# 라이브러리 임포트
from pykrx import stock
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.preprocessing import MinMaxScaler
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense, Dropout
from datetime import datetime, timedelta
# 1. LG전자의 OHLCV와 펀더멘털 지표 가져오기
def get_lg_data():
ticker = "066570" # LG전자 종목코드
today = datetime.today().strftime("%Y%m%d")
one_year_ago = (datetime.today() - timedelta(days=365)).strftime("%Y%m%d")
# OHLCV 데이터 가져오기
ohlcv = stock.get_market_ohlcv_by_date(one_year_ago, today, ticker)
# 펀더멘털 데이터 가져오기
fundamentals = stock.get_market_fundamental_by_date(one_year_ago, today, ticker)
# OHLCV와 펀더멘털 데이터를 합치기
data = pd.concat([ohlcv, fundamentals], axis=1)
return data
data = get_lg_data()
# 2. 데이터 전처리 (종가와 PER을 입력으로 사용)
def preprocess_data(data):
df = data[['종가', 'PER']].dropna() # 종가와 PER만 사용
# MinMaxScaler로 데이터 정규화
scaler = MinMaxScaler()
scaled_data = scaler.fit_transform(df)
# LSTM 입력에 맞게 시퀀스 데이터 만들기
X, y = [], []
seq_length = 10 # 10일 동안의 데이터를 사용하여 다음날을 예측
for i in range(len(scaled_data) - seq_length):
X.append(scaled_data[i:i+seq_length])
y.append(scaled_data[i+seq_length, 0]) # 종가를 예측
X = np.array(X)
y = np.array(y)
return X, y, scaler
X, y, scaler = preprocess_data(data)
# 3. LSTM 모델 생성 및 학습
def create_lstm_model():
model = Sequential()
model.add(LSTM(units=50, return_sequences=True, input_shape=(X.shape[1], X.shape[2])))
model.add(Dropout(0.2))
model.add(LSTM(units=50))
model.add(Dropout(0.2))
model.add(Dense(1)) # 종가 예측을 위한 출력층
model.compile(optimizer='adam', loss='mean_squared_error')
return model
model = create_lstm_model()
# 모델 학습
model.fit(X, y, epochs=20, batch_size=32)
# 4. 주가 예측 및 시각화
def predict_future_prices(model, data, scaler, days=7):
# 최근 10일간의 데이터를 가져와서 예측에 사용
recent_data = data[-10:]
scaled_recent_data = scaler.transform(recent_data[['종가', 'PER']].values)
# 예측할 일주일 동안의 데이터
predictions = []
for _ in range(days):
input_data = scaled_recent_data[-10:].reshape(1, 10, 2)
predicted_price = model.predict(input_data)
predictions.append(predicted_price[0, 0])
# 새로운 예측값을 기존 데이터에 추가
scaled_recent_data = np.vstack([scaled_recent_data, [[predicted_price[0, 0], scaled_recent_data[-1, 1]]]])
# 예측된 종가 값을 스케일링 복원
predicted_prices = scaler.inverse_transform(np.array(predictions).reshape(-1, 1))
return predicted_prices
predicted_prices = predict_future_prices(model, data, scaler)
# 실제 종가와 예측 종가 시각화
def plot_predictions(data, predicted_prices):
plt.figure(figsize=(10,6))
# 실제 데이터 시각화
plt.plot(data.index, data['종가'], label='Actual Prices', color='blue')
# 예측 데이터 시각화
future_dates = pd.date_range(start=data.index[-1] + timedelta(days=1), periods=len(predicted_prices))
plt.plot(future_dates, predicted_prices, label='Predicted Prices', linestyle='--', color='orange')
plt.title("LG Electronics Stock Price Prediction")
plt.xlabel("Date")
plt.ylabel("Price")
plt.legend()
plt.grid()
plt.show()
plot_predictions(data, predicted_prices)
- LG전자의 데이터 가져오기: get_lg_data() 함수에서 LG전자의 종목 코드를 사용하여 오늘부터 1년 동안의 OHLCV 및 펀더멘털 지표를 가져옵니다.
- 데이터 전처리: preprocess_data() 함수에서 종가와 PER를 사용하여 LSTM 모델의 입력 데이터로 변환합니다. 데이터를 정규화하고, 시퀀스 데이터를 생성합니다.
- LSTM 모델 생성: create_lstm_model() 함수에서 LSTM 모델을 구성합니다. 여기서는 두 개의 LSTM 레이어와 드롭아웃 레이어를 추가하여 과적합을 방지합니다.
- 모델 학습: LSTM 모델을 학습시킵니다.
- 주가 예측 및 시각화: predict_future_prices() 함수에서 모델을 사용하여 향후 7일 간의 주가를 예측합니다. plot_predictions() 함수에서 실제 주가와 예측된 주가를 시각화합니다.
'프로그래밍 > 파이썬' 카테고리의 다른 글
주식 예측 모델 (2) | 2024.10.10 |
---|---|
주식거래 시스템을 위한 준비 (0) | 2024.10.06 |