728x90
# 필요한 라이브러리 설치
!pip install pykrx tensorflow matplotlib pandas numpy scikit-learn

# 라이브러리 임포트
from pykrx import stock
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.preprocessing import MinMaxScaler
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense, Dropout
from datetime import datetime, timedelta

# 1. LG전자의 OHLCV와 펀더멘털 지표 가져오기
def get_lg_data():
    ticker = "066570"  # LG전자 종목코드
    today = datetime.today().strftime("%Y%m%d")
    one_year_ago = (datetime.today() - timedelta(days=365)).strftime("%Y%m%d")

    # OHLCV 데이터 가져오기
    ohlcv = stock.get_market_ohlcv_by_date(one_year_ago, today, ticker)

    # 펀더멘털 데이터 가져오기
    fundamentals = stock.get_market_fundamental_by_date(one_year_ago, today, ticker)
    
    # OHLCV와 펀더멘털 데이터를 합치기
    data = pd.concat([ohlcv, fundamentals], axis=1)

    return data

data = get_lg_data()

# 2. 데이터 전처리 (종가와 PER을 입력으로 사용)
def preprocess_data(data):
    df = data[['종가', 'PER']].dropna()  # 종가와 PER만 사용

    # MinMaxScaler로 데이터 정규화
    scaler = MinMaxScaler()
    scaled_data = scaler.fit_transform(df)

    # LSTM 입력에 맞게 시퀀스 데이터 만들기
    X, y = [], []
    seq_length = 10  # 10일 동안의 데이터를 사용하여 다음날을 예측

    for i in range(len(scaled_data) - seq_length):
        X.append(scaled_data[i:i+seq_length])
        y.append(scaled_data[i+seq_length, 0])  # 종가를 예측

    X = np.array(X)
    y = np.array(y)

    return X, y, scaler

X, y, scaler = preprocess_data(data)

# 3. LSTM 모델 생성 및 학습
def create_lstm_model():
    model = Sequential()
    model.add(LSTM(units=50, return_sequences=True, input_shape=(X.shape[1], X.shape[2])))
    model.add(Dropout(0.2))
    model.add(LSTM(units=50))
    model.add(Dropout(0.2))
    model.add(Dense(1))  # 종가 예측을 위한 출력층

    model.compile(optimizer='adam', loss='mean_squared_error')
    return model

model = create_lstm_model()

# 모델 학습
model.fit(X, y, epochs=20, batch_size=32)

# 4. 주가 예측 및 시각화
def predict_future_prices(model, data, scaler, days=7):
    # 최근 10일간의 데이터를 가져와서 예측에 사용
    recent_data = data[-10:]
    scaled_recent_data = scaler.transform(recent_data[['종가', 'PER']].values)

    # 예측할 일주일 동안의 데이터
    predictions = []
    for _ in range(days):
        input_data = scaled_recent_data[-10:].reshape(1, 10, 2)
        predicted_price = model.predict(input_data)
        predictions.append(predicted_price[0, 0])

        # 새로운 예측값을 기존 데이터에 추가
        scaled_recent_data = np.vstack([scaled_recent_data, [[predicted_price[0, 0], scaled_recent_data[-1, 1]]]])

    # 예측된 종가 값을 스케일링 복원
    predicted_prices = scaler.inverse_transform(np.array(predictions).reshape(-1, 1))

    return predicted_prices

predicted_prices = predict_future_prices(model, data, scaler)

# 실제 종가와 예측 종가 시각화
def plot_predictions(data, predicted_prices):
    plt.figure(figsize=(10,6))

    # 실제 데이터 시각화
    plt.plot(data.index, data['종가'], label='Actual Prices', color='blue')

    # 예측 데이터 시각화
    future_dates = pd.date_range(start=data.index[-1] + timedelta(days=1), periods=len(predicted_prices))
    plt.plot(future_dates, predicted_prices, label='Predicted Prices', linestyle='--', color='orange')

    plt.title("LG Electronics Stock Price Prediction")
    plt.xlabel("Date")
    plt.ylabel("Price")
    plt.legend()
    plt.grid()
    plt.show()

plot_predictions(data, predicted_prices)

 

  • LG전자의 데이터 가져오기: get_lg_data() 함수에서 LG전자의 종목 코드를 사용하여 오늘부터 1년 동안의 OHLCV 및 펀더멘털 지표를 가져옵니다.
  • 데이터 전처리: preprocess_data() 함수에서 종가와 PER를 사용하여 LSTM 모델의 입력 데이터로 변환합니다. 데이터를 정규화하고, 시퀀스 데이터를 생성합니다.
  • LSTM 모델 생성: create_lstm_model() 함수에서 LSTM 모델을 구성합니다. 여기서는 두 개의 LSTM 레이어와 드롭아웃 레이어를 추가하여 과적합을 방지합니다.
  • 모델 학습: LSTM 모델을 학습시킵니다.
  • 주가 예측 및 시각화: predict_future_prices() 함수에서 모델을 사용하여 향후 7일 간의 주가를 예측합니다. plot_predictions() 함수에서 실제 주가와 예측된 주가를 시각화합니다.

 

 

 

 

728x90

'프로그래밍 > 파이썬' 카테고리의 다른 글

주식 예측 모델  (2) 2024.10.10
주식거래 시스템을 위한 준비  (0) 2024.10.06
728x90

1. LSTM(Long Short-Term Memory) 모델

순환신경망의 한 종류로, 시계열 데이터를 예측하는데 효과적이다.
LSTM은 과거 정보를 기억하고 현재 및 미래의 주식 가격과의 관계를 파악하는데 유용하다.

2. CNN(Convolution Neural Network) 모델

이미지 처리에 주로 사용하지만, 주식 가격 데이터를 이미지로 변환하여 예측하는 데에도 활용할 수 있다.
주식 가격 데이터를 시간축으로 변경하여 이미지로 인식하고 CNN을 사용하여 패턴을 감지 할 수 있다.

3. 변형 Transformer 모델

주로 자연어 처리에 사용하지만, 주식 가격 예측과 같은 시계열 데이터에도 적용할 수 있다.
트랜스포머 모델은 멀티헤드어텐션 메커니즘을 활용하여 주식 가격의 시간적인 의존성을 모델링 할 수 있다.

4. ARIMA(AutoRegressive Integrated Moving Average) 모델

전통적인 통계적 방법으로, 주식 가격 예측에도 자주 사용되고 있다. 
ARIMA는 시계열 데이터의 자기회귀 및 이동평균 성분을 모델링하여 예측을 수행한다.
728x90

+ Recent posts