주식 AI모델 개발과정 리포트 - 231228
주식 AI모델에서 Item을 분류하여 신경망 모델을 학습시켜서, 모델의 예측력을 검증해 보는 과정에 대한 결과를 설명
AI development0 • 0 • 2024-02-03 18:11:13.0
주식 AI모델 개발 진행상황
2023. 12. 28
1. 결론: 모델에서 영향력이 절대적인 item(가격변수)을 제거하고, 신경망모델을 돌려서 펀더멘털 지표와 밸류에이션 지표의 예측력을 검증하는 과정을 시도함:
미흡한 결과 도출하였으며, 향후에는 중요한 영향력을 행사하는 가격지표와 밸류에이션, 펀더멘털, 수급 지표 중 핵심적인 지표로 모델을 구성하여 검증할 계획임
l 현재 모델 내에서 영향력이 큰 가격변수를 제외하고 모델을 돌려서, 모델의유효성을 검증해 보았음
l 방식은 배치정규 방식을 선택하고, Dense를 20으로 줄이고, 결과치에 +10에서-10의 규제를 구하고 구할 계획임. (이 방식은 각각 적용했을때 안정적인 성과를 보였던 레코드가 있는 방식들임)
l 결과치를 도출하는 상황에서, 예측치가 매우 좁은 구간에서분포되는 관계로 테스트할 때마다 아주 근소한 차이에 따라 결과치가 크게 달라지는 상황이 발생함
l 모델의 안정성 측면과 예측성 측면에서 불안정한 부분이 있다고 판단하여, 결과치에 대한 범위를 +50에서 -30으로확대하고, Epoch수를 3,000으로 늘여서, 모델을 train하였으나, 분기별편차가 크게 나타남
l 가격변수를 완전 누락시킨 다음 신경망을 구성하여 검증하였으나, 기준에미치지는 못했음
2. 모델에 영향을 미치는요소들의 영향력 그래프
Ø 모델의 예측치에 영향력이 큰 변수는 가격변수로 아래의 7개변수가 절대적인 영향력 행사
l 9번: 1주일전대비 수익률
l 10번: 1개월전대비 수익률
l 11번: 3개월전대비 수익률
l 22번: 1개월KOSPI대비 상대주가
l 23번: 3개월KOSPI대비 상대주가
l 24번: 6개월 KOSPI대비 상대주가
l 25번: 12개월KOSPI대비 상대주가
Ø 영향력이 큰 가격변수와 가격변수를 제외했을 때 큰 영향력을 가지는 밸류에이션, 실적, 수급변수
- 밸류에이션 지표
l 2번: PE
l 5번: P/B(TTM)
l 7번: 배당수익률
- 실적변수
l 13번: 분기ROE
l 14번: 분기영업이익률
l 16번: 매출액증가율
- 수급변수
l 26번: 5일누적 기관 순매수 대금
l 27번: 5일누적 외국인 순매수 대금
3. AI모델의 산포도 상관계수비교 (기존 모델 VS 가격변수를 제외한 모델)
l 배치정규15: 기존의 배치정규모델 중 15년 train한 결과값으로 이후에 대한 예측을 한 결과치
l Dropout 직전train: Dropout방식으로 과최적화를 방지한 방식(현재 사용중인 방식)
l 가격Out(231220): 가격변수의 파라메터를 0으로 조정하고 Train하여 예측한 결과치
l 가격Out_10-10_1000EP(231221): 가격변수의파라메터를 0으로 조정하고, 최소 최대값을 10%와 -10%까지만 반영한 결과
l 가격Out_10-10_1000EP(231222): 위의방식과 동일하게 하되, train을 새로 돌렸을 때 나온 결과
l 가격Out_50-30_3000EP(231226): 가격변수의파라메터를 0으로 조정하고, 최소 최대값을 50%와 -30%까지만 반영한 결과
l 4번째와 5번째모델은 동일 모델이지만, Train하는 날짜가 변경됨에 따라 비교적 큰 폭의 차이가 발생하였음
l 6번째 모델은 1사분기는뛰어난 예측력을 보였으나, 2사분기는 거의 상관관계가 없게 나옴에 따라 탈락
l 5번째 모델은 가격변수 자체를 다 뺀 상황에서 모델을검증한 결과
l 공통적으로 전일까지 가격을 반영한 결과치를 보면, 현재사용중인 모델만 (+)의 상관계수를 보이고, 나머지 모델은비교적 큰 폭의 (-)상관계수를 나타냄
l 원인을 분석해보면, 현재의 상황은 지수관련주(KOSPI200과 KOSDAQ150)에 대한 공매도가 한시적으로 금지되어있다는 점, 또한 연준이 금리인하 사이클로 들어 감에 따라 예상을 뛰어넘는 강세장이 나올 수 있는 상황이라는점을 들 수 있겠음
l 실제 수익률 상위 50개 종목(전체 182개종목 중 평가)을 평가했을 때, AI가 선택한 종목은 1종목에 불과, AI(PM)이 선택한 종목은 5종목, PM이 선택하거나 매매한 종목은 5종목 이었음.
4. 향후 진행 방향:
l 기존의 영향력이 큰 item의 영향력을 줄이기 위해, 가격변수에서 9번 1주일전대비 주가상승률과 23번 KOSP 대비 3개월 주가 상승률 2가지로 축소할 것임.
l 밸류에이션, 펀더멘털, 수급지표 중에서 2번, 5번,7번, 13번, 14번, 16번, 26번, 27번의item을 사용해서 도합 10개의 item으로 축소할 계획임.
l 이 경우 밸류에이션(3개),실적(3개), 수급(2개), 가격(2개)로 구성될 예정임.
l 또 하나의 방법으로는 가장 영향력이 큰 가격변수로만 구성해서 모델을 구성하는 방법도 test해 볼 계획
l Target은 산포도 기준으로 상관계수0.15가 목표이며, 이 부분이 달성되면, 1개월 단위로 끊어서 검증해 볼 계획임.