주식 AI모델 개발 과정 리포트 - 240111
가격변수를 제외한 모델과 Top10변수, Top11변수에 대한 1개월과 3개월의 성과 결과치를 비교한 설명
AI development0 • 0 • 2024-02-03 18:28:17.0
주식 AI모델 개발 진행상황
2024. 1. 11
1. 지나온 과정:
l 기존의 29개 변수를 사용하여 절대수익률을 오차를 최소화하는 방식으로 학습을 시켰던 모델들의 성과가 기준에 미치지 못하였음. 그에 따라
가격변수를 제외한 변수로 학습시키고 예측을 하였으나, 이또한 3Q23의 성과가 부진하게 나왔음
l 가격, 밸류에이션, 펀더멘털, 수급지표 중에서 영향력이 큰 변수를 선정하여, 10개 변수로 줄여서 검증하였는데, 이전보다 개선된 성과를 보였음
l 추가적으로 가격변수를하나를 추가하고 1개월 예측치를 한 결과 예상보다 좋지 않은 결과가 발생하였음
2. 새로운 변수조합으로 검증
l Top11변수에 대해 3개월로검증을 하였을 때도 뚜렷하게 호전되는 모습은 없었음
l 가격변수로만 Top 7개를 선정하여 검증해 보았을 때, 23년 1사분기는 0.403에달하는 상관관계를 보였으나, 2사분기는 정반대로 -0.317의상관관계를
보였음
l 가격지표를 제외한 Top 8개의 지표로 검증하였을 때, 23년 2사분기는 0.261이라는높은 수치를 보였으나, 1사분기와 3사분기는 부진한 성과를보였음
l 가격지표를 제외한 Top 8개의 지표를 1개월 성과로 검증하였을 때, 여전히 유의미한 성과를 거두지 못했음
3. 접근법을 바꾸어서, 3개월 BM대비 주가수익률 값의 예측치와의 오차를 최소화하는 방향으로학습 조건 변경
l 이 경우, 3사분기의 예측치의 상관계수가 (-)로 변환되는 효과가 현저히 줄어들었으며, 대부분의 경우, (+)의 상관계수를 나타내었음
l 고른 수치로 성과를 보인 모델은 29개 데이터를 모두 학습시키고, +20, -20으로 폭을 제한하고, 학습을 1000회 한 경우였음
l 이 경우, 가격변수의 과도한 영향력이 자연스럽게 조정되는효과가 있음으로 해서, 신경망의 예측능력이 올라갔음을 추정할 수 있음
4. 향후 계획
l 현재로서 가장 유망한 조건을 가진 모델을 직전분기까지 학습한 자료를 5년치로 예측해보고 과거의 시기의 예측이 이루어진 패턴을 분석해 볼 계획
(모든데이터 2020 EP 1000)
l 일정한 분기기 특수하게 높은 예측력을 보이는 모델에 대한 활용할 수 있는 방안을 연구하기 위해, 이 모델들의 5년치 자료로 검증해볼 필요는 있을 것으로
보임(가격 Top7_2020_EP1000), (가격 외 데이타 Top8_2020_EP1000)