0 • 0 • 2024-02-03 19:03:45.0
주식 AI모델 개발 진행상황
2024. 1. 25
1. 지금까지의 과정:
l 현재까지의 모든 데이터를활용하여, 분기별 모델을 학습시켰을 때, 코로나 사태와 같은상황에서는 적응하기 힘들었음
l 모델이 모든 상황에서잘 맞지 않는 이유는 편향성, 시장환경의 변화, 모델의 한계등에 있었음
l 여러가지 방법을 활용하여, 모델의 예측력을 올리려는 시도를 할 계획(극단적 상황 배제, 연간단위 모델의 재검토, 모델의 예측력의 패턴 인식 가능성,
다양한 모델의 앙상블을 통한 성공확률 높이기 전략)
l 흥미로운 결과가 나왔음
2. 코로나의 영향력(급락/급등/급락)이 없는 시장 상황
l 기존에 test했던 모델은 All Data(최근까지 Train)모델로 안정적인 성과를 나타낸 장점이있었음
l 이상 상황과 초기 증시의 급등 구간을 배제한 2010-2017로분기 분할이 아닌 하나의 모델로 평가한 모델(2010-2017 SUM&All)은 그다지 좋지못한
결과를 보였음
l특이한 모델은 2010-2017 Qtr&P7(2010년-2017년 분기자료로가격지표7개로 훈련)모델로 최상위권의 평균치를 나타내는 가운데, 맞는 일부 구간을
l 그 밖에 2010-2017 Qtr&All(2010년-2017년 분기자료로 모든 Data로 훈련)모델로 안정적으로 결과치를 보이면서도 극단적인 값이 크지 않았음
l P7모델의 경우, 흥미로운점은 잘 맞는 분기에 상관계수가 높으며, 극단적으로 잘 맞은 분기 이후에 극단적으로 반대의 결과가 나오는사실을 볼 수 있음
l 극단적으로 잘 맞게 되어 가격에 과도하게 반영되고 나면, 이미오버슈팅 효과로 인해 그 다음에는 반대 상황이 나올 수 있을 것이라는 예상에 부합하는
내용임
3. 코로나의 영향권에 있는상황에서의 모델의 결과치
l 코로나 초기의 시장에서는 모든 모델이 잘 맞지 않는 상황이지만, 그중에서 2010-2017 Qtr&P7모델은 상대적으로 양호한 성과를 나타내었으며, 이후
2개분기 동안 상당히 좋은 결과를 나타내었음
l 이 후 그에 대한 부작용으로 2개분기는 부진하게 되지만, 공교롭게도 이때 다른 모델은 상대적으로 양호한 성과를 나타내었음
l 다양한 모델의 분기별 성과를 추적하면서, 해당 분기에 적합한모델을 선택할 수 있다면, 예측율을 개선할 수 있을 것이라고 판단됨
4. 향후 계획
l 예측모델의 예측율에 대해서 학습시키는 것이 가능한지에 대한 고찰
l 급등락한 수익률 발생시 패널티를 부여하는 방법
l 여러 모델을 결합하여 예측결과를 보완하기(앙상블)
l 전문가의 의견을 반영하여 예측결과를 보완하기(AI-PM)
l 시황을 구분하여 별도의 모델을 만드는 방법(정책금리 인상시기, 인하시기, 경기상승기, 경기하강기 등)