주식 AI모델 개발 과정 리포트 - 230926

주식 AI모델 개발 배경 및 진행상황과 애로점 해결방안 등에 대해 설명함
AI development

안지환

0 • 0 • 2024-02-02 12:34:30.0

AI모델 개발 배경 및 진행상황


2023.9.27


1. 개발 배경 


주식을 운용하고 선택함에 있어 펀더멘털 지표, 수급지표, 밸류에이션 지표, 가격지표 등으로 고려해서, 향후 주가 상승 가능성과 상승 폭이 높은 종목을 선정하는 것이 중요함


절대적인 주가상승율 예상은 제반 여건 등을 모두 고려해야 하므로 너무 어려운 과정으로 예상함


상대 Ranking이 의미 있는 이유는 시장의 상황에 관계없이 종목을 선정하는 기준을 제시가능하며,  상위 랭크에 있는 종목은 주식시장 대비 상대적인 초과수익을 올릴 수 있다고 가정


그에 따라 우리가 투자대상으로 하는 투자대상종목군(유니버스)에서 향후 주가 상승률 랭킹을 Output하는 것을 목표로 함 


기준시점: 매분기 실적이 미치는 영향이 지배적이라는 가정 하에, 매분기실적을 공표하는 시점 + 5영업일로 지정하였음. (2월 20일, 5월 20일, 8월 20일, 11월 20일 휴일 시 익일)


비교시점: 다음 분기의 기준시점 즉, 1사분기 자료는 5월 20일에 기준점으로 하여, 각종 Factor의 자료를 확정해서, 8월 20일까지의 주가 수익율로 랭킹을 비교하게 되는 구조 


모델을 만들기 위해, 총 200개 종목의 5년치 자료 + 2개 분기 자료를 투입하여 모델을 학습시킬 계획

 


2. Input 요소


펀더멘털 Factor


- 매출액증가율(Q0Q), (YoY), 


- 영업이익증가율(QoQ), (YoY) 


- 재고자산회전률 


수급지표


- 5일 누적 기관 순매수 대금/시가총액


- 20일 누적 기관 순매수 대금/시가총액


- 5일 누적 외국인 순매수 대금/시가총액


- 20일누적 외국인 순매수 대금/시가총액


밸류에이션 지표


- PE, 


- PB 


- EPS growth


- ROE


- 시가배당률


가격지표


- 1개월전 대비 주가상승율


- 3개월전 대비 주가상승율


- 연초 이후 주가 상승률



3. 기존 Quant 운용과의 차이점


기존의 Quant 접근법은 Rule Base로 투자전략을 제공


- 현 상황(거시변수 및 계절성 등)을 특정하고, 특정조건에 대해 상위의 종목군은 매수하고, 하위의 종목군을 매도하는 방식으로 수익률 측정함


- 결과적으로 여러가지 팩터를 동시에 적용하는 모델은 아니며, 특정 Factor에 특화된 투자전략임


인공신경망 AI모델


- 펀더멘털, 수급, 밸류에이션, 가격지표 등 다중 Factor를 투입해서, 종목의 상대적 상승가능성을 순위로 매긴다는 점


- Rule base가 아닌 인공신경망을 통해, 가중치 값 등에 대해 모델이 학습하여 최적화하는 기법임 


- 다양한 Factor를 동시에 적용하기 때문에, 단일 Factor 모형에 비해 더 종합적인 상황을 고려한 예측력을 제공할 수 있다는 가정 

 


4. 적용상의 애로점


우리의 접근법은, 측정하는 시점자체가 실제로 실적이 가격에 반영되는 시점보다 실질적으로는 3개월정도 후행 한다는 단점이 있음. (해결책: 정확한 예측을 위해서는 실적발표시점의 가격대와 예측하는 시점의 가격대의 차이를 데이터로 넣어줘야 함 


예를 들어, 삼성전자의 경우 1사분기 실적에 대한 추정치는 2월 중순부터 나와서 시장에 반영되기 시작하고, 3월초에 잠정실적이 발표되는 데 반해, 5월 20일에 측정한 가격에는 이런 부분이 선 반영된다는 문제가 있기는 함 


최근의 문제가 되는 와이지엔터의 경우도 1사분기 실적이 발표된 5월 20일 기준으로는 이익증가율의 랭킹이 1위 였으나, 이미 40% 오른 시점에서 수익율 계산에 들어가게 되어서, 이후에는 -20%의 주가 하락을 보였음 


또한 두산테스나의 경우에도 2사분기 실적 서프라이즈가 나서 반영된 시기는 8월 20일인데, 한달이 조금 지난 9월 25일 3사분기 실적에 대한 추정치 하향 리포트가 나오면서, 가격은 이미 선 반영되어 하락하는 사례도 있음 


결국 백 테스팅을 위해 필요한 조건을 맞추는 측정시점의 지연이슈에 대해 한계점을 가지고 접근한다는 점은 인식해야 할 것으로 보임. 

 

(주가상승률과 영업이익률 증가 순위 점 도표: 1사분기 실적 vs 8월 20 종가 기준 수익률 랭킹)


 


(주가상승률과 영업이익률 증가 순위 점 도표: 1사분기 실적 vs 5월 종가 기준 수익률 랭킹)



5. 대응방안 


다만, 기대할 수 있는 부분은 가격지표에서 호실적에 대한 부분이 1개월 주가 상승률, 3개월 주가상승율, 등으로 이미 선 반영된 부분을 모델이 반영해서, 분기실적의 영향력을 낮추는 방식으로 모델을 구성한다면, 이 부분은 Offset될 수 있는 요소라고 보임.


또한, 밸류에이션 지표상에서 최근의 주가 급등은 밸류에이션 지표에 대한 매력도를 낮추었을 가능성이 있기에 어느정도 Offset되는 부분이 있을 가능성이 있음 


또한, 기관 외국인 수급동향에서도, 이부분에 대한 학습이 이루어질 수는 있을 것으로 보임   


현재로서는 Ranking을 예측하는 모델을 선정해서(Tensor Flow Library를 통해 함수선정예정), 중요한 Factor위주로 작은 데이터일지라도 모델을 돌려 보고 학습시키는 것이 우선적으로 시도해야

        할 부분임. 


모델의 함수를 구성함에 있어서, 이런 부분들을 잘 고려해서 함수 및 초기값을 지정해주면 예측력을 보다 개선한 모델로 개발할 수 있을 것으로 보임 


추가적으로 분기별로 발생할 수 있는 계절성이 고려될 있도록 분기별로 나누어서 모델을 학습시켜보고, 전체 통합 모델과의 성과를 측정해볼 필요가 있음 


만일 분기모델의 성과가 통합모델의 성과를 능가한다면, 분기 모델접근법으로 계속 발전시켜 나가면 될 것(월간단위로 모델을 분화하는 방안도 고려)이며, 통합모델의 성과가 더 뛰어나다면,

       통합모델의 학습능력과 예측력에 대해 더 높은 신뢰를 주고 통합모델을 고도화하면 될 것임. (20년치 기간으로 기간확장, Factor의 확장하고, 시총 1,000억 이상으로 종목 수 확장을 통해 예측력 올림) 

 


6. 추가적인 개발 가능성


5번을 통해 가시적인 성과가 나오지 않을 경우에도 불구하고, AI를 활용한 투자기법을 활용할 수는 있을 것을 보임


기존의 상대평가를 통한 주가 상승률 랭킹을 목표로 하는 것이 아닌, 개별 기업의 주가상승률을 예상하는 것으로 전환함 


기존의 모델을 실시간에 가깝게 일주일 단위로 업데이트해서(추정치 변화 반영 및 잠정실적 실시간 반영) 시점이 밀리는 약점을 보완함 


주가상승률 랭킹 주기를 1개월 또는 1주일 단위로 정해서, 동적으로 포트폴리오에 조정하는 모형도 적용가능


Settings

Set your own customized style

Color Scheme

Choose the perfect color mode for your app.


RTL Mode

Switch your language direction

RTL Documentation

Fluid Layout

Toggle container layout system

Fluid Documentation

Navigation Position

Select a suitable navigation system for your web application


Vertical Navbar Style

Switch between styles for your vertical navbar

See Documentation

Like What You See?

Get Falcon now and create beautiful dashboards with hundreds of widgets.

Purchase
customize