AI 기술

6개월 안에 오를 만한 주식을 찾아라

2023. 10. 20

얼마 전 핀트는 미국 주식 전략을 출시했습니다. 미국 주식시장은 오랜 기간 걸쳐 반복된 경기 순환으로 가장 데이터가 풍부한 주식시장 중 하나예요. 여기에 전세계 60%*의 돈이 오가는 유동성까지 뒷받침된 시장이죠.

*출처: 디멘셔널 펀드 2023년 매트릭스북

최근 미국 시장에서 기술주의 상승세를 볼 때, 더 많은 수익을 노린다면 상승률이 높을 것으로 예상되는 개별종목을 잘 선택해 투자를 결정해야 하는 시점일 수 있어요. 그렇다면 왜 직접투자가 아니라, 핀트 미국 주식 전략 투자를 권하는 걸까요?

5,000개가 넘는 미국 주식

수천 개 종목 중에는 반드시 제2의 애플이 있기 마련입니다

미국 뉴욕증권거래소와 나스닥에 상장된 주식은 5,000개가 넘습니다. 주가에 영향 미칠 연관 데이터까지 고려하면 살펴야 할 데이터는 수만 개, 혹은 수십만 개로 늘어나는 셈이죠. 이 수많은 데이터를 통한 의사 판단 후, 나에게 수익을 안겨줄 종목을 골라야 하는 거예요.

이 때부터 핀트의 미션은 시작됩니다. 그 미션은 바로 ‘6개월 안에 오를 만한 주식을 찾는 것’이고요.

Mission ImPossible

제2의 애플을 찾는 일, 과연 불가능할까요?

애플, 구글, MS, 아마존, 엔비디아… 대표 우량주로 꼽히는 미국 주식이에요. 현재까지 아주 높은 수익률을 보여왔고, 앞으로도 그럴 거라 기대되는 종목이기도 한데요. 그렇다면 높은 수익률을 기대할 만한 종목은 이들 소수의 우량주뿐일까요?

아닙니다. 시총 순위는 물론, 산업별 리딩 컴퍼니 역시 주기적으로 바뀐다는 사실을 우리 모두 알고 있어요. 제2, 제3의 애플과 구글이 지금 우리 눈에 보이진 않지만 분명 주식 시장에서 열심히 움직이고 있죠. 오히려 그 성장성과 가치에 비해 저평가된 종목이라면, 우량주에서는 접하기 힘든 수익률을 경험할 수도 있습니다.

그리고 여기엔 많이 들어보셨을 머신러닝, 나아가 딥러닝이 활용됩니다. 쉽게 말해 학습한 데이터를 유사한 문제에 적용해 이성적으로 해답을 찾아 나가는 알고리즘을 통해 6개월 안에 오를 만한 종목을 찾는 거예요.

(6개월 안에 오를 만한 종목) = a(주가 데이터) + b

자산시장이 하나의 데이터에 하나의 학습 결과만 존재하는 일차원적인 공간이라면 y=ax + b로 표현되는 일차함수로도 충분히 주가를 예측할 수 있습니다. 연립방정식을 풀 때처럼 두 번만 데이터를 넣어서 결과를 보면 a와 b라는 파라미터를 알아낼 수 있으니 정확도 100%의 예측을 할 수 있는 것이죠.

여기엔 경사하강법과 역전파라는 학습 테크닉이 적용돼요. 용어는 낯설지만 함수의 근을 구하기 위한 접근을 생각하면 어렵지 않아요.

👉 머신러닝 AI 함수 풀이 솔루션

경사하강법(Gradient Descent)

1차 근삿값을 찾기 위한 최적화 알고리즘으로 손실 함수를 통해 파라미터를 검증하는 AI 특성을 이용. 실제 문제 해결 과정에서의 함수는 미분이 간단하지 않기에 이 값이 가장 낮게 나오는 지점이 최적의 파라미터라는 개념을 활용한 알고리즘.

역전파(Backpropagation)

사슬 규칙을 이용하는 기울기 기반 최적화 알고리즘으로 인공신경망을 효율적으로 훈련하는 데 이용. 임의의 초기 가중치를 부여한 결과를 계산하고 경사하강법을 이용해 정답과의 오차를 작아지는 방향으로 업데이트하는 알고리즘.

주가 예측의 성패는 ‘데이터 쌍’의 확보에 달려 있습니다

주가를 예측하는 데 머신러닝을 활용한다는 건 구체적으로 어떤 의미일까요? 단순하게 설명하면 입력값 x를 넣었을 때 출력값 y가 나온다는, ‘데이터 쌍’을 다수 확보하는 게 관건입니다. 이 모델은 여러 개의 데이터 쌍을 학습하면서 똑똑해지는데요. 점점 최적화가 되어간다는 뜻에서 fitting이라 부르죠.

이러한 fitting 과정을 거쳐 학습이 완료된 모델은 어떤 값(x)을 입력하든 예측값(y)을 내놓게 되는 거고요. 요즘 화두인 부동산에 대입하여, 부동산 구매를 위한 리서칭 과정 중 다음과 같은 데이터 쌍을 확보했다고 가정해 보겠습니다.

30평일 때 집값 1,000만 원 ⇨ (30, 1000)
40평일 때 집값 1,200만 원 ⇨ (40, 1200)
50평일 때 집값 1,400만 원 ⇨ (50, 1400)

위에서 학습한 데이터 쌍을 1차 함수로 표현 가능하다고 할 때, 구해야 하는 파라미터는 y=ax + b 형태의 함수에서 a와 b예요.

평수를 x, 매매가를 y로 두고 대입하여 연립방정식을 풀었을 때, a는 20, b는 400이란 값이 도출되면서 위 적정 부동산 매매가 산출 모델은 y= 20x + 400이란 결과가 나오는 셈이죠.

매매가에 영향을 주는 요인이 단순하게 평수 하나라고 치면, 35평 아파트의 매매가는 1,100만 원이라는 결과를 아주 쉽게 얻을 수 있습니다.

딥러닝으로 추출하는 상승 예상 종목

자산 가격에 영향을 미치는 요인은 간단한 풀이로 얻기 힘듭니다

그렇지만 아쉽게도 자산시장에선 데이터와 결과값이 일대일로 대응하지 않습니다. 같은 데이터를 넣어도 다른 요소에 의해 다른 결과를 내놓는, 다항함수로 불리는 세계예요. 대체로 집이 클수록 집값은 오르긴 하지만, 역세권, 남향, 조망권 여부 등에 따라 집값에 적잖은 영향을 미치듯 말이죠.

구하려는 집값(y)에 영향을 줄 만한 부동산 가치 요인들(x1, x2, x3, …)을 다 넣어야 하고, 이때부터 머신러닝에서 딥러닝으로, 더 고차원적인 풀이를 요하게 됩니다. 특정 종목의 6개월 내 주가 상승 가능성을 계산하려는 미국 주식 전략 딥러닝 AI 엔진에 입력하는 주요 데이터는 다음과 같아요.

이처럼 주가에 영향을 미치는 많은 데이터를 활용하여 딥러닝 AI 엔진을 학습시키고 있어요. 과거 주식 시장에서의 데이터 쌍을 쌓으면서 AI 엔진을 완성형에 가깝게 다듬어 나가는 중이죠. 그럼 여기서, AI 엔진에 무조건 많은 양의 데이터를 넣으면 해결되겠지, 하는 생각을 가진 분들도 계실 거예요.

좋은 종목을 고르는 일은 다른 영역의 딥러닝 문제와 달리, 데이터의 퀄리티가 좌우합니다. 재료의 질에 따라 음식 맛이 달라지듯, 좋은 데이터를 넣어야 좋은 결과가 나오는 것이죠. 그리고 데이터의 질을 높이는 일에 있어, 딥러닝 모델의 디자인이 그 무엇보다 중요합니다.

위 그림은 미국 주식 전략 딥러닝 모델링을 도식화한 모습이에요. 앞선 단계는 어느 정도 알겠는데 중간에 모델 앙상블이 조금은 생소하죠? 모델 디자인의 방점이 되는 앙상블 전략은 디셈버가 미국 주식 전략 알고리즘을 구현할 때 이용하는 핵심기술 세 가지 중 하나예요.

👉 핀트 미국 주식 솔루션 알고리즘 주요 기술 3

앙상블(Ensemble)

여러 AI모델의 예측 결과를 통합해 최종 예측치를 계산하는 전략. 디셈버에서는 여러 앙상블 기법 중 기간과 네트워크를 적용.

팩터(Factor)

거친 데이터(원천 데이터)를 부드러운 데이터(가공 데이터)로 변환해주어 주가 예측모델의 예측력을 보다 좋게 만드는 전략.

룰 베이스(Rule Base)

AI 모델의 판단을 따르기 전에 리스크를 낮추기 위한 목적으로, 일반적인 투자 지침을 따르는 전략.

모듈형 AI의 역할 분담이 빚어내는 시너지 효과

모듈을 조합함으로써 합리적으로 답을 찾아나갑니다

AI 기술이 빠르게 발전하고 있다고는 해도 완벽하게 작동하는 하나의 거대 AI 모델을 가까운 미래에 만들기란 어려운 일입니다. 마치 파트를 나눠서 일하는 생산 현장같이, 아직까진 모듈형 AI의 조합을 통해 답을 찾는 방식이 주로 쓰이는 이유예요. 이를 좁은 인공지능(Narrow AI)이라 부르며 궁극적으로 지향하는 일반 인공지능(General AI)과 구분짓기도 합니다.

여러 모델이 협응을 통해 도출하는 값에 주목합니다

핀트 미국 주식 솔루션 알고리즘에 반영된 핵심 기술 중 앙상블 전략엔 디셈버가 지향하는 이러한 철학이 담겨 있습니다. 그래서 디셈버는 한 개의 모델을 개발하기 보다는 여러 신뢰도 높은 모델을 확보해 각 모델에서 예측값을 취합, 종합 수치를 도출하는 앙상블 전략을 활용함으로써 주가 상승 확률을 계산하고자 해요.

예측 확률 높이는 데이터 퀄리티
리스크 줄이는 인베스트먼트 룰

원천 데이터 vs 가공 데이터, 어느 쪽이 확률을 높여줄까요?

앙상블 전략 다음으로 큰 비중을 차지하는 팩터 전략 역시 취지는 같아요. 쉬운 예를 들어볼까요? 아예 접지 않은 색종이를 주고 학을 접는 것과, 앞단계를 어느 정도 진행한 색종이로 학을 접는 것. 당연히 후자가 더욱 쉽고 빠르게 학을 만들 수 있겠죠. 그냥 색종이가 원천 데이터라면, 접은 색종이는 가공 데이터라고 할 수 있어요.

주가 데이터를 예로 들면, 시가총액과 당기순이익을 그냥 입력하는 경우와 시가총액을 당기순이익으로 나눠 PER 값을 만든 다음에 입력하는 경우와 같아요. 이렇게 하면 Raw Data에 지나지 않은 원천 데이터도 Financial Factor라고 부를 수 있는 쓸 만한 가공데이터가 되기에, 주가 예측 모델의 확률을 높여줄 수 있습니다.

룰 베이스는 그 이름에서 알 수 있듯, 규칙을 기초로 한 예측 전략을 구사하는 것이에요. 주식 투자를 할 때 흔히 ‘거래대금 규모가 작은 종목은 거래하지 말 것’, ‘계란을 한 바구니에 담지 말 것’ 등의 얘기를 하잖아요. 이처럼 최소한의 안전장치를 통해 수익을 추구하면서도 리스크는 줄이고자 하는 게 바로 룰 베이스 전략을 넣은 의도이죠.

그럼 실제로 앙상블 등 핵심기술이 어떤 과정을 거쳐 AI 예측 모델에서 종목을 고르는 걸까요? 이 내용은 다음 시간 AI가 담아주는 미국 주식 2부: 잘 디자인된 AI 모델의 중요성에서 알아볼게요.



디셈버앤컴퍼니자산운용 준법감시인 심사필 제2023-152호(2023.10.17 ~ 2026.10.12)
• 투자일임계약은 예금자보호법에 따라 예금보험공사가 보호하지 않습니다.
• 투자일임계약은 자산가격 변동 등에 따라 투자원금의 일부 또는 전액 손실이 발생할 수 있으며, 그 손실은 투자자에게 귀속됩니다.
• 투자일임계약의 수수료는 기본수수료와 성과수수료 중 어느 하나를 선택할 수 있습니다.
• (기본수수료 선택 시) 투자일임계약의 기본수수료는 연 0.66%(월 0.055%)(디셈버 ISAAC 자산배분 국내형·해외형) / 연 1.02%(월 0.085%)(디셈버 미국 주식 솔루션)로 매월 후취합니다.
• (성과수수료 선택 시) 투자일임계약의 성과수수료는 고객과 합의에 의합니다.
• 투자자는 투자일임계약에 대하여 당사로부터 충분한 설명을 받을 권리가 있으며, 투자전 상품설명서 및 약관을 반드시 읽어보시기 바랍니다.
• 로보어드바이저가 고객에게 맞는 투자 또는 수익달성을 보장하지 않습니다.
• 로보어드바이저 테스트베드를 통과하였습니다.
• 로보어드바이저 테스트베드 통과, 로보어드바이저 테스트베드 심의결과가 해당 알고리즘의 품질이나 수익성을 보장하지 않습니다.
• 핀트는 디셈버앤컴퍼니자산운용의 투자일임서비스입니다.