퀀트 트레이딩에 뛰어들기 전에 꼭 알아야 할 데이터 과학 분석의 비법

퀀트 트레이딩에 뛰어들기 전에 꼭 알아야 할 데이터 과학 분석의 비법
TILPosted On Jul 13, 202419 min read

의심에서 전략으로: 시장 동향, 거래 전술 및 데이터 과학 통찰력의 복잡한 망을 해체해보세요

이미지

숫자와 화려한 수학 기교에 능숙하다는 것이 주식 시장에서 많은 돈을 벌 수 있는 열쇠라고 들어왔어요. 솔직히 말해서, 저도 그것에 대해 조금 의심스러웠어요. 그 이유는 여기 있어요.

데이터 과학에 정말 관심이 많고 통계학 박사 학위도 가졌으며 여러 기업을 위한 예측에 많이 참여했고 일찍이 몇 번의 캐글 경연에서 우승한 경험이 있음에도 불구하고 주식 시장에 대해 모든 것을 알고 있다고 생각했어요. 경제와 주식이 어떻게 작동하는지에 대한 내 지식을 바탕으로 내가 잘할 거라고 확신했죠.

하지만 내 아이디어를 시도할 때, 예상했던 대로 되지 않았어요. 꽤 충격적이었어요.

#1: 주식 거래에서 이익과 손실 이해하기

"주식을 예측하는 것은 다른 사람들이 무엇을 생각하는지 추측하는 것과 같아요."

주식 가격이 계속 상승하고 하락하는 것을 보면, 돈을 벌 생각이 자꾸 들어요. 그래프에서 가격이 급상승하는 것을 보면, 그 행동에 참여해서 그 기회로 돈을 벌 수 있을 것 같아요. 우리는 전에 일어난 일이 다시 일어날 것이라고 믿기 때문에, 과거에서 패턴을 찾아서 다음에 무엇이 일어날지 추측할 수 있다고 생각해요. 이건 마치 외출을 계획하기 전에 날씨를 확인하는 것과 비슷해요; 비가 올 걸 알면 우산을 가져가겠죠?

주식 가격을 예측하는 일은 날씨를 확인하는 것과는 다르지만, 그 아이디어는 비슷해요: 하나는 하루를 계획하는 데 관한 것이고, 다른 하나는 주식 시장에서 돈을 벌려고 하는 것이에요. 핵심은 과거 데이터의 추세를 파악하고 그 통찰을 이용해 앞으로 어떤 일이 일어날지 추측한 다음에는 그 예측에 따라 행동하는 거예요. 그러나 우리가 종종 놓치는 큰 문제가 있어요. 주식 가격을 예측하고 날씨를 예측하는 것은 다른 게임이에요. 날씨를 예측하는 것이 훨씬 간단하죠. 날씨에 대한 추측이 날씨를 어떻게 바꿀지에는 영향을 미치지 않아요. 날씨는 여러분이 맞추든 틀리든 자신의 길을 갈 거예요. 그러나 주식은 훨씬 복잡해요. 주식 시장은 빠르게 돈을 벌려고 하는 사람들로 가득 차 있고, 모두가 다음에 무엇이 일어날지 예측하려고 애를 쓰고 있어요. 문제는 이 모든 추측과 그것으로 이어지는 거래 행위가 예측을 망칠 수 있다는 거에요, 심지어 정말 똑똑한 알고리즘을 가지고 있더라도 말이에요. 여기서 '똑똑하다'는 것은 과거 데이터를 살펴본 결과에 의해 자기 자신을 증명한 것을 말해요. 이 문제는 간단해요: 여러분의 알고리즘은 절대로 다른 사람들이 어떻게 예측하고 그 예측에 따라 행동할지를 알 수 없다는 거죠.

#2: 주식 시장: 빠른 매매 또는 장기 투자?

" 주식 예측: 단기간에 어려워 "

알겠어요, 그럼 몇몇 똑똑한 경제학자들이 이에 대해 어떻게 생각하는지 살펴보겠습니다. 솔직히 말해서, 그들이 주장하는 모든 것에 난 전혀 납득이 되지 않아요. 하지만 한번 알아볼게요:

2013년에 Eugene F. Fama, Lars Peter Hansen, Robert J. Shiller 세 명의 똑똑한 사람들이 경제학 노벨상을 수상했어요. 그들은 주식 시장의 움직임을 이해하고 이를 시장 효율성이라는 용어로 설명한 데서 이 상을 받았어요.

Eugene F. Fama는 효율적 시장 가설 (EMH)을 제시한 것으로 유명해요. 이 이론은 주식 가격에 이미 필요한 정보가 모두 담겨 있다고 주장하는데, 따라서 주식을 골라내거나 적절한 시기에 매수/매도하는 것으로 시장을 이기려는 것은 거의 불가능하다고 말해요. EMH에 따르면 장기적으로 주식 가격은 랜덤하게 움직이고, 그 이유는 새로운 정보에 따라 바뀌기 때문에 미리 예측할 수 없다고 해요.

한편 Robert J. Shiller는 다른 견해를 가지고 있어요. 그는 시장이 항상 완벽하지 않을 수 있다고 생각하고, 주식 가격이 장기적으로 때때로 예측될 수 있다는 것을 발견한 것 같아요. 그 이유는 사람들의 행동, 변덕스러운 시장, 투자자들이 하는 심리전 등 때문이라고 해요. Shiller는 주식 가격이 실제 가치에서 벗어날 수 있다고 생각하며, 그럼으로서 멀리 앞을 내다보고 있다면 어디로 향하는지 추측할 수도 있다는 것이죠.

내 이해에 따르면 두 사람 모두 어느 정도 동의합니다: 주식 가격을 예측하는 것은 특히 단기적으로는 랜덤한 추측이라는 점입니다. 주식 시장은 예측하기 어려운 플레이야죠. 그 의미는 오늘의 가격이 내일을 예측하기에 아무 가격이나 될 수 있다는 것이죠.

거래자에게는 막다른 골목 같군요, 그렇죠? 하지만 진짜는 무엇일까요? 사실, 주식 시장에서 몇 가지 스마트한 지표만 가지고 있는 거래자들이 심각한 이익을 얻고 있다는 사실이 있습니다.

#3: 거래자들은 어떻게 하는 걸까요?

"거래자 승리 뒤에 숨겨진 비밀 소스"

나는 확실해, 노벨상 수상자들이 그들의 이론을 빛낼 때 어둠 속에서 다트를 던지지는 않았을 거야. 이런 사람들은 그저 어떤 경제학자들이 아닌 데이터 과학자들과 같은 사람들이라는 걸 명심해야 해. 그들은 충실한 데이터를 뒷받침하지 않고는 노벨상을 탈 수 없을 거야. 하지만 여기 백만 달러 질문이야: 현실 세계에서 우리가 본 것과는 어떻게 일치할까?

길거리 소문에 따르면, 골드만삭스와 모간 스탠리와 같은 대형 투자은행의 트레이더들은 대박을 터트리는 경우가 훨씬 많다고 해. 주식 시장이 야생적이고 예측할 수 없는 야수라면, 이들이 어떻게 거대한 이익을 창출하고 있을까?

이것이 의문을 품게 만들죠, 그렇지 않나요? 모든 것이 무작위적이고 예측할 수 없다면, 그들이 돈을 버는 비밀은 무엇일까요? 알려줄게요: 이 은행의 거래 고수들은 우리 대부분이 갖고 있지 않은 정보나 전략으로 게임을 하는 특별한 이점이 있다는 것이죠. 경제학자들이 말하는 주식 가격이 모두 무작위적이라는 이론은 대부분의 경우 일어나는 것과 더 관련이 있어요. 이러한 투자 은행은 다른 이들과 달리 게임을 즐기는 것이 아니에요. 일반 사람들이나 일간 트레이더들이 그들처럼 큰 돈을 벌고 싶다면, 그들과 마찬가지로 독특해져야 할 텐데, 그건 현실적으로 말이 쉽지 않아.

그리고 만약 모두가 이 독특하고 굉장히 영리한 트레이더로 변한다면, 그럼 무엇이 생길까요? 더 이상 돈을 벌기 위한 비밀은 없어지겠죠, 그리고 그러면 누구도 이득을 내지 못할 거예요. 따라서 주식 시장은 결국 100% 효율적이지 않다는 거죠. 당신이 어디를 봐야 하는지, 다른 시간대, 산업, 변화나 거대 은행들이 가지고 있는 그런 기술과 도구를 갖추는 곳을 아는 등 추가 수익의 기회를 포착하고 활용하는 데 더 나은 기회를 갖는 것이죠.

그럼, 그들이 그 강력한 경쟁 우위를 얻는 방법은 무엇일까요?

그래요, 간단히 말하자면:

첫 번째로, 기관의 대형 트레이더들? 그들은 로봇과 함께 초고속 거래를 하거나 스스로 개입하기도 하는 것을 좋아해요. 이런 번개처럼 빠른 거래는 전체적인 "주식 시장 규칙" 아이디어를 교란시킬 수 있어요. 거리에서 걷고 있다면 모든 것이 질서 정연해 보이지만 비행기에서 본다면 모든 것이 혼돈스러울 수 있어요. 이 전문가들은 보통 사람들이 감지하지 못하는 가치 있는 것을 가까이서 발견할 수 있어요.

그리고 기관 트레이더들은 하나의 주식이나 한 가지 방법에만 의지하지 않아요. 다양한 전략을 사용하면서 다른 주식에 대해 알아보고 데이터를 분석하며 산업 분위기를 점검하고 모든 것을 딱 맞게 타이밍해요. 하지만 이것을 이루기 위해서는 많은 정보, 시간, 에너지가 필요하죠. 한편, 일반 투자자들은 그냥 몇 가지 주식에 집중하고 최선을 다하기만을 희망할 수도 있어요.

세 번째, 대형 투자자들은 엄격한 규칙을 따르거나 기계들이 모든 일을 처리하도록 하는 등, 평범한 투자자들에겐 까다로운 작업이에요. 평범한 조(e)도가 이 특별한 양적 거래에 발을 담그려고 해봐도, 감정에 휩쓸려 실패할 수도 있어요. 주식 시장은 짐승과도 같고, 일반 투자자들에겐 단기 움직임을 추측하는 건 마치 벽에 젤리를 박는 것과 같아요.

여기서 주목할 점은: 빠르게 현금을 벌고 있다면, 그 돈이 아마 다른 누군가의 지갑에서 나오는 것이고, 그 반대도 마찬가지에요. 통계적으로 보면, 이건 영(零)화 행위야. 단기간에 계속 이기는 사람이 있다면, 그들은 어떤 비밀 소스를 가지고 있거나, 대형 투자 은행과 같은 거대한 투자 은행일 거에요. 장기적으로 돈을 벌면, 이건 모두에게 좋을 수 있어요. 왜냐하면, 회사의 가치가 성장하는 것에 관한 거니까요. 하지만 장기 주가를 예측하기 쉽다고 생각하지 마세요 — 결국에는 회사의 성과를 어떻게 예상할 수 있는지에 달렸어요.

#4: 일상 투자자들이 양적 거래로 승리할 수 있을까요?

"네, 하지만 모든 게 순조롭지는 않을 거예요..."

그래서, 당신은 매일 투자자로서 양적 거래를 통해 빠른 이익을 노리고 있는 거군요? 이렇게 준비하세요:

  • 먼저, 양적 거래 소프트웨어를 확보하거나 알고리즘을 만드세요. 기계가 완전히 대신하도록 하는 것이 아니라, 언제 사고 팔지에 대한 타이트한 조언을 얻는 것이 중요합니다.

  • 소매등을 걷어내고 알고리즘을 세밀하게 조정하는 준비를 하세요. 오늘 한 주식에서 성공을 거둬도, 내일에는 다른 주식에서 실패할 수도 있으며, 나중에 같은 주식에 대해서도 실패할 수 있습니다.

  • 당신이 벌어들이는 수익만큼이 아니라, 시장 지수에 비해 얼마나 잘 하는지를 기준으로 성과를 측정하세요. 시장을 능가하고 있다면, 올바른 길을 걷고 있습니다.

  • 거래 비용과 세금을 주의 깊게 살펴보세요. 어떤 플랫폼들은 거래 수수료가 없는 것도 있지만, 거래를 많이 하면 세금을 내야합니다. 그렇게 되면 이익이 줄어들 수 있으니 주의하세요.

#5: 데이터 과학 탐구: 거래의 엣지?

“데이터 과학이 부자로 만들어주지는 않을지도 모르지만, 여러분의 거래 전략을 형성할 수는 있을 거예요…”

그러니까, 솔직히 말해서 말이죠. 내가 양적 거래에 모든 것을 건다면 부자가 될 수 있을까요? 음, 정확히는 그렇지 않아요. 양적 거래를 저의 풀타임 직업으로 만드는 것이 제 계획은 아니에요. 저에게 궁금증을 자아내는 것은 데이터 과학이 일상적인 트레이더에게 어떤 이점을 제공할 수 있는지에 대한 것이에요. 또한, ChatGPT와 같은 고급 AI의 등장을 고려할 때, 데이터 과학자들을 대체할 수 있는 가능성이 있을까요?

여기 내 생각이야. 다음으로, 몇 가지 알고리즘 백테스팅에 뛰어들 거야. 이것에서 얻는 통찰력이 혹시 더 현명한 거래 결정으로 이어지기를 바랄게.

#6: 거래 전략 디코딩

"코드로 뛰어들기 전에 양으로 거래 전략이 어떻게 작동하는지 이해하세요."

세 가지 거래 전략을 살펴보자: '거북', 'RSI-Bollinger Bands', 그리고 직접적인 '매수 및 보유'. 마지막은 양적 방법이 아닌데요 — 이는 일반적인 지식이죠. 그러나 첫 두 가지는 지표를 활용하거나, 데이터 과학 용어로 말하자면, 통계 모델에 대한 예측자를 활용하고 있어. 새로운 예측자나 모델을 고안해볼까요? 음, 이러한 널리 사용되는 인디케이터와 방법은 거래자들에 의해 널리 사용되며 시장의 트렌드에 부합하고 성능을 향상시킬 수 있어요.

거북이 거래 방법

이 접근법은 주식 거래를 예측의 게임으로 단순화합니다. 주식의 가격이 20일 최고점을 기록하면, 이는 추가 상승을 예상하여 매수 신호로 간주됩니다. 반대로, 20일 최저점으로 하락하면 매도 신호가 됩니다. 코드화된 전략은 이러한 규칙을 준수하여 거래 결정을 자동화하고, 시장 트렌드에 최적화하기 위해 각 움직임을 추적합니다.

RSI-볼린저 밴드 전략

RSI 및 볼린저 밴드라는 두 가지 도구로 이동 주식 가격을 대상으로 상상해보세요. RSI는 주식의 강도를 측정하여 성과가 부족한 주식에 대한 매수와 성과가 우수한 주식에 대한 매도를 제안합니다. 볼린저 밴드는 가격 경계를 설정하여, 가격이 이 한계를 넘을 때 조치를 취하도록 유도합니다. 코드화된 전략은 이러한 신호를 탐지하여 시장의 상승과 하락을 효과적으로 탐색하고 매수 또는 매도 결정을 내립니다.

RSI(상대강도지수)는 주식의 건강도를 나타내는 미터와 같습니다. 이를 통해 주식이 강하거나 (상승할 가능성이 높음) 약한지 (하락할 가능성이 높음) 판단할 수 있습니다. 볼린저밴드는 과거 가격을 기반으로 설정된 경계선과 같습니다. 주식이 이러한 경계를 벗어나면, 그것은 행동할 시기일 수 있습니다.

이러한 전략들을 잘 파악하면 거래자들이 시장의 움직임과 동기화할 수 있습니다. 이는 그들의 거래 방식을 업그레이드시켜, 더 스마트하고 명확한 거래를 할 수 있게 도와줄 수 있습니다.

#6: 나의 주식 분석 게임 플랜 해설

"데이터 과학이 주식 퍼즐에서 당신의 길잡이가 되게 하라."

지금은 주식 분석에 대해 어떻게 다가가는지 알아보겠습니다. 저는 세 가지 핵심 전략인 – 거북이, RSI-Bollinger Bands, 그리고 클래식한 매수 및 보유 – 을 여러 가지 다른 섹터 ETF에서 실험 중이에요. 목표는 어떤 전략이 섹터에 상관없이 수익을 창출하고 손실을 피하는 데 능숙한지 찾는 것이에요. 게다가, 다양한 경제적 분위기에 부합하는 기간을 고려하여 상황을 파악하고 있답니다 – 번성하는, 위축되는, 또는 그냥 평온한 시장을 생각해보세요.

여기서 처리할 일이 몇 가지 있어요: 전략들 자체, 탐험 중인 섹터, 그리고 경제적 시황 보고서까지도요. 왜 이렇게 번거롭게 하는 걸까요? 왜냐하면 주식 시장은 특히 단기간에는 난제이기 때문이죠. "어떤 주식이 급등할까요? 마법같은 전략이 뭔가요?"라는 질문으로 해결할 수 없어요. 올바른 움직임을 올바른 순간에 맞추는 게 중요한 거예요.

이제 만날 시간이에요! (즉, ETF들을 의미하는) 주요 선수들을 살펴보겠습니다. 이들은 섹터별 ETF, 포괄적인 시장 개요, 그리고 금의 적당한 부분까지 혼합된 상태입니다.

아래는 주식/ETF 티커들이 의미하는 내용에 대한 소개입니다. 이들은 섹터 ETF, 포괄적인 시장 ETF 및 상품 ETF의 혼합체입니다:

탭을 변경하여 마크다운 형식으로 변경하세요.

  • XLU: 전기공급업체에 중점을 둠
  • XLY: 소비자 물품에 초점을 맞춤
  • VIG: 성장하는 배당을 찾음
  • GLD: 금시세를 지켜봄

  • SPY: 미국 상위 500개 기업의 파동을 잡아요

  • DIA: 미국 주요 30개 기업을 살펴봐요.

이러한 티커들이 내 필수품이에요. 너무 누락된 부분 없이 넓은 시야를 제공하기 때문이죠.

그리고 시장을 시간여행하는 경우는 여기에요:

  • 2020년 11월부터 2024년 2월까지: 시장 드라마를 다룬 40개월의 이야기

  • 2020년 11월부터 2022년 1월까지: 코로나19 대유행의 첫 번째 파도와 함께

  • 2021년 12월부터 2022년 10월까지: 코로나 후의 이자 인상 폭풍을 탐험하며

  • 2022년 2월부터 2023년 5월까지: 결정을 내리지 못하는 시장을 서핑하며

  • 2020년 12월부터 2022년 12월까지: 상승장에서 하락장으로 변동하며 마지막에는 평평했어요.

매 거래마다 $10,000을 거는 거예요. 이건 추적하고 결과를 비교하기 쉽게 하는 좋은 라운드 넘버예요. 이 모든 것을 내세웠으니, 코드를 실행해서 숫자가 우리에게 말해주는 것을 발견할 준비가 돼 있어요.

#7: 결과 해석하기: 우리가 배운 것은 무엇인가요?

“ 뛰어들기 전에, 이 통찰들을 면밀히 살펴보세요.”

먼저 2020년 11월부터 2024년 2월까지, 총 40개월 동안의 시장의 상승과 하락을 다룬 분석 결과를 확인해 보겠습니다:

analysis

이게 무슨 의미가 있을까요? 여기에서 ChatGPT가 빛을 발합니다. 우리가 하는 것은 어떤 움직임을 해야 하는지 알려주는 것뿐만이 아니라, 그 움직임의 이유를 이해하는 데 중점을 둡니다. 코딩하는 것보다 ChatGPT에게 탐색적 데이터 분석(EDA) 결과를 제공하는 것이 더 유익할 수 있습니다. 제가 원하는 것은 이렇습니다:

이 결과를 분석해 특정 기간과 전체적인 시장 분위기에 초점을 맞춘 교역 전략을 어떤식으로 사용할지 투자자들에게 힌트를 주는 것입니다. 그리고 이때 반드시 업종, 비즈니스 씬 그리고 각 섹터가 수익을 내는 방식과 관련하여 논리를 삽입해야합니다. 예를들어, 'XLE'이 최고의 선택인 경우에 대해 어떻게 이야기할 것인가요? 어떤 전략과 주식이 그들의 부문별 트랙 레코드와 함께 성공하는 이유에 대해 대략적으로 설명하십시오.

여기 ChatGPT가 제공한 스니펫이에요:

에너지 섹터 (XLE)

  • 추천 전략: 상승 시장에서는 터틀 전략; 하락 시장에서는 RSI 볼린저 밴드 전략.

  • 이유: 에너지 섹터의 순환적인 성격은 동적인 접근을 요구하며, 성장 단계에서는 추세를 활용하고, 쇠퇴 기간의 변동성을 관리해야 합니다.

금융 부문 (XLF)

  • 권장 방법: Buy Hold Sell 전략을 유지하세요.
  • 이유: 금융 부문은 금리와 경제 지표에 민감하기 때문에 적극적인 거래 방식을 통해 다양한 시장 단계에서 이익을 얻을 수 있습니다.

ChatGPT는 매우 구체적이고 상세한 결과를 제공할 수 있습니다. 물론 길어지기도 하죠. ChatGPT에게 "XLE를 제외하고 이 기간에 한 가지 ETF만 거래하려고 할 때 어떤 주식과 거래 방법을 사용해야 하는지 알려주세요"와 같이 간단한 질문을 하실 수도 있어요.

그리고 이러한 전략을 더 백테스트하고 정교화하기 위해 다양한 기간에서 더 많은 데이터를 가지고 있습니다:

2020년 11월부터 2022년 01월까지: 코로나19로 인한 첫 번째 상승 시장입니다.

2024-07-13-Beforeyouhitthequanttradingsceneswingbymydatascienceanalysisyoursecretweaponformakingthosetradesworkharder_2.png

2021–12부터 2022–10까지: 코로나 이후의 곰 시장을 통해:

2024-07-13-Beforeyouhitthequanttradingsceneswingbymydatascienceanalysisyoursecretweaponformakingthosetradesworkharder_3.png

2022–02부터 2023–05까지: 혼합 시장, 첫 곰 시장에서 시작하여 후에 황홀 시장으로 바뀜:

이미지

2020–12부터 2022–12까지: 상승에서 하락으로 바뀌는 혼합 시장, 결과는 호황:

이미지

백테스팅을 위한 Python 스크립트는 제 깃허브 저장소에서 확인하실 수 있습니다:

https://github.com/datalev001/stock_trading

끝내는 중: 나의 마지막 생각

우리의 데이터 탐구를 마무리 짓는 시간입니다. 솔직히 말하자면, ChatGPT가 도달한 결론마다 100% 동의하는 것은 아니지만, 내가 제공한 데이터를 기반으로 한 꽤 탄탄한 추론을 제시했기 때문에 일부는 인정할 필요가 있습니다. 에너지 지수 펀드를 예로 들자면, 서로 다른 부문과 거래 전략에 40개월이라는 꽤 긴 시간을 투자한 후, 시장 코드를 풀어내는 것이 제각각의 도전임이 분명해졌습니다. 하지만, 우리가 모은 통찰력은 충분히 가치가 있는데, 이를 통해 트레이더들을 특정 방향으로 이끌어주고 있습니다.

요지는 여기에 있습니다: 양적 거래로 큰 파동을 일으킬 계획이라면, 전략을 선택하기 전에 집중해서 시장과 귀하가 활동하는 부문을 이해해야 합니다. 물론, 그저 곁에서 구경만 하고 있다가도 괜찮습니다. 내 연구 결과는 최소한 거대한 결정을 내릴 때 몇 가지 생각거리를 제공해줄 것입니다. 게다가, 이러한 전략들의 장기적인 지속 가능성을 고려하는 것도 매우 중요합니다.

그럼 전략별로 평균 수익률에 대해 이야기해볼까요? 일반적으로, 간단한 매수 보유 전략이 대부분의 투자자에게 가장 좋은 선택일 수도 있어요. 양적 방법으로 평균을 넘어서는 것이 불가능하다는 뜻은 아니에요 — 진실하게 노력해야 할 뿐이에요.

하나 확실한 것은, 이 분야에서의 경험이 나에게 데이터 과학이 양적 거래에 있어서 교섭 불가능한 요소임을 납득시켰어요. 그러나, 그리고 중요한데, AI가 인간의 통찰력을 곧 대체할 가능성은 아직 없어요.