전체 글(187)
-
GaussianHMM으로 시장 국면을 분류한 방법
https://dinsightlab.com Passive미국 지수 투자자를 위한 금융 데이터 분석 사이트dinsightlab.com GaussianHMM으로 시장 국면을 분류한 방법 AI 기반 미국 주식 분석 플랫폼 Passive의 핵심 기능인 Noise vs Signal 국면 분류기 구현 과정을 기록한다.왜 시장 국면 분류가 필요했는가ETF 투자자에게 가장 위험한 순간은 "지금 시장이 이성적으로 움직이고 있는가, 아니면 감정에 의해 움직이고 있는가"를 구분하지 못할 때다.주가가 오르고 있어도 펀더멘털 대비 고평가된 상태에서 감정이 이끄는 상승이라면 매수 타이밍이 아니다. 반대로 주가가 급락해도 펀더멘털이 견고하다면 공포에 의한 과매도 구간일 수 있다.이 판단을 숫자로 만들고 싶었다. "지금 시장이 이성..
2026.05.03 -
XGBoost로 급락·급등 예측 모델을 만든 방법
https://dinsightlab.com Passive미국 지수 투자자를 위한 금융 데이터 분석 사이트dinsightlab.com XGBoost로 급락·급등 예측 모델을 만든 방법 혼자 만든 AI 주식 분석 플랫폼 Passive의 핵심 모델 구현 과정을 기록한다.이 글은 "어떻게 만들었는가"보다 "왜 이 선택을 했는가"에 집중한다.왜 조기경보 시스템이 필요했는가GaussianHMM으로 시장 레짐을 분류하는 데 성공했지만, 한 가지 중요한 질문이 남았다."지금 강세 국면인 건 알겠는데, 곧 급락이 올 가능성은 얼마나 되는가?"레짐 분류는 현재 상태를 알려주지만, 단기 리스크 이벤트를 사전에 감지하지는 못한다. 강세 국면 한가운데서도 갑자기 -10% 급락이 발생하는 게 시장이기 때문이다. 이 문제를 풀기 ..
2026.05.03 -
GaussianHMM으로 S&P 500 시장 레짐을 분류한 방법
https://dinsightlab.com Passive미국 지수 투자자를 위한 금융 데이터 분석 사이트dinsightlab.com GaussianHMM으로 S&P 500 시장 레짐을 분류한 방법 왜 시장 레짐 분류가 필요했는가Passive를 기획할 때 가장 먼저 고민한 것은 "사용자에게 어떤 판단 근거를 줄 수 있는가"였다.단순히 주가 차트나 ETF 수익률을 보여주는 서비스는 이미 넘쳐난다. 내가 만들고 싶었던 건 "지금 시장이 어떤 국면인지"를 데이터로 명확하게 알려주는 기능이었다. 같은 ETF라도 상승기에 사는 것과 하락기에 사는 것은 완전히 다른 결과를 만들기 때문이다.문제는 시장 국면이라는 게 직접 관측할 수 없다는 점이다. 우리가 볼 수 있는 건 주가 수익률, VIX, 스프레드 같은 관측 데이..
2026.05.02 -
18년치 금융 데이터 파이프라인을 혼자 설계하면서 배운 것들
"과거 데이터를 모으는 건 쉬울 줄 알았습니다"Passive를 만들 때 가장 먼저 부딪힌 벽은 모델이 아니었습니다. 데이터였습니다.HMM이든 XGBoost든, 머신러닝 모델의 품질은 결국 학습 데이터에 달려있습니다. 미국 시장 레짐을 판별하려면 최소한 여러 경기 사이클이 포함된 데이터가 필요합니다. 2008년 금융위기, 2015년 유가 쇼크, 2020년 코로나, 2022년 인플레이션 — 이런 "다른 시장 얼굴"들이 학습 데이터에 있어야 모델이 다양한 상황을 구분할 수 있기 때문입니다.그래서 목표를 잡았습니다. 2007년부터 현재까지, 18년치 데이터. 처음엔 "그냥 FRED에서 긁어오면 되는 거 아닌가?"라고 생각했습니다. 그게 첫 번째 오판이었습니다.문제 1. "한 곳에서 다 주는 데이터가 아니다"Pa..
2026.04.15 -
인덱스 투자자에게 시장 분석 도구가 필요한 이유 — Passive 앱 개발지 ①
📌 앱 바로가기: Passive - 미국 지수 투자 분석 이 글은 Passive 앱 개발 과정을 다루는 시리즈의 첫 번째 글입니다. Passive미국 지수 투자자를 위한 금융 데이터 분석 사이트passive-financial-data-analysis-production.up.railway.app 해결하고자 했던 문제2024년 기준, 전 세계 인덱스 펀드에 투자된 자산은 약 15조 달러를 넘었습니다. 뱅가드 창립자 존 보글이 1975년에 첫 인덱스 펀드를 만들었을 때, 월가에서는 "보글의 어리석음(Bogle's Folly)"이라고 비웃었습니다. 50년이 지난 지금, 인덱스 투자는 개인 투자의 표준이 되었습니다.S&P 500 ETF 하나만 사서 20년을 들고 있으면 연평균 10% 수익률을 기대할 수 있습니..
2026.03.16 -
데이터 분석 머신러닝/통계분석/분석기법/전처리/시각화 종류 총정리
이번 포스트에서는 데이터 분석에는 어떤 대표적인 머신러닝 알고리즘이 있는지, 또한 분석에 많이 쓰이는 통계분석, 비즈니스적 그외에도 다양한 도메인 맞춤형 분석기법과 데이터 전처리, 시각화 종류들에 대해서 나열을 하고 다음 포스트에서 하나씩 상세히 설명하도록 하겠습니다.머신러닝 알고리즘1. 비지도 학습 (Unsupervised Learning)정답(레이블)이 없는 데이터에서 패턴이나 구조를 찾아내는 기법입니다. 질문하신 클러스터링과 연관분석이 여기에 해당합니다.군집화 (Clustering)K-Means: 데이터를 K개의 그룹으로 묶는 가장 대표적인 알고리즘입니다.계층적 군집화 (Hierarchical Clustering): 계층적 트리 구조를 이용해 데이터를 군집화합니다.DBSCAN: 데이터의 밀도를 기반..
2026.02.22