[초과 수익을 찾아서] 11장 세 개 축 계획 ~ 22장 SNS와 수익률

Recent Posts

Today

Total

관리 메뉴

PRAESENTIA

[초과 수익을 찾아서] 11장 세 개 축 계획 ~ 22장 SNS와 수익률 본문

퀀트 공부/금융공학

[초과 수익을 찾아서] 11장 세 개 축 계획 ~ 22장 SNS와 수익률

박병후 2023. 5. 19. 18:30

Finding Alphas

11장. 세 개 축 계획

알파 공간을 탐색하려면 세 가지 축(TAP)이 필요
- 구조화된 전략
- 앵커링 포인트
- 방향 기법
탭은 복잡하고 다차원적인 알파 전략을 조직하기 위한 도구, 포트폴리오 다각화에 이점
- 이에 맞춰 위 3가지를 이렇게 구체화할 수 있음
- 1. 아이디어와 데이터셋
  - 아이디어: 회귀, 모멘텀, 계절성, 학습, 앞섬-지연
  - 데이터셋: 펀더멘털, 애널리스트, 센티멘트, 소셜 미디어, 옵션
- 2. 성과 파라미터
  - 높은 수익률, 샤프지수, 낮은 비용, 낮은 MDD
- 3. 지역 및 유니버스
  - 지역: 미국, 유럽, 아시아 등
  - 유니버스: top50, 특정 섹터 등
탭 구현
- 하나의 축을 먼저 타깃으로 정하고, 나머지 두 축을 유연하게 조작
  - 우리의 경우 유니버스가 사실상 한정되어 있음, 따라서 1번과 2번의 우선순위만 정해서 진행하면 될 듯
  - 아니면 메이저(시총 상위 top5 코인)와 알트 코인으로 나눠서, 앞에서 유효한 전략과 나머지에서 유효한 전략 정도는 비교해볼 수 있을 듯
  - 약간 빈틈없이, 포트폴리오를 짜고 전략을 구현하게 도와주는 기법이 이 탭이라 생각됨

12장. 알파 강건성 향상을 위한 기법

강건성의 두 가지 요소
- 불변: 알파는 통계적 특성을 반영하되, 거래할 금융상품의 선택과는 독립적이어야 함
- 견고성: 알파는 벤치마크 대비 급격한 하락이 있어서는 안 됨
  - 여기서 벤치마크 지표로는 정보비율, 최대 손실율, 수익률 등
강건성 개선을 위한 방법
- 1. 순서 방법: 불변성을 강화
  - 랭킹: 벡터의 요소를 어떤 정렬 기준에 따라 순위로 대체하는 연산, 스피어맨의 순위 상관관계를 정의하는 데 활용 가능
  - 분위수 근사치: 순서가 지정된 데이터셋을 동일한 크기의 데이터 하위 집합으로 분할하는 것이 q-분위수의 동기
- 2. 정규분포에 대한 근사치
  - 임의 분포 함수를 다음의 방식을 거치면 정규분포로 변환 가능
  - 피셔변환 공식, Z-score
- 3. 제한 방법: 이상치 영향 최소화
  - 트리밍: 임계값보다 높거나 낮은 일부 데이터 제거
  - 윈저화(winsorization): 트리밍과 비슷하나 극단값을 버리는 대신 컷오프 값으로 대체하는 방식
  - 트리밍이나 윈저화 방식을 통해 강건성을 높일 수 있음

13장. 알파와 리스크 팩터들

자본자산가격결정모형(CAPM)
- 기대수익률 = 무위험 수익률 + 주식시장 베타(위험 요인) * 시장 위험 프리미엄
- 다만, CAPM은 제한적 가정과 실증적 데이터와의 불일치로 많은 도전을 받음
- 이에 차익거래가격결정론(APT)가 개발됨
차익거래가격결정론(APT)
- 기대 수익률 = 무위험 수익률 + sum(주식 요인 베타 * 요인 위험 프리미엄)
파마 프렌치 N요인
- 3요인: 시장 위험, 기업규모, 가치 요소
- 5요인: 3요인 + 수익성, 투자
- 파마 프렌치 5요인에 흡수되지 않은 요인들도 물론 있음 => 모멘텀 효과, 유동성 효과, 발생액 이상 현상
적응형 시장 가설(AMH)
- 각 요인이 비합리적 투자의 결과인지, 어느 정도 체계적인 리스크에 대한 보상인지 구별이 어려움 -> 그나마 AMH로 약간의 인사이트만 얻을 수 있음
- AMH는 시장이 균형을 이룬다 보지 않음, 대신 진화 과정으로 시장의 역동설 설명
- 시장 기회의 위험과 보상은 안정적이지 않으며, 투자 전략도 퇴색될 수 있음. 즉, 최상의 기회는 짧은 시간 동안만 유효하다는 것
알파와 베타
- 장기적으로 긍정적 수익을 낼 수 있는 알파라 해도, 연구 과정에서는 헤지펀드 베타(위험요소)가 될 수 있음. 때문에 위험 요인의 높은 부하를 피하는 것이 좋음
- 위험 요소들을 중립화해 알파 강도를 평가할 수 있는데, 가장 일반적인 방법은 알파 포트폴리오를 위험 요인 포트폴리오로 다변량 회귀 분석하는 것(p.149)

14장. 리스크와 손실율

위험 추정
- 포지션 기반 조치
  - 현재 포지션에 기초한 추정량
  - 특정 증권, 상관관계가 있는 유가증권 그룹 등의 외부적 위험은 포지션 집중으로 측정 가능, 매우 집중된 포지션의 예측이 틀리면 큰 손실 발생
  - 주어진 포지션의 과거 수익률을 팩터의 과거 수익률로 회귀분석하는 방법도 가능
과거 손익 기반 조치
- 알파의 과거 포지션의 성과를 검토하는 방법(알파 포지션이 현재 환경에 적응되어 있다 가정)
- PnL 값은 천천히 변화하니 이러한 조치는 좀 더 부드럽고 변동이 적으나, 급작스러운 변화에 대응이 느림
- 좀 더 강력한 알파 전략은 가능한 많은 섹터에 걸쳐 성과를 균등하게 만드는 것이 좋음
손실 폭
- 가장 큰 규모의 하락 & 가장 긴 기간의 하락, 둘 모두 고려해야 함
- 기본적으로 연율화 수익률이 하락폭 보다 커야 함.
- 문제는 큰 낙폭이 드물게 발생하기 때문에 손실 폭은 쉽게 과적합 됨. 이를 방지하는 방법 중 하나가 bootstrapping
  - 알파 손익의 자기상관도(autocorrelation)를 측정
  - 자기상관 기간과 같은 길이의 손익 snippet을 임의로 선택해, 1000개의 합성 10년 손익 데이터를 생성
  - 합성 손익의 최대 손실 폭 분포도를 표시
위험 통제
- 가능한 경우 다양화
  - 새로운 지침, 새로운 지역, 새로운 자산을 포함시키며 다양화 추구
  - 그러나 너무 다양한 경우 의미 있게 수익률에 기여하기 어려움
- 외부 위험 감소
  - 외부 위험은 중립화나 리스크 헷지로 통제 가능. 포지션 집중의 경우 개별 포지션에서 그룹 평균을 빼거나, 포지션 벡터를 팩터 벡터에 직교하거나, 팩터의 베타 곱을 빼면 쉽게 달성
  - 리스크 헷지는 다른 금융상품을 회피 수단으로 쓰는 것
- 내재적 위험 감소
  - 소프트한 중립화나 위험 헷지 후에도 남아있는 내재적&외재적 리스크는 동적 포지션 변경에 의해 제어되어야 함
  - 이럴 때 보는 알파는 CBOE 변동성 지수, 위험 회피 자산으로의 자금 흐름, 상관관계 고유값의 급증 등
- 단순회피
  - 아예 거래를 하지 않는 것도 방법

15장. 자동화 검색에서 찾은 알파

자동화 알파 탐색
- 겉으로는 훌륭해 보이는 알파 시그널 대부분이 잡음이며 예측력 없음. 즉, 자동화된 알파 탐색은 과적합을 피하는 데 초점
자동 검색의 문제점
- 세 가지 문제점: 계산 부하 발생, 모든 요소를 수동으로 검사 못함, 각 알파에 대한 신뢰도가 낮아짐
몇 가지 팁
- 때문에 입력 데이터를 너무 많은 범주에서 가져오면 안됨
- 단위를 쓰지 않는 비율을 입력 데이터로 활용할 것
  - 기업 이익보다는 이익을 매출로 나눈 값을 비교하는 게 좋음
  - 또 현재값을 과거값으로 나눠 사용하는 것도 가능
- 불필요한 검색 공간 제거
- 중간 변수
  - 둘 이상의 기본 데이터의 단순한 함수와 관련된 중간 변수가 강력한 알파 값을 창출할 수 있음
- 단순 알파들
  - 알파 공간의 복잡성을 계속 증가시키고 싶은 유혹이 들지만, 이건 좋지 않음. 되려 입력 데이터와 시험 함수 등을 확장하는 폭 기반 접근법에 더욱 집중해야 함.
- 백테스팅 기간
  - 기간이 늘어났을 때 통계적 유의성은 증가하나, 데이터의 역학 관계가 동일하다는 가정에서만 유효함. 금융시장은 참여자들의 행동이 빠르게 변화하므로 무조건 길다 해서 좋은 게 아님
  - 백테스트 기간이 너무 길 때는 기간을 분할하고 일관성 탐색하는 걸 추천
- 알파 배치
  - 검색 공간 전체의 성과를 배치 성과라 함. 단일 알파 전략보다 이 배치 성과가 좋을수록 강건한 알파임(MA나 threshold 값이 조금 바뀌더라도 여전히 준수한 성과를 유지하는 전략이 좋은 것)

16장. 알파 연구에서의 머신러닝

생략(개괄적인 ML 소개)

17장. 알고리즘 사고

최적화와 손실 함수
- 손실 함수를 잘 선택해야 효과적인 최적화 알고리즘을 골라낼 수 있음
- 가령 L2가 우수한 성과 제공에는 유용하나 이상치에 대해서는 덜 강건함
편향-분산 trade-off
- 통계적으로 유의미한 결과를 얻으려면 충분히 큰 데이터 표본이 필요하나, 데이터를 얻으려 과거로 더 돌아갈수록 데이터 포인트의 관련성은 줄어듦.
- 때문에 학습 시 차원을 줄이거나 문제 구조에 대한 약간의 사전 지식을 포함시킬 필요가 있음
- 분산이 높은 모형은 지나치게 과대적합, 편향성이 높은 모형은 문제를 지나치게 단순화하여 과소적합 됨.
축소 모수 추정량
- 높은 차원의 데이터를 다룰 때 일부 추가 정보를 결합하여 차원을 축소하는 방식
- 가령 공분산 행렬의 추정량을 즉흥적으로 수정 가능. 공분산 행렬의 표본 추정 모수를 구조적 추정 모수(상수 상관 모형 기반)로 축소함으로써 더 좋은 성과 가능
파라미터 최적화
- 동적 파라미터 최적화가 정적인 것보다 더 효율적임

18장. 주식 가격과 거래량

효율적 시장 가설(EMH)
- 가격과 거래량은 시장에서 이용 가능한 정보를 충분히, 즉각적으로 반영하고 있다는 가설
거래 빈도
- 거래 빈도가 높은 전략일수록 통계적으로 유의
- IR과 거래비용은 trade-off 관계
모멘텀반전 효과
- 개별 종목은 모멘텀이 존재, 상관관계가 있는 종목군 내에서는 사뭇 다른 모습
- 단기적으로는 평균 회귀 현상이 있으나, 장기적으로는 대세 추세를 따름
정수 효과
- 투자자 심리와 연관, 대체로 소수점보다는 정수형으로 매매한다는 것.
- 1%의 손실이 1%의 이득보다 더 중요. 때문에 손실난 종목을 더 오래 보유함
이벤트 효과
- 가격 이외의 다른 유형의 데이터, 가령 기업 이벤트와 결합했을 때 효과가 유의미
- 특정 월에 수익을 발표하는 모든 회사 주식을 매수, 공시하지 않을 것으로 예상되는 종목은 숏을 치면, 연평균 7~18%의 수익률 기록

19장. 재무제표 분석

긍정적 팩터
- 재무제표 기본
  - 대차대조표
    - 미래 수익률과 긍정적인 상관관계의 팩터 발굴
    - 회사 건전성에 대한 스냅샷 제공
  - 손익계산서, 현금흐름표
    - 대차대조표와 마찬가지, 미래 수익률과 긍정적인 상관관계 팩터 발굴
- 성장
  - 회사의 성장성 관련 수치들
  - ex) 재고 감소, 매출채권 개선, 관리비 절감, 법인세율 개선 등
부정적 팩터: 숏 포지션에 유용

20장. 기본적 분석과 알파 연구

기본적 분석 핵심 아이디어
- 회사의 수익이 꾸준히 증가하는가
- 부채상환능력이 있는가
- 수익의 질이 높고 수익성이 좋은가
- 부채 대비 유동자산이 충분한가
재무제표 분석
- 미래 수익률을 분석할 때는 발생액보다 현금흐름 이익에 의존할 것
분기별 컨퍼런스콜은 현재 상황과 향후 실적을 보여줌. 재무제표가 과거라면 컨퍼런스콜은 미래 대변
거시경제적 변수
- 근본적인 주가 지표로 사용 가능
기본적 데이터는 업데이트 빈도가 낮으므로 주식에 즉각 반영되진 않으나 장기적으로 영향

21장. 모멘텀 알파 소개

모멘텀
- 이전에 상승하던 종목이 더 오를 가능성이 높다는 가설, 시장의 이상현상 중 하나, 시간이 지나며 조정되기도 함
모멘텀 전략 근거?
- 새로운 정보에 덜 반응하는 경향
  - 공시가 발표되기 전에 가격이 움직임, 애널리스트들의 권고 때문
  - 기본적으로 정보 공개가 지연될수록 모멘텀 수익은 증가함
- 이벤트 기반 알파
  - 뉴스나 이익 발표 등을 토대로 해당 사건 터지기 전에 수익률에 기초하여 계산하는 알파
- 또래 효과
  - 애널리스트들 역시 동일한 집단과 마찬가지의 권고를 함, 이는 시간 지연으로 이어져 정확한 예측에 실패하게 함
- 이런 효과들이 존재하기 때문에 모멘텀 현상이 발생
대안 가설
- 베팅에 유의적인 위험을 감수하고, 그에 대한 보상으로 수익을 얻는 방식
- 성장주가 기본적으로 평가가 어렵기 때문에 가치주보다 모멘텀 수익이 좋음
- 매수-매도 호가 스프레드가 높은 종목일수록 상대적으로 높은 수익
- 매분기 마지막 월에는 모멘텀 알파 전략이 잘 먹힘

22장. 뉴스와 소셜 미디어가 주식 수익률에 미치는 영향

감성
- 뉴스의 질을 측정. 긍정/부정/중립과 같은 형태.
- 가령 A의 감성지수가 70 이상이면 롱하고, 30이하면 숏하는 형태
참신성
- 뉴스가 새로운 이야기인지 아니면 오래된 이야기의 갱신인지 측정
- 덜 참신한 뉴스일수록 이미 시장에 반영되어 시장에 미치는 영향이 적음
관련성
- 특정 종목에 대한 뉴스의 초점을 측정
- 하나의 뉴스 스토리는 제품의 공급망에 있는 여러 회사에 대해 이야기 할 수 있음, 이 경우 제품을 직접 제조하는 회사는 관련성이 가장 높고, 공급망을 따라 멀리 있는 기업들은 관련성 점수가 낮아짐
뉴스 카테고리
- 뉴스 카테고리가 다르면 시장에서 반응하는 시간도 다를 수 있음
- 시장은 각 시점마다 뉴스에 상이한 선호도를 지님
- 일부 뉴스 카테고리는 특정 산업과 섹터에만 영향을 미칠 수 있음
기타
- 기업 관련 뉴스가 적을수록 대체로 좋음
- 뉴스가 즉각적으로 시장에 영향을 미치지 않는다면, 이후에 뉴스가 널리 알려지고 이해되면서 모멘텀을 보일 수 있음
소셜미디어
- 소셜미디어는 더 많은 수의 레코드를 가지며 업데이트도 빠름
- 소셜 미디어는 콘텐츠 형식에 구애받지 않음. 가령 약어와 서식이 많음
- 소셜 미디어는 가짜 시그널이 많음

저작자표시 (새창열림)

'퀀트 공부 > 금융공학' 카테고리의 다른 글

[초과 수익을 찾아서] 23장 주식옵션시장 ~ 30장 선물 거래의 알파 (1)	2023.05.20
[초과 수익을 찾아서] 1장 알파 설계 ~ 10장 편향 통제 (0)	2023.05.18
[AFML] 12장 교차검증 백테스트 ~ 16장 자산배분 (0)	2023.05.17
[AFML] 7장 금융에서의 교차검증 ~ 11장 앙상블 기법 (1)	2023.05.16
[AFML] 2장 금융 데이터 구조 ~ 6장 앙상블 기법 (0)	2023.05.15

'퀀트 공부/금융공학' Related Articles

Comments

PRAESENTIA

[초과 수익을 찾아서] 11장 세 개 축 계획 ~ 22장 SNS와 수익률 본문

[초과 수익을 찾아서] 11장 세 개 축 계획 ~ 22장 SNS와 수익률

'퀀트 공부 > 금융공학' 카테고리의 다른 글

티스토리툴바