MENU

Fun & Interesting

금융과 딥러닝 - 금융 영역에서의 딥러닝은 어떻게 다른가?

NAVER D2 53,678 6 years ago
Video Not Working? Fix It Now

발표자: 문효준 (크래프트테크놀로지스) 더욱 다양한 영상을 보시려면 NAVER Engineering TV를 참고하세요. https://tv.naver.com/naverd2 발표월: 2019.3. ○ 개요 * Frequency별 금융 상품 소개 (크래프트 프로젝트 소개) - Ultra low frequency : 자산배분문제 (3달 ~ 6달) - low frequency : 로보어드바이저 (2달~3달) - median frequency : 펀드, ETF (1달~2달) - high frequency : 주문집행, 마켓메이킹 (일단위 밑) ○ 문제점 정의 - 금융데이터로 딥러닝을 할 경우 왜 학습이 안 되는가? : 문제점 1 : Feature 종류 대비 짧은 Sequence 길이 : 문제점 2 : Feature 자체의 노이즈 : 문제점 3 : 문제점 1, 2로 인한 오버피팅 문제 - 레몬마켓 : 위 문제점들로 인해, 1) 퀀트 only 2) 퀀트 + 딥러닝 3) 잘못된 딥러닝이 대부분임. : 이런 문제로 기존 로보어드바이저는 AI라는 이름을 달고 나오지만 실제로는 AI가 아닌 경우도 있고, 딥러닝을 쓰지만 성과가 나쁜 경우가 대다수임. 이런 문제로 금융 + 딥러닝 업체들에 대한 레몬마켓 현상이 발생. ○ 크래프트 해결책 (직관에 대한 최적화) - (문제점1) Feature 종류 대비 짧은 Sequence를 어떻게 해결할 것인가? : GAN등의 방법으로 Sequence를 연장할 수도 있지만 GAN 데이터가 시계열 데이터의 패턴을 완벽하게 반영하지 않으면 데이터 생성의 의미가 없으면, 금융데이터는 시계열 간의 관계도 매우 중요함. 따라서 부적절 : 직관적으로 퀀트들은 이런 문제를 해결하기 위해 경제적 함의점을 가지는 퀀트모델들을 만듦. (간단한 팩터모델들 소개) : 우리는 퀀트모델들에 대한 직관적 사고 방식을 모사하는 딥러닝 모형을 설계. (팩터 모델, 자산배분모델 등에서 매우 잘 작동함을 확인) - (문제점2) Feature 자체의 노이즈를 어떻게 해결할 것인가? : stacked CNN AutoEncoder 기반의 노이즈 제거기술. 모듈로 확장가능성 존재 : (노이즈 제거가 잘 되는 자료 첨부, 이로 인한 학습 효과 증대) - (문제점3) 그럼에도 발생하는 오버피팅 문제를 어떻게 해결할 것인가? : Asynchronous Multi Network Learning Framework 소개. : Beam search와 유사하게 각 프로세서 개별적으로 초기화된 네트워크를 가지고 학습을 진행. validation data로 검증 후 적자생존 방식으로 오버피팅 발생가능성 최소화 발표 슬라이드: - https://www.slideshare.net/NaverEngineering/investment-and-deep-learning

Comment