728x90 반응형 728x90 반응형 kernel 평활 1 시계열 자료의 평활법 - 회귀평활 part 1 지난 포스트에 이어서 우리는 불필요한 잡음을 없애는데 계속해서 주력할 것이다. 왜냐? 대부분의 주식투자자들이 추세를 판가름하고자 할때 이동평균을 많이 활용한다. 즉 어제 오늘의 변동성에 휘둘리기 싫다는 의미가 된다. 하물며 일반적인 투자도 그러할진데 모델링을 이용한 AI 혹은 EA(Expert Adviser)로 구현하고자 한다면 더 더욱 이러한 문제에 직면하게 된다. 추후 다루겠지만 강화학습을 수행함에 있어서 일반적인 Policy Gradient 에서도 이러한 문제가 발생을 한다. 간단히 부연설명을 하자면 환경에서 주어지는 데이터가 조금만 변하더라도 정책 신경망의 최적화된 파라메터는 급격히 변동을 한다. 이러한 문제를 해결하고 강화학습의 학습이 잘 되도록 하기 위해서 Actor-Critic, A3C 등의.. 2020. 10. 15. 이전 1 다음