Coding Is My Life

코딩은 인생

카테고리 없음

[기타][앞으로 포스팅 계획]

산기대 컴공 2022. 11. 5. 02:00
728x90

포스팅의 전체적인 주제

이전글인 고점 저점 알고리즘을 이용한 추세 예측에 대한 매매 전략과 전략에서의 문제점의 대해서 포스팅을 할 계획이다. 이전에 분석 했던 내용은 바이낸스 BTC/USDT의 1d 데이터만을 가지고 단순히 최근 몇개의 데이터만을 테스트해보았지만 최근 1m 데이터를 가지고 여러방면으로 분석하고 교차검증한 결과 유의미한 모델이 나와서 이 모델에 대한 전략을 생성해서 자동매매를 해보았다. 여러가지 문제점이 있었지만 나름 안정적인 수익률이 나왔고 이 모델을 더 발전할 수 있는 방향과 보안점을 기점으로 포스팅하려고 한다.

포스팅 주제

1. 저점/고점 주변 몇%의 데이터를 저점/고점과 같이 라벨링과 하락추세와 상승추세 라벨링의 결합

기존의 추세 라벨링에서는 예측 클래스가 상승추세, 하락추세 두가지 였다면 이번에는 저점 and 주변, 고점 and 주변, 상승 추세, 하락 추세 이렇게 4가지 클래스로 나눠서 예측해보고 그에 따른 기존 상승/하락 추세 예측모델과의 차이와 새로운 클래스에 대한 예측이 제대로 이루어지는지 분석해 볼 계획이다.

 

2. 1분봉 데이터가 아닌 30분봉 1시간봉, 4시간봉에 대한 중장기 추세 예측

1분봉 모델에서 사용하던 파이프 라인에서 파라미터를 수정해가며 중장기 추세도 예측 모델을 만들고 분석해 볼 계획이다.

 

3. 기존의 1분봉 추세 매매의 급락시 대처 방법(저점 대량 매수)에 대한 매매전략 백테스팅

1분봉 추세 예측을 기반한 자동매매에서의 문제점인 급락시 대처점으로 저점에서 대량 매수 또는 다른 전략들을 백테스팅하여서 기존의 전략을 보안할 계획이다.

 

4. 고점/저점을 찾는 예측 모델 -> 실현 가능성이 낮다

이미 분석을 하였지만 파라미터를 조정해보면서 까지 깊이 분석해보지는 못했다 하지만 기존의 파라미터로 예측해서 분석해보았을 때 실현가능이 낮다고 판단했다.

 

5. 스케일링 방법 및 스케일링 데이터와 원본 데이터의 정확도 및 예측 내용 분석

스케일링을 하지 않은 데이터로 모델을 훈련시켰을 때와 스케일링을 사용해서 모델을 훈련시켜서 어느쪽이 더 좋은 성능을 내는 지 비교해 보겠다. 스케일링 방법에는 일반적으로 minmax 스케일링이 있으나 금융 데이터이기 때문에 상대적인 수치여야한다고 생각하기 때문에 전날의 종가로 모든 요소들을 나누어 주면 어떨까하는 방법도 생각해 보았다. 그이외에도 많은 스케일링 방법을 연구할 계획이다.

 

6. 4번의 내용에서 마지막 출력값의 확률을 0.5가 아닌 다른 값으로 조정

보통 바이너리 분류 문제에서는 마지막 시그모이드 함수의 출력값 0.5을 기준으로 분류를 하지만 이 기준을 조정하여 확실한 상승추세, 하락추세를 알아내겠다는 의미이다.

 

7. 이전의 예측했던 라벨을 다시 다음 라벨의 입력값으로 넣으면 어떨까?

RNN 모델에서 히든 노드를 구하는 과정에서 이전 시점의 히든 노드를 입력으로 넣는 것에 아이디어를 얻었다. 추세도 똑같은 시계열 데이터이기에 이전 값에 영향을 받는다. 그래서 이와 같은 방법을 제시한다.

 

8. 2번의 내용에서 중/장기 추세예측이 가능해질시 그에 따른 기준의 1분봉 추세매매에 대한 롱숏 결정

중장기 추세에서 상승장이 나오면 1분봉으로 하는 추세매매에서 롱으로 매매전략을 세운다면 더 안전한 매매를 보장받을 수 있다.

 

9. 데이터를 수집하는데 필요한 자동화

1m,3m,5m,15m,30m,1h,4h,1d,1w.. 모든 코인의 데이터를 저장하는 필요가 있어보인다.

 

10. 매매전략 : 하루에 ex(20%) 이상 나온 봉에 대한 시가가 저항이라는 차트 분석이 있는데 이것에 대한 벡테스팅

저항이 생기는 자리에서 매매 후 반등이 오면 매도하는 전략, 저항자리에서 반등이 일어나는지? 일어난다면 평균적으로 얼마정도 반등이 생기는지 분석 필요 

728x90