>source

저는 시계열 예측과 LSTM을 모두 처음 사용하므로 이 질문이 이 사이트에 속하지 않는 경우 사과드립니다.

약 240개의 항목으로 구성된 비교적 간단한 데이터세트가 있습니다.엑스그리고와이쌍. 이 경우 데이터는 매주 같은 날 같은 시간에 기록되었습니다. 불행히도 짧은 간격(전체 기간의 약 5%) 동안 데이터를 얻을 수 없었습니다.

제 목표는 Keras의 LSTM을 활용하여 60개의 후속 포인트에 대한 데이터를 예측하는 것입니다. 그러나 이 간격으로 무엇을 해야 할지 잘 모르겠습니다. 나는 모든 점을 간격의 오른쪽으로 단순히 이동하여 연속 데이터로 처리하는 것에 대해 생각했지만 네트워크 교육 및 후속 모델에 부정적인 영향을 미칩니다. 사용에 대해 들었습니다마스킹()잠재적인 솔루션으로 이것이 최선의 솔루션처럼 보입니다. 그런데 예측이 처음이라 더 좋은 방법이 있는지 여쭤보고 싶습니다.

  • 답변 # 1

    마스킹은 이 문제를 방지하는 좋은 방법입니다. 다른 방법은 예측을 사용하여 LSTM을 재교육하는 것입니다. 내 말은 Masking()을 사용하여 훈련했다고 상상하고 훈련된 LSTM을 사용하여 %5 간격을 예측한다는 것입니다. 그런 다음 간격이 없는 이 데이터 세트로 LSTM을 다시 훈련시킵니다. 때때로 이것은 LSTM을 오도하기 때문에 문제를 일으킬 수 있지만, 다소 패턴화된 시퀀스가 ​​있는 경우 LSTM을 훈련하는 데 도움이 될 수 있습니다. 일반적으로 이 방법은 다른 유형의 데이터 부족에 유용합니다(때로는 작동하지 않더라도). 이것과 마스킹보다 귀하의 경우에는 방법을 모릅니다.

    이 데이터 세트에 대해 만들기를 사용하려면 교육 및 검증 기간을 분류하는 것이 좋습니다.

    Stan2022-02-04 18:55:42
  • 이전 dspace : 컬렉션의 일부 항목은 컬렉션 목록에 표시되지 않으며 강도 수를 계산할 때 포함되지 않습니다.
  • 다음 c++ : #configurationProvider 설정에서 제공한 정보를 기반으로 감지된 오류 포함