이 문서는 고객사에서 Deepflow Forecast 로 수요예측 모델링을 위한 데이터들을 전송하는 방법을 설명합니다.
데이터셋은 데이터의 ‘기준 시간’ 필드 유무에 따라 EVENT와 METADATA 로 구분됩니다.
데이터셋 타입은 스키마 규격서나 Deepflow CLI 로 확인이 가능합니다
기준 시간 필드에 대해 정리하자면 다음과 같습니다.
대용량 데이터를 다루는 입장에서는 특정한 덩어리 단위로 데이터를 관리하는데 이 덩어리 단위를 ‘파티션’ 이라고 합니다.
데이터셋 타입마다 파티션의 유무와 처리 방법이 다릅니다
데이터타입 | 파티션 단위 저장 | 데이터 업데이트시 |
---|---|---|
METADATA | X | 전체 교체 |
EVENT | O | 파티션 단위 교체 |
기준시간 필드는 데이터를 월간 단위로 구분하는 기준이 됩니다.