반응형
데이터셋
YouTube-8M benchmark
- video preprocessing
- 관련 없는 비디오 제거
- 정보 누락된 비디오 제거
- rescale(224 x 224)
- deep feature extraction
- 각 비디오 클립의 전처리된 프레임 추출
- imageNet으로 사전 훈련, EfficientNetB7에 입력으로 전달
- 각 비디오 클립의 전처리된 프레임 추출
- video representation and classification
- 각 비디오 클립의 전처리된 프레임 추출
- BiLSTM로 학습 이후 fully connected, softmax를 지나 분류
- 각 비디오 클립의 전처리된 프레임 추출
반응형
댓글