추출한 regional proposal output을 모두 동일 input size로 만들어 주기 위해 warp 해준다.
2000개의 warped image를 각각 CNN 모델에 넣는다.
각각의 Convolution 결과에 대해 classification을 진행하여 결과를 얻는다.
R-CNN의
RoI (Region of Interest) 마다 CNN연산을 함으로써 속도저하
multi-stage pipelines으로써 모델을 한번에 학습시키지 못함
한계점들을 극복함.
1-1. R-CNN에서와 마찬가지로 Selective Search를 통해 RoI를 찾는다.
1-2. 전체 이미지를 CNN에 통과시켜 feature map을 추출한다.