Computer Vision29 FCN (2015) 논문 리뷰 FCN은 Fully Convolutional Networks for Semtantic Segmenation이란 논문에서 나온 컴퓨터 비전 알고리즘이다. (링크) 저자는 Jonathan Long, Evan Shelhamer, Trevor Darrell 이다. 제목에서도 알 수 있듯이 Semantic Segmentation 분야의 문제를 풀고자 하는 논문이다. Abstract본 논문은 Semantic segmentation의 최신 성능을 능가했다. 핵심적인 통찰 중 하나는 'fully convolutional' network로 이를 통해서 arbitrary size, 어떠한 사이즈라도 상관 없이 input을 받아서 그에 따른 사이즈의 output을 반환하면서 동시에 학습과 추론에 있어서도 효율적이다. Al.. 2025. 4. 6. Faster R-CNN (2016) 논문 리뷰 Faster R-CNN의 논문 이름은 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks이다. 저자는 Shaoqing Ren, Kaiming He, Ross Girshick, Jian Sun이다. (링크) Faster R-CNN은 이름에서 짐작할 수 있듯이 Fast R-CNN을 개선한 모델이다. Fast R-CNN의 저자인 Ross Girshick 도 참여한 논문이다. AbstractSOTA (최근의) object detection networks는 region proposal을 통해서 object locations의 대상을 추측한다. SPPnet이나 Fast R-CNN은 detection 과정에서의 소요 시간을 .. 2024. 4. 27. ResNet (2016) 논문 리뷰 ResNet이 소개된 논문 이름은 Deep Residual Learning for Image Recognition이라는 심플한 이름이다. 저자는 Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun이다. (링크)ResNet은 residual connection이 핵심인 모델이며 ILSVRC 2015 image classification에서 1등을 한 모델이다. AbstractResidual functions을 도입해서 layers input에 reference로 작용하도록 구성했다. 충분히 이해할만한 실증적인 증거들을 보여준다. 약 152 layers를 가지고 있으며, 이는 VGGNet보다 8배 더 깊은 구조를 지니지만 complexity는 더 낮다. ILSVRC .. 2024. 4. 15. Fast R-CNN (2015) 논문 리뷰 Fast R-CNN의 논문 이름은 모델 이름과 똑같은 Fast R-CNN (링크)이다. 저자는 Ross Girshick다. Fast R-CNN은 이름에서 짐작할 수 있듯이 기본적으로 R-CNN의 느린 속도를 보완하기 위한 모델이다. Abstract이 논문은 object detection을 위한 Fast Region-based Convolutional Network (Fast R-CNN)이다. 기존의 deep convolutional network에 기반한 효율적인 object proposals 분류(classify)를 활용하여 몇가지 혁신을 적용했다. 그 혁신은 트레이닝과 테스트 속도를 높이면서 동시에 detection accuracy도 향상시켰다. Fast R-CNN은 VGG16 network에 기.. 2024. 4. 14. SPPNet (2014) 논문 리뷰 SPPNet의 논문 이름은 Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition이다. 저자는 Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun이다. (링크)R-CNN은 object detection 데이터 셋인 PASCAL VOC dataset에 대해 성공적인 결과를 달성한 모델이다. Object detection 딥러닝 분야에서 가장 먼저 공부하는 모델이기도 하다. Abstract현존하는 deep cnn은 224 x 224 같은 고정된 사이즈의 이미지를 필요로 한다. 이는 인공적인 상황이며 임의의 사이즈의 이미지에 대한 recognition 정확도를 떨어뜨린다. 본 논문.. 2024. 4. 9. R-CNN (2014) 논문 리뷰 R-CNN의 논문 이름은 Rich feature hierarchies for accurate object detection and semantic segmentation이다. 저자는 Ross Girshick, Jeff Donahue, Trevor Darrell, Jitendra Malik다. (링크) R-CNN은 object detection 데이터 셋인 PASCAL VOC dataset에 대해 성공적인 결과를 달성한 모델이다. Object detection 딥러닝 분야에서 가장 먼저 공부하는 모델이기도 하다. PASCAL VOC는 Pattern Analysis, Statistical Modeling and Computational Learning Visual Object Classes의 약자로 옥스포드.. 2024. 4. 4. 이전 1 2 3 4 5 다음