본문 바로가기

분류 전체보기196

SSD (2016) 논문 리뷰 SSD의 논문의 제목은 SSD: Single Shot MultiBox Detector이다. (링크) 저자는 Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg다.  SSD 알고리즘은 논문 제목에서도 알 수 있듯이 object detection 문제를 푼다.  AbstractSSD로 명명된 우리의 방법으로 서로 다른 aspect ratios와 scales를 가진 feature map location으로 부터 발생하는 default box를 이산화하여 bounding box (이하 bbox)를 만들고자 한다. 예측 국면에서 네트워크는 각각의 오브젝트 카테고리의 존재 가능.. 2025. 4. 7.
CAM (2015) 논문 리뷰 CAM은 Class Activation Mapping의 약자로 논문의 제목은 Learning Deep Features for Discriminative Localization이다. (링크) 저자는 Bolei Zhou, Aditya Khosla, Agata Lapedriza, Aude Oliva, Antonio Torralba다. 공식 Github: 링크 CAM에서는 Weakly supervised 방법으로 이미지의 오브젝트를 히트맵 Heatmap 형식으로 표기한다. AbstractGlobal average pooling (GAP)를 다시 활용하여 CNN에 있어서의 localization 능력을 이미지 레벨에서 효과를 달성한다. ILSVRC 2014에서 top-5 error를 37.1%를 달성했는데 이는.. 2025. 4. 7.
YOLO v1 (2015) 논문 리뷰 YOLO는 You Only Look Once: Unified, Real-Time Object Detection으로 가장 유명한 논문 중 하나일 것이라 생각한다.  (링크) 저자는 Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi다. 반쯤 방치된 블로그도 살리고 컴퓨터 비전 분야 복습도 할 결심을 하게 해준 논문의 첫번째 버젼이다.최근에 YOLO가 v10까지 나온걸 발견해서 이전에 공부한 내용을 옮겨 적기 시작했기 때문이다. 논문 제목에서도 알 수 있듯이 object detection 알고리즘이다. AbstractYOLO는 object detection을 일종의 regression 문제로 해석하여 spatially separated bounding b.. 2025. 4. 6.
U-net (2015) 논문 리뷰 U-net은 U-net: Convolutional Networks for Biomedical Image Segmenation으로 의료 데이터쪽에서 나온 논문이다. (링크) 저자는 Olaf Ronneberger, Philipp Fischer, Thomas Brox다. AbstractISBI challenge 중에서 neuronal structures in electron microscopic stacks의 segmentation에서 좋은 성능을 보였다.   Network Architecture     Fig 1을 보면 알겠지만 U-net에서는 Shallow layers의 정보를 copy and crop으로 뒤쪽의 deeper layer에서도 사용한다. 왼쪽 파트는 contracting path라고 하고 오.. 2025. 4. 6.
DeepLab v1(2016) 논문 리뷰 DeepLab의 논문 이름은 Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRF으로 Atrous Convolution (aka Dilated Convolution)으로 유명한 논문이다. (링크) 저자는 Liang-Chieh Chen, George Papandreou, Iasonas Kokkinos, Kevin Murphy, Alan L. Yuille다. Abstract픽셀 레벨 분류 (semantic image segmenation)의 문제를 푸는데 있어서 Deep CNN (DCNN)이 마지막 레이어에서 충분하게 localized되어 정확한 object segmentation.. 2025. 4. 6.
FCN (2015) 논문 리뷰 FCN은 Fully Convolutional Networks for Semtantic Segmenation이란 논문에서 나온 컴퓨터 비전 알고리즘이다. (링크) 저자는 Jonathan Long, Evan Shelhamer, Trevor Darrell 이다. 제목에서도 알 수 있듯이 Semantic Segmentation 분야의 문제를 풀고자 하는 논문이다.  Abstract본 논문은 Semantic segmentation의 최신 성능을 능가했다. 핵심적인 통찰 중 하나는 'fully convolutional' network로 이를 통해서 arbitrary size, 어떠한 사이즈라도 상관 없이 input을 받아서 그에 따른 사이즈의 output을 반환하면서 동시에 학습과 추론에 있어서도 효율적이다. Al.. 2025. 4. 6.