Computer Vision52 Inception v4 (2016) 논문 리뷰 Inception v4의 논문 이름은 Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning다. (링크) 저자는 Christian Szegedy, Sergey Ioffe, Vincent Vanhoucke, Alex Alemi다. Inception에 Residual connection을 연결하는 구조를 연구한 논문이다. Inception과 Residual connection의 연결뿐만 아니라 Inception 모듈 자체도 여러가지로 연구한 논문이다. Figure 1과 2가 ResNet에서 소개된 일반적인 residual connection이다. 위 Figure 5, 6, 7, 8은 residual connec.. 2025. 4. 28. MobileNet V2 (2018) 논문 리뷰 MobileNet V2의 논문 이름은 MobileNetV2: Inverted Residuals and Linear Bottlenecks다. (링크) 저자는 Mark Sandler, Andrew Howard, Menglong Zhu, Andrey Zhmoginov, Liang-Chieh Chen다. MobileNet의 두 번째 버젼으로 object detection에 적용해서 SSDLite라는 새로운 프레임워크를 소개한 논문이다. torchvision의 사전 학습 모델 중에서 SSDLite가 있는데 여기서 만나게 되었다. 또한 semantic segmentation 문제를 풀기 위해서 DeepLabv3 모델에 적용한 MobileDeepLabv3를 소개한다 Abstract새로운 Mobile net 네트.. 2025. 4. 28. Squeeze-and-Excitation (2018) 논문 리뷰 Squeeze-and-Excitation의 논문 이름은 Squeeze-and-Excitation Networks다. (링크) 저자는 Jie Hu, Li Shen, Samuel Albanie, Gang Sun, Enhua Wu다. AbstractCNN의 블록의 핵심은 convolution operator 컨볼루션 연산자에 있다. 컨볼루션은 각각의 레이어에서의 local receptive field 내에 존재하는 spatial information 공간 정보와 channel-wise information 채널 정보을 융합하여 informative features를 구성한다. 광범위한 선행 연구들은 공간 정보의 component 요소들 간의 관계를 연구하고 representational power 표현력을.. 2025. 4. 28. HRNet (2019) 논문 리뷰 HRNet의 논문 이름은 Deep High-Resolution Representation Learning for Visual Recognition다. (링크) 저자는 Jingdong Wang, Ke Sun, Tianheng Cheng, Borui Jiang, Chaorui Deng, Yang Zhao, Dong Liu, Yadong Mu, Mingkui Tan, Xinggang Wang, Wenyu Liu, Bin Xiao다. Github: 링크 논문 제목에서 알 수 있듯이 High-resolution 고해상도를 잘 활용하고자 하는 모델이다. HRNet V1, V2, V2p가 있지만 HRNet v2라는 별도의 논문이 있는게 아니라 본 논문에서 모두 다 제시했다. HRNet 깃허브에 가보면 human .. 2025. 4. 28. FCOS: Fully Convolutional One-Stage Object Detection FCOS 모델의 논문 이름은 FCOS: Fully Convolutional One-Stage Object Detection다. (링크) 저자는 Zhi Tian, Chunhua Shen, Hao Chen, Tong He다. Github: 링크 Anchor free 객체 탐지 방법이다. HRNet에서도 언급되길래 리뷰를 결심하게 되었다. AbstractSemantic segmentation과 유사하게 per-pixel prediction 방법으로 fully convolutional one-stage detector (FCOS) 방법을 제안한다. RetinaNet, SSD, YOLOv3와 Faster R-CNN 등 대부분의 SOTA 모델들은 사전에 정의된 anchor boxes 앵커 박스에 의존한다. 본 .. 2025. 4. 28. DeepLab V3 (2017) 논문 리뷰 DeepLab V3 모델의 논문 제목은 Rethinking Atrous Convolution for Semantic Image Segmentation이다. (링크) 저자는 Liang-Chieh Chen, George Papandreou, Florian Schroff, Hartwig Adam다. Atrous Convolution은 기존에 DeepLab v1 리뷰(링크)와 DeepLab v2 리뷰(링크)에서 살펴보았으므로 간략하게 핵심 위주로 살펴본다. DeepLab V3에서는 atrous convolution의 구조를 다양한 방법으로 적용하고 체계적으로 비교하는 논문이다. Figure 1이 Atrous conv를 보여준다. Going Deeper with Atrous Convolution Fig.. 2025. 4. 28. 이전 1 2 3 4 5 6 ··· 9 다음