본문 바로가기

Computer Vision43

EfficientNetV2 (2021) 논문 리뷰 EfficientNetV2의 논문 이름은 EfficientNetV2: Smaller Models and Faster Training다. (링크)저자는 Mingxing Tan, Quoc V. Le다. 기존의 EfficientNet을 개선한 모델로 NASNet, MobileNet의 구조를 응용했다. Figure 1에 나와있듯이 ImageNet 2012 데이터에 대한 이미지 분류에서 기존의 EfficientNet이나 ViT보다 훨씬 더 작은 파라미터와 학습 시간으로 높은 정확도를 달성했음을 알 수 있다. 3. EfficientNetV2 Architecture Design Depthwise convolutions are slow in early layers but effective in later stag.. 2025. 4. 28.
MobileNet V3 (2019) 논문 리뷰 MobileNet V3의 논문 이름은 Searching for MobileNetV3다. (링크)저자는 Andrew Howard, Mark Sandler, Grace Chu, Liang-Chieh Chen, Bo Chen, Mingxing Tan, Weijun Wang, Yukun Zhu, Ruoming Pang, Vijay Vasudevan, Quoc V. Le, Hartwig Adam다. 역시나 기존 MobileNet V1, V2와 마찬가지로 경량화 모델이다.MobileNetV3를 통해서 처음 알게된 모델들인 NasNet, MNasNet, NetAdapt도 나중에 한 번 봐야겠다. Abstract다음 세대의 MobileNets을 제안한다. MobileNetV3는 핸드폰의 CPU에 맞게 특화된 모델로.. 2025. 4. 28.
Xception (2016) 논문 리뷰 Xception의 논문 이름은 Xception: Deep Learning with Depthwise Separable Convolutions다. (링크)저자는 François Chollet다. Inception 구조를 조금 더 수정한 모델이다. 따라서 간단하게만 짚고 넘어간다. 그리고 해당 논문에서 Depthwise convolution도 중요하게 다뤄서 이를 포함한다. Figure 1과 2는 전통적인 Inception 모델이다. Figure 3와 4에서는 1 x 1을 극단적으로 변경한 모델이다. 이는 곧 depthwise separable convolution과 동일한 연산이다. 아래 references에서 가져온 그림을 이용해서 설명하고자 한다. 일반적인 pointwise conv는 위 그.. 2025. 4. 28.
Inception v4 (2016) 논문 리뷰 Inception v4의 논문 이름은 Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning다. (링크) 저자는 Christian Szegedy, Sergey Ioffe, Vincent Vanhoucke, Alex Alemi다. Inception에 Residual connection을 연결하는 구조를 연구한 논문이다. Inception과 Residual connection의 연결뿐만 아니라 Inception 모듈 자체도 여러가지로 연구한 논문이다. Figure 1과 2가 ResNet에서 소개된 일반적인 residual connection이다. 위 Figure 5, 6, 7, 8은 residual connec.. 2025. 4. 28.
MobileNet V2 (2018) 논문 리뷰 MobileNet V2의 논문 이름은 MobileNetV2: Inverted Residuals and Linear Bottlenecks다. (링크) 저자는 Mark Sandler, Andrew Howard, Menglong Zhu, Andrey Zhmoginov, Liang-Chieh Chen다. MobileNet의 두 번째 버젼으로 object detection에 적용해서 SSDLite라는 새로운 프레임워크를 소개한 논문이다. torchvision의 사전 학습 모델 중에서 SSDLite가 있는데 여기서 만나게 되었다. 또한 semantic segmentation 문제를 풀기 위해서 DeepLabv3 모델에 적용한 MobileDeepLabv3를 소개한다 Abstract새로운 Mobile net 네트.. 2025. 4. 28.
Squeeze-and-Excitation (2018) 논문 리뷰 Squeeze-and-Excitation의 논문 이름은 Squeeze-and-Excitation Networks다. (링크) 저자는 Jie Hu, Li Shen, Samuel Albanie, Gang Sun, Enhua Wu다. AbstractCNN의 블록의 핵심은 convolution operator 컨볼루션 연산자에 있다. 컨볼루션은 각각의 레이어에서의 local receptive field 내에 존재하는 spatial information 공간 정보와 channel-wise information 채널 정보을 융합하여 informative features를 구성한다. 광범위한 선행 연구들은 공간 정보의 component 요소들 간의 관계를 연구하고 representational power 표현력을.. 2025. 4. 28.