Computer Vision29 EfficientNet (2019) 논문 리뷰 EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks (링크)에서 소개된 EfficientNet은 효율적인 NN 구조를 탐색하는 논문이다. 저자는 Mingxing Tan, Quoc V. Le다. AbstractCNN은 스케일을 키울수록 정확도가 올라가는 경향을보였다. 본 논문에서는 네트워크 구조의 depth, width, resolution 사이의 밸런스를 조심스럽게 맞추면서 좋은 성능을 내도록 한다. MobileNet이나 ResNet보다 효율적인 성능을 냈음을 보인다. Figure 1을 보면 대체로 모델 크기가 커질수록 좋은 성능임을 알 수 있다. 3. Compound Model Scaling 본 논문에서는 width,.. 2025. 4. 8. MobileNet (2017) 논문 리뷰 MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications (링크)에서 소개된 MobileNet은 휴대용 기기에서 사용하기 위해 고안한 작은 규모의 NN이다. 저자는 Andrew G. Howard, Menglong Zhu, Bo Chen, Dmitry Kalenichenko, Weijun Wang, Tobias Weyand, Marco Andreetto, Hartwig Adam다. Abstract모바일 기기나 임베디드 비전 어플에서 사용할 효율적인 모델인 MobileNets를 제시한다.Depth-wise separable convolutions를 통해서 가벼운 DNN을 소개한다.두 개의 단순한 global hyp.. 2025. 4. 8. DeepLab v2 (2016) 논문 리뷰 DeepLab의 논문 이름은 Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRF으로 Atrous Convolution (aka Dilated Convolution)으로 유명한 논문이다. (링크) 저자는 Liang-Chieh Chen, George Papandreou, Iasonas Kokkinos, Kevin Murphy, Alan L. Yuille다. DeepLab v2는 DeepLab v1의 개정증보판이라고 보면된다. 따라서 자세한 내용은 이전에 정리한 DeepLab v1의 내용과 거의 동일하다. 차이점은 ASPP (Atrous Spatial Pyramid Pooling.. 2025. 4. 8. RetinaNet Focal Loss (2017) 논문 리뷰 RetinaNet은 Focal Loss for Dense Object Detection에서 소개된 방법이다. (링크) 저자는 Tsung-Yi Lin, Priya Goyal, Ross Girshick, Kaiming He, Piotr Dollár다. RetinaNet에서 제시한 Focal loss는 object detection에서의 class imbalance의 문제를 해결하려는 논문이다. 클래스 불균형 문제를 해결할 때 oversampling, undersampling, data augmentation 외에도 고려해볼만한 옵션이라고 생각한다. AbstractObject detection에 있어서 class imbalance 문제가 중요한 문제라고 생각했으므로 이를 해결하기 위해서 Focal Loss.. 2025. 4. 7. DeepPose (2014) 논문 리뷰 DeepPose의 논문의 제목은 DeepPose: Human Pose Estimation via Deep Neural Networks이다. (링크) 저자는 Alexander Toshev, Christian Szegedy다. DeepPose는 pose estimation을 해결하려는 논문으로 사람의 관절 (joints)를 찾는 알고리즘이다.Figure 1과 같은 결과를 내고자 한다. AbstractDNN (Deep Neural Network) 기반의 regression 문제로 해석해서 사람의 신체 관절 (body joints)를 통한 pose estimation을 수행한다. Pose에 대한 설명과 동시에 4가지 학술적인 벤치마크에서 좋은 성능을 냈다. 3. Deep Learning Model f.. 2025. 4. 7. FaceNet (2015) 논문 리뷰 FaceNet의 논문의 제목은 FaceNet: A Unified Embedding for Face Recognition and Clustering이다. (링크) 저자는 Florian Schroff, Dmitry Kalenichenko, James Philbin다. FaceNet은 Re-identification을 해결하려는 논문이다.Re-identification이란 해당 인물이 다른 얼굴면을 보이거나 할 때도 여전히 같은 사람인지 인식 할 수 있느냐의 문제다. Abstract최근의 Face recognition과 face verification은 발전했지만 여전히 문제가 남아있다. FaceNet에서는 얼굴 이미지를 compact Euclidean space로 매핑해서 얼굴 유사도를 학습한다. 이.. 2025. 4. 7. 이전 1 2 3 4 5 다음