딥러닝 모델 분석과 구현 정리 주요 ML / DL 성능 지표 (미완성) 이전다음 DeepPose (2014) 논문 리뷰 DeepPose의 논문의 제목은 DeepPose: Human Pose Estimation via Deep Neural Networks이다. (링크) 저자는 Alexander Toshev, Christian Szegedy다. DeepPose는 pose estimation을 해결하려는 논문으로 사람의 관절 (joints)를 찾는 알고리즘이다.Figure 1과 같은 결과를 내고자 한다. AbstractDNN (Deep Neural Network) 기반의 regression 문제로 해석해서 사람의 신체 관절 (body joints)를 통한 pose estimation을 수행한다. Pose에 대한 설명과 동시에 4가지 학술적인 벤치마크에서 좋은 성능을 냈다. 3. Deep Learning Model f.. 2025.04.07 FaceNet (2015) 논문 리뷰 FaceNet의 논문의 제목은 FaceNet: A Unified Embedding for Face Recognition and Clustering이다. (링크) 저자는 Florian Schroff, Dmitry Kalenichenko, James Philbin다. FaceNet은 Re-identification을 해결하려는 논문이다.Re-identification이란 해당 인물이 다른 얼굴면을 보이거나 할 때도 여전히 같은 사람인지 인식 할 수 있느냐의 문제다. Abstract최근의 Face recognition과 face verification은 발전했지만 여전히 문제가 남아있다. FaceNet에서는 얼굴 이미지를 compact Euclidean space로 매핑해서 얼굴 유사도를 학습한다. 이.. 2025.04.07 DenseNet (2017) 논문 리뷰 DenseNet의 논문의 제목은 Densely Connected Convolutional Networks이다. (링크) 저자는 Gao Huang, Zhuang Liu, Laurens van der Maaten, Kilian Q. Weinberger다. DenseNet은 object detection에 사용되는 알고리즘이다. Abstract본 논문에서는 DenseNet을 소개한다. 모든 레이어들을 feed-forward 방식으로 모두 연결한다. L개의 레이어가 있다면 총 L(L+1) / 2 개의 직접적인 연결이 존재하게 된다. 각각의 레이어에서 나온 feature map을 다음 레이어에 대한 input으로 사용한다.위 방법을 통해서 다음 문제들이 완화되었다. vanishing-gradient 문제, f.. 2025.04.07 SSD (2016) 논문 리뷰 SSD의 논문의 제목은 SSD: Single Shot MultiBox Detector이다. (링크) 저자는 Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg다. SSD 알고리즘은 논문 제목에서도 알 수 있듯이 object detection 문제를 푼다. AbstractSSD로 명명된 우리의 방법으로 서로 다른 aspect ratios와 scales를 가진 feature map location으로 부터 발생하는 default box를 이산화하여 bounding box (이하 bbox)를 만들고자 한다. 예측 국면에서 네트워크는 각각의 오브젝트 카테고리의 존재 가능.. 2025.04.07 CAM (2015) 논문 리뷰 CAM은 Class Activation Mapping의 약자로 논문의 제목은 Learning Deep Features for Discriminative Localization이다. (링크) 저자는 Bolei Zhou, Aditya Khosla, Agata Lapedriza, Aude Oliva, Antonio Torralba다. CAM에서는 Weakly supervised 방법으로 이미지의 오브젝트를 히트맵 Heatmap 형식으로 표기한다. AbstractGlobal average pooling (GAP)를 다시 활용하여 CNN에 있어서의 localization 능력을 이미지 레벨에서 효과를 달성한다. ILSVRC 2014에서 top-5 error를 37.1%를 달성했는데 이는 fully supervi.. 2025.04.07 more