본문 바로가기

분류 전체보기101

Sentence-BERT (2019) 논문 리뷰 Sentence-BERT 혹은 SBERT 모델이 나온 논문 이름은 Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks다. (링크) 저자는 Nils Reimers, Iryna Gurevych다.  요즘은 document나 sentence embedding을 구할 때 API로 OpenAI의 embeddings를 많이 사용하겠지만, 예전에는 문장 레벨로 embedding을 도출할 때 많이 쓰던 알고리즘이 SBERT라서 공부했던 기억이 난다.  AbstractBERT과 RoBERTa는 sentence-pair regression tasks; semantic textual similarity (STS)와 같은 태스크에서 SOTA를 달성했다. 하지만 두 .. 2025. 4. 9.
CutMix (2019) 논문 리뷰 CutMix 기법의 논문의 제목은 CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Features이다. (링크) 저자는 Sangdoo Yun, Dongyoon Han, Seong Joon Oh, Sanghyuk Chun, Junsuk Choe, Youngjoon Yoo다.  CutMix는 image classification 문제에 대한 data augmentation 논문이다.  AbstractRegional dropout 전략은 conv net classifier의 성능을 향상시키기 위해서 도입되었다. less discriminative (식별하기 어려운) 파트에 모델이 집중하도록 만드는 전략이 유효함이 밝혀졌다.. 2025. 4. 8.
ViT Vision Transformer(2021) 논문 리뷰 ViT (Vision Transformer) 모델의 논문 이름은 An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale다. (링크) 저자는 Alexey Dosovitskiy, Lucas Beyer, Alexander Kolesnikov, Dirk Weissenborn, Xiaohua Zhai, Thomas Unterthiner, Mostafa Dehghani, Matthias Minderer, Georg Heigold, Sylvain Gelly, Jakob Uszkoreit, Neil Houlsby다.  NLP에서 쓰던 Transformer를 컴퓨터 비전 분야에 성공적으로 적용한 모델이 나온 논문이다. Abstract트랜스포머.. 2025. 4. 8.
YOLO v3 (2018) 논문 리뷰 YOLO v3의 논문 이름은 YOLOv3: An Incremental Improvement다. (링크) 저자는 Joseph Redmon, Ali Farhadi다.   AbstractYOLOv3는 YOLOv2에서 약간의 모델 디자인 변경으로 성능의 개선을 이루었다. Bounding Box Prediction YOLOv2와 같은 방식으로 Bbox들을 예측한다. Class PredictionSoftmax를 사용하는 대신에 각 class 별로 독립적인 logstic classifier를 두어서 분류를 수행한다.그리고 loss로는 SSE가 아닌 binary cross-entropy를 사용한다. 개별적인 로지스틱 분류기를 사용하는 이유는 multilabel classification에 있어서 좋은 성능을 내기 위함.. 2025. 4. 8.
YOLO v2 (2016) 논문 리뷰 YOLO v2의 논문 이름은 YOLO9000: Better, Faster, Stronger다. (링크) 저자는 Joseph Redmon, Ali Farhadi다.  DenseNet은 object detection에 사용되는 알고리즘이다.  AbstractYOLO9000은 real-time object detection 시스템으로 9000개 넘는 오브젝트 카테고리를 탐지할 수 있다. 기존의 YOLO의 개선 버젼인 본 논문의 YOLOv2는 본 논문에서 소개한다. PASCAL VOC 2007, COCO에서 SOTA를 달성했다. Object detection과 classification을 동시에 학습했다. COCO detection 데이터셋과 ImageNet의 classification 데이터셋을 동시에 학습했.. 2025. 4. 8.
EfficientNet (2019) 논문 리뷰 EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks (링크)에서 소개된 EfficientNet은 효율적인 NN 구조를 탐색하는 논문이다.  저자는 Mingxing Tan, Quoc V. Le다. AbstractCNN은 스케일을 키울수록 정확도가 올라가는 경향을보였다. 본 논문에서는 네트워크 구조의 depth, width, resolution 사이의 밸런스를 조심스럽게 맞추면서 좋은 성능을 내도록 한다. MobileNet이나 ResNet보다 효율적인 성능을 냈음을 보인다.   Figure 1을 보면 대체로 모델 크기가 커질수록 좋은 성능임을 알 수 있다.  3. Compound Model Scaling 본 논문에서는 width,.. 2025. 4. 8.