본문 바로가기

분류 전체보기247

Mixtral (2024) 논문 리뷰 Mixtral이 제시된 논문 제목은 Mixtral of Experts다. (링크) 저자들은 Albert Q. Jiang, Alexandre Sablayrolles, Antoine Roux, Arthur Mensch, Blanche Savary, Chris Bamford, Devendra Singh Chaplot, Diego de las Casas, Emma Bou Hanna, Florian Bressand, Gianna Lengyel, Guillaume Bour, Guillaume Lample, Lélio Renard Lavaud, Lucile Saulnier, Marie-Anne Lachaux, Pierre Stock, Sandeep Subramanian, Sophia Yang, Szymon Anton.. 2025. 6. 24.
YOLOv7 (2022) 논문 리뷰 YOLOv7의 논문 제목은 YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors다. (링크) 저자들은 Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao다. Github: 링크 3. Architecture 3.1. Extended efficient layer aggregation networks 최근 대부분의 문헌들에서 효율적인 아키텍처를 구성할 때 고려하는 사안들은 파라미터의 수, 계산량, 계산 밀집도다. 여러 논문들을 보면 Input / output channel ratio, 아키텍처 브랜치의 수, 추론 속도에서의 element-wise o.. 2025. 6. 24.
Codex (2021) 논문 리뷰 Codex 논문의 이름은 Evaluating Large Language Models Trained on Code다. (링크) 저자들은 Mark Chen, Jerry Tworek, Heewoo Jun, Qiming Yuan, Henrique Ponde de Oliveira Pinto, Jared Kaplan, Harri Edwards, Yuri Burda, Nicholas Joseph, Greg Brockman, Alex Ray, Raul Puri, Gretchen Krueger, Michael Petrov, Heidy Khlaaf, Girish Sastry, Pamela Mishkin, Brooke Chan, Scott Gray, Nick Ryder, Mikhail Pavlov, Alethea Power.. 2025. 6. 24.
PP-YOLOE (2022) 논문 리뷰 PP-YOLOE의 논문 제목은 PP-YOLOE: An evolved version of YOLO다. (링크) 저자들은 Shangliang Xu, Xinxin Wang, Wenyu Lv, Qinyao Chang, Cheng Cui, Kaipeng Deng, Guanzhong Wang, Qingqing Dang, Shengyu Wei, Yuning Du, Baohua Lai다. Github: 링크 PP-YOLOE는 PP-YOLO v2의 개선된 버젼이다. 전반적인 구조는 아래 Figure 2와 같다. PP-YOLOE의 백본 구조는 cross stage dense connection을 사용한 CSPNet의 개선된 버젼인 CSPRepResNet이다. 그리고 neck에서는 Path Aggregation Net.. 2025. 6. 23.
YOLOX (2021) 논문 리뷰 YOLOX의 논문 이름은 YOLOX: Exceeding YOLO Series in 2021다. (링크) 저자들은 Zheng Ge, Songtao Liu, Feng Wang, Zeming Li, Jian Sun다. Github: 링크 YOLOX는 YOLOv3에다가 ultraltics-YOLOv3에서 제시한 data augmentation 방법들을 포함해서 decoupled head 등 여러가지 변형을 가한 모델이다. 아래 Figure 2에 전체적인 YOLOX의 아키텍처가 나와있다. 기존의 YOLOv3와의 차이점은 다음과 같다. 우선 random horizontal flip, color jitter 방법만을 데이터 증강으로 사용한다.그리고 class와 object에 대해서 BCE loss를 사용하고, bo.. 2025. 6. 23.
Session-based & Sequential Recommender Systems Basics Session-based recommender systems이란 특정한 시간 구간 동안인 session에 기반한 추천을 의미한다. Session의 길이에 따라서, 유저의 단기적인, 중기적인, 장기적인 interactions나 선호를 기반으로 하여 추천을 하게 된다. 시간의 개념이 들어가기 때문에 유저가 아이템들과 상호작용한 순서를 고려한 Sequential recommender systems와도 연결된다. 여기서는 간단하게 아래의 논문들을 살펴본다. GRU4RecSR-GNNSASRecCaserCL4SRecTransformers4RecBERT4Rec은 재현성의 문제가 있다고 알고 있어서 제외한다. Session-based & Sequential Models GRU4RecGRU4Rec의 논문.. 2025. 6. 20.