본문 바로가기

분류 전체보기55

GRU 모델 설명 GRU 설명 GRU는 Gated Recurrent Units의 약자로 Recurrent Neural Network (RNN)의 하나다. GRU가 소개된 논문 이름은 Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation이다. 저자는 Cho, Kyunghyun; van Merrienboer, Bart; Bahdanau, DZmitry; Bougares, Fethi; Schwenk, Holger; Bengio, Yoshua이다. 전체적인 내용은 LSTM과 유사하여 간략하게 설명하고 구현도 비슷하므로 생략한다. GRU의 가장 특징은 LSTM의 Cell을 다소 단순화했다는 사실이다. Update ga.. 2024. 4. 11.
Information Retrieval and Recommender Systems Information Retrieval (IR)과 Recommender Systems (RS)는 밀접한 관련이 있다. Information Retrieval의 하위 분야에 원하지 않거나 불필요한 정보를 제거하는 information filtering이 있고, recommender systems은 그 infromation filtering의 하위 갈래다. 단순한 계층 구조 외에도 IR와 RS의 가장 중요한 차이점이 있는데 바로 두 시스템의 성격이다. IR IR은 사용자의 능동적인 쿼리를 통한 검색을 통해서 정보를 도출한다. 즉, 사용자의 요구를 먼저 받아 들여야만 그에 대한 결과를 반환한다. IR은 수동적인 패시브 시스템이다. IR은 구글이나 쇼핑몰에서의 검색 결과다. RS 반면에 RS는 사용자의 요구 없.. 2024. 4. 9.
Information Retrieval 소개 IR (Information Retrieval) Basics Information retrieval (정보검색)이란 대규모 정보군으로부터 정보 요구를 충족시키는 비구조적인 속성(일반적으로 텍스트)를 지닌 자료(일반적으로 문헌)을 찾아내는 것이다. 과거에는 경영 관리, 연구 개발, 출판물, 특허, 설계도, 시험 데이터 파일 등 기억 매체에 기록된 대량의 데이터 집단에서 자신이 필요로 하는 특정 정보를 선택하여 신속하게 찾는 형태이었으나, 웹이 활성화되면서 원격지나 분산되어 있는 자료까지 통합하여 검색하는 웹 정보검색 서비스로 발전되고 있다. 데이터는 여러 타입으로 분류할 수 있는데, Structured Data (구조적 자료), Semi-Structured Data (반구조적 자료) , Unstructur.. 2024. 4. 9.
LSTM 모델 설명과 PyTorch Implementation LSTM 설명 LSTM은 Long Short Term Memory의 약자로 Recurrent Neural Network (RNN)의 하나다. 워낙 오래된 모델이라 논문에 대한 설명 보다는 알고리즘에 대한 설명한 하고 넘어가겠다. 설명을 생략하기에는 Tabular data 등의 예측 모델에 쓴다거나 하는 식으로 응용할 수 있기에 포스팅해야겠다 생각했다. RNN은 기본적으로 sequential model로 순서가 유의미한 모델이다. 따라서 단어의 순서가 중요한 NLP라든가 시간에 따른 변화 추이가 중요한 금융 데이터 등에 쓰기 좋은 모델이다. LSTM 역시 RNN의 하나로 sequential model이다. Figure 1을 보면 $t-1$의 이전 state의 cell의 정보가 현재 state인 $t$의 c.. 2024. 4. 9.
SPPNet (2014) 논문 리뷰 SPPNet의 논문 이름은 Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition이다. 저자는 Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun이다. R-CNN은 object detection 데이터 셋인 PASCAL VOC dataset에 대해 성공적인 결과를 달성한 모델이다. Object detection 딥러닝 분야에서 가장 먼저 공부하는 모델이기도 하다. Abstract 현존하는 deep cnn은 224 x 224 같은 고정된 사이즈의 이미지를 필요로 한다. 이는 인공적인 상황이며 임의의 사이즈의 이미지에 대한 recognition 정확도를 떨어뜨린다. 본 논문에서는 .. 2024. 4. 9.
R-CNN (2014) PyTorch Implementation R-CNN을 Pytorch를 활용하여 구현하고자 한다. https://arsetstudium.tistory.com/33에서 공부한 내용을 토대로 구현보면 아래와 같다. 이때, R-CNN의 CNN 구조는 AlexNet과 같으므로 생략하고 기존의 classification과 다른 부분에 집중하고자 한다. 바로 bounding box의 생성 부분인데 우선 ROI (Region of Interest)라는 개념도 알아야 한다. ROI는 이름 그대로 어떤 이미지에서 관심이 가는 특정 대상에 대한 영역을 의미한다. Object detection에서 ROI 지정은 bounding box로 하며, 아래의 Figure 1를 예시로 알아보자. 우선 interest는 새다. 그리고 그 새에 대한 영역인 ROI를 빨간색 bou.. 2024. 4. 8.