multimodal13 Show and Tell = Neural Image Caption (NIC) (2014) 모델 간단 리뷰 Neural Image Caption (NIC)는 2014년에 나온 논문으로 풀 네임은 Show and Tell: A Neural Image Caption Generator다. (링크) 이름에서 알 수 있듯이 이미지를 받으면 DNN (Deep Neural Network)를 통해서 캡션, 이미지에 대한 설명을 작성하게 된다. 저자는 Oriol Vinyals, Alexander Toshev, Samy Bengio, Dumitru Erhan이다. 해당 논문은 구조 상으로 큰 개선은 없었으나 Vision CNN과 NLP LSTM을 함께 사용하여,이미지 캡셔닝을 사용한 비교적 오래된 2014년 논문이라 점에서 간단하게 짚고 넘어가고 싶어서 포스팅한다. 모델 설명 Figure 1은 Show and Tell .. 2024. 4. 13. 이전 1 2 3 다음