U-net은 U-net: Convolutional Networks for Biomedical Image Segmenation으로 의료 데이터쪽에서 나온 논문이다. (링크)
저자는 Olaf Ronneberger, Philipp Fischer, Thomas Brox다.
Abstract
ISBI challenge 중에서 neuronal structures in electron microscopic stacks의 segmentation에서 좋은 성능을 보였다.
Network Architecture
Fig 1을 보면 알겠지만 U-net에서는 Shallow layers의 정보를 copy and crop으로 뒤쪽의 deeper layer에서도 사용한다.
왼쪽 파트는 contracting path라고 하고 오른쪽 파트는 expansive path라고 한다.
Conv와 max pool은 전통적인 convolution과 max pooling 연산이다.
Up-conv는 Transposed convolution이라고 한다.
Transposed Convolution
아래의 references를 참고했다.
transposed convolution은 FC의 deconvolution과 유사한것 같지만 다르다.
deconvolution은 일종의 element-wise product의 느낌이다.
반면에 transposed convolution은 일반적인 convolution과 같은 연산이지만,
output의 사이즈를 키우기 위해서 input에 여러개의 padding을 더해서 input 자체의 사이즈를 키운 느낌으로 인튜이션을 가져가면 이해하기 편하다.
물론 위 Figure들을 보면 알겠지만 input 사이즈가 반드시 output 사이즈보다 큰 것은 아니다.
References:
https://velog.io/@lighthouse97/UNet%EC%9D%98-%EC%9D%B4%ED%95%B4
https://sd118687.tistory.com/7
https://zzsza.github.io/data/2018/02/23/introduction-convolution/
https://arxiv.org/pdf/1603.07285v1
https://datascience.stackexchange.com/questions/6107/what-are-deconvolutional-layers
https://zzsza.github.io/data/2018/06/25/upsampling-with-transposed-convolution/
'Computer Vision' 카테고리의 다른 글
CAM (2015) 논문 리뷰 (0) | 2025.04.07 |
---|---|
YOLO v1 (2015) 논문 리뷰 (0) | 2025.04.06 |
DeepLab v1(2016) 논문 리뷰 (0) | 2025.04.06 |
FCN (2015) 논문 리뷰 (0) | 2025.04.06 |
Faster R-CNN (2016) 논문 리뷰 (0) | 2024.04.27 |