ComputerVision55 VGGNet PyTorch Code Implementation VGGNet을 Pytorch를 활용하여 구현하고자 한다. https://arsetstudium.tistory.com/29에서 공부한 내용을 토대로 구현보면 아래와 같다. 우선 Top-5 error rate 성능이 가장 낮았던, 성능이 가장 좋았던 16 layers와 19 layers를 구현하는 편이 좋다. 그중에서도 16 layers가 파라미터 수가 더 적어서 효율적이기 때문에 16 layers 구조를 채택해서 구현하고자 한다. VGGNet은 max pooling을 경계로 해서 features extraction의 convolutional layers를 5개의 block으로 나눠 볼수도 있다. 하지만 여기서는 구체적으로 block의 class나 sequential로 나누지는 않았고 주석으로만 표기했다. .. 2024. 4. 2. VGGNet (2014) 논문 리뷰 VGGNet은 2014년 ImageNet Large Scale Visual Recognition Challenge (ILSVRC)에서 성공적인 결과를 달성한 모델이다. VGGNet의 논문 이름은 VeryDeep Convolutional Networks for Large-Scale Image Recognition로 Karen Simonyan과 Andrew Zisserman이 작성했다. Abstract Large-scale image recognition을 해결하기 위해서 convolutional network의 depth를 집중적으로 연구하여 accuracy를 어떤 영향을 주는지를 연구했다. 3 x 3의 작은 convolution filter를 가지고도 depth를 충분히 쌓는다면 좋은 결과를 도출할 수 .. 2024. 4. 1. AlexNet PyTorch Code Implementation AlexNet을 Pytorch를 활용하여 구현하고자 한다. https://arsetstudium.tistory.com/18에서 공부한 내용을 토대로 구현보면 아래와 같다. 첫 번째 구현 class AlexNet(nn.Module): def __init__(self, num_classes = 1000, dropout = 0.5): super().__init__() self.model = nn.Sequential( # Extracting Fetures Part # First Convolution nn.Conv2d(3, 96, kernel_size = 11, stride = 4, padding = 2), # Activation function is applied nn.ReLU(), # Max pooling n.. 2024. 3. 27. AlexNet (2012) 논문 리뷰 AlexNet은 2012년 ImageNet Large Scale Visual Recognition Challenge (ILSVRC)에서 우승한 현대 CNN 모델의 시초격인 모델이다. AlexNet의 논문 이름은 ImageNet Classification with Deep Convolutional Neural Networks로 Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton 3인이 작성했다. Abstract ImageNet LSVRC-2010에서 제공하는 1000개의 클래스를 가진120만의 high-resolution 이미지들을 분류하기 위해 Large deep convolutional neural network을 학습했다. 테스트 데이터에 대해서 top-1과 .. 2024. 2. 28. AI/ML/DL 주요 컨퍼런스 AI 분야는 저널 보다는 컨퍼런스 위주로 논문이 작성되고 읽히고 있다. 전반적인 AI와 CV, NLP, 데이터 마이닝, 추천 시스템쪽 컨퍼런스를 정리하고자 한다. Graph 관련이나 추천 시스템 관련 논문들은 AI나 데이터 마이닝 분야에서 많이 등장한다. 또한 의류 추천 등과 같이 이미지가 주 학습 데이터로 쓰이는 경우 CVPR 등에서 찾아볼 수도 있다. AI AAAI (Association for the Advancement of Artificial Intelligence) NIPS = NeuraIPS (Neural Information Processing Systems) IJCAI (International Joint Conference on Artificial Intelligence) ICLR (I.. 2024. 2. 21. Computer Vision 소개 Computer Vision의 개념 컴퓨터 비전이란 Agent 혹은 컴퓨터가 사람처럼 이미지를 인식하도록 만든다. 사진, 그림, 동영상 등이 인지 대상이다. 반면에 Computer Graphics는 컴퓨터를 사용해 이미지를 그려내는 과정이다. 게임에서 보이는 그래픽이나 영화에서의 CG 등이 이에 속한다. Types of Computer Vision Low-level일수록 pixel 단위로 이미지를 처리하고, High-level로 갈수록 이미지 전반을 하나의 entity로 묶어서 처리한다. Low-level Image Processing: Resize, Color Jitter, Blur, Rotate 등 Feature Extraction: Edge Detection, Segmentation by Color.. 2024. 2. 21. 이전 1 ··· 6 7 8 9 10 다음