Computer Vision의 개념
컴퓨터 비전이란 Agent 혹은 컴퓨터가 사람처럼 이미지를 인식하도록 만든다.
사진, 그림, 동영상 등이 인지 대상이다.
반면에 Computer Graphics는 컴퓨터를 사용해 이미지를 그려내는 과정이다.
게임에서 보이는 그래픽이나 영화에서의 CG 등이 이에 속한다.
Types of Computer Vision
Low-level일수록 pixel 단위로 이미지를 처리하고, High-level로 갈수록 이미지 전반을 하나의 entity로 묶어서 처리한다.
Low-level
Image Processing:
Resize, Color Jitter, Blur, Rotate 등
Feature Extraction:
Edge Detection, Segmentation by Color 등
Mid-level
Images to Image:
Panorama Stitching - 파노라마 이미지 생성
Images to World:
Multi-view Stereo, Depth Estimation, LIDAR
High-level
Semantics:
Image Classification, Object Detection, Segmentation (Semantic and Instance)
Applications
헬스케어, 자율주행, 의료이미지, 스포츠, 제조업 등 다양한 분야에서 활용되고 있다.
- Object Tracking
- Image Captioning
- Image Question and Answer
- Image Generation
- Image Super Resolution
- Image Enhancement
- Image Style Transfer
- Image Colorization
- Image Reconstruction
- Image Inpainting
- OCR (Optical Character Recognition)
- 3D Reconstruction
- Pose Estimation
- Action Recognition
- Anomaly Detection
- Person Re-identification
등등
References:
[업스테이지] - AI 심화학습 Computer Vision
고려대학교 XAI602: Computer Vision Application and Practice
https://paperswithcode.com/area/computer-vision
'Computer Vision' 카테고리의 다른 글
GoogLeNet = Inception v1 (2014) 논문 리뷰 (0) | 2024.04.03 |
---|---|
VGGNet PyTorch Code Implementation (0) | 2024.04.02 |
VGGNet (2014) 논문 리뷰 (0) | 2024.04.01 |
AlexNet PyTorch Code Implementation (0) | 2024.03.27 |
AlexNet (2012) 논문 리뷰 (0) | 2024.02.28 |