본문 바로가기
Computer Vision

Computer Vision 소개

by 아르카눔 2024. 2. 21.

Computer Vision의 개념

컴퓨터 비전이란 Agent 혹은 컴퓨터가 사람처럼 이미지를 인식하도록 만든다.

사진, 그림, 동영상 등이 인지 대상이다.

 

반면에 Computer Graphics는 컴퓨터를 사용해 이미지를 그려내는 과정이다.

게임에서 보이는 그래픽이나 영화에서의 CG 등이 이에 속한다.

 

Types of Computer Vision

Low-level일수록 pixel 단위로 이미지를 처리하고, High-level로 갈수록 이미지 전반을 하나의 entity로 묶어서 처리한다.

 

Low-level

Image Processing:

Resize, Color Jitter, Blur, Rotate 등

 

Feature Extraction:

Edge Detection, Segmentation by Color 등

 

Mid-level

Images to Image:

Panorama Stitching - 파노라마 이미지 생성

 

Images to World:

Multi-view Stereo, Depth Estimation, LIDAR

 

High-level

Semantics:

Image Classification, Object Detection, Segmentation (Semantic and Instance)

 

Applications

헬스케어, 자율주행, 의료이미지, 스포츠, 제조업 등 다양한 분야에서 활용되고 있다.

 

  • Object Tracking
  • Image Captioning
  • Image Question and Answer
  • Image Generation
  • Image Super Resolution
  • Image Enhancement
  • Image Style Transfer
  • Image Colorization
  • Image Reconstruction
  • Image Inpainting
  • OCR (Optical Character Recognition)
  • 3D Reconstruction
  • Pose Estimation
  • Action Recognition
  • Anomaly Detection
  • Person Re-identification

등등

 

 

References:

[업스테이지] - AI 심화학습 Computer Vision

고려대학교 XAI602: Computer Vision Application and Practice

https://paperswithcode.com/area/computer-vision

 

 

'Computer Vision' 카테고리의 다른 글

GoogLeNet = Inception v1 (2014) 논문 리뷰  (0) 2024.04.03
VGGNet PyTorch Code Implementation  (0) 2024.04.02
VGGNet (2014) 논문 리뷰  (0) 2024.04.01
AlexNet PyTorch Code Implementation  (0) 2024.03.27
AlexNet (2012) 논문 리뷰  (0) 2024.02.28