비디오 생성 SOTA 모델들 리서치

최근 행성을 자르는 영상 (링크)를 본적이 있다. 이외에도 온갖것을 자르는 영상이 있어서 신기했다.

그래서 비디오 생성 모델들은 제대로 공부하거나 정리한 적이 없다는걸 깨닫고 이 참에 최신 모델들을 정리해보았다.

직접 찾아보기도 하고 허깅페이스의 블로그 글 State of open video generation models in Diffusers (링크)의 도움을 받았다.

우선 제일 유명한건 OpenAI의 Sora인데 이를 공개한 오픈 모델도 있다.

Open Models

ConfyUI: Github 링크

Diffusion Model을 보다 쉽게 사용할 수 있게 만들어주는 UI다

Open Sora의 이해에 도움이 될 듯 하며 다음 두 글을 첨부한다.

State of open video generation models in Diffusers (링크)에는 Closed 모델들도 소개하고 있다. 이를 정리하면 다음과 같다.

Closed Models

Stable Diffusion은 Web UI를 통해서 비교적 간단히 생성할 수 있었는데 비디오도 오픈 모델을 이용해서 한 번 시도해봐야겠다.

공부 기록하는 블로그