본문 바로가기
Deep Learning

GPT-OSS와 딥마인드의 월드 모델 Genie 3

by 아르카눔 2025. 8. 7.

GPT-OSS

 

OpenAI가 ClosedAI로서 행동하는게 아니라 진짜로 "오픈" 소스로 무려 아파치 2.0으로 GPT-OSS라는 MoE LLM 모델을 공개했다. (공식 페이지 링크, Huggingface: 링크, GeekNews 링크)

 

120B의 모델 중에서 실제 active parameters는 고작 5B라서 굉장히 놀라웠다.

 

전문가의 수는 128인데, 이는 하나의 전문가가 1B 정도의 크기란 이야기라서 생각보다 개별 전문가의 파라미터 크기는 작다 싶었다.

 

전에 Mixtral 논문을 공부하고 블로그에 포스트 (링크)을 했는데, 그때 MoE를 공부하길 잘했다 싶다. 

 

 

 

Genie 3

 

그런데, 이 보다 더 나에게 신기하게 다가온건 바로 구글 딥마인드의 월드 모델이었다.

 

월드 모델이라는 이름 그대로 실제 우리가 살고 있는 물리적인 세계 자체를 만드는 정말 놀라운 AI 모델이다.

 

Yann LeCun도 월드 모델에 관심이 많은것으로 알고 있는데 이 참에 월드 모델과 관련된 링크 몇가지를 정리한다.

 

 

  • 스티비 - World Model의 시대가 온다 (링크)=
  • GeekNews - 구글 딥마인드, Genie 3 월드 모델 공개 (링크)
  • Google DeepMind's Genie 3 (링크)
  • 튜링포스트 코리아 - Topic #35: '월드 모델 (World Models)'이란 무엇인가? (링크)
  • The AI [GTC 2025] 얀 르쿤 “월드 모델 구축… 3~5년 후 AMI 시대 올 것” 기사 (링크)

 

 

 

AMI는 Advanced Machine Intelligence고 

AGI는 Artificial General Intelligence다. 

 

 

 

 

'Deep Learning' 카테고리의 다른 글

ODIN (2018) 논문 리뷰  (2) 2025.07.25
Quantization 정리  (0) 2025.05.20
KAN (2024) 논문 리뷰  (0) 2025.05.15
Floating-point Number와 Mixed Precision  (0) 2025.04.29
Meta, Few-shot, Zero-shot, Active Learning  (0) 2024.10.25