Memory Requirement of Deep Learning Models
최근 AI 모델, 특히 딥러닝 모델의 크기는 점점 커지고 있으며 GPU 메모리는 유한하기 때문에 모델의 메모리 요구량을 계산해봐야 한다. Floating Point and Memory fp32는 32bit floating point로 Exponent 8 bits와 Mantissa 23 bits가 있다. 나머지 1 bit는 sign으로 양수와 음수를 나타낸다. fp16은 16bit로 Exponent가 5 bits, Mantissa가 10 bits, 1 bit가 sign이다. Input, Activation, Parameter, Gradient, Optimize State (Adam의 경우 Parameter, Gradient, Momentum, Variance)를 모두 fp32로 나타낼 수도 있고, Opti..
2024. 2. 1.