标签:MXFP4
什么是MXFP4
MXFP4是一种低精度浮点数格式,专为超低比特计算设计,旨在在保持一定精度的同时,显著减少模型的计算和存储开[…]
什么是MXFP4量化技术
MXFP4量化技术是一种用于深度学习模型训练和推理的低精度量化方法,旨在通过减少计算和存储开销来提高模型的效率[…]