Tag: Performance

1 articles

AI Research 37 - Multimodal Large Model Quantization: Impact on Vision, Language and Multimodal Tasks

Model quantization compresses FP32 weights into low-precision representations, significantly reducing inference resource consumption.