Gleam Lab · Tag Archive

Tag: 量化

5 articles collected by topic for tutorials, cases, engineering practice, and research notes.

AI Research 42 - Multimodal Large Model Quantization: From FP32 to INT4, the Final Summary

Survey outline for multimodal large model quantization schemes: from FP32 to INT4. Core goal is model capability retention, compression efficiency 50-75%...

7/24/2025

AI Research 39 - Multimodal Large Model Quantization: How Fine-Tuning and Quantization Maximize Performance

In multimodal large model optimization, the order choice of fine-tuning and quantization directly affects the final model's performance and efficiency.

7/21/2025

AI Research 38 - Multimodal Large Model Quantization: Evaluation Strategies for Mainstream Vision-Language Tasks

To systematically evaluate the impact of model quantization on performance, need to combine multiple vision-language datasets and metrics.

7/20/2025

AI Research 37 - Multimodal Large Model Quantization: Impact on Vision, Language and Multimodal Tasks

Model quantization compresses FP32 weights into low-precision representations, significantly reducing inference resource consumption.

7/19/2025

AI Research 36 - Comprehensive Analysis of Multimodal Large Model Quantization

This comprehensive overview systematically introduces mainstream quantization techniques in multimodal models.

7/18/2025