微光实验室
首页
博客
系列
项目
FAQ
关于
🇺🇸
EN
标签:
性能
共 1 篇文章
AI-调查研究-37-多模态大模型量化 对视觉、语言与多模态任务性能的影响
模型量化将FP32权重压缩为低精度表示,可显著降低推理资源消耗。实验表明,量化后模型延迟降低60%、内存减少70%。分析量化对视觉、语言、跨模态任务的影响。
2025/7/19