面壁智能开源8B参数的多模态模型MiniCPM-V 4.5

8月26日,面壁智能正式开源8B参数的MiniCPM-V 4.5多模态模型,具备“高刷”视频理解能力。据介绍,该模型高刷视频理解同级SOTA且性能超过Qwen2.5-VL 72B;同等视觉token开销下,MiniCPM-V 4.5可接收6倍视频帧数量,达到96倍视觉压缩率,是同类模型的12-24倍。

Published by

风君子

独自遨游何稽首 揭天掀地慰生平