1月30日,蚂蚁灵波科技宣布开源具身世界模型LingBot-VA。据介绍,该模型首次提出自回归视频-动作世界建模框架,将大规模视频生成模型的能力与机器人控制融合,模型在生成“下一步世界状态”的同时,直 … Continue reading 蚂蚁灵波开源具身世界模型LingBot-VA
标签: 新论文
DeepSeek发布DeepSeek-OCR 2模型
《科创板日报》27日讯,DeepSeek团队发布《DeepSeek-OCR 2: Visual Causal Flow》论文,并开源DeepSeek-OCR 2模型,采用创新的DeepEncoder … Continue reading DeepSeek发布DeepSeek-OCR 2模型
阶跃星辰开源多模态模型Step3-VL-10B
1月20日,阶跃星辰宣布多模态模型Step3-VL-10B开源。据介绍,仅用10B参数量,Step3-VL-10B在视觉感知、逻辑推理、数学竞赛以及通用对话等一系列基准测试中均达到同规模SOTA水平。
