《科创板日报》13日讯,DeepSeek官方助手在开发者交流群中表示:DeepSeek 网页/APP正在测试新的长文本模型结构,支持1M上下文。而API 服务不变,仍为V3.2,仅支持128K上下文。 … Continue reading DeepSeek:正测试新的长文本模型结构 支持1M上下文
标签: 新论文
你追我赶!国产大模型春节档密集上新
《科创板日报》2月12日讯(记者 黄心怡)国产AI大模型春节档密集发布。 在智谱正式推出新一代旗舰模型GLM-5,Minimax亦上线Minimax 2.5。同时,DeepSeek已在网页及App端进 … Continue reading 你追我赶!国产大模型春节档密集上新
DeepSeek模型更新!上下文提升至百万Token 可处理三体小说全集
《科创板日报》2月11日讯(记者 黄心怡 编辑 宋子乔)DeepSeek传闻中的V4尚未正式发布。2月11日,多位用户反馈DeepSeek已在网页及App端进行版本更新,上下文窗口由原有的128K直接 … Continue reading DeepSeek模型更新!上下文提升至百万Token 可处理三体小说全集
OpenAI推出GPT-5.3-Codex
OpenAI当地时间2月5日推出编码模型GPT-5.3-Codex,该模型在GPT‑5.2-Codex的编码性能基础上,融合了GPT‑5.2的推理与专业知识能力,实现性能双飞跃,同时运行速度提升25% … Continue reading OpenAI推出GPT-5.3-Codex
阿里千问发布Qwen3-Coder-Next:低推理成本编程智能体模型
每经AI快讯,2月4日,阿里巴巴千问Qwen官微宣布推出 Qwen3-Coder-Next,一款专为编码代理与本地开发打造的开放权重的语言模型。该模型基于 Qwen3-Next-80B-A3B-Bas … Continue reading 阿里千问发布Qwen3-Coder-Next:低推理成本编程智能体模型
蚂蚁灵波开源具身世界模型LingBot-VA
1月30日,蚂蚁灵波科技宣布开源具身世界模型LingBot-VA。据介绍,该模型首次提出自回归视频-动作世界建模框架,将大规模视频生成模型的能力与机器人控制融合,模型在生成“下一步世界状态”的同时,直 … Continue reading 蚂蚁灵波开源具身世界模型LingBot-VA
DeepSeek发布DeepSeek-OCR 2模型
《科创板日报》27日讯,DeepSeek团队发布《DeepSeek-OCR 2: Visual Causal Flow》论文,并开源DeepSeek-OCR 2模型,采用创新的DeepEncoder … Continue reading DeepSeek发布DeepSeek-OCR 2模型
阶跃星辰开源多模态模型Step3-VL-10B
1月20日,阶跃星辰宣布多模态模型Step3-VL-10B开源。据介绍,仅用10B参数量,Step3-VL-10B在视觉感知、逻辑推理、数学竞赛以及通用对话等一系列基准测试中均达到同规模SOTA水平。
