DeepSeek V4下周上线?原生多模态架构 技术报告同步开放

《科创板日报》3月1日讯(编辑 宋子乔) 当地时间2月28日,据金融时报报道,DeepSeek将于下周发布其最新的大模型V4。 据两位知情人士透露,这是一款具备图片、视频和文本生成功能的多模态模型。在 … Continue reading DeepSeek V4下周上线?原生多模态架构 技术报告同步开放

MiniMax成Token调用第一之后 模型厂商的下一个必争高地显现

《科创板日报》2月27日讯(编辑 宋子乔) 最近,大模型token调用量井喷成为关注点。OpenRouter最新数据显示,各大模型的token调用量自2026年1月下旬出现明显跃升。 与此同时,国产大 … Continue reading MiniMax成Token调用第一之后 模型厂商的下一个必争高地显现

阿里发布新一代基模千问3.5,每百万Token低至0.8元

《科创板日报》2月16日讯(记者 黄心怡)除夕当天,阿里巴巴开源全新一代大模型千问Qwen3.5-Plus,总参数为3970亿,激活仅170亿,性能超过万亿参数的Qwen3-Max模型,部署显存占用降 … Continue reading 阿里发布新一代基模千问3.5,每百万Token低至0.8元

DeepSeek模型更新!上下文提升至百万Token 可处理三体小说全集

《科创板日报》2月11日讯(记者 黄心怡 编辑 宋子乔)DeepSeek传闻中的V4尚未正式发布。2月11日,多位用户反馈DeepSeek已在网页及App端进行版本更新,上下文窗口由原有的128K直接 … Continue reading DeepSeek模型更新!上下文提升至百万Token 可处理三体小说全集