《科创板日报》9月13日讯 在AI浪潮中,模型参数增长和算力堆叠一度成为竞逐焦点。不过站在当下时点,当生成式AI开启规模化落地,战场已经转向推理:真实场景中海量数据的瞬间调用、百万Token的连续推理 … Continue reading 推理算力“正在耗尽”?百万Token时代来临 产业打响新一轮竞逐
标签: 深度思考按钮
美团发布并开源大模型LongCat-Flash-Chat
据“LongCat”官微消息,美团今日正式发布并开源大模型LongCat-Flash-Chat。LongCat-Flash采用创新性混合专家模型(Mixture-of-Experts, MoE)架构, … Continue reading 美团发布并开源大模型LongCat-Flash-Chat
硅基流动:上线DeepSeek-V3.1,上下文升至160K
据硅基流动消息,8月25日,硅基流动大模型服务平台上线深度求索团队最新开源的DeepSeek-V3.1。DeepSeek-V3.1总参数共671B,激活参数37B,采用混合推理架构(同时支持思考模式与 … Continue reading 硅基流动:上线DeepSeek-V3.1,上下文升至160K
