存储成本压力上升期,面壁智能1.58-bit模型能缓解“显存焦虑”吗?

界面新闻记者 | 伍洋宇界面新闻编辑 | 文姝琪 5月25日,面壁智能联合清华大学、OpenBMB开源社区正式发布BitCPM-CANN。这是一个基于国产算力平台原生训练并开源的1.58-bit三值权 … Continue reading 存储成本压力上升期,面壁智能1.58-bit模型能缓解“显存焦虑”吗?

英特尔推出本地+云端“混合龙虾” 号称能少烧多达7成云端Token

财联社5月22日电,面对日益高涨的AI成本,英特尔推出混合智能体方案“SuperClaw”,使用端侧芯片处理高频和涉及敏感文件的任务,同时保留接入云端模型的能力,用于高级推理和外部数据检索。公告称,通 … Continue reading 英特尔推出本地+云端“混合龙虾” 号称能少烧多达7成云端Token

一行代码加速60%:明略科技(2718.HK)Cider如何补齐Apple端侧AI生态的关键短板

如果给2026年上半年的开发者社区选一个关键词,”本地AI”可能会高票当选。 这股风潮的标志性事件发生在3月底:Ollama宣布其Mac版本从llama.cpp切换到苹果原生的 … Continue reading 一行代码加速60%:明略科技(2718.HK)Cider如何补齐Apple端侧AI生态的关键短板

创大模型价格新低!DeepSeek API输入缓存降至首发价十分之一

界面新闻记者 | 宋佳楠 DeepSeek正在重新定义大模型普惠的边界。 4月26日,DeepSeek官方发布API价格调整公告,全系API输入缓存命中价格降至首发价的十分之一,V4‑Pro更叠加限时 … Continue reading 创大模型价格新低!DeepSeek API输入缓存降至首发价十分之一

海外评测DeepSeek-V4:智能体任务排名开源第一,幻觉率上升,Token消耗大

4月24日, DeepSeek-V4预览版正式发布并同步开源,号称在Agent能力、世界知识与推理性能三大维度达到国内及开源领域领先水平。 DeepSeek-V4分为Pro与Flash两个版本,均支持 … Continue reading 海外评测DeepSeek-V4:智能体任务排名开源第一,幻觉率上升,Token消耗大