《科创板日报》2日讯,《科创板日报》记者获悉,4月2日智谱发布首个原生多模态Coding基座模型GLM-5V-Turbo。据介绍,该模型最大突破在于深度融合视觉与编程能力,能够原生处理文本、图片、视频 … Continue reading 智谱发布首个多模态Coding基座模型 OpenClaw龙虾获视觉能力
标签: 视觉
美团发布原生多模态 LongCat-Next
3月27日消息,美团发布并全面开源原生多模态大模型LongCat-Next及其核心组件——离散原生分辨率视觉分词器(dNaViT)。该模型打破了当前大模型以“语言为中心”的传统拼凑式架构,将图像、语音 … Continue reading 美团发布原生多模态 LongCat-Next
给广告做「脑电图」:明略科技(2718.HK)AdEff 为什么又快又准?
一条广告好不好,该问消费者,还是问他的大脑? 问卷调查用了半个多世纪,逻辑清晰但有个致命bug:消费者喜欢的广告和刷手机时真正会看完的,往往不是同一条。 诺贝尔经济学奖得主丹尼尔·卡尼曼曾指出,人的大 … Continue reading 给广告做「脑电图」:明略科技(2718.HK)AdEff 为什么又快又准?
攻克“鬼探头”与“逆光盲区”,自动驾驶的“长尾补盲战”
2026年,自动驾驶行业迎来关键商业化窗口期。特斯拉在奥斯汀实现“车内无人”运营落地,国内百度萝卜快跑和小马智行也在多城加速布局。与此同时,工信部在2025年底发布首批L3级有条件自动驾驶车型准入许可 … Continue reading 攻克“鬼探头”与“逆光盲区”,自动驾驶的“长尾补盲战”
摩尔线程:3DGS在计算机图形学与视觉领域实现显著突破
财联社3月3日电,摩尔线程在互动平台表示,2025年12月17日,在香港举办的全球图形学领域备受瞩目的顶级学术盛会SIGGRAPH Asia 2025上,公司在3DGS重建挑战赛中凭借自研技术Lite … Continue reading 摩尔线程:3DGS在计算机图形学与视觉领域实现显著突破
清华AIR团队揭示人类与智驾算法视觉注意力的本质差异
2月21日,据清华大学智能产业研究院消息,清华大学智能产业研究院AIR团队于2026年2月发表在《npj Artificial Intelligence》的研究《驾驶任务中的人类与算法视觉注意力》,以 … Continue reading 清华AIR团队揭示人类与智驾算法视觉注意力的本质差异
脑虎科技宣布入驻上海科技馆,将在春节期间试开放
2月10日,界面新闻获悉,脑虎科技宣布公司正式入驻上海科技馆, 其核心展区聚焦“具身智能与人机融合”,将在春节期间试开放。据介绍,展区将首次公开展示脑虎科技包括柔性电极阵列、高通量脑电采集芯片、植入体 … Continue reading 脑虎科技宣布入驻上海科技馆,将在春节期间试开放
商汤开源多模态自主推理模型SenseNova-MARS
1月29日,商汤正式开源多模态自主推理模型SenseNova-MARS(8B/32B双版本)。据商汤介绍,该模型是首个支持动态视觉推理和图文搜索深度融合的Agentic VLM模型。
马斯克:新一代神经链接脑机接口增强版的性能将提升至三倍
财联社1月29日电,马斯克发帖称,新一代神经链接脑机接口增强版的性能将提升至三倍,将于今年晚些时候面市。待监管部门批准后,Neuralink准备推出首款盲视增强技术,使那些完全失明的人能够以低分辨率视 … Continue reading 马斯克:新一代神经链接脑机接口增强版的性能将提升至三倍
DeepSeek发布DeepSeek-OCR 2
每经AI快讯,1月27日消息,DeepSeek发布全新DeepSeek-OCR 2模型,采用创新的DeepEncoder V2方法,让AI能够根据图像的含义动态重排图像的各个部分,而不再只是机械地从左 … Continue reading DeepSeek发布DeepSeek-OCR 2
