天眼查知识产权信息显示,1月6日,广州小鹏汽车科技有限公司申请的“机器人视觉标定方法、装置、机器人和存储介质”专利公布。摘要显示,该方法包括:在接收到标定需求后,基于标定需求规划机器人的运动轨迹;机器 … Continue reading 小鹏汽车公布机器人视觉标定专利,可实现标定过程全程自动化
标签: 视觉
Getty Images与AI公司Perplexity达成多年授权协议
10月31日,视觉内容公司Getty Images与Perplexity宣布达成多年授权协议,该协议涵盖Perplexity在其AI搜索和发现工具中展示Getty Images图片。
仿生软镜片可像人眼一样自动调焦
财联社10月27日电,美国佐治亚理工学院研究人员开发出一种仿生软镜片,能够像人眼一样根据环境光照强度自动调节焦距。这一成果展示了光驱动软体材料在构建自适应视觉系统、自主运行的软体机器人、智能医疗设备及 … Continue reading 仿生软镜片可像人眼一样自动调焦
DeepSeek团队开源新模型DeepSeek-OCR:少量视觉token完成海量文本压缩
财联社10月20日电,DeepSeek-AI 团队发布《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方法。Huggin … Continue reading DeepSeek团队开源新模型DeepSeek-OCR:少量视觉token完成海量文本压缩
豆包大模型1.6-vision正式发布
火山引擎正式发布豆包大模型1.6-vision,这是豆包大模型家族首个具备工具调用能力的视觉深度思考模型,拥有更强的通用多模态理解和推理能力,并支持 Responses API,以更高性价比更好满定客 … Continue reading 豆包大模型1.6-vision正式发布
奥比中光:与地平线、地瓜机器人达成进一步战略合作
财联社9月16日电,奥比中光在互动平台表示,公司3D视觉开发者社区是面向行业开发者打造的开发、分享与交流平台。该社区致力于将公司在视觉领域的技术经验赋能开发者,为国内外开发者提供优质的开发环境和服务。 … Continue reading 奥比中光:与地平线、地瓜机器人达成进一步战略合作
面壁智能开源8B参数的多模态模型MiniCPM-V 4.5
8月26日,面壁智能正式开源8B参数的MiniCPM-V 4.5多模态模型,具备“高刷”视频理解能力。据介绍,该模型高刷视频理解同级SOTA且性能超过Qwen2.5-VL 72B;同等视觉token开 … Continue reading 面壁智能开源8B参数的多模态模型MiniCPM-V 4.5
智谱GLM-4.5V正式上线并开源
8月11日,智谱正式推出开源视觉推理模型GLM-4.5V,总参数106B,激活参数12B,在多个多模态榜单达到SOTA性能,并同步在魔搭社区与Hugging Face开源。其API 调用价格为输入2元 … Continue reading 智谱GLM-4.5V正式上线并开源
全球最长LED巨幕点亮成都世运会,“成都高新造”硬核科技加持!
成都世运会将于8月7日晚在天府国际会议中心迎来开幕。开幕式上,面积约1.1万平方米、全球最长连续LED巨幕将呈现令人震撼的视觉画卷,而这块担纲开幕式核心视觉呈现的巨型大屏,正是由成都高新区科技领军企业 … Continue reading 全球最长LED巨幕点亮成都世运会,“成都高新造”硬核科技加持!
KITTI数据集:一种流行的自动驾驶视觉数据集(深度估计KITTI数据集介绍与使用说明)
一、简介 KITTI数据集是一个免费的自动驾驶视觉数据集,用于估计车辆和行人的深度,运动或感知物体的姿态。KITTI数据集是由德国卡尔斯鲁厄理工学院和丹麦技术大学联合提供的,其中包括关于城市驾驶场景的 … Continue reading KITTI数据集:一种流行的自动驾驶视觉数据集(深度估计KITTI数据集介绍与使用说明)
