每经AI快讯,2月26日,云知声宣布正式推出文档智能基础大模型“Unisound U1-OCR”。作为首个工业级文档智能基座,该模型正式开启OCR 3.0时代,在理解版面的基础上,进一步洞察文档深层语 … Continue reading 云知声推出文档智能基础大模型“Unisound U1-OCR” 正式开启OCR 3.0时代
标签: ocr
智谱开源GLM-OCR模型
2月3日,智谱宣布正式发布并开源GLM-OCR。据介绍,该模型仅0.9B参数规模,支持vLLM、SGLang和Ollama部署,在公式识别、表格识别、信息抽取的多项主流基准中均取得SOTA表现。
Kimi发布并开源K2.5模型;DeepSeek发布DeepSeek-OCR 2模型并开源|未来商业早参
每经记者:郑欣蔚 李卓 每经编辑:黄博文 | 2026年1月28日 星期三 | NO.1千问最强推理模型正式发布 1月26日晚间,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking。该模 … Continue reading Kimi发布并开源K2.5模型;DeepSeek发布DeepSeek-OCR 2模型并开源|未来商业早参
DeepSeek发布DeepSeek-OCR 2
每经AI快讯,1月27日消息,DeepSeek发布全新DeepSeek-OCR 2模型,采用创新的DeepEncoder V2方法,让AI能够根据图像的含义动态重排图像的各个部分,而不再只是机械地从左 … Continue reading DeepSeek发布DeepSeek-OCR 2
DeepSeek发布DeepSeek-OCR 2模型
《科创板日报》27日讯,DeepSeek团队发布《DeepSeek-OCR 2: Visual Causal Flow》论文,并开源DeepSeek-OCR 2模型,采用创新的DeepEncoder … Continue reading DeepSeek发布DeepSeek-OCR 2模型
腾讯混元OCR专家模型宣布开源,参数仅1B
11月25日,腾讯混元宣布推出开源模型HunyuanOCR,参数仅为1B。HunyuanOCR是混元原生多模态端到端OCR专家模型,主要由三大部分组建构成:原生分辨率视频编码器、自适应视觉适配器和轻量 … Continue reading 腾讯混元OCR专家模型宣布开源,参数仅1B
腾讯混元OCR模型宣布开源
财联社11月25日电,腾讯混元推出全新开源模型HunyuanOCR,参数仅为1B,依托于混元原生多模态架构打造,获得多项业界OCR应用榜单SOTA(最先进水平)成绩。
只有0.9B的PaddleOCR-VL,却是现在最强的OCR模型。
这几天,OCR这个词,绝对是整个AI圈最火的词。 因为DeepSeek-OCR,甚至让OCR这个赛道文艺复兴,又给直接带火了。 整个Hugging Face的趋势版里,前4有3个OCR,甚至Qwen3 … Continue reading 只有0.9B的PaddleOCR-VL,却是现在最强的OCR模型。
DeepSeek团队开源新模型DeepSeek-OCR:少量视觉token完成海量文本压缩
财联社10月20日电,DeepSeek-AI 团队发布《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方法。Huggin … Continue reading DeepSeek团队开源新模型DeepSeek-OCR:少量视觉token完成海量文本压缩
ocr图像识别技术,ocr图像识别
这期间,公司上面突然下起了需求。 根据用户提供的身份证和营业执照照片,获取照片中的信息如姓名、身份证号码、公司名称等),并存入数据库。 而且给的时间是两周,当时我很无知。 之后添加语言尽量使用免费的A … Continue reading ocr图像识别技术,ocr图像识别
