DeepSeek-OCR 2模型在智算适配成功
来源:公司新闻 发布时间:2026-02-28 15:30:47

近日,DeepSeek-OCR 2 基于成都智算中心昇腾910A成功完成适配验证。此前,PaddleOCR-VL 模型也已在该中心通过适配验证。两款模型的相继落地,进一步丰富了成都智算中心在文档智能解析与理解领域的技术储备。

   

   


日前,DeepSeek团队开源的全新DeepSeek-OCR 2模型,采用创新的DeepEncoder V2方法,让AI能够像人类一样按照逻辑顺序“看”图像。这项技术的核心创新在于改变了传统AI处理图像的方式。DeepEncoder V2让AI基于图像含义动态重新排列图像片段,而非传统的从左到右刚性扫描。这种方法模仿了人类追随场景逻辑流的方式。

 

根据DeepSeek公布的技术报告,DeepSeek-OCR 2在多项关键指标上展现出显著优势。在OmniDocBench v1.5基准测试中,该模型取得了91.09%的成绩,相较于前代DeepSeek-OCR提升了3.73%。

值得注意的是,该模型在保持极高精度的同时,严格控制了计算成本,其视觉Token数量被限制在256至1120之间,这一上限与Google的Gemini-3 Pro保持一致。在实际生产环境中,该模型在处理在线用户日志和PDF预训练数据时的重复率分别下降了2.08%和0.81%,显示出极高的实用成熟度。
本次在成都智算中心昇腾AI平台上的全流程适配验证,重点验证了DeepSeek-OCR 2核心组件DeepEncoder V2能够在国产算力上稳定运行。该模型凭借其创新的逻辑化视觉理解方式,能够在实际场景中有效解析表格、合同等复杂文档结构,为本地企业与开发者在智能化文档处理方面提供了一个新的可选工具。

   

   
未来,成都智算中心将继续聚焦行业需求,继续推进各类先进模型的适配与部署工作,与生态伙伴共同推动人工智能在千行百业的深度融合与价值落地。