关注Model Opensource2026-06-22 21:29:56

百度飞桨正式开源新一代OCR模型PP-OCRv6 支持50种语言

这是百度飞桨PaddleOCR团队2026年6月发布的第六代文本检测识别模型，提供三档不同参数规模版本，覆盖端侧到服务器全算力平台。相比前作精度明显提升，扩展支持50种语言与多种工业场景，以Apache 2.0协议开源

编辑视角

PP-OCR是工业界广泛使用的开源OCR方案，新一代版本的性能、场景扩展，能满足端侧、工业场景需求，对开发者选型和落地有较高参考价值

深度解读

主旨是百度飞桨PaddleOCR团队正式推出第六代OCR系统PP-OCRv6，完成性能与场景升级，已在开源社区开放。证据来自官方博客、公开研究论文和第三方社区，明确给出精度提升、参数档位、速度优化、语言扩展等具体指标。边界方面：现有公开信息未披露大规模商业化落地案例，也未提及超大参数版本效果，仅公开三档参数模型的核心指标。后续可观察该模型在实际工业场景的落地表现，以及社区生态的适配进展

核心要点

百度飞桨PaddleOCR团队2026年6月正式开源发布PP-OCRv6
提供1.5M到34.5M三档参数，覆盖全算力平台
同规模模型精度较v5提升4%以上，速度大幅优化
单模型支持50种语言，新增多个工业场景支持