返回热力追踪
关注Model Opensource

百度飞桨正式开源新一代OCR模型PP-OCRv6 支持50种语言

这是百度飞桨PaddleOCR团队2026年6月发布的第六代文本检测识别模型,提供三档不同参数规模版本,覆盖端侧到服务器全算力平台。相比前作精度明显提升,扩展支持50种语言与多种工业场景,以Apache 2.0协议开源

编辑视角

PP-OCR是工业界广泛使用的开源OCR方案,新一代版本的性能、场景扩展,能满足端侧、工业场景需求,对开发者选型和落地有较高参考价值

深度解读

主旨是百度飞桨PaddleOCR团队正式推出第六代OCR系统PP-OCRv6,完成性能与场景升级,已在开源社区开放。证据来自官方博客、公开研究论文和第三方社区,明确给出精度提升、参数档位、速度优化、语言扩展等具体指标。边界方面:现有公开信息未披露大规模商业化落地案例,也未提及超大参数版本效果,仅公开三档参数模型的核心指标。后续可观察该模型在实际工业场景的落地表现,以及社区生态的适配进展

核心要点
  • 百度飞桨PaddleOCR团队2026年6月正式开源发布PP-OCRv6
  • 提供1.5M到34.5M三档参数,覆盖全算力平台
  • 同规模模型精度较v5提升4%以上,速度大幅优化
  • 单模型支持50种语言,新增多个工业场景支持
延伸阅读
  • PP-OCRv6: From 1.5M to 34.5M Parameters, Surpassing Billion-Scale VLMs on OCR Tasks官方研究论文,可查看完整技术实现细节
  • PP-OCRv6正式发布,精度全面跃升,本地浏览器单图预测轰出97ms可查看详细性能测试数据与场景说明