近日百度文心衍生模型PaddleOCR在GitHub上Star数突破73.3K超越谷歌Tesseract OCR成为全球Star数最高的OCR项目标志着新一代技术体系改写行业标杆。超越谷歌标杆Tesseract OCR诞生于1985年是OCR领域近四十年的技术标杆。而PaddleOCR此次超越它是大模型驱动下中国开源项目首次在OCR领域超越谷歌主导产品意义重大。技术实力强劲PaddleOCR基于文心大模型训练是文心多模态能力重要部分。它支持超100种语言识别用户覆盖160个国家和地区。1月29日其新一代文档解析模型还取得全球SOTA成绩。顺应行业趋势近年来大模型成为OCR赛道增长重要动力。PaddleOCR在GitHub上的Star自2024年起爆发式增长。2025年OCR成大模型厂商布局重点众多产品相继发布。服务升级与生态建设PaddleOCR同步升级服务官网免费每日解析页数提升至2万用户还能免费获取高精度PDF解析能力。同时PaddleOCR OCEAN生态联盟成立首批成员包括多家全球平台伙伴。编辑观点PaddleOCR超越谷歌标杆展现了中国开源项目的实力。随着大模型发展OCR领域竞争将更激烈PaddleOCR有望凭借技术与生态优势引领行业发展。