PP-OCRv6 : Modèle OCR multilingue performant
PP-OCRv6 propose trois modèles (tiny, small, medium) avec des tailles variant de 1,5M à 34,5M paramètres. Le modèle medium atteint 86,2% en détection et 83,2% en reconnaissance, supportant 50 langues.
« PP-OCRv6_medium reaches 86.2% detection Hmean and 83.2% recognition accuracy. » — Hugging Face Blog
Que faut-il retenir ?
- PP-OCRv6 propose trois modèles : tiny (1,5M paramètres), small (7,7M paramètres), et medium (34,5M paramètres).
- Le modèle medium améliore la détection de texte de +4,6 points et la reconnaissance de +5,1 points par rapport à PP-OCRv5_server.
- Les modèles small et medium supportent 50 langues, dont le chinois simplifié, le chinois traditionnel, l'anglais et le japonais.
- PP-OCRv6 utilise RepLKFPN pour la détection de texte et EncoderWithLightSVTR pour la reconnaissance.
Pourquoi cette nouvelle compte-t-elle ?
PP-OCRv6 est crucial pour les professionnels travaillant avec des documents multilingues, des étiquettes industrielles ou des textes scéniques. Ses améliorations en précision et sa flexibilité de déploiement en font un outil puissant pour les applications nécessitant une OCR fiable et performante. La prise en charge de 50 langues simplifie également les workflows multilingues.
34,5M paramètres pour le modèle PP-OCRv6_medium
Public concerné : développeurs, entreprises
Quelles sont les améliorations de PP-OCRv6 par rapport à la version précédente ?
PP-OCRv6 améliore la détection de texte de +4,6 points et la reconnaissance de +5,1 points. Il introduit également de nouvelles architectures comme RepLKFPN pour la détection et EncoderWithLightSVTR pour la reconnaissance, tout en supportant 50 langues.