Retromarc

A l’occasion d’un marché conclu avec la BNF, la société MAXIMA Sarl a développé un logiciel qui permet la rétroconversion automatique des notices papier.

Ce marché concerne le traitement de 40 000 notices des imprimés des années 1980-1996 en caractères cyrilliques, groupées dans 7 fichiers séparés en Belorusse, Bulgare, Macédonien, Moldave, Russe, Serbe et Ukrainien à livrer sous un codage UTF8.

Pour ce marché le choix a été fait d’une lecture optique (OCR) des notices photographiées suivie d’un traitement automatique du résultat de la lecture par un logiciel spécifique utilisable sur PC. Cette option très innovante présentait des risques en termes de procédé et de délais de mise au point. Elle devait permettre une économie significative en comparaison des propositions des prestataires habituels pour ce type de marché.

La problématique de la rétroconversion ISBD + cyrillique tient essentiellement dans la confusion continue possible entre les caractères des mots en caractères cyrilliques et des mots en caractères latins présents simultanément dans les notices. Par son activité de traduction technique « autour du russe » MAXIMA a accumulé une expérience de plusieurs années de l’OCR cyrillique, ce qui a facilité la conception du traitement.

L’analyse approfondie d’un lot test a conduit à un traitement qui se déroule en quatre étapes :

  • Étape 1 : Repérage des zones pour la lecture OCR
  • Étape 2 : Traitement par RETROMARC qui permet
  • Étape 3 : Dédoublonnage et création des liens
  • Étape 4 : Finition

Proposition :

Si vous êtes en situation de procéder à une Rétroconversion, y compris avec des caractères cyrilliques, MAXIMA est à votre disposition pour vous présenter RETROMARC.

*RETROMARC est une marque déposée de la société :
MAXIMA Sarl
100 rue Bobillot
75013 PARIS
Contact : dg[at]maxima-sarl.com