OCR (Optical Character Recognition)

L’OCR, ou reconnaissance optique de caractères, est une technologie qui convertit des textes figurant sur une image ou un PDF en données numériques exploitables. En matière de facturation, l’OCR est utilisé pour lire automatiquement le contenu de factures papier ou PDF non structurées (montants, dates, références) afin de les intégrer dans un système informatique. Toutefois, avec l’avènement de la facture électronique structurée, le recours à l’OCR tendra à diminuer pour les échanges B2B domestiques (puisque les données seront déjà disponibles sans saisie). L’OCR restera utile pendant la transition (pour numériser d’anciennes factures papier) et pour traiter les pièces hors périmètre (ex : factures de fournisseurs étrangers reçues en PDF). Exemple : un expert-comptable pourra utiliser un OCR pour extraire les données d’une facture PDF de 2023 afin de les injecter dans son logiciel, alors qu’en 2026 les nouvelles factures arriveront déjà en format structuré.

Définitions

Autres définitions

UBL (Universal Business Language)

TVA (Taxe sur la Valeur Ajoutée)

Ticket Z