| |
OCR ou reconnaissance optique de caractères
(ROC en français)
Vous pouvez utiliser le moteur OCR de PixEdit Pro pour convertir des documents scannés dans des fichiers
PDF lisibles et accessibles à la recherche en plein texte. L’OCR peut être lancée manuellement sur un document déjà scanné ou vous pouvez utiliser « l’assistant traitement par lots différés » pour traiter des milliers voire des millions de documents sans manipulation. L’OCR peut aussi être effectuée automatiquement après le scannage. Sélectionnez une zone avec l’outil Sélection, cliquez le bouton droit de la souris et choisissez Copier Comme du Texte pour reconnaître et copier une zone de texte dans le presse-papiers Windows. Le texte pourra être collé dans n’importe quelle application.
Pour obtenir une reconnaissance des caractères maximale, les documents scannés doivent présenter une bonne lisibilité. Une résolution de 300 dpi est recommandée. Assurez-vous que les documents scannés ne
sont ni trop sombres ni trop pâles.
Si vous enregistrez vos documents en format PDF, le texte reconnu sera enregistré en addition au contenu scanné, sans affecter le document original, et permettra une vraie possibilité de recherche en plein texte tout en préservant l’apparence du document scanné.
Ci-dessous, exemple du résultat de la
recherche d'un mot dans un document fichier raster : les pages comportant
le mot apparaissent dans la fenêtre de recherche, et le mot est surligné
en jaune dans la fenêtre principale.
Dans l'application PixEdit :

Ouvert avec l'application Adobe Reader :
Utilisation manuelle de l’OCR
Cliquez sur l’icône OCR pour lancer la reconnaissance du texte. Vous pouvez aussi vous servir de l’icône de recherche et désigner le texte que vous recherchez. Si la reconnaissance n’a pas déjà été effectuée, PixEdit lancera l’OCR puis affichera les résultats.
Utilisation de l'OCR en mode Traitement par lots
Si vous devez traiter de nombreux documents, il vous faut d’abord enregistrer une macro. Avec un document ouvert, cliquez sur Enregistrement puis sur l’icône OCR et précisez toutes les pages à traiter. Cliquez Arrêt de l’enregistrement et donnez un nom à votre macro. La macro enregistrée peut alors être lancée dans un traitement par lots en utilisant l’Assistant traitement par lots. Quand vous l’utilisez dans ce but, pensez à préciser le format de fichier pouvant enregistrer du texte reconnu : les formats PDF ou TDF en sont capables.
Remarque : vous pouvez utiliser l’assistant traitement par lots en mode différé pour permettre à PixEdit d’attendre que les documents arrivent dans le dossier désigné, puis exécute l’OCR et enregistre les documents.
Cette méthode est préférable pour de grandes lignes de production où vous utilisez plusieurs PC pour travailler avec de meilleures performances.
Utilisation automatique de l’OCR après le scannage
Cochez l’option « Autoriser les opération d’Après Scannage » (menu « Scanner, Après Scannage… »), puis cochez Reconnaissance de texte avec OCR.
Configuration du module OCR
Utilisez les commandes Outils, Options et sélectionnez l’onglet OCR.
Langue
La précision de la reconnaissance de caractères est améliorée si PixEdit connaît la langue utilisée dans le texte scanné. PixEdit reconnaît par défaut la langue configurée dans Windows, mais vous pouvez vous en affranchir en cochant une langue particulière dans la liste des langues reconnues. Si vous traitez un document dans une langue non reconnue dans la boite de dialogue OCR, cochez « Langue indépendante ».
Accueil
|
|