Beaucoup se rappellent sans doute, il y a plusieurs années, à quel point le fait de scanner un document et d’en tirer automatiquement le texte contenu était une révolution. Des balbutiements de la reconnaissance d’écriture (OCR, Optical character recognition) jusqu’à Google, on trouve désormais un monde d’écart.
Là où des solutions professionnelles étaient requises, on accède à ce genre de fonctionnalité gratuitement, notamment chez Google depuis juin de l’année dernière. L’OCR mis en place permettait lors de l’upload de fichiers PDF par exemple de créer un document dans Google Docs avec l’ensemble du texte. Google indique que depuis le lancement de cette fonction de nombreux retours ont permis de l’améliorer.
Ajout le plus important : la reconnaissance de 29 langues supplémentaires, dont toutes les principales utilisées en Europe (y compris le Français).
Sur la page d’import des fichiers dans Google Docs, il faudra cocher la case « Convertir le texte de fichiers image ou PDF au format Google Documents », puis être certain que Français est bien sélectionné.
L’exemple donné par Google se base sur une image contenant des caractères cyrilliques :
Là où des solutions professionnelles étaient requises, on accède à ce genre de fonctionnalité gratuitement, notamment chez Google depuis juin de l’année dernière. L’OCR mis en place permettait lors de l’upload de fichiers PDF par exemple de créer un document dans Google Docs avec l’ensemble du texte. Google indique que depuis le lancement de cette fonction de nombreux retours ont permis de l’améliorer.
Ajout le plus important : la reconnaissance de 29 langues supplémentaires, dont toutes les principales utilisées en Europe (y compris le Français).
Sur la page d’import des fichiers dans Google Docs, il faudra cocher la case « Convertir le texte de fichiers image ou PDF au format Google Documents », puis être certain que Français est bien sélectionné.
L’exemple donné par Google se base sur une image contenant des caractères cyrilliques :