Article publié dans:
Numérisation
le vendredi 29 septembre 2006 à 19:23
par
Maud
Lu 1751 fois
| 0 commentaire(s)
Démonstration dans les locaux de la société Spigraph 3 rue de La Haye, 38070 Saint Quentin Fallavier,
Jeudi 21 septembre 2006
Documents testés :
Fonds Desanti, boîte-archive n°DST4
Cartotèque ENS LSH : Carte ???
Présent-e-s :
Spigraph : Benjamin Boyet, Denis Lupin
ENS LSH : Vincent Braudt, Anne Courant, Najib Fawzi, Maud Ingarao, Anne Maître, Arnaud Pelfrêne
Une machine i2S, société bordelaise qui représente 50% du marché mondial (? ??) Spigraph est distributeur exclusif en France (vente, formation, maintenance) Actuellement une centaine de machines installées en production
Le CopyBook modèle RGB (A2 couleur) est le plus complet de ce format
Informatique
PC embarqué (linux)
Connexion réseau.
Extension mémoire possible
USB, VGA, clavier, souris...
Ergonomie
Plateau réglable et motorisé, épaisseur des docs jusqu’à 10cm, poids des docs jusqu’à 10kg
Numérisation avec ou sans vitre (selon fragilité du document)
Scan auto : démarrage auto à l’abaissement de la vitre, relèvement auto de la vitre à la fin de la numérisation.
Numérisation
3 x 35 millions de pixels (= 300 dpi optique)
Pas de lumière additionnelle, se fait à la lumière ambiante (il faut donc aménager un minimum l’environnement pour une luminosité stable)
Cadrage automatique (on peut définir marges souhaitées)
Temps de numérisation, traitement et sauvegarde inclus (ne varie pas avec la taille du document)
couleur, 7,5 secondes/page
NB/gris : 3 secondes/pages
Algos de traitement immédiats (applicables au moment de la capture. Les autres traitements sont applicables a posteriori avec Book Restorer) :
Suppression doigts (si besoin de maintenir doc à la main)
Redressement des documents (pages penchées)
Redressement géométrique (supprime courbures de la page)
Accentuation des détails
Connecteur pour pointer vers un OCR (ou OCR inclus dans Book Restorer : Abby Fine Reader)
Métadonnées de base : auteur, copyright, description.
Choix de l’image archivée : image brute et/ou image restaurée et/ou (autres formats encore : ???)
Image brute : analogie exacte du document présenté.
Taille : de l’ordre de 2 à 3 mo
Image restaurée : image à laquelle sont appliqués les algos de traitement immédiat qu’on a sélectionnés
Taille : de l’ordre de 1,5 mo (ou deux images de 750ko)
Image éventuellement scindée en deux (livre ou cahier ouvert) : crée deux images.
Possibilité d’exclure la zone centrale (spirales d’un cahier par exemple)
Image éventuellement redressée et applatie
Image éventuellement accentuée
Image PixToPdf
Taille : de l’ordre de 224 ko
PixToPdf est un logiciel payant, non inclus dans l’offre commerciale de base. Tarif 2200 €/an pour 10 000 pages/mois Format compression MRC (mixed rasted content) : l’image est décomposée en 3 couches (fond, texte, couleur). Le texte est l’OCR brut (recherche plein texte possible etc.) Intéressant si texte OCRisable (dactylographié et non manuscrit)
Pour certains Digibook, plusieurs "têtes" sont possibles. Ex. tête à 1600 pixels (donne du 250 dpi en A1)
bras mobile (sur certains modèles uniquement)
en combinant le choix d’une tête et l’utilisation du bras mobile, on peut obtenir beaucoup plus "fin" que 300 dpi - jusqu’à 800... l’appareil peut alors avoir un intérêt pour les images icono. D’ailleurs en amtière de numérisation il vaut mieux parler en pixels qu’en dpi...
il faut des écrans graphiques pour travailler sur les images iconos (1.000 à 1.500 euros par écran)
Une machine spécifique image : IQsmart (de la gamme Creo )
permet d’avoir entre entre 3.200 et 5.200 dpi selon le modèle de machine. Spécialisée pour les photographies, notamment diapos et jusqu’à A3. Entre 8.500 et 23.100 euros selon le modèle
Par contre, ne convient pas aux livres (très faible épaisseur tolérée contre la vitre : qq mm).
A noter : 50 numérisations par heure, maxi : plus d’1 min par numérisation.
Technologiquement, rien à voir avec les scanners à livres : c’est une barette de numérisation qui passe linéairement sur le document. Donc, bcp + précis.
Avantages
Traitements automatisés (dès la capture) qui peuvent faire gagner beaucoup de temps (cf. estimation Arnaud du volume horaire nécessaire pour les retraitements d’images ???)
Simplicité d’utilisation (une machine qu’on pourrait - presque - installer en libre service...)
Connexion réseau, etc.
Limites
Résolution : 300 dpi max, peut être limite pour certains types de documents ?
Format : A2 max : Cartes A0 ?
Pas de maîtrise précise de la colorimétrie (apprentissage possible par le logiciel mais reste limité)
Metadonnées immédiates (dès la capture) très limitées : 3 champs.
Conclusion Najib et Maud : répond à l’ensemble des besoins pour le projet archive Desanti. Vérifier si idem pour les autres projets intéressés, notamment au vu des limites ci-dessus.