CopiBook (modèle RGB) : compte-rendu de démonstration

Article publié dans: Numérisation le vendredi 29 septembre 2006 à 19:23 par Maud
Lu 1751 fois | 0 commentaire(s)

Démonstration dans les locaux de la société Spigraph 3 rue de La Haye, 38070 Saint Quentin Fallavier,

Jeudi 21 septembre 2006

Documents testés :
- Fonds Desanti, boîte-archive n°DST4
- Cartotèque ENS LSH : Carte ???

Présent-e-s :
- Spigraph : Benjamin Boyet, Denis Lupin
- ENS LSH : Vincent Braudt, Anne Courant, Najib Fawzi, Maud Ingarao, Anne Maître, Arnaud Pelfrêne

1. Caractéristiques techniques, ergonomiques, etc.

Une machine i2S, société bordelaise qui représente 50% du marché mondial (? ??) Spigraph est distributeur exclusif en France (vente, formation, maintenance) Actuellement une centaine de machines installées en production

Le CopyBook modèle RGB (A2 couleur) est le plus complet de ce format

Informatique
- PC embarqué (linux)
- Connexion réseau.
- Extension mémoire possible
- USB, VGA, clavier, souris...

Ergonomie
- Plateau réglable et motorisé, épaisseur des docs jusqu’à 10cm, poids des docs jusqu’à 10kg
- Numérisation avec ou sans vitre (selon fragilité du document)
- Scan auto : démarrage auto à l’abaissement de la vitre, relèvement auto de la vitre à la fin de la numérisation.

Numérisation
- 3 x 35 millions de pixels (= 300 dpi optique)

Pas de lumière additionnelle, se fait à la lumière ambiante (il faut donc aménager un minimum l’environnement pour une luminosité stable)

Cadrage automatique (on peut définir marges souhaitées)

Temps de numérisation, traitement et sauvegarde inclus (ne varie pas avec la taille du document)
- couleur, 7,5 secondes/page
- NB/gris : 3 secondes/pages

Algos de traitement immédiats (applicables au moment de la capture. Les autres traitements sont applicables a posteriori avec Book Restorer) :
- Suppression doigts (si besoin de maintenir doc à la main)
- Redressement des documents (pages penchées)
- Redressement géométrique (supprime courbures de la page)
- Accentuation des détails

Connecteur pour pointer vers un OCR (ou OCR inclus dans Book Restorer : Abby Fine Reader)

Métadonnées de base : auteur, copyright, description.

Choix de l’image archivée : image brute et/ou image restaurée et/ou (autres formats encore : ???)

2. Images obtenues

Image brute : analogie exacte du document présenté.
- Taille : de l’ordre de 2 à 3 mo

Image restaurée : image à laquelle sont appliqués les algos de traitement immédiat qu’on a sélectionnés
- Taille : de l’ordre de 1,5 mo (ou deux images de 750ko)

- Image éventuellement scindée en deux (livre ou cahier ouvert) : crée deux images.
- Possibilité d’exclure la zone centrale (spirales d’un cahier par exemple)
- Image éventuellement redressée et applatie
- Image éventuellement accentuée

Image PixToPdf
- Taille : de l’ordre de 224 ko

PixToPdf est un logiciel payant, non inclus dans l’offre commerciale de base. Tarif 2200 €/an pour 10 000 pages/mois Format compression MRC (mixed rasted content) : l’image est décomposée en 3 couches (fond, texte, couleur). Le texte est l’OCR brut (recherche plein texte possible etc.) Intéressant si texte OCRisable (dactylographié et non manuscrit)

3. Notes sur d’autres machines

- Pour certains Digibook, plusieurs "têtes" sont possibles. Ex. tête à 1600 pixels (donne du 250 dpi en A1)
- bras mobile (sur certains modèles uniquement)
- en combinant le choix d’une tête et l’utilisation du bras mobile, on peut obtenir beaucoup plus "fin" que 300 dpi - jusqu’à 800... l’appareil peut alors avoir un intérêt pour les images icono. D’ailleurs en amtière de numérisation il vaut mieux parler en pixels qu’en dpi...
- il faut des écrans graphiques pour travailler sur les images iconos (1.000 à 1.500 euros par écran)

Une machine spécifique image : IQsmart (de la gamme Creo )

permet d’avoir entre entre 3.200 et 5.200 dpi selon le modèle de machine. Spécialisée pour les photographies, notamment diapos et jusqu’à A3. Entre 8.500 et 23.100 euros selon le modèle

Par contre, ne convient pas aux livres (très faible épaisseur tolérée contre la vitre : qq mm).

A noter : 50 numérisations par heure, maxi : plus d’1 min par numérisation.

Technologiquement, rien à voir avec les scanners à livres : c’est une barette de numérisation qui passe linéairement sur le document. Donc, bcp + précis.

4. Conclusion : avantages/limites du CopyBook pour nos besoins

Avantages
- Traitements automatisés (dès la capture) qui peuvent faire gagner beaucoup de temps (cf. estimation Arnaud du volume horaire nécessaire pour les retraitements d’images ???)
- Simplicité d’utilisation (une machine qu’on pourrait - presque - installer en libre service...)
- Connexion réseau, etc.

Limites
- Résolution : 300 dpi max, peut être limite pour certains types de documents ?
- Format : A2 max : Cartes A0 ?
- Pas de maîtrise précise de la colorimétrie (apprentissage possible par le logiciel mais reste limité)
- Metadonnées immédiates (dès la capture) très limitées : 3 champs.

Conclusion Najib et Maud : répond à l’ensemble des besoins pour le projet archive Desanti. Vérifier si idem pour les autres projets intéressés, notamment au vu des limites ci-dessus.

Dans la même rubrique

Toutes les rubriques

Numérisation
Logiciels et programmation
Suivi du site Transversale
Vu Ailleurs (sur le web)...
Standards, modèles, formats d’échange...
Référencement, moteurs de recherche, classements internationaux
Conception graphique, ergonomie et webdesign
Enjeux, aspects juridiques et sociaux, évolution des métiers, formation continue...
Publication scientifique et édition en ligne
Blogoshpère Académique
Systèmes & réseaux, sécurité informatique

Nuage de mots

droit d’auteur ajax java php xml colloques Contenus Endnote humour i-conf lodel Métadonnées Optimisation peer commentary peer review pratiques pédagogiques Refworks validation scientifique Vidéo blog CMS ENT Flash gestion bibliographique Outil Spip Wiki Editions critiques Hal Université couleur css Ergonomie Evolution du web Expérience utilisateur Google Interface riche Internet explorer tests Web 2.0 webdesign

Veille

Nos sites

Site réalisé avec SPIP | squelette Inter.not 1.0 | Admin | Webmestre | Suivre la vie du site RSS 2.0

Créative Commons : Les publications sur Transversale sont mises à disposition selon le Contrat Paternité-Partage des Conditions Initiales à l'Identique 2.0 France
Creative Commons License