Читать книгу Informationswissenschaft: Theorie, Methode und Praxis / Sciences de l'information: théorie, méthode et pratique - Группа авторов - Страница 47

Le choix d’un format d’images pour un projet de numérisation: méthodes existantes

Оглавление

Différents auteurs se sont intéressés à la manière d’évaluer et de choisir un format d’images parmi d’autres formats. Par exemple, la Bibliothèque nationale des Pays-Bas 27 et le Centre de coordination pour l’archivage à long terme de documents électroniques (CECO)28 ont étudié et établi de telles méthodes d’évaluation, orientées vers la conservation des images à long terme.

Une tendance se dégage de ces études: l’idée générale est de déterminer des critères importants pour la conservation à long terme, et ensuite de noter les différents formats envisagés vis-à-vis de ces critères. Cette façon de faire permet d’établir aisément un classement des formats en fonction des notes attribuées. De plus, le procédé pour arriver à ce résultat semble relativement facile à appliquer, puisqu’il suffit de suivre une «recette de cuisine». Celle-ci consiste à confronter chaque format aux différents critères pour en tirer une note.

Par exemple, les critères définis par le CECO sont les suivants: «Ouverture du format», «Licence libre», «Diffusion», «Fonctionnalités», «Implémentation», «Densité de mémorisation», «Vérifiabilité», «Bonnes pratiques» et «Perspectives». La signification plus précise de chacun de ces termes est expliquée dans le travail du CECO.

Ensuite, ce dernier attribue une note à chaque format et ce pour chaque critère. Finalement, un calcul de moyenne est fait en tenant compte du facteur de pondération attribué à chaque critère. Cette moyenne permet d’établir le classement suivant pour les formats d’images matricielles, étant précisé que les formats qui ne sont pas indiqués n’ont pas été évalués.

1. TIFF 6.0 sans compression et PDF/A-2 Note: 1,51.
3. JPEG, JPEG 2000 et DNG Note: 0,89.
6. PNG Note: 0,73.

L’étude de la Bibliothèque nationale des Pays-Bas établit une méthode similaire, dotée de quelques raffinements. Ainsi, les sept critères (Openness, Adoption, Complexity, Technical Protection Mecanism (DRM), Self-documentation, Robustness, Dependencies) sont chacun partagés en différentes caractéristiques. Par exemple, le critère Openness admet les trois caractéristiques suivantes: «Standardisation, Restrictions on the interpretation of the file format» et «Reader with freely available source». Finalement, un type de moyenne pondérée est établi à partir des notes qui correspondent aux diverses caractéristiques. Cette moyenne permet d’aboutir au classement suivant, seuls les formats indiqués ayant été évalués.

1. TIFF (Baseline 6.0 sans compression) Note: 84,8.
2. PNG 1.2 Note: 78.
3. JP2 (JPEG 2000 Part 1) lossless Note: 74,7.
4. JP2 (JPEG 2000 Part 1) lossy Note: 66,1.
5. Basic JFIF (JPEG) 1.02 Note: 65,4.
6. TIFF 6.0 LZW Note: 65,3.

On constate que ces deux classements sont différents. Si l’établissement d’une méthode universelle, valable dans toute situation, était le but de ces deux études, alors cette constatation serait une contradiction. Mais les études de la Bibliothèque nationale des Pays-Bas 29 indiquent que les facteurs de pondération doivent être établis en fonction des situations particulières. Dans le même esprit, les recommandations du CECO précisent bien qu’il n’existe pas un unique format valable dans toute situation, et qu’il est nécessaire de tenir compte de l’application prévue pour faire un choix.

En effet, les deux méthodes décrites ci-dessus sont imparfaites. Ces méthodes visent à simplifier le plus possible l’évaluation et le choix d’un format en ramenant tous les critères sur une seule dimension. Ainsi, en additionnant des nombres correspondant à divers critères, on établit un moyen permettant de comparer des critères qui peuvent ne rien avoir en commun. Une telle simplification est discutable.

Une autre observation que l’on peut faire est que les processus définis par les méthodes brièvement présentées ci-dessus impliquent de noter les formats selon divers critères. Mais la façon dont il s’agit d’attribuer les notes est subjective. Elle dépend des personnes chargées de cette tâche. Or, les compétences et l’expérience de ces gens influent certainement sur les notes distribuées.

En résumé, les méthodes d’évaluation de formats vues plus haut donnent un faux sentiment de rigueur. Elles permettent d’obtenir des chiffres et d’en déduire un ou plusieurs formats plus adaptés que les autres, alors qu’il n’est pas possible de définir ces chiffres de manière unique. Il est d’ailleurs utopique de vouloir créer une méthode absolument rigoureuse, puisque le choix d’un format dans le domaine de la conservation à long terme n’est pas seulement une question de compétence et de réflexion, mais aussi un pari sur l’avenir.

Informationswissenschaft: Theorie, Methode und Praxis / Sciences de l'information: théorie, méthode et pratique

Подняться наверх