Comme vous avez peut-être déjà pu le lire sur Cross-files, les archives du Comité international de la Croix-Rouge ont lancé leur plus grand projet de numérisation à ce jour. La bibliothèque est heureuse d’y prendre part et de poursuivre ainsi son travail pour rendre ses collections uniques accessibles en ligne au plus grand nombre.

Cet article vous emmène en coulisses pour découvrir le travail de l’équipe, du choix des collections à numériser aux différentes étapes de description et de préparation qui suivent. Avec, en bonus, un aperçu des près de 9’000 publications numérisées supplémentaires qui seront bientôt disponibles dans notre catalogue.

Quelles collections numériser et pourquoi ?

La numérisation de nos collections répond à deux objectifs principaux. Le premier est de faciliter l’accès à des publications qui ne peuvent actuellement être consultées que dans nos locaux à Genève. Nos collections retracent une partie importante de l’histoire de l’action humanitaire et du droit international humanitaire, du milieu du 19e siècle à nos jours. Une fois numérisées, elles pourront être consultées par des chercheurs et chercheuses du monde entier, mais aussi exploitées à l’aide de nouveaux outils technologiques.

Le second objectif est la conservation à long terme des collections. Lorsqu’une copie numérique existe, il devient possible de limiter la manipulation des originaux et donc de réduire les risques de déchirure, par exemple. Il faut trouver le bon équilibre : certaines publications particulièrement fragiles ou déjà abîmées sont exclues du projet car leur transport et la numérisation présenteraient un risque trop important. Même après leur numérisation, les originaux imprimés pourront continuer à être consultés à la demande des chercheurs et chercheuses, tant que leur état le permet.

Ces deux objectifs ont toujours guidé le choix des collections numérisées par la bibliothèque. Pour le projet en cours, nous en avons sélectionné quatre : les traductions des Conventions de Genève et de leurs Protocoles additionnels, le dépôt institutionnel des publications du CICR, et deux collections patrimoniales, l’« Ancien fonds » et la collection « Prisonniers de guerre ».

Bandes dessinées, brochures et traités, dans 135 différentes combinaisons linguistiques

Le projet commence ainsi avec une collection de taille modeste, mais essentielle : les différentes traductions des traités de droit international humanitaire que possède la bibliothèque, de l’albanais au vietnamien. Les documents numérisés viendront ensuite enrichir les bases de données du CICR en ligne. Un soin particulier sera apporté à l’identification des versions officielles des traités.

Vient ensuite le dépôt institutionnel des publications du CICR, une collection qui rassemble l’ensemble des publications imprimées produites par le siège de notre institution et de nombreuses traductions publiées par ses délégations dans le monde entier.[1] Au total, un peu plus de 4 000 publications seront numérisées, couvrant la période allant de la création du CICR en 1863 jusqu’au passage à la production numérique du début des années 2000.

Cette collection offre un témoignage unique de la communication du CICR au fil du temps. La diversité des langues (135 combinaisons différentes) et des formats, des bandes dessinées aux traités juridiques, reflète à la fois la longévité de l’institution, son empreinte globale, et la diversité de ses activités et de ses interlocuteurs. On y retrouve aussi les productions intellectuelles majeures du CICR, des commentaires des Conventions de Genève aux manuels de chirurgie de guerre.

Cartes, journaux et catalogues : un aperçu des collections patrimoniales de la bibliothèque

À l’automne, le projet se poursuivra avec la numérisation de deux de nos collections patrimoniales. Notre « Ancien fonds » est la toute première collection constituée par la bibliothèque. Elle rassemble près de 4 000 publications, couvrant la période du milieu du 19e siècle à la fin de la Première Guerre mondiale. Entre illustrations détaillées, papier souvent fragile et encarts dépliants de formats divers, sa numérisation promet d’être un vrai défi.

Cliquez ici pour en savoir plus sur notre « Ancien fonds »

La collection patrimoniale « Prisonniers de guerre » rassemble un peu plus de 700 documents consacrés à la captivité en temps de guerre. La majorité date de la Première et la Seconde Guerre mondiale, avec quelques documents antérieurs. La plupart de ces publications ont été collectées par le CICR pour soutenir le travail de ses agences de recherches durant les deux conflits mondiaux, et pour développer la protection juridique des prisonniers dans l’entre-deux-guerres.

On y trouve un ensemble très varié de documents : règlements et accords sur le traitement des prisonniers, rapports de visite de camps, journaux de camps, documentation sur les secours envoyés (dont des ouvrages éducatifs et récréatifs), ainsi que des témoignages d’anciens prisonniers de guerre. La collection comprend également des cartes, récemment reconditionnées puis intégrées à la collection, tant par souci de cohérence que pour en assurer la conservation.

Cliquez ici pour en savoir plus sur la collection « Prisonniers de guerre » (en anglais)

Comment prépare-t-on les collections pour la numérisation ?

Un projet de numérisation se décline en de nombreuses étapes. À chacune ses dilemmes, du plus petit point de détail à celui qui finit par être lourd de conséquences. Nos deux objectifs (accès et conservation) continuent à nous guider tout au long du processus, même s’il est parfois nécessaire d’arbitrer entre les deux. Le travail de préparation à la bibliothèque a officiellement débuté en septembre 2025. Il s’est terminé en mars 2026 pour les deux premières collections et se poursuit encore pour les collections patrimoniales. Ci-dessous, un aperçu des différentes étapes, introduites par quelques questions posées lors de nos réunions d’équipe hebdomadaires.

“Tout est bien dans le catalogue ?”

Des notices de catalogue claires et fiables sont la clé pour rendre les publications numérisées réellement accessibles. La première étape du travail de préparation consiste donc à créer, compléter ou corriger nos notices de catalogue pour les collections sélectionnées, document par document. Avec une petite équipe et un volume important de documents, nous avons dû faire quelques compromis et réduire le niveau de détail des descriptions, sans renoncer à l’espoir de les compléter dans le futur. Il faut aussi, et ce n’est pas aussi simple qu’il n’y paraît, reconstruire la logique de nos prédécesseurs pour comprendre comment les collections ont été constituées et décrites par le passé.  À nous de repérer les incohérences, de corriger certaines erreurs et de tenter de garantir l’harmonie du tout.

L’une des surprises du projet a été de découvrir le nombre de traductions de publications du CICR existantes dans la collection qui n’avaient jamais été décrites. Plusieurs centaines de ces traductions apparaîtront ainsi dans le catalogue d’ici à la fin de l’année. Cette première étape ressemble parfois à une chasse au trésor ou un jeu de piste, avec ou sans indices.

“Il va falloir faire un deuxième passage, n’est-ce pas ?”

Une fois les notices descriptives finalisées, retour aux documents eux-mêmes. La préparation à la numérisation est aussi un moment opportun pour examiner leur état de conservation et, lorsque c’est indiqué, améliorer leur conditionnement. Pour cette étape, nous avons la chance de pouvoir compter sur l’expertise de notre spécialiste en conservation, que l’on voit sur la photo ci-dessous en plein travail de restauration d’une carte de notre collection « prisonniers de guerre ».

Pages à découper et cartes à réparer

À ce stade, nous reconditionnons les documents les plus fragiles (livres, brochures et journaux) en les plaçant dans des chemises et des boîtes en carton sans acide, conçues pour mieux les protéger dans le temps. Nous nous occupons également des pages non coupées, retirons les supports qui doivent être conservés séparément (les années 80-90 et leur cortège de VHS et de CD-ROM…), et mettons de côté les documents trop fragiles ou trop abîmés pour être numérisés sans risque.

Et bien sûr, le travail n’est jamais totalement terminé : un second tri en appelle souvent un troisième, afin de préparer au mieux le transport et la numérisation hors site.

« Tu as le compas dans l’œil ? »

Nombre de publications, nombre de pages, poids des boîtes : préparer un projet de numérisation est aussi une affaire de chiffres. Ces estimations servent à notre propre planification et à l’allocation des ressources (car notre travail s’intègre à un projet bien plus large), mais aussi et surtout au travail du prestataire externe chargé de la numérisation. Une règle empirique semble ne jamais se démentir : il y a toujours plus de pages dans une collection que ce que l’on avait anticipé au départ. Au-delà des chiffres, il faut aussi donner des consignes très concrètes pour devancer les questions qui vont se poser lors de la numérisation. Par exemple, que faire des papiers semi-transparents (à scanner avec un contraste), des pages blanches (à numériser si elles sont comprises dans la pagination), ou des illustrations pliées (à déplier et numériser en une seule image).

Pour finir, pour chaque publication à numériser, nous réunissons dans un même tableau l’indication de son emplacement physique dans la collection, une série d’éléments bibliographiques utiles au travail de numérisation et au contrôle qualité, ainsi qu’un nom de fichier fondé sur un identifiant unique à attribuer à la copie numérisée. Ce dernier élément garantit qu’il existera toujours un lien entre chaque document physique de nos collections et sa copie numérique. Cote, titre, date, langue(s), parfois auteur(s): chaque information sert un objectif. Documenter les langues, par exemple, permet de sélectionner le bon dictionnaire pour la reconnaissance optique de caractères (OCR). Une fois la couche textuelle correctement extraite, il deviendra possible d’effectuer des recherches en plein texte dans les documents numérisés.

En coulisses : tableau Excel et contrôle qualité

Et la suite ?

Les deux premières collections ont été transportées en vue de leur numérisation à la fin du mois d’avril. Nous testons maintenant le transfert des fichiers et le contrôle qualité des documents numérisés. Nous espérons rendre les premières collections accessibles dans notre catalogue en ligne à l’automne, en commençant par les traductions des Conventions de Genève et le dépôt institutionnel des publications du CICR. Les collections patrimoniales suivront ensuite en 2027.

Nos expériences passées nous ont montré que la numérisation n’est que la première étape. Vient ensuite tout un travail pour rendre les contenus réellement accessibles, faciles à trouver et à exploiter. En parallèle, les contours d’un futur portail unifié commencent à se dessiner, avec l’ambition de proposer de nouvelles façons d’interroger, explorer et mettre en relation les fonds d’archives et les collections de la bibliothèque du CICR.

Nous aurons plus de nouvelles à partager bientôt. Dans l’intervalle, si vos recherches soulèvent des besoins particuliers, n’hésitez pas à nous écrire à library@icrc.org. Pour finir, un grand merci à l’ensemble des collègues impliqués pour le travail accompli jusqu’ici et pour celui à venir.

Du rayon au camion, du camion au scanner… et bientôt de retour.


[1] Avec quelques exceptions. Par exemple, certaines collections dites de littérature grise conservées à la bibliothèque sortent pour l’instant du périmètre du projet, mais pourraient y être intégrées à l’avenir.