Retour sur la Journée « RDA en Europe »

logo EurigOrganisée le 14 septembre 2021 en visioconférence par EURIG  (European RDA Interest Group), la Journée « RDA en Europe » a offert l’occasion aux bibliothèques européennes d’une dizaine de pays d’échanger et de présenter leurs modalités respectives pour la mise en œuvre du code de catalogage international RDA.

La France était représentée par Héloïse Lecomte, chargée de mission Normalisation à l’Abes et responsable du Comité français Unimarc, et par les responsables des deux agences bibliographiques, Frédérique Joannic-Seta pour la BnF, David Aymonin pour l’Abes.

Si les présentations (à voir en ligne) ont permis de mesurer les charmantes variations d’accents nationaux dans la langue de Shakespeare, elles ont surtout – et plus sérieusement – mis en lumière les convergences des positions face à RDA, et le fait que la position française est loin d’être isolée.

Ce qui nous rassemble : un profil d’application national

Les bibliothèques européennes ne se concentrent plus tellement sur la traduction dans leur langue du code de catalogage RDA, mais plutôt sur :

  • la construction d’un profil d’application = faire des choix parmi les options proposées par RDA, choix qui restent rédigés en anglais et sont destinés à être publiés dans le RDA ToolKit pour informer les autres pays et faciliter les échanges de données
  • la rédaction locale de consignes de catalogage par entité et par type de document, accompagnées d’exemples dans la langue du pays.

Majoritairement, l’outil RDA Toolkit n’est plus considéré par les catalogueurs européens comme l’outil à consulter au quotidien pour cataloguer (même si les instances de normalisation doivent, elles, le consulter régulièrement pour rédiger leurs consignes).

Ces constats rejoignent les choix de la France, avec la mise en œuvre depuis 2012 du programme Transition bibliographique, en charge de l’écriture du code national RDA-FR, permettant la mise en œuvre progressive des principes du code international RDA en l’adaptant au contexte de catalogage français.

Rappelons que, pour l’instant,  les éléments du code RDA-FR sont publiés sur le site du programme Transition bibliographique sous forme de fichiers PDF.  Cependant, un outil de consultation, plus convivial et plus pratique que ces énormes documents, est à l’étude. Dans cette perspective, il a été intéressant d’apprendre, au cours de la journée, que plusieurs pays travaillent à la construction de wiki pour la publication de leur documentation nationale.

Ce qui nous distingue : la stratégie d’implémentation de RDA

Aucun autre pays que la France n’évoque de projets majeurs de transformation de données MARC (type LRMisation, c’est-à-dire transformation de notices autorités/biblio en entités OEMI & co). La démarche est plutôt de généraliser l’usage du format MARC21 là où ce n’était pas encore le cas (à l’exemple de la Grèce) et d’utiliser le mapping MARC21 vers RDA/RDF maintenu par le RSC (RDA Steering Committee) pour la diffusion des métadonnées sur le web de données, dans une modélisation entités-relations.

Plusieurs pays évoquent leur souhait de ne pas faire changer les pratiques des catalogueurs et la difficulté à les former sur la modélisation LRM/RDA, très abstraite. À l’inverse, d’autres pays ont fait le choix radical d’abandonner le MARC pour BIBFRAME (c’est le cas de la Suède), pour cataloguer directement dans un format type RDF, entièrement compatible avec la modélisation entités-relations (mais pas encore avec LRM/RDA…

La position française sur les agrégats (refus d’adopter ce qu’en dit RDA et positionnement de RDA-FR comme un modèle concurrent, plus économique en termes de coût de catalogage) n’a pas encore convaincu nos homologues européens, qui avouent ne pas avoir eu des réflexions aussi abouties sur le sujet. Gordon Dunsire, membre du groupe technique qui développe RDA, a souligné qu’il n’y avait jamais eu de consensus sur la modélisation des agrégats et a recommandé en aparté que le groupe de travail de l’IFLA sur la modélisation LRM s’empare du sujet, afin de replacer les débats au niveau international.

Un petit tour d’Europe

Pays Implémentation de RDA ? Solution adoptée Particularités
Danemark Adoption votée en 2016, avec un profil d’application national. Mais pas encore implémenté pour raisons financières Publication de règles RDA uniquement si valeur ajoutée par rapport aux règles en vigueur Problème de formation des professionnels
Suède Implémentation de RDA en 2017.

Décision d’attendre avant de mettre en œuvre RDA 3R

BIBFRAME + linked data BIBFRAME n’est pas conforme à RDA, ce qui pose des problèmes pour mettre en œuvre les règles.
Problème de formation
Pologne Implémentation de RDA en 2015, sans profil d’application Manuel de consignes pour des types de documents particuliers
Portugal Implémentation en attente, mais traduction et formation des personnels en cours En attendant, maintien des règles nationales (1984) basées sur AACR2 + ISBD
Grèce En cours : formation des personnels depuis 2021 Diffusion de données compatibles RDA (entités) par conversion du MARC21 vers RDA/RDF Projet de production collaborative d’autorités (comme le projet FNE français)
Grande-Bretagne Implémentation de RDA, avec profil national d’application. Mais passage au RDA 3R repoussé Profil d’application complet publié sur le RDA Toolkit
Allemagne Application de RDA, avec profil national d’application Manuel de catalogage en cours de rédaction ; sera   ouvert à tous sur Wikibase

 

Notre envie commune

Cette journée a prouvé qu’il y avait un réel besoin d’échanges sur des sujets techniques, et les pays européens, qu’ils se soient exprimés lors de cette journée ou non, doivent maintenant trouver sous quelle forme ces échanges pourraient avoir lieu, à l’échelle européenne. Le souhait de partage de nos documentations nationales respectives a également été exprimé.

Il y avait là une envie réelle et commune, à faire pâlir, sans aucun doute, d’autres commissions européennes sur d’autres sujets !

Une scène de l’Auberge espagnole, de Cédric Klapish, sur les irresistibles différences entre les européens.

Continuer la lectureRetour sur la Journée « RDA en Europe »

Section 8 de RDA-FR : projet de texte soumis à enquête

enquêteAvant leur publication officielle, les nouveaux éléments du code RDA-FR – dont la rédaction incombe au groupe Normalisation dans le cadre du programme national Transition Bibliographique, sont soumis à l’avis des professionnels de la documentation au travers d’une enquête ouverte jusqu’au 15 septembre 2021.

Cette enquête est menée sous l’égide de l’AFNOR, par la commission CN 46-9 Information et documentation – Identification et description.

Donnez votre avis sur le futur code RDA-FR !

Chacun est invité à donner son avis au sujet des chapitres 23 à 26 de la Section 8. Pour participer à l’enquête, voici comment procéder :

  1. Consulter le projet de texte de la Section 8 (fichier PDF)
  2. Répondre au questionnaire
  3. Avant le 15 septembre 2021 : envoyer vos commentaires par courriel aux adresses électroniques indiquées sur la page d’accueil du questionnaire

Objet de l’enquête

Cette enquête porte sur les chapitres 23 à 26 de la Section 8 du code de catalogage RDA-FR. Ils ont été rédigés par le sous-groupe « Œuvres et Expressions« , groupe Normalisation du programme Transition bibliographique ayant la charge d’élaborer, sous l’égide de la CN 46-9 de l’AFNOR, le nouveau code de catalogage applicable en France, fondé sur le modèle IFLA LRM (Library Reference Model).

Consacrés aux relations entre deux entités définies par le modèle IFLA LRM (l’Œuvre et l’Expression), ces chapitres viennent compléter deux sections du code RDA-FR précédemment publiées :

  • la Section 2 : Enregistrement des attributs des Œuvres et des Expressions
  • la Section 5 : Enregistrement des relations principales entre l’Œuvre, l’Expression, la Manifestation et l’Item

Le chapitre 23 constitue un chapitre général consacré à l’Enregistrement des relations entre les Œuvres, les Expressions, les Manifestations et les Items. Pour leur part, les chapitres 24 à 26 fournissent  les indicateurs de relation utilisables entre les Œuvres et les Expressions et entre les Expressions et les Œuvres. Au sein de ces chapitres, chaque indicateur de relation est accompagné d’une définition et d’un/plusieurs exemple(s) illustrant la relation en question. Enfin, une annexe générale, ainsi que des annexes spécifiques par type d’Œuvre et d’Expression, proposent une vue synthétique de l’ensemble des indicateurs de relations utilisables entre ces entités.

Le sous-groupe « Œuvres et Expressions » a veillé à la conformité de chacun des indicateurs de relation avec les relations génériques prévues par le modèle IFLA LRM. Lorsque le code RDA-FR sera en vigueur dans les catalogues de bibliothèque, ces indicateurs de relation offriront aux utilisateurs un plus grand confort de recherche et de nouvelles possibilités de navigation.

À titre d’exemple, un utilisateur pourra retrouver facilement, en suivant des liens, les différentes adaptations d’une œuvre littéraire, ces adaptations étant traitées elles-mêmes comme des œuvres distinctes. Ainsi, depuis l’Œuvre Pride and prejudice de Jane Austen, la relation « A pour adaptation dans un autre mode d’expression [Œuvre] » permettra d’accéder aux diverses adaptations cinématographiques, télévisuelles, en bandes dessinées (…) de cette œuvre. La relation inverse « Est une adaptation dans un autre mode d’expression [Œuvre] » permettra quant à elle de remonter d’une adaptation particulière à l’œuvre adaptée. De même, l’usage de la relation « A pour interprétation/exécution [Expression] » donnera accès, par exemple, aux lectures par des actrices d’une traduction française de cette œuvre, tandis que la relation « Est une interprétation/exécution de [Expression] » proposera le chemin inverse, des interprétations vers l’œuvre.

Notons que la Section 8 sera complétée à terme par des chapitres concernant les relations entre les Manifestations et les Items dont la responsabilité relève, au sein du groupe Normalisation, du sous-groupe « Manifestations et Items« .

Continuer la lectureSection 8 de RDA-FR : projet de texte soumis à enquête

Les vidéos de la 5° journée professionnelle « Métadonnées en bibliothèque » (04/12/2020) sont en ligne

Organisée en ligne pour la première fois, sur le thème « Cataloguer par entités ou le big bang des données« , la 5ème journée professionnelle « Métadonnées en bibliothèque » organisée par le groupe « Systèmes et Données » du programme national Transition Bibliographique a réuni près de 500 participants.

Les enregistrements des présentations sont à consulter ICI.

Avec l’intervention « Décrire les œuvres et les expressions« , par Héloïse Lecomte (Abes) et Florence Tfibel (BnF), on découvre comment les  évolutions du format UNIMARC (validées par le PUC) permettent désormais de traduire en format les éléments constitutifs des entités Œuvre et Expression. Ces évolutions majeures, outre le fait qu’elles aident à mieux comprendre le contour de ces entités, vont permettre de travailler de manière concrète à l’évolution des logiciels, l’éclatement des notices, la reprise des données, la mise en place de nouveaux outils de production…

L’intervention « Transformation d’une notice en arbre OEMI » par Tiphaine-Cécile Foucher (BnF) illustre ce que signifie « cataloguer par entités » : on y voit comment les données d’une notice bibliographique du catalogue général de la BnF sont redistribuées dans les nouvelles entités de l’arbre OEMI (OEuvre Expression Manifestation Item).

Les catalogueurs ont également été informés des avancées du « Projet FNE« , futur outil de production d’entités, par Anila Angjeli (BnF) et Benjamin Bober (Abes). 

Ces orientations doivent se matérialiser dans les systèmes de gestion des bibliothèques. Grâce aux retours d’expériences (partie 5) des bibliothèques ayant commencé la transformation de leur catalogue, elles sont apparues plus concrètes. Chaque catalogueur peut ainsi mesurer le chemin parcouru, et réaliser que la transition bibliographique est en marche.

 

Journée S&D 2020
« Cataloguer par entités ou le big bang des données » (Image par Gerd Altmann de Pixabay)
Continuer la lectureLes vidéos de la 5° journée professionnelle « Métadonnées en bibliothèque » (04/12/2020) sont en ligne

PUC 2020 : what else ? (19-22 octobre)

Lors des sessions du Permanent UNIMARC Committee 2020, l’essentiel des discussions  a été consacré à l’adaptation du format au modèle LRM à travers la finalisation des grilles de description des œuvres et expressions dans le format UNIMARC/A. Consulter les billets précédents :

Après le marathon de septembre, les membres du PUC ont eu le plaisir de se retrouver du 19 au 22 octobre pour 3 autres réunions au cours desquelles ont été débattues quelques autres évolutions des formats UNIMARC/A et B.

Voici un éclairage sur les principales décisions prises, en attendant la publication officielle des mises à jour 2020 du format UNIMARC sur le site de l’IFLA et la mise en œuvre de certaines de ces nouveautés dans le Sudoc, selon un calendrier et des modalités à définir. N’hésitez pas à nous signaler des besoins en la matière !

Une amélioration de la zone B225 pour les ensembles monographiques

La représentante de la Bibliothèque nationale de Russie a proposé la correction d’une lacune dans la zone B225, correspondant à la « zone de la collection et de la monographie en plusieurs volumes » de l’ISBD et permettant de transcrire le titre, les compléments de titre et les mentions de responsabilité de la collection ou de l’ensemble monographique dans lequel se situe une ressource. Il sera désormais possible d’indiquer l’ISBN, l’ISMN (identifiant des partitions) ou tout identifiant international de l’ensemble monographique dans la nouvelle sous-zone $y.

The History of Chinese Civilisation
Source

Par exemple, dans la notice bibliographique du 1er volume de l’ensemble The History of Chinese Civilization, l’ISBN de l’ensemble (1-107-01309-7) pourra désormais être catalogué en B225 $y, tandis que l’ISBN du volume restera enregistré dans la zone 010.

 

 

 

De nouveaux codes pour des alphabets très utilisés

Prenant acte du petit nombre de codes d’écriture proposé par le référentiel UNIMARC utilisé par les catalogueurs pour la zone B100 (positions 34-35, « écriture du titre ») et la sous-zone de contrôle $7 du format autorités (positions 0-1, « écriture de catalogage » et 4-5 « écriture de la racine de la vedette » – la traduction française n’ayant pas encore été remise au goût du jour…), la représentante de l’ICCU, agence bibliographique nationale italienne, a fait la proposition d’ajouter des codes pour une meilleure représentation d’alphabets non latins dans les notices en UNIMARC. En effet, pour le moment, les catalogueurs ne peuvent utiliser que le code « zz – autre » pour ces écritures, qui demeurent donc invisibles dans les données structurées de nos catalogues. 

Petit manuel scolaire birman, collection de la BULAC
Petit manuel scolaire birman, collection de la BULAC – Source

Le critère choisi par les italiens est celui du nombre de locuteurs des langues utilisant ces alphabets : un nouveau code a été proposé pour toutes les écritures utilisées actuellement par au moins 10 millions de personnes dans le monde. Si cette méthodologie peut sembler arbitraire en ne se fondant pas sur les besoins de description réels des bibliothèques utilisatrices de l’UNIMARC, qui ont été jugés trop difficiles à recenser, elle a le mérite d’être objective.

Les nouveaux codes correspondent presque uniquement à des écritures asiatiques : birman, khmer, bengali, gujarati, gurmukhi, odia, kannada, malayalam, cingalais, telugu. Un code représentera également l’alphabet éthiopien. D’autres écritures pourront bien sûr être intégrées à cette liste de codes en fonction des besoins signalés par les communautés utilisant l’UNIMARC.

La question de l’utilisation de la norme ISO 15924 plutôt que de la liste UNIMARC pour représenter les codes d’écriture a été posée par la France. En effet, la norme ISO est complète : représentant toutes les écritures du monde, elle est maintenue par une instance ad hoc. La présidente du PUC a proposé que les représentants nationaux interrogent les bibliothécaires et les fournisseurs de SGB de leurs pays afin de vérifier l’intérêt et la faisabilité technique de cette évolution, les codes ISO ayant 4 caractères (et non 2 comme les codes UNIMARC). Le sujet sera à l’ordre du jour du PUC 2021.

De nouveaux codes de fonction en provenance d’Italie

Cette année, les collègues italiens ont également planché sur les codes de fonction (utilisés en B/7XX $4 pour indiquer le rôle joué par un agent en relation avec une ressource), en particulier dans le domaine des manuscrits et du livre ancien.

Page de titre de Summaire ou Epitome du livre de Asse […] de Guillaume Budé (1523)
Page de titre de Summaire ou Epitome du livre de Asse de Guillaume Budé (1523) – Source

Voici les nouveaux codes retenus  :

  • 355 – Epitomateur (du grec ἐπιτομή, epitomē) : personne qui compose l’abrégé d’une œuvre. Ce code sera utile en particulier lorsqu’une œuvre antique n’est connue que par son épitomé.
  • 407 – Glossateur : auteur de gloses. Ce code est plus spécifique que « 212 – auteur du commentaire ».
  • 552 – Notaire : cette fonction est utile dans le cadre de la description de matériaux archivistiques et/ou de manuscrits.
  • 678 – Restaurateur : même type d’utilisation.
  • 735 – Translittérateur : utile uniquement dans le cas de textes anciens manuscrits, qui nous sont parvenus via une translittération faite par une auteur plus tardif.

 

Enfin, dans le domaine du jeu, un nouveau code, plus spécifique que l’actuel « 245 – Concepteur », a été défini  : « 405 – Concepteur du jeu (Game designer) »

Continuer la lecturePUC 2020 : what else ? (19-22 octobre)

Le Permanent UNIMARC Committee et LRM, la suite (9 au 14 septembre)

Les échanges qui se sont déroulés sur 5 jours sont évoqués dans 2 billets distincts.

1.« PUC , Day 1 »
2. « Le Permanent UNIMARC Committee et LRM, la suite (9 au 14 septembre 2020) » (ce billet)

Après la séance d’ouverture de la réunion annuelle du Permanent UNIMARC Committee, les 4 journées suivantes ont été consacrées à l’examen des propositions d’évolution du format bibliographique et du format autorités. La France portait de nombreuses demandes, concernant principalement le format autorités. Il s’agissait de le compléter pour lui permettre d’exprimer l’ensemble des attributs des entités « Œuvre » et « Expression » prévues par le modèle IFLA-LRM.

Extrait du diaporama de F. Tfibel (BnF) présenté lors de la Journée « Systèmes & Données » le 15/11/2019

De RDA-FR à UNIMARC en passant par LRM

Initiée par les collègues du département des Métadonnées de la BnF, la comparaison entre les attributs des œuvres et expressions dans RDA-FR (voir RDA-FR, section 2) et l’état actuel du format UNIMARC a abouti à plusieurs constats :

Continuer la lectureLe Permanent UNIMARC Committee et LRM, la suite (9 au 14 septembre)

PUC, Day 1 (8 septembre 2020)

Les échanges qui se sont déroulés sur 5 jours sont évoqués dans 2 billets distincts.

Initialement programmée en mars 2020, la réunion annuelle du Permanent UNIMARC Committee, organe international rattaché à l’IFLA qui maintient et fait évoluer le format d’échange UNIMARC, s’est tenue début septembre par visioconférence, en raison de la situation sanitaire. Pour permettre aux participants, dispersés de l’Iran au centre des États-Unis, de suivre les sessions pendant leurs heures de travail, les réunions ont été organisées sur 5 jours, deux à trois heures par jour, à midi en temps universel (14h en France).

PUC à la maison
Le PUC à la maison, avec la fidèle compagnie des gros livres rouges…

La France sur le pont

Comme chaque année, le Comité français UNIMARC était représenté par l’Abes. Les sessions se sont ouvertes par une discussion méthodologique générale sur l’adaptation du format UNIMARC au nouveau modèle LRM. L’analyse de la compatibilité du format UNIMARC avec ce modèle, autre standard de l’IFLA, constitue en effet l’un des deux axes de travail 2019-2021 définis par la présidente du PUC, Gordana Mazić (IZUM, Slovénie), en plus de l’examen annuel des propositions d’évolution du format préparées et transmises par les différents membres. Le deuxième axe de travail est la « visibilité » du format, avec notamment un projet de création d’espaces de noms IFLA reprenant la structure du format UNIMARC, et permettant de transposer ce vétéran de l’encodage dans le web de données.

Continuer la lecturePUC, Day 1 (8 septembre 2020)

Expérimentation Sudoc FRBR II. L’évaluation : algo vs humain 3/3

Robot and the Book of Light
« Robot and the Book of Light » by Eric Kilby flickr CC BY-SA 2.0

 

Billets précédents :
1. Les règles du jeu
2. Le score

 

 

 

 

L’analyse des résultats du match

De l’examen des cas issus de l’analyse statistique décrite dans le billet précédent, il est possible de dégager des éléments récurrents de perturbation du fonctionnement de l’algorithme. Sans grande surprise les zones contenant les titres et les auteurs ont un poids important dans la formule de calcul et sont, de fait, sources d’erreur surtout quand les œuvres sont très représentées dans le Sudoc. Certains partis pris ont aussi leur responsabilité dans quelques cas quant au niveau de granularité des regroupements ou des difficultés à les réaliser.

Continuer la lectureExpérimentation Sudoc FRBR II. L’évaluation : algo vs humain 3/3

Expérimentation Sudoc FRBR II. L’évaluation : algo vs humain. 2/3

grille de résultats
« I win » by Ginny flickr (CC BY-SA 2.0)

Billet précédent :
1. Les règles du jeu

 

 

 

 

 

Le score

1000 notices de monographies ont finalement été examinées par « le onze abesien ». Le jeu de données clusterisées par les testeurs a été confronté aux regroupements réalisés par l’algorithme dans la base de test. Les clusters ont été classés en six catégories une fois le taux de regroupement global connu :

Parmi ces 1000 notices faisant partie du périmètre d’action du programme :

  • 629 notices ne sont ni dans un cluster humain ni dans un cluster machine
  • 371 notices font partie d’un regroupement humain et/ou machine.

Continuer la lectureExpérimentation Sudoc FRBR II. L’évaluation : algo vs humain. 2/3

Expérimentation Sudoc FRBR II. L’évaluation : algo vs humain. 1/3

L’évaluation globale de l’expérimentation annoncée dans le billet précédent  a pu s’achever à la fin du mois de juin avec deux mois de retard sur le calendrier initial.

Les forces et les faiblesses de l’algorithme sont désormais connues :

Les paramétrages actuels permettent de traiter au niveau œuvre une partie non négligeable des notices de monographies qui représentent le plus gros volume des données du Sudoc. Cependant, le nombre total de notices regroupées reste modeste par rapport au périmètre pris en compte par le programme (un grand nombre « d’unicas » d’œuvres en sont aussi responsables). Par ailleurs, l’algorithme ne tourne pas sur toutes les données du Sudoc (notamment les agrégats dont font partie les ressources continues) et l’hétérogénéité des pratiques de signalement ainsi que la qualité des notices limitent ses performances.

robot

Voici une présentation de cette évaluation publiée en trois parties :

  1. Les règles du jeu (ce billet)
  2. Le score
  3. L’analyse des résultats du match

Continuer la lectureExpérimentation Sudoc FRBR II. L’évaluation : algo vs humain. 1/3

La Transition Bibliographique en actions… et en images !

Le programme national Transition Bibliographique travaille, et avance, à un rythme doux, propice à l’énorme enjeu de réécriture des normes de description et d’un code de catalogage.

Alors, de mois en mois, il peut arriver qu’on perde le fil, qu’on délaisse sa veille sur ce sujet.

Jusqu’au jour où il survient à nouveau dans une discussion, au détour d’un texte, et où l’angoisse – ou la culpabilité – nous rattrape. « Mince ! Ai-je donc tout oublié ? »

Reveil soudain
Noisy Wake Up Trompet – by Dolhala


Alors, pour ne pas que cela vous arrive, nous proposons ici un rapide bilan de tout ce qui s’est passé, pendant l’année universitaire 2019-2020, concernant la transition bibliographique dans le Sudoc.

D’abord, on récapitule les nouveautés 2020, et leurs impacts dans le Sudoc. On explique aussi ce qui va se passer en 2021.

Ensuite, on zoome sur la réforme Rameau, et on vous dit l’essentiel de ce qu’il faut retenir.

Enfin, on se projette, pour imaginer ce que sera un catalogue avec des notices d’œuvres.
Et on comprend que tout le travail effectué sur les données aujourd’hui (notamment le travail de liage) rendra possible demain l’existence de ces notices d’œuvres.

Continuer la lectureLa Transition Bibliographique en actions… et en images !
Aller au contenu principal