Des nouvelles du PUC 2023

Depuis les réunions annuelles en visio de 2020, il n’y a pas eu de billet Oubipo sur le PUC (Permanent UNIMARC Committee), l’organe international de maintenance du format UNIMARC sous l’égide de l’IFLA. Que devient le PUC, vous demandez-vous peut-être … mais également : que devient le format UNIMARC ?

Eh bien, le PUC se réunit toujours en visio, une fois l’an au printemps, pendant quelques demi-journées. Il comporte une dizaine de membres issus majoritairement de pays d’Europe (Croatie, France, Grèce, Lituanie, Portugal, Slovénie) mais aussi de Russie et d’Iran, et une représentante d’OCLC. La présidente, Gordana Mazić, est slovène. La France est représentée par Héloïse Lecomte (Abes), en tant que pilote du Comité français UNIMARC (CfU).

La France, moteur des évolutions du format UNIMARC

Que se passe-t-il lors des réunions annuelles du PUC ? On y débat des évolutions du format d’échange proposées par les membres du comité, et on y suit les autres projets de l’IFLA impliquant le format UNIMARC.

Notons que, depuis 2020, la France est le seul pays à avoir fait des propositions d’évolution du format. Cette année, par exemple :

  • Une proposition française a abouti à la validation d’un ensemble important de zones dédiées au catalogage en UNIMARC/B des monnaies et médailles, présentées une première fois lors des réunions du PUC 2022 par Florence Tfibel (BnF). Un guide de bonnes pratiques préparé par nos collègues de la BnF devrait être publié sur le site de l’IFLA pour accompagner ces nouvelles zones, l’ensemble étant attendu pour cet automne.
  • La discussion sur la généralisation d’une sous-zone dédiée aux URI a abouti, sur la base de propositions françaises formulées dans un discussion paper en 2022 : la « sous-zone de contrôle » $3 (comprenez : sous-zone applicable de la même façon dans tout le format) permettra dorénavant d’enregistrer des URI pointant vers des descriptions d’entités, et plus seulement des identifiants système. C’est une étape supplémentaire vers des données liées.
  • La France a également présenté 15 propositions d’évolution allant de la définition d’un référentiel à la création d’une nouvelle sous-zone ou zone, pour améliorer le format UNIMARC dédié au catalogage entités-relations (« UNIMARC ER », parfois aussi appelé « UNIMARC-LRM »). Des manques ou incohérences avaient en effet été constatés par le groupe de travail qui a créé et publié fin 2022 un jeu de notices OEMI en UNIMARC ER sur la plate-forme Zenodo du programme Transition bibliographique.
    • 6 de ces propositions ont été acceptées,
    • 9 doivent être retravaillées et seront débattues de nouveau lors d’une réunion de suivi.

Pendant ce temps, les collègues slovènes travaillent sur la prochaine édition complète des manuels UNIMARC A et B, qui sera disponible intégralement et gratuitement en ligne, et certains membres du PUC participent à des groupes de travail sur la création d’une ontologie pour l’UNIMARC/A (celle pour l’UNIMARC/B existe déjà), ou sur l’évolution de l’ISBD dans un contexte de catalogage par entités, conforme au modèle LRM.

Que fait la communauté UNIMARC internationale ?

De fait, depuis plus de 10 ans, la France est le seul pays à travailler à des évolutions en profondeur du format UNIMARC afin qu’il puisse être utilisé pour échanger des données modélisées en entités-relations, suivant le modèle FRBR puis IFLA-LRM

Voir à ce sujet la présentation « Décrire les œuvres et les expressions : les évolutions de l’UNIMARC » (5e journée professionnelle « Métadonnées en bibliothèques » du 4 décembre 2020), disponible en ligne : https://www.transition-bibliographique.fr/systemes-et-donnees/5e-journee-professionnelle-metadonnees-en-bibliotheques-du-4-decembre-2020/

C’est le sens du travail mené sur le format UNIMARC ER, avec évidemment les critiques constructives des autres membres du PUC, qui ont amélioré d’année en année les propositions apportées par la France.

Mais en dehors de quelques échanges au sein du Committee on Standards (CoS, tutelle du PUC au sein de l’IFLA), de présentations régulières dans le contexte de la journée annuelle EURIG (European RDA Interest Group) ou d’un webinaire de l’IFLA, le format UNIMARC ER n’est pas, à ce stade, un projet partagé au niveau international.

Au niveau français, le CfU travaille à mettre en valeur les zones dédiées au catalogage entités-relations dans les manuels du format UNIMARC disponibles sur le site web Transition bibliographique.

Lors des Journées Abes de mai dernier, l’intervention de Maurits van der Graaf au sujet des implications pratiques de la transition bibliographique dans l’ESR laisse à penser qu’il n’a pas identifié de pays ou d’institution qui se serait emparé d’Unimarc ER dans le cadre d’un projet de transition bibliographique en cours.

Dans ce contexte, la présidente slovène du PUC a accepté de prolonger son mandat d’une année, mais elle arrive en fin de carrière, et la question de sa succession se pose. Aucun pays n’a manifesté pour l’instant d’intérêt pour ce rôle.

L’horizon pour discuter avec l’ensemble de la communauté UNIMARC de l’avenir du format, c’est l’organisation, l’année prochaine, d’une réunion des utilisateurs d’UNIMARC. Cette réunion – dénommée « UNIMARC Users’ Group Meeting » – qui a eu lieu régulièrement depuis que l’UNIMARC existe, devrait être organisée en marge de la réunion du PUC au printemps 2024. Il faut espérer que l’IFLA, à travers le Committee on Standards (CoS), s’y implique réellement et propose une vision de l’avenir de l’UNIMARC dans un monde de données liées et de forte concurrence des standards.

Concevoir l’après MARC

En effet, la tendance de fond qui se dessine est plutôt celle d’une sortie des formats MARC à l’échelle mondiale. Celle-ci est déjà amorcée et, selon Maurits van der Graaf, pourrait être terminée à l’horizon 2040. Le modèle dominant, notamment dans les pays utilisateurs du MARC21, est de mettre en place une diffusion de leurs données en linked data, selon le modèle et vocabulaire entités-relations BIBFRAME. Ce modèle, qui a connu un fort développement depuis quelques années et semble se rapprocher progressivement des standards internationaux que sont RDA et IFLA-LRM, est considéré dans nombre de pays comme le successeur du MARC, à la fois pour la production et pour l’échange de données. Des SGB de nouvelle génération, le plus souvent basés sur une double interface MARC21 et BIBFRAME, exploitant le plein potentiel des linked data pour mettre en place de nouveaux services pour les usagers professionnels et finaux, commencent à être commercialisés.

Une nouvelle instance, le « BIBFRAME Interoperability group », a été mise en place en 2022 sous l’égide du programme coopératif de catalogage américain (PCC) et traite notamment de ces sujets. Voir « BIBFRAME Interoperability Group » (BIBFRAME Workshop in Europe 2022), disponible en ligne : https://www.casalini.it/bfwe2022/web_content/2022/presentations/picknally_li.pdf

Du côté de la communauté UNIMARC, la demande d’avancer ensemble vers BIBFRAME commence à émerger au sein du PUC. Conversion BIBFRAME-UNIMARC, échange de pratiques dans le cadre de projets, intégration à l’active communauté BIBFRAME afin de soutenir notamment le rapprochement avec le modèle IFLA-LRM : ce sont autant de pistes que la communauté UNIMARC pourrait vouloir explorer afin d’avancer vers l’après MARC.

Continuer la lectureDes nouvelles du PUC 2023

LRMisation des données Sudoc : début des travaux d’une équipe « Qualité / corrections LRM »

Logo Sudoc QualitéDepuis décembre 2021, l’Abes a mis en place une équipe transversale dédiée à l’amélioration de la qualité des données Sudoc en vue de leur « LRMisation », c’est à dire de leur migration à moyen terme vers une structure compatible avec le modèle IFLA-LRM et le code de catalogage RDA-FR.
Ces travaux s’inscrivent dans la suite de l’expérimentation « Sudoc FrBr » menée de 2014 à 2021.

En savoir plus sur le processus : consulter le diaporama de la session plénière des Journées Abes 2021 – « Repenser le SI de l’Abes en période de transition(s) ».

En savoir plus sur l’expérimentation « Sudoc FrBr » : consulter ces billets de blog.

Quelle est l’activité de cette équipe ?

L’équipe « Qualité/corrections LRM », constituée de 9 membres issus des différents services du département Métadonnées et Services aux Réseaux (DMSR), a initié plusieurs chantiers de corrections portant sur des lots de notices ayant des caractéristiques communes.
Les premiers chantiers, menés depuis la mi-décembre, ont porté sur les notices comportant des erreurs empêchant de les modifier (par exemple :  incohérence entre le type de document – imprimé ou électronique – et les zones présentes – B135, B856…), ce qui permet notamment de repérer des notices dont le support est mal renseigné (papier > électronique, ou inversement). Des erreurs bloquantes ont ainsi pu être corrigées à ce jour dans près de 75 000 notices.

D’autres chantiers de ce type sont en cours à l’issue desquels l’équipe se concentrera sur l’amélioration des zones clés pour la LRMisation des données : données codées, zones de titres, de responsabilité, etc.

En savoir plus sur les bonnes pratiques de catalogage dans le cadre de la Transition bibliographique :  consulter le Guide Méthodologique, notamment la page : Transition bibliographique : quelques consignes de catalogage applicables au 04/06/2018 (mise à jour novembre 2019)

 

 

Continuer la lectureLRMisation des données Sudoc : début des travaux d’une équipe « Qualité / corrections LRM »

Les vidéos de la 5° journée professionnelle « Métadonnées en bibliothèque » (04/12/2020) sont en ligne

Organisée en ligne pour la première fois, sur le thème « Cataloguer par entités ou le big bang des données« , la 5ème journée professionnelle « Métadonnées en bibliothèque » organisée par le groupe « Systèmes et Données » du programme national Transition Bibliographique a réuni près de 500 participants.

Les enregistrements des présentations sont à consulter ICI.

Avec l’intervention « Décrire les œuvres et les expressions« , par Héloïse Lecomte (Abes) et Florence Tfibel (BnF), on découvre comment les  évolutions du format UNIMARC (validées par le PUC) permettent désormais de traduire en format les éléments constitutifs des entités Œuvre et Expression. Ces évolutions majeures, outre le fait qu’elles aident à mieux comprendre le contour de ces entités, vont permettre de travailler de manière concrète à l’évolution des logiciels, l’éclatement des notices, la reprise des données, la mise en place de nouveaux outils de production…

L’intervention « Transformation d’une notice en arbre OEMI » par Tiphaine-Cécile Foucher (BnF) illustre ce que signifie « cataloguer par entités » : on y voit comment les données d’une notice bibliographique du catalogue général de la BnF sont redistribuées dans les nouvelles entités de l’arbre OEMI (OEuvre Expression Manifestation Item).

Les catalogueurs ont également été informés des avancées du « Projet FNE« , futur outil de production d’entités, par Anila Angjeli (BnF) et Benjamin Bober (Abes). 

Ces orientations doivent se matérialiser dans les systèmes de gestion des bibliothèques. Grâce aux retours d’expériences (partie 5) des bibliothèques ayant commencé la transformation de leur catalogue, elles sont apparues plus concrètes. Chaque catalogueur peut ainsi mesurer le chemin parcouru, et réaliser que la transition bibliographique est en marche.

 

Journée S&D 2020
« Cataloguer par entités ou le big bang des données » (Image par Gerd Altmann de Pixabay)
Continuer la lectureLes vidéos de la 5° journée professionnelle « Métadonnées en bibliothèque » (04/12/2020) sont en ligne

PUC 2020 : what else ? (19-22 octobre)

Lors des sessions du Permanent UNIMARC Committee 2020, l’essentiel des discussions  a été consacré à l’adaptation du format au modèle LRM à travers la finalisation des grilles de description des œuvres et expressions dans le format UNIMARC/A. Consulter les billets précédents :

Après le marathon de septembre, les membres du PUC ont eu le plaisir de se retrouver du 19 au 22 octobre pour 3 autres réunions au cours desquelles ont été débattues quelques autres évolutions des formats UNIMARC/A et B.

Voici un éclairage sur les principales décisions prises, en attendant la publication officielle des mises à jour 2020 du format UNIMARC sur le site de l’IFLA et la mise en œuvre de certaines de ces nouveautés dans le Sudoc, selon un calendrier et des modalités à définir. N’hésitez pas à nous signaler des besoins en la matière !

Une amélioration de la zone B225 pour les ensembles monographiques

La représentante de la Bibliothèque nationale de Russie a proposé la correction d’une lacune dans la zone B225, correspondant à la « zone de la collection et de la monographie en plusieurs volumes » de l’ISBD et permettant de transcrire le titre, les compléments de titre et les mentions de responsabilité de la collection ou de l’ensemble monographique dans lequel se situe une ressource. Il sera désormais possible d’indiquer l’ISBN, l’ISMN (identifiant des partitions) ou tout identifiant international de l’ensemble monographique dans la nouvelle sous-zone $y.

The History of Chinese Civilisation
Source

Par exemple, dans la notice bibliographique du 1er volume de l’ensemble The History of Chinese Civilization, l’ISBN de l’ensemble (1-107-01309-7) pourra désormais être catalogué en B225 $y, tandis que l’ISBN du volume restera enregistré dans la zone 010.

 

 

 

De nouveaux codes pour des alphabets très utilisés

Prenant acte du petit nombre de codes d’écriture proposé par le référentiel UNIMARC utilisé par les catalogueurs pour la zone B100 (positions 34-35, « écriture du titre ») et la sous-zone de contrôle $7 du format autorités (positions 0-1, « écriture de catalogage » et 4-5 « écriture de la racine de la vedette » – la traduction française n’ayant pas encore été remise au goût du jour…), la représentante de l’ICCU, agence bibliographique nationale italienne, a fait la proposition d’ajouter des codes pour une meilleure représentation d’alphabets non latins dans les notices en UNIMARC. En effet, pour le moment, les catalogueurs ne peuvent utiliser que le code « zz – autre » pour ces écritures, qui demeurent donc invisibles dans les données structurées de nos catalogues. 

Petit manuel scolaire birman, collection de la BULAC
Petit manuel scolaire birman, collection de la BULAC – Source

Le critère choisi par les italiens est celui du nombre de locuteurs des langues utilisant ces alphabets : un nouveau code a été proposé pour toutes les écritures utilisées actuellement par au moins 10 millions de personnes dans le monde. Si cette méthodologie peut sembler arbitraire en ne se fondant pas sur les besoins de description réels des bibliothèques utilisatrices de l’UNIMARC, qui ont été jugés trop difficiles à recenser, elle a le mérite d’être objective.

Les nouveaux codes correspondent presque uniquement à des écritures asiatiques : birman, khmer, bengali, gujarati, gurmukhi, odia, kannada, malayalam, cingalais, telugu. Un code représentera également l’alphabet éthiopien. D’autres écritures pourront bien sûr être intégrées à cette liste de codes en fonction des besoins signalés par les communautés utilisant l’UNIMARC.

La question de l’utilisation de la norme ISO 15924 plutôt que de la liste UNIMARC pour représenter les codes d’écriture a été posée par la France. En effet, la norme ISO est complète : représentant toutes les écritures du monde, elle est maintenue par une instance ad hoc. La présidente du PUC a proposé que les représentants nationaux interrogent les bibliothécaires et les fournisseurs de SGB de leurs pays afin de vérifier l’intérêt et la faisabilité technique de cette évolution, les codes ISO ayant 4 caractères (et non 2 comme les codes UNIMARC). Le sujet sera à l’ordre du jour du PUC 2021.

De nouveaux codes de fonction en provenance d’Italie

Cette année, les collègues italiens ont également planché sur les codes de fonction (utilisés en B/7XX $4 pour indiquer le rôle joué par un agent en relation avec une ressource), en particulier dans le domaine des manuscrits et du livre ancien.

Page de titre de Summaire ou Epitome du livre de Asse […] de Guillaume Budé (1523)
Page de titre de Summaire ou Epitome du livre de Asse de Guillaume Budé (1523) – Source

Voici les nouveaux codes retenus  :

  • 355 – Epitomateur (du grec ἐπιτομή, epitomē) : personne qui compose l’abrégé d’une œuvre. Ce code sera utile en particulier lorsqu’une œuvre antique n’est connue que par son épitomé.
  • 407 – Glossateur : auteur de gloses. Ce code est plus spécifique que « 212 – auteur du commentaire ».
  • 552 – Notaire : cette fonction est utile dans le cadre de la description de matériaux archivistiques et/ou de manuscrits.
  • 678 – Restaurateur : même type d’utilisation.
  • 735 – Translittérateur : utile uniquement dans le cas de textes anciens manuscrits, qui nous sont parvenus via une translittération faite par une auteur plus tardif.

 

Enfin, dans le domaine du jeu, un nouveau code, plus spécifique que l’actuel « 245 – Concepteur », a été défini  : « 405 – Concepteur du jeu (Game designer) »

Continuer la lecturePUC 2020 : what else ? (19-22 octobre)

Le Permanent UNIMARC Committee et LRM, la suite (9 au 14 septembre)

Les échanges qui se sont déroulés sur 5 jours sont évoqués dans 2 billets distincts.

1.« PUC , Day 1 »
2. « Le Permanent UNIMARC Committee et LRM, la suite (9 au 14 septembre 2020) » (ce billet)

Après la séance d’ouverture de la réunion annuelle du Permanent UNIMARC Committee, les 4 journées suivantes ont été consacrées à l’examen des propositions d’évolution du format bibliographique et du format autorités. La France portait de nombreuses demandes, concernant principalement le format autorités. Il s’agissait de le compléter pour lui permettre d’exprimer l’ensemble des attributs des entités « Œuvre » et « Expression » prévues par le modèle IFLA-LRM.

Extrait du diaporama de F. Tfibel (BnF) présenté lors de la Journée « Systèmes & Données » le 15/11/2019

De RDA-FR à UNIMARC en passant par LRM

Initiée par les collègues du département des Métadonnées de la BnF, la comparaison entre les attributs des œuvres et expressions dans RDA-FR (voir RDA-FR, section 2) et l’état actuel du format UNIMARC a abouti à plusieurs constats :

Continuer la lectureLe Permanent UNIMARC Committee et LRM, la suite (9 au 14 septembre)

PUC, Day 1 (8 septembre 2020)

Les échanges qui se sont déroulés sur 5 jours sont évoqués dans 2 billets distincts.

Initialement programmée en mars 2020, la réunion annuelle du Permanent UNIMARC Committee, organe international rattaché à l’IFLA qui maintient et fait évoluer le format d’échange UNIMARC, s’est tenue début septembre par visioconférence, en raison de la situation sanitaire. Pour permettre aux participants, dispersés de l’Iran au centre des États-Unis, de suivre les sessions pendant leurs heures de travail, les réunions ont été organisées sur 5 jours, deux à trois heures par jour, à midi en temps universel (14h en France).

PUC à la maison
Le PUC à la maison, avec la fidèle compagnie des gros livres rouges…

La France sur le pont

Comme chaque année, le Comité français UNIMARC était représenté par l’Abes. Les sessions se sont ouvertes par une discussion méthodologique générale sur l’adaptation du format UNIMARC au nouveau modèle LRM. L’analyse de la compatibilité du format UNIMARC avec ce modèle, autre standard de l’IFLA, constitue en effet l’un des deux axes de travail 2019-2021 définis par la présidente du PUC, Gordana Mazić (IZUM, Slovénie), en plus de l’examen annuel des propositions d’évolution du format préparées et transmises par les différents membres. Le deuxième axe de travail est la « visibilité » du format, avec notamment un projet de création d’espaces de noms IFLA reprenant la structure du format UNIMARC, et permettant de transposer ce vétéran de l’encodage dans le web de données.

Continuer la lecturePUC, Day 1 (8 septembre 2020)
Aller au contenu principal