Le Permanent UNIMARC Committee et LRM, la suite (9 au 14 septembre)

  • Commentaires de la publication :4 commentaires

Les échanges qui se sont déroulés sur 5 jours sont évoqués dans 2 billets distincts.

1.« PUC , Day 1 »
2. « Le Permanent UNIMARC Committee et LRM, la suite (9 au 14 septembre 2020) » (ce billet)

Après la séance d’ouverture de la réunion annuelle du Permanent UNIMARC Committee, les 4 journées suivantes ont été consacrées à l’examen des propositions d’évolution du format bibliographique et du format autorités. La France portait de nombreuses demandes, concernant principalement le format autorités. Il s’agissait de le compléter pour lui permettre d’exprimer l’ensemble des attributs des entités « Œuvre » et « Expression » prévues par le modèle IFLA-LRM.

Extrait du diaporama de F. Tfibel (BnF) présenté lors de la Journée « Systèmes & Données » le 15/11/2019

De RDA-FR à UNIMARC en passant par LRM

Initiée par les collègues du département des Métadonnées de la BnF, la comparaison entre les attributs des œuvres et expressions dans RDA-FR (voir RDA-FR, section 2) et l’état actuel du format UNIMARC a abouti à plusieurs constats :

Continuer la lectureLe Permanent UNIMARC Committee et LRM, la suite (9 au 14 septembre)

PUC, Day 1 (8 septembre 2020)

  • Commentaires de la publication :4 commentaires

Les échanges qui se sont déroulés sur 5 jours sont évoqués dans 2 billets distincts.

Initialement programmée en mars 2020, la réunion annuelle du Permanent UNIMARC Committee, organe international rattaché à l’IFLA qui maintient et fait évoluer le format d’échange UNIMARC, s’est tenue début septembre par visioconférence, en raison de la situation sanitaire. Pour permettre aux participants, dispersés de l’Iran au centre des États-Unis, de suivre les sessions pendant leurs heures de travail, les réunions ont été organisées sur 5 jours, deux à trois heures par jour, à midi en temps universel (14h en France).

PUC à la maison
Le PUC à la maison, avec la fidèle compagnie des gros livres rouges…

La France sur le pont

Comme chaque année, le Comité français UNIMARC était représenté par l’Abes. Les sessions se sont ouvertes par une discussion méthodologique générale sur l’adaptation du format UNIMARC au nouveau modèle LRM. L’analyse de la compatibilité du format UNIMARC avec ce modèle, autre standard de l’IFLA, constitue en effet l’un des deux axes de travail 2019-2021 définis par la présidente du PUC, Gordana Mazić (IZUM, Slovénie), en plus de l’examen annuel des propositions d’évolution du format préparées et transmises par les différents membres. Le deuxième axe de travail est la « visibilité » du format, avec notamment un projet de création d’espaces de noms IFLA reprenant la structure du format UNIMARC, et permettant de transposer ce vétéran de l’encodage dans le web de données.

Continuer la lecturePUC, Day 1 (8 septembre 2020)

Expérimentation Sudoc FRBR II. L’évaluation : algo vs humain 3/3

  • Commentaires de la publication :3 commentaires
Robot and the Book of Light
« Robot and the Book of Light » by Eric Kilby flickr CC BY-SA 2.0

 

Billets précédents :
1. Les règles du jeu
2. Le score

 

 

 

 

L’analyse des résultats du match

De l’examen des cas issus de l’analyse statistique décrite dans le billet précédent, il est possible de dégager des éléments récurrents de perturbation du fonctionnement de l’algorithme. Sans grande surprise les zones contenant les titres et les auteurs ont un poids important dans la formule de calcul et sont, de fait, sources d’erreur surtout quand les œuvres sont très représentées dans le Sudoc. Certains partis pris ont aussi leur responsabilité dans quelques cas quant au niveau de granularité des regroupements ou des difficultés à les réaliser.

Continuer la lectureExpérimentation Sudoc FRBR II. L’évaluation : algo vs humain 3/3

Expérimentation Sudoc FRBR II. L’évaluation : algo vs humain. 2/3

  • Commentaires de la publication :3 commentaires
grille de résultats
« I win » by Ginny flickr (CC BY-SA 2.0)

Billet précédent :
1. Les règles du jeu

 

 

 

 

 

Le score

1000 notices de monographies ont finalement été examinées par « le onze abesien ». Le jeu de données clusterisées par les testeurs a été confronté aux regroupements réalisés par l’algorithme dans la base de test. Les clusters ont été classés en six catégories une fois le taux de regroupement global connu :

Parmi ces 1000 notices faisant partie du périmètre d’action du programme :

  • 629 notices ne sont ni dans un cluster humain ni dans un cluster machine
  • 371 notices font partie d’un regroupement humain et/ou machine.

Continuer la lectureExpérimentation Sudoc FRBR II. L’évaluation : algo vs humain. 2/3

Expérimentation Sudoc FRBR II. L’évaluation : algo vs humain. 1/3

  • Commentaires de la publication :5 commentaires

L’évaluation globale de l’expérimentation annoncée dans le billet précédent  a pu s’achever à la fin du mois de juin avec deux mois de retard sur le calendrier initial.

Les forces et les faiblesses de l’algorithme sont désormais connues :

Les paramétrages actuels permettent de traiter au niveau œuvre une partie non négligeable des notices de monographies qui représentent le plus gros volume des données du Sudoc. Cependant, le nombre total de notices regroupées reste modeste par rapport au périmètre pris en compte par le programme (un grand nombre « d’unicas » d’œuvres en sont aussi responsables). Par ailleurs, l’algorithme ne tourne pas sur toutes les données du Sudoc (notamment les agrégats dont font partie les ressources continues) et l’hétérogénéité des pratiques de signalement ainsi que la qualité des notices limitent ses performances.

robot

Voici une présentation de cette évaluation publiée en trois parties :

  1. Les règles du jeu (ce billet)
  2. Le score
  3. L’analyse des résultats du match

Continuer la lectureExpérimentation Sudoc FRBR II. L’évaluation : algo vs humain. 1/3

La Transition Bibliographique en actions… et en images !

  • Commentaires de la publication :0 commentaire

Le programme national Transition Bibliographique travaille, et avance, à un rythme doux, propice à l’énorme enjeu de réécriture des normes de description et d’un code de catalogage.

Alors, de mois en mois, il peut arriver qu’on perde le fil, qu’on délaisse sa veille sur ce sujet.

Jusqu’au jour où il survient à nouveau dans une discussion, au détour d’un texte, et où l’angoisse – ou la culpabilité – nous rattrape. « Mince ! Ai-je donc tout oublié ? »

Reveil soudain
Noisy Wake Up Trompet – by Dolhala


Alors, pour ne pas que cela vous arrive, nous proposons ici un rapide bilan de tout ce qui s’est passé, pendant l’année universitaire 2019-2020, concernant la transition bibliographique dans le Sudoc.

D’abord, on récapitule les nouveautés 2020, et leurs impacts dans le Sudoc. On explique aussi ce qui va se passer en 2021.

Ensuite, on zoome sur la réforme Rameau, et on vous dit l’essentiel de ce qu’il faut retenir.

Enfin, on se projette, pour imaginer ce que sera un catalogue avec des notices d’œuvres.
Et on comprend que tout le travail effectué sur les données aujourd’hui (notamment le travail de liage) rendra possible demain l’existence de ces notices d’œuvres.

Continuer la lectureLa Transition Bibliographique en actions… et en images !

4e journée professionnelle « Métadonnées en bibliothèques » du 15 novembre 2019 : des entités en veux-tu en voilà

  • Commentaires de la publication :0 commentaire

« Faire confiance à notre intuition pour trouver ce que l’on cherche dans un catalogue de bibliothèque ?
Naviguer dans une arborescence logique pour identifier et sélectionner notre ressource, plutôt que de parcourir des listes de notices ?
Obtenir facilement une ressource quel que soit son support ?
Explorer les fonds de notre bibliothèque de manière intelligente en suivant des liens riches entre des œuvres, des personnes, des sujets… ?

On veut quoi ? On veut des entités LRM dans le catalogue de notre bibliothèque !! »

Collectif Nuit debout Toulouse – A Jean-Jaurès – Toulouse, manifestation du 12 mai 2016 – www.flickr.com – CC BY-NC-ND 2.0

Des statistiques de prêt par œuvres et par grappes d’exemplaires, une assistance à la politique documentaire, des services documentaires améliorés et un jour, de l’intelligence artificielle comme aide à l’acquisition et à la gestion de nos collections…
Nous, bibliothécaires, nous voulons cela aussi !

Alors :
En club d’utilisateurs,
Avec notre fournisseur de SIGB,
Ou tout simplement animé de notre passion personnelle pour les données bibliographiques…

… allons à la 4e journée professionnelle « Métadonnées en bibliothèques », le 15 novembre 2019 à la BnF à Paris ou suivons-la sur la chaîne Youtube de la BnF et sur Twitter #databiblio pour découvrir pourquoi la gestion des autorités dès aujourd’hui est indispensable pour faire sa Transition bibliographique et accueillir demain de véritables entités dans son catalogue !

Continuer la lecture4e journée professionnelle « Métadonnées en bibliothèques » du 15 novembre 2019 : des entités en veux-tu en voilà

Expérimentation Sudoc FRBR II. Portrait-robot d’un algo

  • Commentaires de la publication :2 commentaires

Suite de : Mais qu’est-ce qu’il se passe encore ? (2) Expérimentation Sudoc FRBR, le retour

Deux phases de recette et une petite trêve estivale plus tard…

portrait noir et blanc de deux jouets robots
flickr : Champignon.Bunny

Après avoir testé et trituré les données dans (presque) tous les sens, l’Abes est en mesure d’annoncer que l’algoclc2 sera très prochainement implémenté en base de production du Sudoc. Il remplacera le premier algorithme, utilisé depuis le 23 octobre 2017 et rebaptisé ”algoclc1”.

Retour sur un été riche d’enseignements.

Continuer la lectureExpérimentation Sudoc FRBR II. Portrait-robot d’un algo

En mai dernier à Maribor ou Chronique d’une réunion du Permanent UNIMARC Committee

  • Commentaires de la publication :0 commentaire

« C’est un Américain, une Russe et une Portugaise, autour d’une table… »

9 mai 2019, 9h, Maribor (Slovénie), « aquarium » de l’IZUM. La 29e réunion du Permanent UNIMARC Committee va bientôt commencer. Un peu tardive cette année (elle se tient habituellement en mars), cette réunion de travail profite de l’hospitalité de l’IZUM, linstitution où travaille la présidente slovène du Comité, un organisme d’enseignement supérieur dont certaines missions sont proches de celles de l’ABES (voir la présentation aux journées ABES 2010), après avoir longtemps été accueillie par la bibliothèque nationale du Portugal et parfois délocalisée pour être adossée à une journée d’étude autour d’Unimarc (à Florence en 2008, Lyon en 2010, Maribor déjà en 2014).

Bâtiment IZUM à Maribor

Le siège de l’IZUM (surnommé « aquarium » car la destination première du bâtiment était d’héberger une structure pour « gros poissons » de l’ex-Yougoslavie).

 

Continuer la lectureEn mai dernier à Maribor ou Chronique d’une réunion du Permanent UNIMARC Committee

Mais qu’est-ce qu’il se passe encore ? (2) Expérimentation Sudoc FRBR, le retour

  • Commentaires de la publication :3 commentaires
Light par Bob Doran

Suite de :
Mais qu’est-ce qu’il se passe encore ? (1) Où en est l’expérimentation Sudoc FRBR ?

Des dysfonctionnements et une boîte noire

Force est de constater que les premiers résultats de l’expérimentation avec l’algoclc1 sont perfectibles. Le fichier partagé de signalement des anomalies par le réseau complète et consolide des éléments déjà pointés par l’Abes :

  • 60% environ du signalement concerne des anomalies générées par l’algorithme
  • 30% concerne un problème de catalogage
  • les 10% restants sont un mélange des deux qu’il est parfois difficile de démêler.
Continuer la lectureMais qu’est-ce qu’il se passe encore ? (2) Expérimentation Sudoc FRBR, le retour
Aller au contenu principal