Retour sur la réunion des catalogueurs et catalogueuses arabisant.e.s

  • Commentaires de la publication :0 commentaire

À la demande de la BULAC, l’Abes a proposé aux catalogueurs signalant, régulièrement ou occasionnellement, des ouvrages en langue arabe, de se réunir afin d’échanger sur les spécificités liées à ce type de signalement.

Il s’agissait d’évoquer à la fois les contraintes techniques imposées par les outils de production et de consultation fournis par l’Abes pour chacun des réseaux (WiniBW, IdRef et Calames Pro), de traiter collectivement des questions de catalogage puis de réfléchir ensemble à des collaborations, afin de réunir les forces et les compétences particulières demandées par ce type de catalogage.

Après avoir sondé les membres des réseaux Sudoc, IdRef et Calames potentiellement intéressés, l’Abes a réuni une quarantaine de participants, sur un mode hybride (en présentiel à la BULAC, à distance via Zoom) le mardi 28 novembre 2023.

Les contraintes techniques pour les écritures sinistroverses et pour l’arabe en particulier

L’ arabe fait partie des écritures qui s’écrivent de droite à gauche, ce qui peut poser de réels problèmes pour le catalogage avec certains outils informatiques en Europe : dans une notice UNIMARC saisie avec WinIBW doivent cohabiter des sous-zones dans lesquelles les caractères sont saisis selon deux sens différents.

Où placer le caractère d’indexation @ ? Comment bien positionner le curseur ? À ces contraintes s’ajoutent celles de la saisie dans deux alphabets, qui impose souvent l’utilisation d’un clavier virtuel. Enfin, comment faire pour que les requêtes fournissent aux usagers, professionnels ou non, des résultats pertinents, alors que de nombreuses graphies sont possibles pour le même mot en arabe ?

La première partie de la réunion a donc été consacrée au relevé de ces problèmes techniques, dans les outils de production et de consultation actuellement proposés par l’Abes ainsi qu’au partage des astuces et solutions de contournement trouvées par certains collègues.

Continuer la lectureRetour sur la réunion des catalogueurs et catalogueuses arabisant.e.s

Ressources cartographiques : évolution des consignes de signalement

  • Commentaires de la publication :1 commentaire

À l’invitation de l’Abes, sept structures documentaires du réseau Sudoc ont travaillé, pendant presque deux ans, à la révision et l’enrichissement des consignes de catalogage pour les ressources cartographiques.
De mai 2021 à mars 2023, huit bibliothécaires  (cf liste au bas de l’article) ont oeuvré au sein d’un Groupe de travail, animé par l’Agence, sous la responsabilité scientifique de Jean-Luc Arnaud, directeur de recherche CNRS (laboratoire Telemme Aix-Marseille Université), spécialiste de l’histoire de la cartographie et fondateur du site web CartoMundi. 

Un  précédent groupe de travail s’était constitué, en 2002-2003, pour élaborer les consignes jusqu’à présent en vigueur dans le réseau ; en 2010, un second groupe avait complété ces consignes mais elles n’avaient pas été révisées depuis. 

Des consignes claires, pour les cartothécaires

En 2021, l’Abes a choisi d’importer directement dans la base de production du Sudoc des notices de documents cartographiques d’origine BnF (voir ce billet).
Jusqu’alors, ces notices n’étaient disponibles que dans un réservoir annexe à la base de production et devaient donc être importées manuellement par qui souhaitait s’en servir.
Ce nouvel import systématique dans le Sudoc offrait un double avantage pour tout catalogueur : 

  • suppression de l’étape de l’import manuel ;
  • présence de notices complètes (zones de données codées renseignées, indexation Rameau-nom commun réalisée) , même si relecture, parfois correction et enrichissement sont toujours nécessaires.

Il présentait cependant un inconvénient majeur : les consignes en vigueur à la BnF étant différentes de celles du Sudoc, le risque était grand d’instaurer de la confusion dans l’esprit des catalogueurs et des incohérences dans la présentation des données, sur le catalogue Sudoc, pour les chercheurs et le public universitaire. 

Le Groupe de Travail a donc eu pour mission de re-examiner les consignes, et dans la mesure du possible, de les harmoniser notamment pour le signalement des séries cartographies, jusqu’à présent non signalées dans le Sudoc.

À l’occasion de ce long travail de relecture des consignes, il fût également décidé de se rapprocher le plus possible des principes de RDA-FR, lorsque des nouveaux choix devaient être faits et de préparer ainsi la migration de ces données bibliographiques vers la modélisation IFLA-LRM.

Enfin, parce que  l’Abes entend jouer pleinement son rôle de tête de réseau et accompagner au mieux les producteurs de données du Sudoc, elle mit à profit ce temps pour enrichir de définitions, d’exemples, d’astuces et d’illustrations les consignes publiées sur le Guide méthodologique, grâce à l’expertise des membres du GT.

Continuer la lectureRessources cartographiques : évolution des consignes de signalement

Le format UNIMARC évolue dans le Sudoc pour répondre aux besoins des établissements

  • Commentaires de la publication :0 commentaire

Le bon moment

En janvier 2022, une mise à jour importante du format de production dans le Sudoc a été finalisée afin de prendre en compte les décisions validées ces dernières années par le Permanent UNIMARC Committee (PUC), instance de l’IFLA qui maintient le format UNIMARC au niveau international.

Rappelons qu’aucune mise à jour n’avait été proposée en janvier 2021 : dans le contexte de crise sanitaire, à l’Abes comme dans les établissements, le télétravail généralisé n’était pas propice à la réalisation d’opérations techniques potentiellement risquées, comme peuvent l’être celles liées à tout changement de version.

L’Abes souhaitait donc implémenter en janvier 2022 ces « nouveautés » en attente, afin de ne pas créer un trop grand décalage entre l’UNIMARC standard (ou international) et l’UNIMARC « Sudoc ». De plus, elles répondaient à des besoins actuels exprimés par les établissements membres des réseaux Sudoc et Thèses.

Continuer la lectureLe format UNIMARC évolue dans le Sudoc pour répondre aux besoins des établissements

Expérimentation Sudoc FRBR II. L’évaluation : algo vs humain 3/3

  • Commentaires de la publication :3 commentaires
Robot and the Book of Light
« Robot and the Book of Light » by Eric Kilby flickr CC BY-SA 2.0

 

Billets précédents :
1. Les règles du jeu
2. Le score

 

 

 

 

L’analyse des résultats du match

De l’examen des cas issus de l’analyse statistique décrite dans le billet précédent, il est possible de dégager des éléments récurrents de perturbation du fonctionnement de l’algorithme. Sans grande surprise les zones contenant les titres et les auteurs ont un poids important dans la formule de calcul et sont, de fait, sources d’erreur surtout quand les œuvres sont très représentées dans le Sudoc. Certains partis pris ont aussi leur responsabilité dans quelques cas quant au niveau de granularité des regroupements ou des difficultés à les réaliser.

Continuer la lectureExpérimentation Sudoc FRBR II. L’évaluation : algo vs humain 3/3

Expérimentation Sudoc FRBR II. L’évaluation : algo vs humain. 2/3

  • Commentaires de la publication :3 commentaires
grille de résultats
« I win » by Ginny flickr (CC BY-SA 2.0)

Billet précédent :
1. Les règles du jeu

 

 

 

 

 

Le score

1000 notices de monographies ont finalement été examinées par « le onze abesien ». Le jeu de données clusterisées par les testeurs a été confronté aux regroupements réalisés par l’algorithme dans la base de test. Les clusters ont été classés en six catégories une fois le taux de regroupement global connu :

Parmi ces 1000 notices faisant partie du périmètre d’action du programme :

  • 629 notices ne sont ni dans un cluster humain ni dans un cluster machine
  • 371 notices font partie d’un regroupement humain et/ou machine.

Continuer la lectureExpérimentation Sudoc FRBR II. L’évaluation : algo vs humain. 2/3

Expérimentation Sudoc FRBR II. L’évaluation : algo vs humain. 1/3

  • Commentaires de la publication :5 commentaires

L’évaluation globale de l’expérimentation annoncée dans le billet précédent  a pu s’achever à la fin du mois de juin avec deux mois de retard sur le calendrier initial.

Les forces et les faiblesses de l’algorithme sont désormais connues :

Les paramétrages actuels permettent de traiter au niveau œuvre une partie non négligeable des notices de monographies qui représentent le plus gros volume des données du Sudoc. Cependant, le nombre total de notices regroupées reste modeste par rapport au périmètre pris en compte par le programme (un grand nombre « d’unicas » d’œuvres en sont aussi responsables). Par ailleurs, l’algorithme ne tourne pas sur toutes les données du Sudoc (notamment les agrégats dont font partie les ressources continues) et l’hétérogénéité des pratiques de signalement ainsi que la qualité des notices limitent ses performances.

robot

Voici une présentation de cette évaluation publiée en trois parties :

  1. Les règles du jeu (ce billet)
  2. Le score
  3. L’analyse des résultats du match

Continuer la lectureExpérimentation Sudoc FRBR II. L’évaluation : algo vs humain. 1/3

Expérimentation Sudoc FRBR II. Portrait-robot d’un algo

  • Commentaires de la publication :2 commentaires

Suite de : Mais qu’est-ce qu’il se passe encore ? (2) Expérimentation Sudoc FRBR, le retour

Deux phases de recette et une petite trêve estivale plus tard…

portrait noir et blanc de deux jouets robots
flickr : Champignon.Bunny

Après avoir testé et trituré les données dans (presque) tous les sens, l’Abes est en mesure d’annoncer que l’algoclc2 sera très prochainement implémenté en base de production du Sudoc. Il remplacera le premier algorithme, utilisé depuis le 23 octobre 2017 et rebaptisé ”algoclc1”.

Retour sur un été riche d’enseignements.

Continuer la lectureExpérimentation Sudoc FRBR II. Portrait-robot d’un algo

Mais qu’est-ce qu’il se passe encore ? (2) Expérimentation Sudoc FRBR, le retour

  • Commentaires de la publication :3 commentaires
Light par Bob Doran

Suite de :
Mais qu’est-ce qu’il se passe encore ? (1) Où en est l’expérimentation Sudoc FRBR ?

Des dysfonctionnements et une boîte noire

Force est de constater que les premiers résultats de l’expérimentation avec l’algoclc1 sont perfectibles. Le fichier partagé de signalement des anomalies par le réseau complète et consolide des éléments déjà pointés par l’Abes :

  • 60% environ du signalement concerne des anomalies générées par l’algorithme
  • 30% concerne un problème de catalogage
  • les 10% restants sont un mélange des deux qu’il est parfois difficile de démêler.
Continuer la lectureMais qu’est-ce qu’il se passe encore ? (2) Expérimentation Sudoc FRBR, le retour

Mais qu’est-ce qu’il se passe encore ? (1) Où en est l’expérimentation Sudoc FRBR ?

  • Commentaires de la publication :1 commentaire


« Bon ben alors qu’est-ce qu’i fabriquent à l’Abes, i nous bassinent avec leur FRBRisation là, et i s passe rien, quels pignoufs ceux-là alors. »


Le Pape, Philippe, 2012. Mais qu’est-ce qu’il se passe ? (3) Sudoc. RDA@Abes 19/12/2012 : https://rda.abes.fr/2012/12/19/mais-quest-ce-quil-se-passe-3-sudoc

“Souvenirs, souvenirs…” C’était tout juste six mois après les Journées Abes 2012 et le lancement de “l’expérimentation Sudoc FRBR” – pas un projet non, une ex-pé-ri-men-ta-tion où l’on échafaude des plans, on teste, on bidouille et on regarde comment ça tourne…

Il s’en est passé des choses depuis ! Reprenons les jalons.

Continuer la lectureMais qu’est-ce qu’il se passe encore ? (1) Où en est l’expérimentation Sudoc FRBR ?
Aller au contenu principal