Centre d'aide
Identifiants internationaux
Identifiant ARK
Les URL (Universal Resource Locator) sont des chaînes de caractères destinées à localiser une ressource de manière univoque sur le web par le biais du protocole HTTP ou HTTPS.
À ce titre, elles ont l’avantage de donner un accès immédiat à la ressource, dans la mesure où le protocole HTTP est normalisé et utilisé partout sur le Web. Sur le long terme, on note que nombre d’URL se « cassent », c’est-à-dire ne donnent plus accès à une ressource (ou à la même ressource qu’auparavant).
Il y a plusieurs raisons possibles à cela :
- Les ressources sont toujours là, mais ont changé d’emplacement : cas fréquent lorsque l’architecture d’un site est modifiée, ou quand les ressources sont déplacées vers un autre site, ou un autre hôte.
- Les ressources ont été retirées ; l’URL ne renvoie alors à rien.
- Les ressources ont été remplacées : dans ce cas la même URL renvoie désormais à une ressource différente.
Comme Tim Berners-lee le souligne dans son texte « Cool URIs don’t change », ces problèmes peuvent être limités en définissant, au niveau d’une institution, des URL bien conçues et faciles à maintenir, et par une politique cohérente de nommage de ces URL. La plus-value d’ARK réside dans le fait qu’il intègre nativement ces problématiques dans sa spécification. La spécification ARK encourage à faire les bons choix dès l’origine pour garantir une durée de vie maximale des identifiants et des permaliens construits à partir de ceux-ci :
- Dissocier l’identifiant, nom stable de la ressource, de son URL d’accès, nécessairement amenée à changer à plus ou moins long terme ;
- Publier cet identifiant et encourager l’utilisateur à l’employer pour citer la ressource, de préférence à tout autre « nom » dont l’organisation ne garantirait pas l’unicité et la pérennité ;
- Fournir à l’utilisateur un moyen simple de donner accès non seulement à la ressource mais également à des métadonnées d’identification afin de favoriser une citation standard de la ressource ;
- Fournir également à l’utilisateur une déclaration de permanence pour toute ressource identifiée par un ARK (pendant combien de temps l’organisation s’engage-t-elle à garantir l’accès à la ressource ? quels changements celle-ci peut-elle subir au cours du temps ?) ;
- Utiliser un numéro opaque pour identifier l’organisation ayant attribué l’ARK, afin que l’identifiant survive à un changement de libellé de celle-ci ;
- Générer des noms ARK opaques afin que l’identifiant survive aux évolutions de la ressource nommée (modification de son titre, de son possesseur, etc.) ;
- Utiliser comme dernier caractère du nom ARK un caractère de contrôle calculé à partir des caractères précédents (sur le modèle de la clé de contrôle de l’ISBN) et vérifier lors de la résolution qu’il correspond à l’attendu afin de se prémunir contre les fautes de frappe.
Comme ARK, DOI (Digital Object Identifier) est un format d’identifiants dits « pérennes ». À la différence d’ARK qui appartient davantage au monde des institutions culturelles publiques (notamment bibliothèques, archives et musées), DOI est issu du monde des éditeurs et du e-commerce, et est fréquemment utilisé pour identifier des articles et des publications en ligne.
Pour attribuer des DOI, il est nécessaire de s’enregistrer auprès d’une agence d’enregistrement (DataCite, CrossRef ou en France l’Inist-CNRS) qui attribue à l’organisation un préfixe unique (l’équivalent du NAAN) permettant d’attribuer un certain nombre d’identifiants. Le coût est laissé à la discrétion de chaque agence d’enregistrement – généralement, il prend la forme d’une cotisation annuelle permettant de générer un nombre limité ou non d’identifiants –, mais correspond à un service complet de gestion d’identifiants. La fourniture de métadonnées simples au format DataCite associées à la ressource identifiée est obligatoire.
DOI et ARK, qui sont relativement proches en termes de structure, diffèrent surtout par leurs communautés et leur approche : chaque agence DOI est en pratique le niveau opérant où sont conservées les données des ressources (identifiant, URL d’accès, métadonnées) et où est assurée la redirection ; avec ARK, ce niveau intermédiaire n’existe pas, chaque autorité nommante ayant une liberté plus grande de définir sa propre politique et ses propres services, mais devra développer ou intégrer elle-même un système de gestion et de résolution d’identifiants. Cependant, la CDL propose également un service payant, similaire à celui des agences d’enregistrement DOI, pour les identifiants ARK : le service EZID.
Le choix de DOI, d’ARK ou d’un autre format d’identifiants dépend donc de vos objectifs et de votre stratégie.
Il faut demander l’inscription auprès de la California Digital Library via le formulaire de demande de NAAN. L’inscription est gratuite. La CDL vous attribuera un numéro d’autorité nommante.
ARK pouvant identifier tout type de ressource, le choix de celles devant recevoir un ARK est laissé aux autorités nommantes, selon les critères suivants :
- Quelles ressources doivent pouvoir être citées par mes utilisateurs ?
- Puis-je m’engager à maintenir la résolution de ces identifiants sur le long terme (c.-à-d. au-delà des changements techniques de plateforme de diffusion) ? Bien que des ARK puissent être attribués à des ressources dont la durée de vie est limitée, il est préférable de ne les attribuer qu’à des ressources que l’on souhaite pérenniser.
- En fonction des réponses ci-dessus, à quel(s) niveau(x) de granularité attribué-je un ARK ?
- Si j’attribue un ARK à différents niveaux de granularité, vais-je révéler la relation entre ceux-ci par le biais de qualificatifs de granularité ?
Exemple : si l’on attribue un ARK à un livre et à chacun de ses chapitres, donne-t-on à ces derniers un nom ARK différent de celui du livre, ou utilise-t-on le nom ARK du livre suffixé par un qualificatif de granularité ?
- Si mes ressources identifiées par un ARK sont disponibles sous différentes formes, quels qualificatifs de service vais-je définir ?
À retenir : un ARK est un identifiant (le nom officiel de vos ressources, au même titre qu’une cote pour les documents physiques) avant d’être un permalien. Sa pérennité résidera dans votre capacité à gérer la ressource sur le long terme et son association avec la chaîne de caractères qui l’identifie.
Les fonctions principales d’un outil de gestion d’identifiants sont les suivantes :
- Générer un nom ARK conforme aux règles de nommage choisies par l’organisation ;
- Attribuer un identifiant : associer un nom ARK à une ressource en enregistrant ses métadonnées et son URL d’accès ;
- « Résoudre » l’identifiant : lors de l’appel de l’identifiant, rediriger vers la localisation actuelle de la ressource ;
- Fournir également des métadonnées d’identification et une déclaration de permanence pour chaque ressource ;
- Conserver la trace de l’identifiant et de ses métadonnées même lorsque la ressource est supprimée ou indisponible.
Plusieurs options sont disponibles aux utilisateurs d’ARK :
- Développer son propre outil d’attribution et de résolution ;
- Réutiliser un outil open source et l’intégrer dans ses processus ;
- Choisir une solution de production intégrant nativement l’attribution d’ARK ;
- Souscrire à l’offre EZID de la CDL et l’intégrer à ses processus.
Une liste d’outils commerciaux ou open source est en cours d’élaboration à l’adresse http://coptr.digipres.org/Category:Persistent_Identification.
Sur le même modèle que DOI, la CDL fournit également un service de génération et de maintenance d’identifiants : EZID (prononcer : « i-zi-aïe-di »). Ce service existe à la fois sous la forme d’une interface en ligne et d’une API qui permet d’automatiser la génération en masse d’identifiants
Ce qui doit être pérenne dans un identifiant ARK est l’association entre une chaîne de caractères et une ressource. La ressource, en revanche, peut connaître des évolutions de différente nature au cours de son cycle de vie (suppression, remplacement, fusion, scission, etc.). On veillera donc à prévoir ces cas de « mutabilité » des ressources :
- Dans le cas où une ressource est prévue pour être conservée/diffusée pendant un temps limité (mémoires professionnels par ex.), en avertir l’utilisateur par le biais d’une déclaration de permanence.
- Continuer à résoudre l’identifiant en fournissant a minima des métadonnées et une information à l’utilisateur lorsque la ressource devient inaccessible à un utilisateur qui l’avait citée.
- Rediriger vers une (ou plusieurs) ressource(s) de substitution dans le cas où il en existe.
Les solutions de diffusion fournissent une URL d’accès aux ressources que vous publiez. Cette URL d’accès peut être qualifiée de « permalien » lorsqu’elle est correctement construite pour résister au temps. Ainsi, l’outil libre Omeka propose par défaut des URL sous la forme « http://mon-nom-de-domaine/items/show/001 » où les éléments signifiants et les paramètres techniques sont réduits au minimum.
Lorsque vous changerez de solution de diffusion, si vous souhaitez garantir l’accès aux ressources citées par leur précédente URL, vous aurez le choix entre
- conserver cette dernière comme URL d’accès dans la nouvelle solution, ce qui n’est pas toujours possible, ou à défaut,
- adopter le nouveau formalisme d’URL comme permalien de vos nouvelles ressources et mettre en place une redirection pour que chaque URL des ressources publiées jusque-là soit associée à son équivalent dans la nouvelle solution.
L’intérêt d’un outil de gestion d’identifiants indépendant de la solution de diffusion, tel que ceux cités plus haut, est de vous abstraire de toute contrainte technique pour la création de vos identifiants en distinguant l’identifiant de la ressource (ex. : « ark:/99999/123456 ») de son URL d’accès (« http://mon-nom-de-domaine/items/show/001 » pour la solution Omeka). Sa fonction de résolution redirigera l’utilisateur appelant la ressource par son identifiant vers sa localisation actuelle. Il vous permettra donc aisément de mettre à jour l’URL d’accès de chacune de vos ressources pour que votre identifiant redirige désormais vers la ressource dans la nouvelle solution de diffusion, par exemple si, pour poursuivre l’exemple ci-dessus, vous abandonnez Omeka pour une solution de diffusion dont l’URL d’accès pour l’ARK « ark:/99999/123456 » est « http://mon-nom-de-domaine/idurl/001 »).
De manière générale, il est important que vous maîtrisiez l’attribution d’identifiants et leur nommage afin que de maintenir une politique cohérente par-delà les changements de solution de diffusion.
Au 1er juillet 2018, près de 600 institutions dans le monde sont inscrites au registre ARK – entre autres exemples la California Digital Library, Library and Archives Canada, Bibliothèque et Archives nationales du Québec, Österreiche national Bibliothek, Internet Archive, la National Library of Medicine des États-Unis, la New York Public Library, la Biblioteca Nacional de Portugal, la British Library, etc.
En France, outre la BnF, plus de 220 organisations sont inscrites au registre ARK. Il s’agit essentiellement d’institutions publiques à vocation patrimoniale, mais non exclusivement. On citera notamment
- des institutions spécialisées dans la préservation des données numériques : le Centre Informatique national de l’Enseignement Supérieur (CINES), l’Institut national de physique nucléaire et de physique des particules (IN2P3), etc. ;
- des universités : Claude Bernard Lyon 1, Lille 3, Sciences-Po Paris, la Cité numérique de la Méditerranée, etc. ;
- des bibliothèques : la bibliothèque municipale de Toulouse, la Bibliothèque interuniversitaire Cujas, la Bibliothèque Publique d’Information, etc. ;
- des archives : les Archives nationales d’outre-mer (ANOM), Mémoire des Hommes (Ministère de la Défense), la majorité des archives départementales (60 d’entre elles sont inscrites au registre) et une vingtaine d’archives municipales ;
- des musées : le musée des Augustins, les archives du musée Picasso, la Cité des Sciences et de l’Industrie, le musée d’Histoire naturelle de Toulouse, etc. ;
- d’autres organismes publics à vocation patrimoniale : le Centre de Musique Baroque de Versailles (CMBV), le site Son d’Aquí pour le patrimoine musical ; l’Institut national d’Histoire de l’Art (INHA) ; l’Institut de Recherche et d’Histoire des Textes (IRHT), la Maison de l’Orient et de la Méditerranée, la Fédération des Ressources sur l’Antiquité (FRANTIQ) ;
- Il est également utilisé par d’autres organismes publics tels que le Ministère de la Culture, le Centre national de documentation pédagogique (CNDP), la Ville de Paris, la Ville de Besançon et le Conseil général de la Martinique; il est enfin utilisé par l’Agence régionale ACCOLAD et l’Assemblée nationale.
- Enfin, certaines organisations du secteur privé l’utilisent, en particulier le monde de l’édition (Éditis, Hachette Livre, etc.).
Pour obtenir la liste exhaustive des institutions utilisant des identifiants ARK, consultez le registre ARK.
ISNI
Pour vérifier si vous avez un ISNI, vous pouvez consulter la base internationale de l’ISNI en ligne.
La BnF procède aux demandes d’attribution d’ISNI aux personnes et collectivités figurant dans son fichier d’autorité. Celui-ci est constitué à partir des titres bibliographiques déposés au titre du Dépôt légal et décrits conformément à sa politique de catalogage. Il faut donc d’abord déclarer et déposer le document à la BnF. Sous réserve des critères d’attribution en vigueur, un ISNI vous sera attribué.
- Si vous constatez une erreur dans la base ISNI, vous pouvez la signaler via le lien « Please help us improve this record » accessible depuis la notice ISNI concernée.
- S’il s’agit d’une erreur dans la base ISNI et votre notice d’autorité dans BnF catalogue général, merci de contacter isni@bnf.fr en indiquant les erreurs constatées et les sources permettant de faire la correction.
ISSN
Mode(s) d'emploi
Contacter la BNF
Vous pouvez nous contacter via le formulaire