项目作者: Lully
项目描述 :
Programmes développés (à titre personnel) pour l'utilisation du SRU (web service) du catalogue BnF
高级语言: Python
项目地址: git://github.com/Lully/bnf-sru.git
Scripts Catalogue BnF (web service SRU)
Programme facilitant l’extraction des données du catalogue BnF, via son SRU
Le script ExtractionCatalogueBnF.py a été converti en exécutable grâce à la librairie Python cx_freeze, via le fichier setup_ExtractionCatalogueBnF.py
L’exécutable Windows est récupérable dans le dossier bin
Installation
- Récupérer le fichier ZIP, le décompresser n’importe où.
- Lancer le fichier ExtractionCatalogueBnF à la racine
- Les fichiers rapports sont déposés dans un répertoire /reports, à la racine également
Utilisation du programme
Quand on double-clique sur le fichier ExtractionCatalogueBnF, une fenêtre s’ouvre :
Dans la moitié gauche : les donnés en entrée, avec au choix :
Dans la moitié droite : les données en sortie
- Le nom du fichier rapport qui contiendra les informations extraites
Ce fichier sera déposé dans un répertoire reports directement dans le répertoire ExtractionCatalogueBnF - La liste des éléments d’information à récupérer :
- Pour les formats Marc : nom des zones et/ou sous-zones.
Si vous indiquez une zone, il précisera chaque sous-zone par son dollar. L’ensemble de la zone sera dans une colonne
Si vous indiquez une sous-zone, le $ ne sera rappelé que dans le nom de la colonne
Vous pouvez mélanger tout ça et mettre par exemple :
200;200$a;200$e$i
Ce qui vous permettra d’avoir une colonne avec l’ensemble de la zone 200 (zone de titre, en Unimarc), mais aussi dans une colonne à part la 200$a, et encore à côté les compléments éventuels du titre - Si vous avez choisi Dublin Core : indiquez simplement le nom des balises à récupérer :
dc:identifier;dc:title;dc:creatorSi certaines informations sont répétées, elles seront dans la même colonne, séparées par un ~
- Si vous voulez extraire des informations concernant des notices d’autorité, vous pouvez récupérer le nombre de notices bibliographiques liées à chacune des notices, en cochant la case idoine
C’est une information qui, dans l’interface web du catalogue, est indiquée en bas à droite des notices d’autorité. Dans ce programme, elle mélange les notices liées comme auteur et comme sujet
On sait que l’extraction est terminée quand…
La fenêtre se referme