Intervento al convegno "METODI SCELTE STRUMENTI : IL NUOVO CATALOGO DELLA RETE URBS", 11 giugno 2015. Video at https://www.youtube.com/watch?v=gK3_6NKJMzM
1 of 7
Download to read offline
More Related Content
Koha RDA FRBR: alcune riflessioni (text)
1. Koha, RDA, FRBR : alcune riflessioni
Intervento al convegno
METODI SCELTE STRUMENTI : IL NUOVO CATALOGO DELLA RETE URBS
11 giugno 2015
Stefano Bargioni, Pontificia Universit della Santa Croce
際際滷 1
Le regole RDA stanno interessandoci sempre di pi湛. Mentre FRBR ci 竪 parso un modello intrigante
da circa dieci anni, non si 竪 riusciti a ottenere qualcosa di veramente concreto. Si inizi嘆 a ragionarci
nel 2005. Tiziana Possemato present嘆 un proof of concept basato su Amicus al convegno ADLUG
tenuto a Budapest.
Ora invece iniziamo a capire meglio come collegare il mondo MARC con FRBR
(MARC21, perch辿 di RDA e Unimarc non ho ancora sentito parlare con
concretezza...1
). Il collegamento sono le RDA.
際際滷 2
Che cosa sta facendo Koha per introdurre le RDA? Anzitutto, ha gi di per s辿 molte capacit da
sfruttare, e vedremo come. Ma anche un limite, e vedremo come il Koha Gruppo Italiano stia
aiutando la community degli sviluppatori a superarlo.
Va detto subito che Koha accetta qualunque nuovo tag di record di autorit e bibliografici gi di per
s辿. Chiunque pu嘆 adattarlo alle proprie esigenze, definendo nuovi tag tramite l'interfaccia web di
configurazione o tramite le tabelle del database.
La versione appena uscita 3.20 include l'Update 19 del MARC21, mentre 竪 in lavorazione l'Update
20 di aprile2
, e una griglia di catalogazione denominata RDA2 riporta tutti i campi necessari per
catalogare in RDA. Ma le RDA non sono una griglia di catalogazione, dato che ogni griglia di Koha
竪 destinata tipicamente a un tipo di materiale. Con la griglia specifica si hanno a disposizione le
definizioni dei nuovi tag, da riportare nelle griglie in uso presso la propria biblioteca.
I tag introdotti sono immediatamente disponibili per la catalogazione, ma la visualizzazione
nell'OPAC va portata avanti soprattutto dalla community stessa. E il riempimento dei nuovi tag
deve essere agevolato con strumenti specifici.
1 Forse il contributo pi湛 significativo 竪 quello di Gordon Dunsire, presentato a IFLA 2009:
http://conference.ifla.org/past-wlic/2009/135-dunsire-en.pdf [5 giugno 2015].
2 http://www.itsmarc.com/crs/mergedprojects/helptop1/helptop1/appendices/appendix_g_format_changes_update_no
._20_april_2015.htm [5 giugno 2015] e
http://www.itsmarc.com/crs/mergedprojects/helpauth/helpauth/appendix_f_format_changes_update_no._20_april_2
015.htm [5 giugno 2015].
1
2. 際際滷 3
Anzitutto ci sono i default. Quelli globali, sino al singolo sottocampo. Non mi dispiacerebbe che
fosse possibile dotare il singolo catalogatore di default, decisi dall'interessato stesso, e questo
potrebbe essere una miglioria per Koha.
Ci sono poi i men湛 a tendina, dai quali si sceglie un valore tra quelli offerti. L'insieme di questi
valori pu嘆 essere statico, o rinnovato automaticamente ogni tanto, o procedere sul momento da una
fonte esterna che li mantiene (esterna all'ILS o addirittura all'agenzia catalogatrice stessa).
際際滷 4
Tra i men湛 a tendina, ci sono gli autosuggest, che all'inserimento di pochi caratteri rispondono con
una lista di valori disponibili. Poi vi sono i casi dei campi correlati, frequenti nelle RDA, dove si
vuole conservare la stessa informazione sotto forma di codice e di stringa. Inutile riempire a mano
entrambi i campi, apporterebbe anche errori. Poi ci sono campi che vanno compilati con l'ausilio di
plugin, dove la complessit particolare richiede programmazione specifica. Per esempio i tag 000 e
008 (000 e 100 dell'Unimarc) in Koha sono governati da plugin, e in altri ILS succede qualcosa di
simile, per esempio hanno una schermata apposita.
際際滷 5
Portiamoci in ambito RDA. I valori di default possono essere utili per i sottocampi $2 dei tag 33x,
che avranno valore rdacontent, rdamedia, rdacarrier, in riferimento ai sottocampi $a e
$b.
際際滷 6
Un simpatico esempio di men湛 a tendina a lista chiusa si potrebbe trovare nella compilazione di un
tag 384, quando si cataloga materiale musicale.
Invece i sottocampi $a e $l del tag 377 per la lingua associata dipendono da una lista che talvolta
varia nel tempo e potrebbe essere la stessa usata per il codice lingua del tag 008 (100). In PUSC
rinnoviamo automaticamente ogni 7 giorni questa lista, scaricando il file dalla LOC e inserendolo in
Koha.
際際滷 7
Un campo con funzionalit di autosuggest potrebbe essere il 340 $a. La fonte dovr essere quella
pi湛 adatta, e ovviamente andrebbe trovata con i valori nella lingua dell'agenzia catalogatrice.
La tecnica a cui si dovrebbe fare ricorso per maggiore comodit 竪 quella di interrogare dal browser
stesso, in REST o SPARQL, la fonte suddetta, estrarre i primi risultati e popolare la tendina. Un
compito non arduo ma per conoscitori di interfacce web dinamiche.
2
3. 際際滷 8
Una fonte di autosuggest pu嘆 essere interna, o esterna, e anche se autorevole, potrebbe non essere
completa. E in questo caso, la fonte interna 竪 l'insieme dei valori creati dai catalogatori perch辿
mancanti nella fonte esterna.
Si potrebbe applicare un autosuggest al campo di autorit 374 $a (Occupation) interrogando il
Nuovo Soggettario di Firenze.
際際滷 9
Questa 竪 l'interrogazione che va inviata all'endpoint SPARQL della BNCF, se i primi tre caratteri
sono "att". Notare che la ricerca avviene all'interno della categoria "persone".
際際滷 10
La risposta che si ottiene permette di popolare la tendina con le voci "attacchini" ecc. Notare il
plurale: probabilmente il valore dovr essere ritoccato a mano. Si pu嘆 costituire cos狸, volendo, un
insieme di valori interni da riutilizzare anch'essi, mescolandoli alla risposta di BNCF. Se si vuole, si
pu嘆 sfruttare la potenza dello SPARQL che pu嘆 interrogare pi湛 di un endpoint alla volta e fornire
una sola risposta. Per riuscirci, ovviamente anche la fonte interna deve essere in formato linked
data.
Side 11
Particolarmente interessante sembra essere rdaregistry.info, che offre in formati diversi molta
informazione strutturata relativa alle RDA. L'esempio mostrato permette di scaricare sul momento
nel browser tutti i dati per compilare un men湛 a tendina per il tag 338. Attualmente le voci sono in 4
lingue, ma possiamo supporre che presto verr incluso l'italiano, grazie al lavoro di traduzione del
gruppo di Mauro Guerrini.
際際滷 12
Veniamo ai campi correlati, di cui le RDA fanno un uso frequente, per una ragione pratica di
standardizzazione dell'informazione: utilizzare vocabolari controllati validi in ambiti pi湛 ampi
possibile permette di farsi capire anche fuori dall'ambito strettamente bibliotecario, e quindi di
partecipare meglio al web semantico. L'ideale sono i codici, ma va salvaguardata la leggibilit del
dato. Ecco allora la coppia code e term, spesso rappresentata dai sottocampi $4 e $e rispettivamente,
unitamente al sottocampo $2 che indica la fonte della coppia suddetta, e che sar probabilmente,
come gi detto, un default della biblioteca.
La coppia deve avere valori coerenti, e va tenuto presente che non si tratta sempre di una
corrispondenza biunivoca. Per esempio, per i 7xx al relator code "wit" (witness) la traduzione
italiana fa corrispondere i relator term "Testimone oculare", "Astante, "Teste", "Osservatore",
"Testimone".
3
4. 際際滷 13
Ecco come apparirebbe in Koha quanto ipotizzo. Presumo che il catalogatore preferir usare il $e e
gradir che il $4, meno user friendly, venga riempito automaticamente, per cui non ho previsto il
caso contrario.
In quanto all'importanza del $e specialmente per gli autori secondari, mai utilizzati purtroppo presso
la Pontificia Universit della Santa Croce, i miei colleghi giustamente sperano in un intervento di
recupero automatico del pregresso. Credo che potremo affrontarlo utilizzando la stessa logica che ci
port嘆 a migliorare molto la classificazione Dewey3
. L'idea 竪 sfruttare l'ISBN per cercare questa
informazione su fonti interessanti per noi. Lo useremo sia per il pregresso sia per il corrente.
Vedremo in conclusione perch辿 questa informazione risulta utile nell'OPAC.
際際滷 14
I plugin associati a un campo di Koha sono noti soprattutto per i tag 000 e 008 (100), e per
compilare i campi associati a record di autorit. Ma possono essere scritti anche per altri campi.
Siccome si tratta sia di codice Perl sia di codice Javascript, si d allo sviluppatore una notevole
possibilit di aiutare il lavoro del catalogatore.
Li vedo bene per campi che trattano date, quali il tag 046 (sia bib che auth) e il tag 033. Si sa che le
date sono scomode da scrivere, e quindi gli errori sono dietro l'angolo. In pi湛 occorre assicurare
alcune coerenze con altri campi o parti di essi, che tanto vale fare in modo automatico.
際際滷 15
Vediamo adesso un caso molto pi湛 complesso, che -lo confesso- non 竪 fatto con la logica stretta dei
plugin di Koha, ma potrebbe. Ha come finalit un arricchimento del catalogo di grande valore. Con
Koha, l'ufficio catalogazione ha deciso di dare un forte impulso ai record di autorit. Al tempo
stesso, ci siamo resi conto dell'importanza dei legami che possono formarsi in ambito linked data se
vengono associati al record alcuni identificatori numerici significativi. Abbiamo ovviamente
individuato il VIAFid e l'ISNI. Per evitare una trascrizione manuale, che richiede soprattutto una
ricerca manuale sui rispettivi siti, abbiamo pensato di aggiungere a Koha una utility che riuscisse a
minimizzare lo sforzo di individuazione del match e la relativa costruzione di due occorrenze del
tag 024 del record di autorit. Il match viene suggerito tramite gli ISBN relativi a un record di
autorit: quelli presenti nel nostro catalogo e quelli derivanti da una ricerca per nome su isni.org,
che restituisce anche gli ISBN associati. Quando vi sono ISBN in comune, la probabilit che si tratti
dello stesso autore 竪 alta, e il catalogatore decide se procedere alla creazione di due occorrenze del
tag 024 del record di autorit con un click su un bottone. Questi valori renderanno poi possibili
alcune funzionalit nell'OPAC e soprattutto permetteranno di costruire triple RDF basate sulla
propriet owl:sameAs. Propriet che, come si pu嘆 capire, fa veramente diventare linked i linked
data, come piace sottolineare a Paola Manoni, perch辿 lega risorse proprie a risorse altrui.
3 http://leo.cineca.it/index.php/jlis/article/view/8766 (consultata il 2015.06.07).
4
5. 際際滷 16
Conclusa la carrellata su come Koha pu嘆 aiutare la catalogazione a livello campi seguendo le RDA,
vediamo adesso alcune riflessioni personali, come promesso dal sottotitolo di questo intervento.
1. Vi sono diversi casi nel MARC21 attuale che riflettono la necessit di avere un'informazione pi湛
esaustiva rispetto a quella portata da 000 e 008. Abbiamo visto i campi 33x per content, media e
carrier, abbiamo visto date riportate nel tag 046, ecc. Questo mi fa pensare che i controlfield, gi
scomodi, stiano soffrendo una crisi di identit. Sono decisamente gli elementi pi湛 ancestrali del
MARC.
2. Gi da tempo si trovano nel MARC esempi di sottocampi correlati. Adesso, con i casi che
abbiamo visto, specialmente le coppie term e code, direi che diventa evidente un problema. Essendo
ripetibili, ogni $4 a quale $e fa riferimento? Si affida questa informazione alla posizione fisica nel
tag, ma questa vale per l'occhio, non per la macchina. Il programmatore quindi dovrebbe rispettare
la sequenza dei sottocampi ogni volta che interviene sul record. Ma con linguaggi attuali come
XML e JSON con cui si pu嘆 molto pi湛 comodamente rappresentare un record MARC, la posizione
pu嘆 cambiare casualmente, cio竪 a piacimento delle librerie di software stesse. Sarebbe necessario
quindi che questa informazione sia presente nel record, ma il MARC non lo prevede.
3. Sempre pi湛 spesso le specifiche del MARC21 fanno riferimento a FRBR: contengono frasi del
tipo "When the resource description is for an expression...", oppure citano il concetto di entit,
come riportato sulla slide4
. Ora, studiando le RDA, soprattutto seguendo corsi e libri di Tiziana!, ho
inteso che espressioni e opere sono punti di accesso la cui descrizione associo pi湛 ai record di
autorit che a quelli bibliografici. Il MARC introduce le regole RDA, fa appello al modello FRBR,
ma non d tutti gli strumenti, in particolare non dice come si devono legare tra loro le entit.
Anche RDAToolkit fa capire che opere ed espressioni andrebbero descritte con record di autorit.
Poi aggiunge, negli esempi di record bibliografici: "Related expression recorded using an
unstructured description". Vale a dire che, giustamente, la relazione della manifestazione andrebbe
legata alla sua espressione usando un metodo a piacimento, che alla fine sar un tag 900, cio竪 dove
si 竪 liberi di agire. Ma poi come la mettiamo con le migrazioni? Riusciremo a migrare le relazioni?
4. Per quanto detto, quindi, non sorprende il tentativo di rifondazione globale del MARC che sta
andando avanti con BIBFRAME.
際際滷 17
Le relazioni FRBR sono uno a molti, reciproche, ricorsive... Dove vengono adottate, portano
notevole informazione per l'utente: basta vedere il catalogo dell'IDEO, recentemente rifatto
utilizzando espressioni e opere.
際際滷 18
Dieci anni fa Barbara Tillett rappresentava cos狸 le relazioni FRBR. Il punto 竪 allora non solo come
4 http://www.loc.gov/marc/bibliographic/bd377.html (consultata il 2015-06-04).
5
6. descriverle con il MARC (qualche tag 900, si diceva), ma soprattutto come legare questi record tra
loro assicurando le performance per la ricerca e la visualizzazione. Neo4j, Solr, Elasticsearch, ma
anche i database relazionali classici possono risolvere il problema. Non certo l'attuale motore di
ricerca full-text con cui Koha indicizza i record bibliografici e di autorit. Per questo il Koha
Gruppo Italiano ha promosso la sostituzione di Zebra con Elasticsearch, ottenendo un cospicuo
grant da Ebsco a favore della community internazionale degli sviluppatori.
際際滷 19
Come si potrebbero legare le entit FRBR usando Elasticsearch? Questo esempio mostra un legame
tra espressione e manifestazione. Si limita a descrivere la relazione, non i record stessi, per cui gli
elementi essenziali sono gli identificatori numerici dei due record e il tipo di relazione. Si noti che
la propriet relationships 竪 una lista, cio竪 竪 ripetibile. La sintassi 竪 JavaScript Object Notation o
JSON, tipica di Elasticsearch e gi pronta per un browser web.
In realt 竪 previsto molto di pi湛 per Elasticsearch in Koha: dovr anche conservare i record stessi e
indicizzarli, appunto per sostituire il motore di ricerca attuale che con fatica sarebbe in grado di
gestire anche le relazioni.
際際滷 20
Sono gi diversi, e significativi, gli impieghi di relazioni FRBR in cataloghi di varia natura. Invito a
visitarli. Direi che tutti vengono accomunati da due caratteristiche abbastanza innovative per gli
OPAC: grafica e dinamicit. Attraenti, navigabili... Ma potrebbero anche nascere problemi di
accessibilit per ipovedenti.
際際滷 21
Un esempio di importanza delle relazioni 竪 il draft che abbiamo realizzato con i dati del nostro
catalogo.
Come si vede, la relazione non 竪 qualificata. Abbiamo gi parlato nella slide 13 del progetto per il
sottocampo $e.
Se senza ricorrere a RDA e FRBR si possono gi mostrare relazioni significative come quelle tra
autori del proprio catalogo, si capisce che nel lavoro di catalogazione dovremo dare via via
maggiore enfasi alla correlazione, in concreto a quella che non pu嘆 avvenire tramite algoritmi.
impegnativo, 竪 lavoro intellettuale, 竪 quello che credo possa dare un forte ritorno al reference, alla
ricerca, allo sfruttamento delle risorse possedute e disponibili in rete.
際際滷 22
Per concludere con un sorriso, riciclo ancora una volta questa striscia nata durante un corso RDA.
Charlie Brown si rivolge al catalogatore Snoopy, che con il suo lap-top sforna schede classiche. Ma
si lamenta.
6
7. 際際滷 23
Da adesso vuole legare i dati: da catalogatore vuole diventare catalegatore, from cataloguing to
catalinking.
--------------
7