Scusi, dov’è il metadato? Considerazioni sparse e un video di Marco Deligios.
Prima di scoprire che esistono più di una norma ISO e di standard che si occupano di metadati (anche per la gestione documentale), la mia esperienza di metadati si era limitata a quelli che si incontrano avendo a che fare con documenti e file multimediali su un PC, quasi sempre incorporati (embedded) nei file stessi:
- TAG ID3 nei file audio .mp3, con informazioni aggiuntive su artista, titolo del brano, titolo dell’album, genere, anno[1]Su compilation e/o raccolte che anno ci va? Anche chi si approccia amatorialmente all’ars descriptoria si pone domande: forse il sistema di descrizione è troppo povero? Andrebbe ampliato in … Continue reading ecc. Se uno era bravo riusciva a completare anche il metadato “numero di traccia” così da ricostituire l’ordine dei brani nell’album [2]Nota nostalgica: mi si dice che ormai, nell’epoca della musica in streaming e delle playlist l’idea di album è ormai superata. Non più “passa alla tre” o i meccanismi … Continue reading;
- i meatadati Exif nelle foto JPEG scattate con fotocamere digitali: oltre a data e ora, ci sono le informazioni sulla fotocamera, impostazioni di fuoco e diaframma, uso del flash, le coordinate GPS del luogo di scatto (forse agiunte dopo, forse presenti in altri set di metadati incorporati nelle foto);
- il formato elettronico per video Matroska (estensione .mkv) è un formato di tipo contenitore[3]L’allegato alle linee guida sul documento informatico che tratta di formati elettronici dedica un’ampia parte introduttiva alla classificazione e alle caratteristiche generali dei formati … Continue reading che contiene la traccia video, una o più tracce audio e una o più tracce di sottotitoli. Anche qui abbiamo metadati descrittivi del video (almeno il titolo), ma anche metadati che descrivono la lingua delle tracce audio e di sottotitoli: coì quando si riproduce il video sono proposte scelte comprensibili per audio e sottotitoli e non tracciaaudio1, tracciaaudio2, subtitles1, subtitles2….
- i metadati di autore, titolo, oggetto e parole chiave (descrizione del contenuto)[4]Vi è mai capitato di aprire un PDF e leggere sulla barra della finestra un titolo che non c’entra niente con il contenuto del PDF? Colpa dei metadati descrittivi. nei file PDF consentono ai fanatici più audaci di organizzare la propria collezione di articoli scientifici. Accanto a questi nel file PDF (guardare fra le proprietà del file in un visualizzatore di PDF) ci sono anche i metadati che indcano se il file può essere stampato, copiato, commentato, riordinato (metadati gestionali);
- i programmi televisivi trasmessi in digitale e i servizi di streaming video fruibili tramite smart TV sono pieni di metadati: titolo del programma/film, autore, protagonisti, trama, anno di pubblicazione[5]Parzialmente fuori tema si potrebbe osservare come la capacità di fornire descrizioni efficaci e complete diminuisca mentre la tecnologia per visualizzarli diventa più sofisticata. Infatti, di … Continue reading ecc. che guidano le nostre scelte;
- anche i software di elaborazione di testI hanno la loro sezione di metadati. Di nuovo: autore, titolo, descrizione…
Chi si occupa di gestione documentale ha incontrato sicuramente i metadati e apprezzato la fiducia e le aspettative che in essi ripone chi si trova a gestire informazione. Ne parlano diffusamente le linee guida sul documento informatico in circolo da oltre due anni e ne descrivono un ampio schema (da implementare in una codifica e in un formato a piacimento, anche se le linee guida propongono una realizzazione in XML). Archivisti e bibliotecari sono abituati ai metadati definiti da standard internazionali come EAD e EAC (Encoded Archival Description e Context), METS, PREMIS (che forse è più concetto che codifica), Dublin Core, RiC ecc. e li distinguono in metadati descrittivi, gestionali, strutturali, di conservazione…
Dopo averli approcciati con lo studio teorico, questi sistemi di codifica di metadati risultano un po’ sfuggenti, soprattutto perché non sempre è chiarissimo dove, nelle implementazioni, debbano essere memorizzati e tutto fa presupporre che siano contenuti in oggetti (file) esterni all’oggetto (file o altro) a cui si riferiscono. Fra i dubbi e gli interrogativi emergono quindi quelli legati a come mantenere associati oggetti e metadati, perché l’ideale sarebbe che i metadati accompagnassero sempre l’oggetto a cui si riferiscono. Quando poi si intende usare i metadati per garantire integrità, provenienza e autenticità del documento, il dubbio riguarda inoltre come fare a garantire i medesimi requisiti anche per i metadati stessi. Limitandosi all’ambito documentale, i metadati hanno anche lo scopo di comunicare il contesto del documento, le sue relazioni e le sue vicende. Non ci si stanca mai di dirlo, non c’è documento senza contesto, non c’è archivio senza relazioni. Per le canzoni esiste Shazam, per i documenti no (non ancora, ma ci si potrebbe pensare[6]Mi è in effetti capitato di sentire parlare di uno strumento – basato sull’intelligenza artificiale, va da sé – che legge messaggi e-mail e documenti per proporre un indice di … Continue reading…).
L’allegato 5 delle nominate linee guida si occupa proprio di metadati (descrittivi e gestionali) e dà indicazioni su quali informazioni siano indispensabili o utili per dare significato e valore a un documento informatico. Nella proposta delle linee guida i metadati di un documento sono contenuti in un file XML esterno e collegati al documento tramite l’impronta (hash) del relativo file[7]Qui ci sarebbe da aprire una parentesi sulla relazione fra file e documento, ma ci sarebbe da spaccare il capello in quattro. Del resto, se non c’è documento senza contesto e il contesto sta … Continue reading, che è appunto riportata in un apposito tag dell’XML. Anche l’allegato 6, dedicato alla segnatura di protocollo per la comunicazione fra pubbliche amministrazioni, tratta di metadati. La segnatura XML (alla quale ho dedicato tre post: 1, 2, 3), infatti, è un insieme di metadati e fornisce informazioni aggiuntive (e necessarie) nella cornice di una comunicazione fra pubbliche amministrazioni, quali, per esempio, il numero di protocollo.
Proprio in risposta al post “La segnatura per tutti (a tutela del contesto)“, Marco Deligios mi ha segnalato una sua idea, con conseguente realizzazione, per mantenere i metadati “adesi” al documento: tramite strumenti software di uso comune ha implementato una realizzazione dei metadati del documento informatico conforme alla linee guida (sia in forma incorporata nel file .docx[8]Anche i file OOXML (la famiglia dei .docx) sono di tipo contenitore. prodotto, sia come file esterno – o detached – in formato XML secondo lo schema proposto dalle stesse linee guida). Personalmente, provo sempre una certa emozionata soddisfazione quando vedo delle elaborazioni teoriche applicate (correttamente) a un contesto pratico-operativo, possibilmente tramite strumenti esistenti e di uso diffuso. Il video di Marco rientra in questi casi.
Ammetto di non aver riflettuto approfonditamente sulle più o meno immediate applicazioni pratiche di quanto sviluppato da Marco. Senz’altro mi viene da pensare che, in un ambiente di pubblica amministrazione, un documento così composto è di fatto pronto per essere registrato in un sistema di gestione documentale (registrato a protocollo, insomma). Oppure, in un ambiente di casa o piccolo ufficio, un ulteriore strumento software potrebbe aiutare a tenere in ordine documenti dotati, come in questo caso, del giusto corredo descrittivo (che non può essere racchiuso tutto e solo nel nome del file).
Anche senza addentrarmi in approfondimenti applicativi e rimanendo a un livello di suggestione, ho trovato – e da subito – molto istruttivo lo strumento stesso e il video di presentazione, anche dal punto di vista archivistico e diplomatistico. Infatti, mostra con chiarezza come il contesto di un documento è veicolato in parte già dalla sua evidenza visiva (ciò che si vede a video aprendo il file o quando si stampa), con possibili ripetizione nei metadati “invisibili” e in parte solo da questi ultimi, in un meccanismo che, nel documento informatico, vede la forma documentaria dividersi fra ciò che si apprezza immediatamente e ciò che va cercato altrove, nel sistema di gestione. La dimostrazione rende inoltre evidente quali siano i benefici di utilizzare dati strutturati (i metadati in questo caso) quando si producono documenti con strumenti informatici: vederlo su un software che si usa abitualmente anche per usi personali è sicuramente più incisivo e conferisce alla situazione quella concretezza che potrebbe essere meno evidente se riprodotta su software specializzati e irraggiungibili, che poggiano su complicate alchimie di server e database.
In realtà, i concetti alla base di una corretta gestione (informatica) dei documenti hanno ben poco a che fare con le alchimie informatiche. Le complicazioni tecnologiche vengono tutte dopo.
Buona visione!
Photo by Jean-Frederic Fortier on Unsplash
Note
↑1 | Su compilation e/o raccolte che anno ci va? Anche chi si approccia amatorialmente all’ars descriptoria si pone domande: forse il sistema di descrizione è troppo povero? Andrebbe ampliato in modo da distinguere fra data di pubblicazione dell’album e data di creazione del brano? Oppure meglio mantenere la semplicità e accettare qualche compromesso? |
---|---|
↑2 | Nota nostalgica: mi si dice che ormai, nell’epoca della musica in streaming e delle playlist l’idea di album è ormai superata. Non più “passa alla tre” o i meccanismi mentali che associano alla fine di un brano l’incipit del successivo anche a distanza di tempo. |
↑3 | L’allegato alle linee guida sul documento informatico che tratta di formati elettronici dedica un’ampia parte introduttiva alla classificazione e alle caratteristiche generali dei formati elettronici e spiega anche cosa si intende per file contenitore. |
↑4 | Vi è mai capitato di aprire un PDF e leggere sulla barra della finestra un titolo che non c’entra niente con il contenuto del PDF? Colpa dei metadati descrittivi. |
↑5 | Parzialmente fuori tema si potrebbe osservare come la capacità di fornire descrizioni efficaci e complete diminuisca mentre la tecnologia per visualizzarli diventa più sofisticata. Infatti, di recente nel mio televisore alle informazioni “in testo semplice” (veicolate attraverso il segnale TV digitale) che si visualizzavano alla pressione del tasto “info” si è sostituita una app (fornita dall’emittente televisiva, probabilmente proprio come app via internet) sicuramente gradevole all’aspetto, che appare con trasparenza nella parte bassa dello schermo. Tuttavia arrivare a leggere il titolo del film o programma richiede, oltre ai tempi di caricamento, anche di navigare fra vari menu e, soprattutto, le informazioni visualizzate sono del tutto povere: manca l’ora di conclusione del programma, per i film e le serie mancano l’anno e il paese di di produzione, il regista, il cast… |
↑6 | Mi è in effetti capitato di sentire parlare di uno strumento – basato sull’intelligenza artificiale, va da sé – che legge messaggi e-mail e documenti per proporre un indice di classificazione al protocollista… |
↑7 | Qui ci sarebbe da aprire una parentesi sulla relazione fra file e documento, ma ci sarebbe da spaccare il capello in quattro. Del resto, se non c’è documento senza contesto e il contesto sta nei metadati, allora non c’è documento senza metadati. Possono quindi i metadati riferirsi esternamente a qualcosa di cui sono condizione di esistenza? Oppure: la vita è un metadato o i metadati aiutano a vivere meglio? |
↑8 | Anche i file OOXML (la famiglia dei .docx) sono di tipo contenitore. |