Estrazione e classificazione della conoscenza dai metadati.
Nel precedente articolo ho descritto una proposta complessiva per la costruzione delle ontologie della pubblica amministrazione, che si basa sui metadati e sulle strutture dei database della p.a.
Tale proposta si può sintetizzare in 3 fasi:
1- la costruzione bottom-up di un repository delle basi dati, come primo step dell'opera (prototipo qui: https://drive.google.com/file/d/0B9eWAzJTqlgUcm9YZ1VCVUZGYUk/view?pli=1 )
2- la realizzazione top-down delle ontologie per la p.a., per la quale consiglio di ispirarsi alla proposta di Nicola Guarino (vedi http://ontolog.cim3.net/file/resource/presentation/NicolaGuarino_20060202/DOLCE--NicolaGuarino_20060202.pdf )
3- una fase di raccordo, nella quale estrarre per somiglianza e classificare la conoscenza dai metadati delle basi dati; per fare questo si possono utilizzare gerarchie di entità, e relazioni tra entità; in dote porto le entità avute da Carlo Batini.
Tale fase di raccordo "pesca" la conoscenza nei nomi e nelle descrizioni di tavole e campi dei database.
Recentemente, a seguito della pubblicazione open da parte di AgID del catalogo basi dati della pubblica amministrazione, ho sperimentato la fase di "pesca" nei nomi e nelle descrizioni delle basi dati pubblicate appunto da AgID.
Il livello di aggregazione è maggiore, i metadati pubblicati da agid sono a livello atomico di base dati, non ancora di singole tavole e singoli campi: questo sarà possibile se e quando sarà realizzata la fase 1 descritta sopra.
Nell'approfondimento tecnico a cui si rimanda, è descritta la fase di raccordo, svolta dapprima qualche anno fa su tavole e campi delle basi dati piemontesi, e recentemente sulle basi dati del catalogo AgID.
Tale approfondimento tecnico è disponibile al seguente link:
https://www.dropbox.com/s/2qi0skrt11cbc0s/Basi%20dati%20della%20Pubblica%20Amministrazione3.doc?dl=0